![]() |
전채남 〈주〉더아이엠씨 대표 |
인간은 어떻게 학습하고 있는가. 학습은 지식, 기술, 동작 등을 습득하고 발전시키는 과정으로 경험, 교육, 독서, 사회적 활동 등을 통해서 이루어진다. 학습의 결과로 지식의 증진과 이해력 향상, 문제 해결, 기술 숙련, 사회적 규범의 습관화 등이 가능해진다. 인간은 학습을 통해 새로운 것을 배우고 세상을 이해하고 상황에 맞는 판단을 하고 적합한 행동을 한다.
학습은 크게 고전적 조건화, 강화학습, 인지학습으로 구분된다. 고전적 조건화는 무조건 자극과 조건 자극을 결합하여 조건 자극에 대한 반응을 유발하는 학습이고 강화학습은 행동의 결과에 따라 칭찬과 처벌을 받게 되어 행동을 강화하거나 약화시키는 학습이다. 인지학습은 인지 기능을 향상시키는 학습이다. 인지학습은 인간의 지각, 기억, 이해, 문제 해결, 의사소통, 창의력 등의 인지 기능을 발달시킨다. 장 피아제(Jean Piaget)의 인지발달이론에 의하면 인간의 인지 기능은 선천적으로 주어진 것이 아니라 환경과의 상호작용을 통해 발달한다. 인간은 새로운 정보를 습득하게 되면 기존 지식과 연결하며 기억하고 문제를 해결할 때는 이해와 추론을 한다.
학습은 인간의 지능(Intelligence)을 발달시킨다. 지능은 경험, 모델링, 실수, 강화학습 등을 통한 학습과 추론에 의거한 의사결정을 내리는 인간의 능력이다. 인간의 지능을 컴퓨터를 통해 구현한 기술이 인공지능(AI)이다. 인공지능은 기계학습(Machine Learning)을 통해 만들어지고 발달한다.
AI는 어떻게 기계학습하고 있는가? 아서 사무엘(Arthur Lee Samuel)은 머신러닝을 "컴퓨터가 명시적으로 프로그램되지 않고도 학습할 수 있도록 하는 연구 분야"라고 정의했다. 전통적인 프로그래밍 기법과 달리 데이터 속에서 패턴을 찾아내어 탐지, 분류, 군집, 판단 등을 하는 것이다.
기계학습 방식은 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning)으로 나뉜다. 지도학습은 머신러닝의 가장 기본적인 형태로, 우선 사람이 데이터에 정답을 연결해 주는 방법이다. 이 방식은 데이터의 올바른 정답지를 만드는 학습 데이터 구축이 무엇보다 중요하다. 이를 레이블링(Labeling) 혹은 어노테이션(Annotation) 작업이라고 하며, 정답지를 라벨(Label)이라고 한다. 지도학습의 종류에는 주어진 데이터를 정해진 카테고리로 분류하는 분류(Classification)와 주식, 트렌드 등 연속된 값을 예측하는 회귀(Regression)가 있다. 인간의 고전적 조건화 학습과 유사하다.
비지도학습은 정답지 없이 유사한 특징을 가진 데이터들을 군집화하는 방법이다. 비지도학습의 종류에는 클러스터링(Clustering), 생성적 적대 신경망(Generative Adversarial Networks, GAN) 등이 있다. 지도학습은 일반적으로 비지도학습보다 모델의 성능이 더 좋으나 학습 과정에서 많은 시간과 데이터가 필요하다.
강화학습은 기계가 환경과 상호작용하면서 보상(reward)과 벌을 통해 스스로 최적의 행동을 학습하는 방법이다. 이 방식은 실험과 탐색을 통해 어떤 행동이 최적의 결과를 가져오는지 알아내는 과정이기 때문에 지도학습에 비해 더 많은 연산 능력과 데이터가 필요하다. 최근 화제가 된 챗GPT가 바로 강화학습을 적용한 모델이다.
완전한 인지학습까지 발달하지 못했지만 AI의 학습은 빠르게 발달하고 있다. 몇 년 이내에 AI도 구체적 사물과 추상적 개념에 대해 논리적 사고를 하지 싶다. AI의 학습 발달은 지능이 높은 기계들이 스마트 세상을 만들 것이다. 지능이 높은 사회이다. AI가 만드는 지능이 높은 사회는 유토피아일까. AI가 우리 삶에 미칠 영향에 대한 논의와 사회적 합의가 필요하다.
〈주〉더아이엠씨 대표
영남일보(www.yeongnam.com), 무단전재 및 수집, 재배포금지