2021. 7. 9. 00:06ㆍAI(Artificial Intelligence)
(AI 카테고리에 올라오는 글들은 <모두의 딥러닝> 책과 AI4SCHOOL 사이트를 중점으로 참고하여 올리는 글임을 알립니다.)
1. 머신러닝
머신러닝은 기존의 데이터를 이용해 앞으로의 일을 예측하는 인공지능 기법입니다.
이 머신러닝과 기존 프로그래밍은 결정적인 차이가 있죠! 기존 프로그래밍은 데이터를 입력해서 답을 구하는 것이 주 목적이라면, 머신 러닝은 데이터 안에서 규칙을 발견하고 그 규칙을 새로운 데이터에 적용해서 새로운 결과를 도출하는 것이 주 목적입니다.

머신러닝은 지도학습(Supervised Learning), 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning)으로 나눌 수 있습니다.

- 지도학습은 위의 설명과 같이 답이 정해진 데이터를 가지고 학습하는 것이고,
- 비지도학습은 컴퓨터가 스스로 데이터의 특징을 찾아내어 답을 구하는 방식입니다. 때문에 비지도학습은 지도학습보다 더 많은 데이터량을 요구하며 결과값이 사람이 원하는 방향과 다르게 나올 수 있습니다.
- 강화학습은 컴퓨터에게 목표를 알려주고 데이터를 통해서 결정할 때마다 그 결정에 대한 보상을 합니다. 목표에 가까우면 더 높은 보상을 주어 사람이 원하는 방향으로 학습이 가능하도록 할 수 있습니다.
2. 지도학습
위에서 머신러닝의 첫 번째 분류인 지도학습에는 크게 분류(Classification)와 회귀(Regression)가 있습니다.
만일 중환자를 전문으로 수술하는 어느 병원의 의사가 있다고 치면, 이 의사는 기존에 수술했던 환자의 데이터를 기록한 데이터를 가지고 있을 것입니다. 이렇게 수술한 환자를 사망/생존으로 분류한 데이터를 기반으로 컴퓨터가 새로운 데이터의 사망/생존을 가려낼 수 있다면 지도학습의 분류로 얘기할 수 있으며, 사망/생존과 같이 답을 찾는 분류가 아닌 환자의 상태가 얼마나 중한지의 정도를 숫자로 출력한다면 지도학습의 회귀에 해당한다고 얘기할 수 있습니다.
이처럼 분류는 주어진 데이터에 대한 답을 학습하고, 이를 토대로 새로운 데이터를 받아 아무리 애매한 데이터여도 더 가까운 쪽으로 레이블을 찾아 답을 내립니다. 회귀는 정해진 레이블 안에서 답을 도출해내는 것이 아닌 아래의 그래프처럼 다양한 값을 답으로 출력할 수 있습니다.
중환자의 데이터를 아래와 같이 점으로 표시한 후, 점의 분포와 비슷한 위치에 직선을 그려서 환자의 중한 정도를 기준으로 환자의 현재 질병이나 현재 상태를 도출해냅니다. (사실 여기서는 키에 따른 몸무게 예측과 같은 예제가 더 잘 이해되는 예제긴 합니다...)

데이터의 양과 다양성이 늘수록 예측값과 실제값의 차이인 오차를 줄일 수 있습니다. 회귀 문제에서는 이 오차를 줄이는 것을 가장 중요한 과제로 보고 있습니다.
오늘은 여기까지!
'AI(Artificial Intelligence)' 카테고리의 다른 글
| 딥러닝이란? (0) | 2021.07.18 |
|---|---|
| 머신러닝이란? - (2) 비지도, 강화학습 (1) | 2021.07.10 |