Machine Learning
- 기계 학습 , 기계 스스로 학습하는 것을 뜻합니다.
기존의 프로그래밍과 Machine Learning 방식의 차이
- 기존의 프로그래밍
- 인간이 데이터에서 반복되는 규칙 (Pattern)을 찾아내고, 규칙을 프로그래밍 하여 데이터를 넣었을 때, 답이 나오게 하는 것입니다.
- 문제 해결 순서
- 문제 발견 → 해결해야 할 문제를 발견합니다.
- 규칙 찾기 → 해결해야 할 문제에서 공통되는 규칙을 발견하고 그것을 코드로 작성합니다.
- 평가 → 작성한 코드를 문제에 적용하여 성능을 평가합니다.
- Machine Learning
- 데이터와 정답을 주면, 기계가 스스로 데이터의 규칙을 찾아냅니다.
- 문제 해결 순서
- 문제 발견 → 해결해야 할 문제를 발견합니다.
- 모델 학습 → 데이터와 정답을 기계에 주어 학습 시킵니다. 기계는 학습하며 데이터와 정답 사이의 규칙을 찾습니다.
- 평가 → 규칙이 문제에 잘 적용되는지 성능 평가합니다.
기계 학습 학습 방식의 종류
- Supervised Learning ( 지도 학습 )
훈련 데이터와 정답 데이터 ( label )을 이용하여 학습
하는 것입니다.- 회귀 분석 ( Regression Analysis )은 대표적인 지도 학습 방법 중 하나입니다.
- 예를 들어, 집 값 예측 모델을 만들고 싶다고 한다면,
독립 변수
인집의 위치
,연식
,주변 인프라에 대한 정보
등의 훈련 데이터와종속 변수
인집 값을 정답 데이터( label )로 제공
하면 집 값을 예측하는 모델을 만들 수 있습니다. - 분류에도 많이 사용합니다.
- 예를 들어, 동물 이미지 (
훈련 데이터
) , 고양이인지 아닌지 여부 ( 0,1 라벨링 ) (정답 데이터
)를 이용해서이미지를 입력 받으면 고양이인지 아닌지 여부를 반환하는 모델
을 제작할 수 있습니다. 대표적인 지도 학습 알고리즘
- KNN
- Linear Regression
- Logistic Regression
- LDA
- QDA
- SVM
- Decision Tree, Random Forest
- Neural Network
- Unsupervised Learning ( 비지도 학습 )
- 정답 데이터 ( label ) 없이
훈련 데이터만 가지고 학습
하는 것 대표적인 비지도 학습 알고리즘
- 군집화
- 시각화, 차원 축소
- 연관 규칙 학습
- Semisupervised Learning ( 준 지도 학습 )
- 데이터에 레이블을 다는 것은 매우 비싸고 시간이 많이드는 과정입니다. 따라서 레이블이 있는 데이터를 구하는 것 또한, 어렵습니다.
- 준 지도 학습은 지도학습과 비지도 학습을 섞은 형태의 학습 방법입니다.
- 레이블이 있는 소수의 데이터와 레이블이 없는 다수의 데이터를 이용하여 학습을 진행합니다.
- 레이블이 없는 다량의 데이터에 레이블이 있는 소수의 데이터를 포함시켰을 때, 학습 정확도가 개선되는 경향이 있기에 이런 방식을 이용합니다.
- 준지도 학습 알고리즘으로 순차적으로 학습한 후, 지도학습 알고리즘을 이용하여 세밀하게 조정하는 방식을 많이 채택합니다.
대표적인 준지도 학습 알고리즘
- 제한된 볼츠만 머신 (RBM)
- 심층 신뢰 신경망 (DBN)
- 대표적으로, 구글 포토 기능이 있습니다.
- 다량의 사진을 넣으면 군집화를 통해 분류를 하고, 사진에 등장한 사람에 대해 레이블을 제공하면 특정 인물의 사진을 찾을 수 있는 기능입니다.
- Reinforcement Learning ( 강화 학습 )
- 위의 학습 방식과 완전히 다른 방식의 학습입니다.
- Agent가 환경을 관찰해 행동을 하고, 그 행동에 대해 보상이나 벌점을 받는 식으로 학습합니다.
- Agent : 학습하는 머신
- 시간이 지나면서 더 큰 보상을 얻기 위해 정책(policy)이라 부르는 최상의 전략을 스스로 학습합니다.
- 정책은 주어진 상황에서 Agent가 어떻게 행동할 지 정의합니다.
- 알파고의 학습 방식이 강화학습입니다.
참고
Share article