Machine Learning이란?

Machine Learning과 ML 학습 방식에 대하
전길원's avatar
Apr 12, 2024
Machine Learning이란?

Machine Learning

  • 기계 학습 , 기계 스스로 학습하는 것을 뜻합니다.
 

기존의 프로그래밍과 Machine Learning 방식의 차이

  • 기존의 프로그래밍
    • 인간이 데이터에서 반복되는 규칙 (Pattern)을 찾아내고, 규칙을 프로그래밍 하여 데이터를 넣었을 때, 답이 나오게 하는 것입니다.
    • 문제 해결 순서
        1. 문제 발견 → 해결해야 할 문제를 발견합니다.
        1. 규칙 찾기 → 해결해야 할 문제에서 공통되는 규칙을 발견하고 그것을 코드로 작성합니다.
        1. 평가 → 작성한 코드를 문제에 적용하여 성능을 평가합니다.
  • Machine Learning
    • 데이터와 정답을 주면, 기계가 스스로 데이터의 규칙을 찾아냅니다.
    • 문제 해결 순서
        1. 문제 발견 → 해결해야 할 문제를 발견합니다.
        1. 모델 학습 → 데이터와 정답을 기계에 주어 학습 시킵니다. 기계는 학습하며 데이터와 정답 사이의 규칙을 찾습니다.
        1. 평가 → 규칙이 문제에 잘 적용되는지 성능 평가합니다.
notion image

기계 학습 학습 방식의 종류

  1. Supervised Learning ( 지도 학습 )
    1. 훈련 데이터와 정답 데이터 ( label )을 이용하여 학습하는 것입니다.
    2. 회귀 분석 ( Regression Analysis )은 대표적인 지도 학습 방법 중 하나입니다.
      1. 예를 들어, 집 값 예측 모델을 만들고 싶다고 한다면, 독립 변수집의 위치, 연식, 주변 인프라에 대한 정보 등의 훈련 데이터와 종속 변수집 값을 정답 데이터( label )로 제공하면 집 값을 예측하는 모델을 만들 수 있습니다.
    3. 분류에도 많이 사용합니다.
      1. 예를 들어, 동물 이미지 ( 훈련 데이터 ) , 고양이인지 아닌지 여부 ( 0,1 라벨링 ) (정답 데이터)를 이용해서 이미지를 입력 받으면 고양이인지 아닌지 여부를 반환하는 모델을 제작할 수 있습니다.
    4. 대표적인 지도 학습 알고리즘
      1. KNN
      2. Linear Regression
      3. Logistic Regression
      4. LDA
      5. QDA
      6. SVM
      7. Decision Tree, Random Forest
      8. Neural Network
  1. Unsupervised Learning ( 비지도 학습 )
    1. 정답 데이터 ( label ) 없이 훈련 데이터만 가지고 학습하는 것
    2. 대표적인 비지도 학습 알고리즘
      1. 군집화
      2. 시각화, 차원 축소
      3. 연관 규칙 학습
  1. Semisupervised Learning ( 준 지도 학습 )
    1. 데이터에 레이블을 다는 것은 매우 비싸고 시간이 많이드는 과정입니다. 따라서 레이블이 있는 데이터를 구하는 것 또한, 어렵습니다.
    2. 준 지도 학습은 지도학습과 비지도 학습을 섞은 형태의 학습 방법입니다.
      1. 레이블이 있는 소수의 데이터와 레이블이 없는 다수의 데이터를 이용하여 학습을 진행합니다.
      2. 레이블이 없는 다량의 데이터에 레이블이 있는 소수의 데이터를 포함시켰을 때, 학습 정확도가 개선되는 경향이 있기에 이런 방식을 이용합니다.
    3. 준지도 학습 알고리즘으로 순차적으로 학습한 후, 지도학습 알고리즘을 이용하여 세밀하게 조정하는 방식을 많이 채택합니다.
    4. 대표적인 준지도 학습 알고리즘
      1. 제한된 볼츠만 머신 (RBM)
      2. 심층 신뢰 신경망 (DBN)
    5. 대표적으로, 구글 포토 기능이 있습니다.
      1. 다량의 사진을 넣으면 군집화를 통해 분류를 하고, 사진에 등장한 사람에 대해 레이블을 제공하면 특정 인물의 사진을 찾을 수 있는 기능입니다.
  1. Reinforcement Learning ( 강화 학습 )
    1. 위의 학습 방식과 완전히 다른 방식의 학습입니다.
    2. Agent가 환경을 관찰해 행동을 하고, 그 행동에 대해 보상이나 벌점을 받는 식으로 학습합니다.
      1. Agent : 학습하는 머신
    3. 시간이 지나면서 더 큰 보상을 얻기 위해 정책(policy)이라 부르는 최상의 전략을 스스로 학습합니다.
      1. 정책은 주어진 상황에서 Agent가 어떻게 행동할 지 정의합니다.
    4. 알파고의 학습 방식이 강화학습입니다.
 

참고

 
Share article

한 길