본문 바로가기
Python 과 머신러닝/III. 머신러닝 모델

[Python 머신러닝] 지도학습과 비지도학습

by JoyfulS 2019. 10. 23.

 

 

 

 

 

기계 학습 (Machine Learning) 이란?

- "기계가 일일이 코드로 명시하지 않은 동작을 데이터로부터 학습하여 실행할 수 있도록 하는 알고리즘을 개발하는 연구 분야"  by 아서 사무엘 (1959)

- 인공 지능의 한 분야

- 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야

- ex. 기계 학습을 통해서 수신한 이메일이 스팸인지 아닌지를 구분할 수 있도록 훈련

- 기계 학습의 핵심은 표현(representation)과 일반화(generalization)에 있다. 표현이란 데이터의 평가이며, 일반화란 아직 알 수 없는 데이터에 대한 처리이다.

- 다양한 기계 학습의 응용이 존재 & 문자 인식은 이를 이용한 가장 잘 알려진 사례

- 알고리즘의 유형 : 크게 3가지로 분류 - 지도학습 / 비지도학습 / 강화학습

 

 

머신러닝의 알고리즘 분류 - 지도학습 / 비지도학습 / 강화학습

 

1. 지도 학습 (Supervised Learning) 이란? 

- 정답이 주어진 상태에서 학습하는 알고리즘 (이미 분류가 존재한 상태에서 추가 데이터를 분류)

- 훈련 데이터(Training Data)로부터 하나의 함수를 유추해내기 위한 기계 학습(Machine Learning)의 한 방법

- 이렇게 유추된 함수 중 연속적인 값을 출력하는 것을 회귀분석(Regression)이라 하고 주어진 입력 벡터가 어떤 종류의 값인지 표식하는 것을 분류(Classification)라 한다.

- 즉 지도학습의 목적은 회귀 생성(Regression)과 분류(Classification)라고 할 수 있다.

- 이를 달성하기 위해서는 학습기가 "알맞은" 방법을 통하여 기존의 훈련 데이터로부터 나타나지 않던 상황까지도 일반화하여 처리할 수 있어야 한다.

 

> 지도 학습 알고리즘

- 회귀 분석 (Regression)

- 나이브 베이즈 분류 (Naive Bayes Classification)

- 서포트 벡터 머신 (Support Vector Machine)

- 신경망 (Neural Network)

- 은닉 마르코프 모델 (Hidden Markov Model)

 

> 평가 방법

- 훈련 데이터로부터 하나의 함수가 유추되고 나면 해당 함수에 대한 평가를 통해 파라미터를 최적화한다. 이러한 평가를 위해 교차 검증(Cross-Validation)이 이용된다.

- 교차 검증을 통하여 훈련된 각 함수에 대해 정밀도(Precision)와 재현율(Recall)를 측정할 수 있다.

 

정밀도(Precision), Recall(재현율), 정확도(Accuracy) 의 정의

 

 

2. 비지도 학습 (Unsupervised Learning) 이란?

- 정답이 주어지지 않은 상태에서 데이터의 특성을 학습하는 알고리즘 (분류가 안된 데이터들을 분류)

- 데이터가 어떻게 구성되었는지를 알아내는 문제의 범주에 속하는 기계 학습의 일종

- 이 방법은 지도 학습 혹은 강화 학습과는 달리 입력값에 대한 목표치(분류된 값)가 주어지지 않는다.

- 비지도 학습은 통계의 밀도 추정(Density Estimation)과 깊은 연관이 있다.

- 데이터의 주요 특징을 요약하고 설명할 수 있다.

 

> 비지도 학습 알고리즘

- 군집화 (Clustering), k-평균 군집화 (K-means Clustering)

- 독립 성분 분석 (Independent Component Analysis)

- 차원 축소 (Dimension Reduction)

 등 여러가지 알고리즘 존재

 

 

댓글