티스토리 뷰

 

 

머신러닝 알고리즘은

  • 지도학습(Supervised learning) 
  • 비지도학습 (Unsupervised learning)
  • Others : 강화학습(Reinforcement learning), 추천 시스템(Recommender systems)

으로 구성되어 있다.


1. 지도학습(Supervised Learning)

지도학습은 특정 input에 대한 output(올바른 답) 샘플(label)의 데이터 셋이 주어져서 이 정보로부터 input과 output의 관계를 유추하는 것이다. 즉, 기존 정보를 토대로 새로운 input에 대한 output을 추측하는 것이다.

 

지도학습은 다시 회귀(Regression)와 분류(Classification)로 나뉜다.

 

 

1.1 회귀(Regression)

회귀는 예측하고자 하는 타겟값이 실수, 즉 숫자인 경우이다. 회귀는 예측 결과가 연속성을 지닌다. 여기서 연속성이란, 말 그대로 연속하는 값을 말한다.

 

다음은 회귀의 대표적인 예제인 주택 크기 대비 집값 예측이다.

 

 


1.2 분류(Classification)

 

분류는 예측하고자 하는 타겟값범주형 변수인 경우이다. 회귀와 다르게, 분류는 예측 결과가 이산값을 가지고 있다. 여기서 이산값이란 0과 1로 처리할 수 있는 값으로써 연속적이 아닌 단속적인 값을 뜻한다.

 

다음 예제와 같는 종양 사이즈에 따른 악성(1)/양성(0) 여부를 분류하는 예제이다.  이처럼 분류를 통해 암 여부(yse or no)로 이진 분류(Binary classification)를 할 수 있다.

 

 

그리고 아래와 같이 악성으로 판명이될 경우, 여러 유형의 암 진단을 출력할 수 있다. 이처럼 분류를 통해 암 여부 및 종류 (Yes or Type1 or Type2)로 다중 분류도 할 수 있다.

 

 

 

당연히, input으로 종양의 크기뿐만 아니라 다른 조건(나이, 종양의 두께 등)도 추가할 수 있다.

 


2. 비지도학습(Unsupervised Learning)

비지도 학습은 지도학습과 다르게 데이터셋에 정답이 없기 때문에 예측한 것이 틀렸는지 맞는지는 모른다. 그래서 주로 데이터에 숨겨진 특징이나 구조를 파악하는 데이터 마이닝의 성격을 띤다.

 

비지도 학습은 다시 Clustering과 Non-clustering으로 나뉜다.

 

 

2.1 Clustering

클러스터링은 데이터셋에서 비슷한 항목끼리 묶는(Grouping) 알고리즘이다. 

 

예를 들어, 구글 뉴스는 매일 수만가지의 기사를 수집하고, 수집된 기사들을 유사한 항목(동일 topic)으로 묶는다(Clustering). 따라서, 어떤 뉴스를 검색했을 때, 유사한 기사들이 검색된다. 

 

 

 

또 다른 예시는, 비슷한 경력을 가진 사람들끼리 묶는 예제이다.

 

 

 

2.2 이상 탐지(Anomaly detection)

이상 탐지는 말그대로 평상과 다른 이상을 탐지하는 일이다.

 

사기를 피하기 위해 비정상적인 거래, 극단적 데이터 제거 등이다.

 

 

2.3 차원 축소(Dimensionality reduction)

 

차원 축소비슷한 특징들끼리 하나로 묶어서 차원을 말그대로 축소시켜 공간을 심플하게 만드는 작업이다. 

 

예를 들어, 차의 이동거리는 차의 연식과 비례하기 때문에 하나로 축소시킬 수 있다라는 식이다.

 


3. 마무리

- Supervised learning: Learn from data labeled with the "right answers"

- Unsupervised learning: Find something interesting in unlabeled data

 

  Practice quiz: Supervised vs unsupervised learning

 

공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/06   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30
글 보관함