본문 바로가기

머신러닝 & 딥러닝 공부/호기심 기록

나를 위한 머신러닝 용어정리

반응형

[머신러닝]

- 인공지능 : 학습, 문제 해결, 패턴 인식 등 인지 문제를 해결하는 컴퓨터 공학 분야로 1943년 처음으로 개념이 태동했다.

 

- 머신러닝 : 인공지능을 구현하는 기존방식(:코드로 수행 방법 명시)과 달리 대량의 데이터로부터 학습하고 , 학습 된 모델을 통해 예측/판단

 

-지도학습(Supervised Learning) : 라벨이 붙은 데이터를 학습한 후 신규 데이터에 라벨을 붙임 eg) 분류 : 이미지 분류 , 회귀 : 가격 예측

-비지도학습(Unsupervised Learning) : 라벨이 없는 데이터 들에서 패턴을 찾음 eg) 연관 규칙 : 유사 단어 클러스터링, 군집 : 유사 이미지 클러스터링

-강화학습(Reinforcement Learning) : 피드백 또는 보상을 통하여 학습을 진행 eg) 보상 : 알파고 , 체스게임

 

-머신러닝을 위한 6단계 

1) 문제 정의 및 모델 선정 -> 2) 데이터 수집 -> 3) 데이터 전처리 -> 4) 특징 추출 ->5) 학습 -> 6) 검증

 

-지도학습 알고리즘 9가지

1. KNN : 최근접 이웃 (K-Nearest Neighbor) 으로 가장 고전적이면서도 직관적인 머신러닝 기법이다.

2. 나이브 베이즈
3. 의사결정나무
4. 분류 규칙 학습자
5. 선형 회귀
6. 회귀 트리
7. 모델 트리
8. 신경망
9. 서포트 벡터 머신

 

-교차 검증(cross validation) : 우리는 머신러닝을 진행할 때 train set 을 통해 학습시키고 , test set을 통해 성능을 확인한다. 이 때, train 하는 과정에서 파라미터 튜닝하고 다시 성능을 체크하다보면 사실상 test set 이 validation set으로 사용되면서  test set의 과적합(overfitting)이 일어날 수 있다. 그러므로 아래 그림과 같이 test set 을 바꿔가면서 정확도를 확인한다면 과적합을 어느정도 피할 수 있다, 이것을 교차검증이라고 한다.

 

 

 

 

반응형