[머신러닝] 데이터 관련 개념 이해하기 - 확장판
Computer Vision

[머신러닝] 데이터 관련 개념 이해하기 - 확장판

반응형

 

 

'머신러닝'이라는 음식을 만들 때 필요한 '데이터 레시피'

 

  • 검증용 데이터는 모델의 성능 평가를 위해 존재하는 것이 아니라, 모델의 성능을 '조정'하기 위해 존재한다.
더보기

 더 정확하게는 과적합 유무 판단  하이퍼 파라미터 튜닝을 위해 존재한다.

 

 

 

 

  • 하이퍼 파라미터는 '모델의 성능에 영향을 주는 매개변수' 이며, 가중치, 편향 등의 변수를 매개변수 라고 한다.
더보기

더 정확하게는 하이퍼 파라미터는 '사용자 설정 변수'이며, 매개변수는 '모델이 학습하는 과정에서 얻어지는 값'이다.

즉, 사용자가 '매개 변수'를 바꾸는 등의 행동 못한다.

 

 

 

  • 훈련 데이터는 문제지, 검증 데이터는 모의고사, 테스트 데이터는 최종 평가인 '수능'이다.

train data로 모델 훈련시키고,

Validation data를 사용해서 정확도를 검증하며 하이퍼파라미터를 튜닝하고,

하이퍼 파라미터 튜닝이 끝났다면

Test data로 모델의 진짜 성능 평가 실시.

 

만약, 검증 데이터와 테스트 데이터가 충분치 않다면 k-fold 교차 검증이라는 방법 사용해서 극복.

반응형