하이퍼파라미터 튜닝

    [머신러닝] 데이터 관련 개념 이해하기 - 확장판

    검증용 데이터는 모델의 성능 평가를 위해 존재하는 것이 아니라, 모델의 성능을 '조정'하기 위해 존재한다. 더보기 더 정확하게는 과적합 유무 판단 및 하이퍼 파라미터 튜닝을 위해 존재한다. 하이퍼 파라미터는 '모델의 성능에 영향을 주는 매개변수' 이며, 가중치, 편향 등의 변수를 매개변수 라고 한다. 더보기 더 정확하게는 하이퍼 파라미터는 '사용자 설정 변수'이며, 매개변수는 '모델이 학습하는 과정에서 얻어지는 값'이다. 즉, 사용자가 '매개 변수'를 바꾸는 등의 행동 못한다. 훈련 데이터는 문제지, 검증 데이터는 모의고사, 테스트 데이터는 최종 평가인 '수능'이다. train data로 모델 훈련시키고, Validation data를 사용해서 정확도를 검증하며 하이퍼파라미터를 튜닝하고, 하이퍼 파라미터..