파이썬을 이용한 뉴럴 네트워크 실전

컴퓨터 사이언스/신경망 기초

파이썬을 이용한 뉴럴 네트워크 실전 - 손실함수

KanzesT 2022. 1. 6. 18:37

● 기계학습중 딥러닝 방법은 데이터 주도 학습이다.

기존의 방법론에서는 사람이 특정 패턴과 알고리즘을 찾아내는, 사람의 개입이 필수적인 방법이였다. 하지만 기계학습에서는 사람의 개입이 최소화 되어있으며, 수집한 데이터로 부터 그 패턴을 찾으려는 시도를 하게 된다. 이를 종단간 기계학습 (end-to-end machine learning) 이라한다. 처음부터 끝까지 (데이터 입력부터 목표결과 출력까지) 사람의 개입 없이 얻어진다는 뜻을 담고 있다.

● 데이터는 훈련데이터(training data) 그리고 실험데이터(test data)로 나뉜다.

훈련데이터와 실험데이터를 나눠야 하는 이유는 바로 어느 데이터는 해석할 수 있는 범용능력을 실험데이터로 평가하여야 하기 때문이다.

훈련데이터는 최적의 매개변수를 찾기 위해 사용되며, 실험데이터로 앞서 훈련한 모델의 성능을 평가한다.

만일 실험데이터가 따로 존재하지 않는다면 실험데이터 외의 임의의 데이터를 인지할 수 있는 능력인 범용성을 평가할 수 없다.

한개의 데이터셋에만 지나치게 최적화되며, 다른 임의의 샘플의 인식률이 극히 떨어지는 일을 오버피팅 (overfitting) 이라고 한다.

▶손실함수

가장 많이 쓰이는 손실함수는 평균 제곱 오차(mean squared error) 이다.

이는 앞선 포스팅에 설명되어 있다.

https://blog.naver.com/kanzest/221528705323