\( 28 \times 28\) 크기를 가진 아래와 같은 손글씨 이미지를 판독하려고 한다고 하자.

각각의 이미지는 각 픽셀의 정보를 추출해 764개의 픽셀을 가진 벡터로 생각할 수 있다. 이 벡터들은 휴리스틱한 접근이나, 특정한 규칙을 기반으로 하여 분류될 수도 있으나, 정형화된 규칙을 따르지 않는 예외적인 경우 등에 의해 낮은 정확도를 보인다. 이에 머신러닝을 이용한 방법을 이용해 보도록 하자.
우리의 목표는 \( \mathbf{x} \) 를 입력으로 받아 결과를 나타내는 target vector \( \mathbf{y} \) 를 출력하는 함수 \( \mathbf{y} = f(\mathbf{x}) \) 를 훈련시키는 것이다. 이때, 학습에 사용되는 이미지 \( N \) 장: \( \{ \mathbf{x}_1, \cdots \mathbf{x}_N \}\)을 training set 이라 하며, 함수 \( f \) 를 만들어내는 과정을 학습 이라고 한다.
모델이 훈련된 이후에는 새로운 입력 \( \mathbf{z} \) 에 대해 올바른 출력을 내는지 확인할 수 있는데, 이 집합 \( \mathbf{z} \)를 test set, \( \mathbf{z} \)에 대해 올바른 출력을 내도록 하는 과정을 generalization 이라 한다.
답글 남기기