Ch.01

머신러닝의 출발: 데이터와 특성(Feature)

인공지능이라는 요리를 만들기 위해 가장 먼저 할 일은 좋은 재료(데이터) 를 고르고, 요리하기 좋게 손질(특성 추출) 하는 것입니다. 우리가 보는 세상의 모든 정보가 어떻게 숫자 벡터 라는 마법의 주문으로 변하는지 그 흥미로운 과정을 시작해 봅시다.

챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 머신러닝 흐름을 한눈에 보세요.

이 개념을 표현하는 시각화는 준비 중입니다.

데이터와 특성(Feature): AI가 세상을 보는 안경

x

\mathbf{x} = [x_1, x_2, x_3]^\top

예시로 이해하기 — '중고차 가격'을 예측한다고 해봅시다. 여기서 '주행 거리', '연식', '사고 유무'가 바로 특성(Feature) 입니다. 만약 '차 시트의 색깔' 같은 불필요한 특성을 넣으면 AI는 오히려 혼란에 빠집니다. 즉, 좋은 특성을 뽑아내는 것 이 머신러닝의 핵심 기술입니다.

y

x_1, x_2

x_{smart}

f

이번 챕터에서는 데이터 와 특성(Feature) 이 머신러닝에서 어떤 역할을 하는지, 실제로는 어떻게 쓰이는지 정리했습니다. 데이터는 '(입력, 정답)' 쌍의 집합이고, 특성은 그 입력을 모델이 계산할 수 있는 숫자 벡터 로 바꾼 결과입니다. 좋은 특성을 고르는 특성 공학(Feature Engineering) 이 성능을 크게 좌우하므로, 다음 챕터(KNN, 선형 회귀 등)로 넘어가기 전에 이 개념을 잘 익혀 두시면 좋습니다.

(x, y)