Ch.02

벡터의 내적과 정사영: 얼마나 닮았는지 숫자로 재기

챕터별 수학 도식화

챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 중급 수학 흐름을 한눈에 보세요.

좌표 평면: u, v, 정사영

기준 u회전 v그림자잔차 ⊥ u

방향·유사도·수치

−10+1

내적 u·v

13.32

cos θ (방향)

0.969

|proj| / |v|

0.969

v

내적(Dot Product) 은 두 개의 데이터(벡터)가 '얼마나 비슷한 방향을 향하고 있는지'를 단 하나의 숫자 로 알려주는 마법 같은 도구입니다. 정사영(Orthogonal Projection) 은 한 데이터를 다른 데이터라는 벽에 비췄을 때 생기는 그림자 라고 생각하면 쉽습니다. 이번 장에서는 복잡한 데이터를 숫자로 비교하는 방법을 배우고, 이것이 인공지능이 어떻게 비슷한 이미지를 찾고(유사도), 중요한 정보에 집중하는지(어텐션) 알아봅니다.

벡터의 내적과 정사영: 얼마나 닮았는지 숫자로 재기

앞서 배운 벡터가 숫자들을 담은 '상자'라면, 내적 은 두 상자를 열어서 같은 위치에 있는 숫자끼리 짝지어 곱한 뒤 모두 더하는 작업입니다. 수학적으로는 두 데이터의 크기와 그 사이의 각도를 이용해 계산할 수도 있습니다. 정사영 은 이렇게 구한 내적을 이용해, 한 데이터가 다른 데이터의 방향으로 얼만큼 뻗어 나가는지를 그림자 형태로 만들어내는 과정입니다.

아주 쉽게 말해서, 내적은 두 데이터의'궁합 점수' 를 계산하는 것과 같습니다. 방향이 완전히 같으면 양수로 높은 점수가 나오고, 연관성이 없으면(수직) 0점, 정반대면(반대 방향) 음수가 나옵니다. 정사영은 한 쪽의 데이터를 다른 쪽 데이터의 기준에 맞춰 투영(그림자) 해 보는 것과 같습니다.

\mathbf{u} \cdot \mathbf{v} = \|\mathbf{u}\|\|\mathbf{v}\|\cos\theta

인공지능, 특히 딥러닝 에서는 이 '내적'이 숨 쉬듯이 사용됩니다. 인공지능이 수많은 데이터 속에서 패턴을 찾을 때 계산하는 '가중치와 입력값의 곱'이 바로 내적입니다. 또한, 챗GPT 같은 언어 모델이 문장 속에서 어떤 단어에 집중해야 할지 결정하는 어텐션(Attention) 메커니즘이나, 넷플릭스가 내가 좋아할 만한 영화를 찾아주는 추천 시스템 모두 내적과 코사인 유사도를 바탕으로 작동합니다.

한 줄 요약: 내적 은 두 데이터가 얼마나 닮았는지 보여주는 '궁합 점수'이고, 정사영 은 한 데이터를 다른 데이터의 기준에 맞춰 비춘 '그림자'입니다. 코사인 유사도 는 크기를 무시하고 오직 '방향(특징)'만 비교할 때 최고의 도구입니다. 이 개념들은 앞으로 배울 복잡한 인공지능 모델의 뼈대가 됩니다.

이전 장에서 벡터라는 '숫자 상자'를 만드는 법을 배웠다면, 이제는 그 상자들을 서로 비교하고 관계를 맺어주는 법 을 배우는 단계입니다. 데이터들 사이의 거리, 각도, 유사도 를 하나의 숫자로 명확하게 표현할 수 있게 되면, 컴퓨터는 비로소 데이터 간의 관계를 이해하고 더 복잡한 인공지능 모델로 나아갈 수 있습니다.

컴퓨터에게 '강아지와 고양이가 닮았어?'라고 물어보면 이해하지 못합니다. 오직 숫자만 알기 때문이죠. 내적과 코사인 유사도는 이런 모호한 '닮음'이라는 개념을 명확한 점수(수치) 로 바꿔줍니다. 데이터의 크기(길이)와 특징(방향)을 분리해서 분석할 수 있게 해주기 때문에, 수만 개의 특징을 가진 고차원 데이터를 다룰 때 없어서는 안 될 필수 도구입니다.

머신러닝 에서는 나와 가장 비슷한 취향을 가진 사람을 찾는 k-최근접 이웃(kNN) 알고리즘에서 데이터 간의 유사도를 잴 때 쓰입니다. 또한, 정상적인 데이터와 방향이 완전히 다른 데이터를 찾아내는 이상치 탐지(Anomaly Detection) 에도 활약합니다. 스팸 메일을 걸러내거나 환자의 데이터를 보고 질병을 예측할 때도 내부적으로 무수히 많은 내적이 계산됩니다.

기하학적 관점 에서 정사영은 복잡한 세상을 단순하게 보는 안경과 같습니다. 수많은 변수를 가진 복잡한 데이터를 우리가 이해하기 쉬운 2차원이나 3차원 평면 위로 그림자(사영) 를 내려 시각화하는 주성분 분석(PCA) 같은 차원 축소 기법의 핵심 원리가 바로 여기에 있습니다.

아래 표에는 문제 풀이에 필요한 수식과 기호 의미 를 요약했고, 바로 이어지는 항목별 자세한 설명 에서 왜 그렇게 정의되는지까지 짚습니다. 풀이 예시 에는 대표 유형별로 단계를 적어 두었습니다.

\mathbf{u}\cdot\mathbf{v}

연습 문제

아래는 60문제 은행에서 무작위로 뽑은 10문제입니다(쉬움 4·중간 3·어려움 3, 순서는 쉬움→중간→어려움). 각 문항은 객관식이며, 보기 번호를 선택하세요.

z=\mathbf{w}\cdot\mathbf{x}+b

1 / 10

벡터의 내적과 정사영: 얼마나 닮았는지 숫자로 재기

앞서 배운 벡터가 숫자들을 담은 '상자'라면, 내적 은 두 상자를 열어서 같은 위치에 있는 숫자끼리 짝지어 곱한 뒤 모두 더하는 작업입니다. 수학적으로는 두 데이터의 크기와 그 사이의 각도를 이용해 계산할 수도 있습니다. 정사영 은 이렇게 구한 내적을 이용해, 한 데이터가 다른 데이터의 방향으로 얼만큼 뻗어 나가는지를 그림자 형태로 만들어내는 과정입니다.

아주 쉽게 말해서, 내적은 두 데이터의'궁합 점수' 를 계산하는 것과 같습니다. 방향이 완전히 같으면 양수로 높은 점수가 나오고, 연관성이 없으면(수직) 0점, 정반대면(반대 방향) 음수가 나옵니다. 정사영은 한 쪽의 데이터를 다른 쪽 데이터의 기준에 맞춰 투영(그림자) 해 보는 것과 같습니다.

\mathbf{u} \cdot \mathbf{v} = \|\mathbf{u}\|\|\mathbf{v}\|\cos\theta

인공지능, 특히 딥러닝 에서는 이 '내적'이 숨 쉬듯이 사용됩니다. 인공지능이 수많은 데이터 속에서 패턴을 찾을 때 계산하는 '가중치와 입력값의 곱'이 바로 내적입니다. 또한, 챗GPT 같은 언어 모델이 문장 속에서 어떤 단어에 집중해야 할지 결정하는 어텐션(Attention) 메커니즘이나, 넷플릭스가 내가 좋아할 만한 영화를 찾아주는 추천 시스템 모두 내적과 코사인 유사도를 바탕으로 작동합니다.

한 줄 요약: 내적 은 두 데이터가 얼마나 닮았는지 보여주는 '궁합 점수'이고, 정사영 은 한 데이터를 다른 데이터의 기준에 맞춰 비춘 '그림자'입니다. 코사인 유사도 는 크기를 무시하고 오직 '방향(특징)'만 비교할 때 최고의 도구입니다. 이 개념들은 앞으로 배울 복잡한 인공지능 모델의 뼈대가 됩니다.

이전 장에서 벡터라는 '숫자 상자'를 만드는 법을 배웠다면, 이제는 그 상자들을 서로 비교하고 관계를 맺어주는 법 을 배우는 단계입니다. 데이터들 사이의 거리, 각도, 유사도 를 하나의 숫자로 명확하게 표현할 수 있게 되면, 컴퓨터는 비로소 데이터 간의 관계를 이해하고 더 복잡한 인공지능 모델로 나아갈 수 있습니다.

컴퓨터에게 '강아지와 고양이가 닮았어?'라고 물어보면 이해하지 못합니다. 오직 숫자만 알기 때문이죠. 내적과 코사인 유사도는 이런 모호한 '닮음'이라는 개념을 명확한 점수(수치) 로 바꿔줍니다. 데이터의 크기(길이)와 특징(방향)을 분리해서 분석할 수 있게 해주기 때문에, 수만 개의 특징을 가진 고차원 데이터를 다룰 때 없어서는 안 될 필수 도구입니다.

머신러닝 에서는 나와 가장 비슷한 취향을 가진 사람을 찾는 k-최근접 이웃(kNN) 알고리즘에서 데이터 간의 유사도를 잴 때 쓰입니다. 또한, 정상적인 데이터와 방향이 완전히 다른 데이터를 찾아내는 이상치 탐지(Anomaly Detection) 에도 활약합니다. 스팸 메일을 걸러내거나 환자의 데이터를 보고 질병을 예측할 때도 내부적으로 무수히 많은 내적이 계산됩니다.

기하학적 관점 에서 정사영은 복잡한 세상을 단순하게 보는 안경과 같습니다. 수많은 변수를 가진 복잡한 데이터를 우리가 이해하기 쉬운 2차원이나 3차원 평면 위로 그림자(사영) 를 내려 시각화하는 주성분 분석(PCA) 같은 차원 축소 기법의 핵심 원리가 바로 여기에 있습니다.

아래 표에는 문제 풀이에 필요한 수식과 기호 의미 를 요약했고, 바로 이어지는 항목별 자세한 설명 에서 왜 그렇게 정의되는지까지 짚습니다. 풀이 예시 에는 대표 유형별로 단계를 적어 두었습니다.

\mathbf{u}\cdot\mathbf{v}

연습 문제

z=\mathbf{w}\cdot\mathbf{x}+b

1 / 10

수식	기호 의미
$\mathbf{u}\cdot\mathbf{v}$	같은 인덱스 성분끼리 곱해 모두 더한 값; 결과는 스칼라
$\\|\mathbf{u}\\|$	유클리드 놈(길이) $\sqrt{\mathbf{u}\cdot\mathbf{u}}$
$\cos\theta$	$\dfrac{\mathbf{u}\cdot\mathbf{v}}{\\|\mathbf{u}\\|\\|\mathbf{v}\\|}$ — 두 벡터 사이각의 코사인(영벡터 제외)
$\mathrm{proj}_{\mathbf{u}}\mathbf{v}$	$\mathbf{v}$ 를 $\mathbf{u}$ 가 그리는 직선 위로 내린 정사영 벡터
$\mathbf{v}-\mathrm{proj}_{\mathbf{u}}\mathbf{v}$	정사영을 뺀 잔차; 항상 $\mathbf{u}$ 와 직교
단위벡터 $\mathbf{\hat{u}}$	$\\|\mathbf{\hat{u}}\\|=1$ , 사영 길이 $=\|\mathbf{v}\cdot\mathbf{\hat{u}}\|$

수식	기호 의미
$\mathbf{u}\cdot\mathbf{v}$	같은 인덱스 성분끼리 곱해 모두 더한 값; 결과는 스칼라
$\\|\mathbf{u}\\|$	유클리드 놈(길이) $\sqrt{\mathbf{u}\cdot\mathbf{u}}$
$\cos\theta$	$\dfrac{\mathbf{u}\cdot\mathbf{v}}{\\|\mathbf{u}\\|\\|\mathbf{v}\\|}$ — 두 벡터 사이각의 코사인(영벡터 제외)
$\mathrm{proj}_{\mathbf{u}}\mathbf{v}$	$\mathbf{v}$ 를 $\mathbf{u}$ 가 그리는 직선 위로 내린 정사영 벡터
$\mathbf{v}-\mathrm{proj}_{\mathbf{u}}\mathbf{v}$	정사영을 뺀 잔차; 항상 $\mathbf{u}$ 와 직교
단위벡터 $\mathbf{\hat{u}}$	$\\|\mathbf{\hat{u}}\\|=1$ , 사영 길이 $=\|\mathbf{v}\cdot\mathbf{\hat{u}}\|$