3:["$","$L19",null,{"formats":"$undefined","locale":"ko","messages":{"meta":{"title":"모두의AI","description":"무료 AI·딥러닝·머신러닝 강의. 기초 수학, 기초 딥러닝(내적·신경망·역전파), 기초 머신러닝(KNN·회귀·앙상블)을 챕터별로 배우고 문제로 복습하세요. 인공지능 입문·AI 교육 플랫폼.","keywords":"딥러닝, 머신러닝, AI 교육, 인공지능 강의, 무료 AI 강의, 딥러닝 입문, 머신러닝 입문, 기초 수학, 신경망, 역전파, 내적, 행렬곱, KNN, 선형회귀, 로지스틱회귀, AI 학습, 무료 강의, 딥러닝 강의, 머신러닝 강의","learnTitle":"배우기","learnPageSeoTitle":"기초 딥러닝 | 배우기","learnDescription":"기초 딥러닝 무료 강의: 벡터 내적·행렬곱·선형 계층·활성화 함수·역전파를 챕터별로 배우고 문제로 복습. 시각화와 미니 신경망 Playground로 딥러닝 입문 완성.","learnKeywords":"기초 딥러닝, 딥러닝, 내적, 행렬곱, 신경망, 역전파, 선형 계층, 활성화 함수, 소프트맥스, 배치, 은닉층, 딥러닝 입문, AI 학습, 무료 딥러닝 강의","learnMathTitle":"기초 수학과 인공지능 | 배우기","learnMathDescription":"AI·딥러닝을 위한 기초 수학 무료 강의. 함수, 벡터, 행렬, 지수·로그, 균등·정규분포를 챕터별로 배우세요. 인공지능 수학 입문.","learnMathKeywords":"기초 수학, 함수, 벡터, 행렬, 인공지능, AI 수학, 균등분포, 정규분포, 딥러닝 수학","learnMlTitle":"기초 머신러닝·딥러닝 기초 개념 | 배우기","learnMlDescription":"모두의AI(모두의 ai, 모두의ai) 기초 머신러닝 무료 강의. 머신러닝이란 무엇인지부터 지도학습, 은닉층, KNN, 선형·로지스틱 회귀, 의사결정나무, 앙상블, K-평균, 교차 검증, 추천 시스템까지 챕터별로 배우고 문제로 복습하세요.","learnMlKeywords":"모두의AI, 모두의 ai, 모두의ai, 기초 머신러닝, 머신러닝이란, 딥러닝이란, 머신러닝 정의, 지도학습, 은닉층, KNN, 선형 회귀, 로지스틱 회귀, 의사결정나무, 앙상블, K-평균, 교차 검증, 추천 시스템, 머신러닝 강의, 무료 머신러닝","learnMidMlTitle":"중급 머신러닝 | 배우기","learnMidMlDescription":"기초 모델을 실무 데이터에 적용하기 위한 데이터 전처리(스케일링, 인코딩, 결측치), PCA, SVM, 부스팅 기초, DBSCAN·GMM·이상치 탐지, 파이프라인, 하이퍼파라미터 튜닝을 챕터별로 배웁니다.","learnMidMlKeywords":"중급 머신러닝, 스케일링, 인코딩, 결측치, PCA, SVM, 부스팅, AdaBoost, GBM, DBSCAN, GMM, 파이프라인, Optuna","learnAdvDlTitle":"고급 딥러닝 | 배우기","learnAdvDlDescription":"트랜스포머·BERT·GPT·FlashAttention·ViT·자기지도학습·프롬프트·LoRA·QLoRA·RLHF·DPO·RAG·에이전트·GNN·XAI·오토인코더·VAE·GAN·확산·VLM·음성·지식증류·배포까지, 거대 모델과 생성형 AI를 챕터별로 배웁니다.","learnAdvDlKeywords":"고급 딥러닝, 트랜스포머, BERT, GPT, FlashAttention, ViT, LoRA, QLoRA, RLHF, DPO, RAG, LLM 에이전트, GNN, Grad-CAM, VAE, GAN, 확산 모델, Stable Diffusion, CLIP, Whisper, 지식 증류, TensorRT, vLLM","learnMidDlTitle":"중급 딥러닝 | 배우기","learnMidDlDescription":"가중치 초기화·Adam·학습률 스케줄링·정규화·배치/층 정규화·데이터 증강·CNN·풀링·ResNet·경량 CNN·전이학습·객체 탐지·이미지 분할·토큰화·단어 임베딩·1D CNN·RNN·LSTM·GRU·인코더-디코더·어텐션까지, 안정적 학습과 비정형 데이터 처리를 챕터별로 배웁니다.","learnMidDlKeywords":"중급 딥러닝, 가중치 초기화, Xavier, He, Adam, RMSprop, 학습률 스케줄링, 정규화, 드롭아웃, Batch Norm, Layer Norm, 데이터 증강, CNN, 풀링, ResNet, MobileNet, 전이학습, YOLO, SSD, U-Net, 토큰화, BPE, Word2Vec, GloVe, RNN, LSTM, GRU, 어텐션","learnMidMathTitle":"중급 수학 | 배우기","learnMidMathDescription":"벡터·행렬·선형변환·고유값·그라디언트·야코비안·헤시안·테일러·볼록최적화·조건부확률·베이즈·공분산·다변량정규·MLE·엔트로피·크로스엔트로피까지, 다변수와 불확실성을 다루는 중급 수학을 챕터별로 배웁니다.","learnMidMathKeywords":"중급 수학, 벡터 공간, 내적, 행렬, 선형 변환, 역행렬, 행렬식, 랭크, 고유값, 고유벡터, 그라디언트, 야코비안, 헤시안, 테일러 급수, 볼록 최적화, 조건부 확률, 베이즈 정리, 공분산, MLE, 엔트로피, KL 발산","learnAdvMathTitle":"고급 수학 | 배우기","learnAdvMathDescription":"SVD·텐서·라그랑주·마르코프·몬테카를로·MCMC·EM·MAP·변분추론·바서슈타인·MDP·푸리에·그래프 라플라시안·SDE·랑주뱅·정보기하학 등, 생성 모델과 심화 최적화를 위한 고급 수학을 챕터별로 배웁니다.","learnAdvMathKeywords":"고급 수학, SVD, 유사역행렬, 텐서, 라그랑주, KKT, 마르코프, 몬테카를로, MCMC, EM, MAP, 변분추론, 바서슈타인, MDP, 벨만, 푸리에, 그래프 라플라시안, SDE, 랑주뱅, 스코어 매칭, 정보 기하학","learnAdvMlTitle":"고급 머신러닝 | 배우기","learnAdvMlDescription":"정형 데이터의 SOTA 트리(XGBoost, LightGBM, CatBoost), t-SNE·UMAP 비선형 차원 축소, XAI(PDP·LIME·SHAP), 시계열(ARIMA·Prophet), 추천(행렬분해·FM)·연관규칙·AutoML을 챕터별로 배웁니다.","learnAdvMlKeywords":"고급 머신러닝, XGBoost, LightGBM, CatBoost, t-SNE, UMAP, XAI, SHAP, LIME, PDP, 시계열, ARIMA, Prophet, 추천 시스템, 행렬 분해, FM, AutoML, Optuna","learnPaperReviewHubTitle":"논문 리뷰 | 배우기","learnPaperReviewHubDescription":"AI·딥러닝 논문을 주제별로 정리한 리뷰 허브입니다. 이론·최적화, 경량화, 아키텍처, 정형 데이터, 비전, NLP, XAI, 데이터 중심, 엣지·웹, 도메인 응용 등 카테고리를 선택하세요.","learnPaperReviewHubKeywords":"논문 리뷰, AI 논문, 딥러닝, 머신러닝, 배우기","playgroundTitle":"AI Playground | 신경망·CNN·강화학습","playgroundDescription":"브라우저 무료 AI Playground: MLP 분류기(역전파·결정 경계), 합성곱 CNN(feature map·3×3 커널·ReLU·풀링), Q-러닝 그네 시뮬레이터를 직접 조작하며 딥러닝·컴퓨터 비전·RL을 체험하세요.","playgroundKeywords":"AI Playground, 신경망 Playground, CNN Playground, 합성곱, convolution, feature map, 강화학습 시뮬레이터, Q-learning, MLP, 결정 경계, 역전파, 컴퓨터 비전, 그네, ε-greedy, 무료 AI 실험, 딥러닝 입문","playgroundNnClassifierTitle":"신경망 분류기 Playground","playgroundNnClassifierDescription":"브라우저에서 신경망(MLP)을 직접 학습시키는 무료 실험실. K-컬쳐 데이터(태극·단청·K-웨이브·K-Pop), X₁·X₂·sin 피처, 은닉층 추가·뉴런 조절, 학습률·정규화, 실시간 결정 경계와 손실을 확인하며 역전파·SGD를 체험하세요.","playgroundNnClassifierKeywords":"신경망 분류기, Playground, MLP, 결정 경계, 역전파, 미니배치 SGD, 활성화 함수, ReLU, Tanh, L1 L2 정규화, 딥러닝 실습, 무료 신경망 시뮬레이터, K-컬쳐 데이터셋","playgroundRlTitle":"그네 강화학습 에이전트 Playground","playgroundRlDescription":"Q-러닝으로 로봇이 그네 밀기 타이밍을 스스로 배우는 무료 브라우저 시뮬레이터. 진자 물리·6가지 그네 환경·α·γ·ε 조절·실시간 보상 그래프·벨만 업데이트 수식으로 강화학습 입문.","playgroundRlKeywords":"강화학습, reinforcement learning, Q-learning, Q-러닝, 그네, 진자, pendulum, swing, RL agent, RL Playground, ε-greedy, 탐험과 활용, 보상 함수, 에피소드, 벨만, MDP, 무료 RL 시뮬레이터","playgroundRlAbout":"강화학습(Q-러닝)","playgroundRlFeature1":"진자 그네 물리 시뮬레이션","playgroundRlFeature2":"6가지 환경 프리셋(밧줄·마찰·바람)","playgroundRlFeature3":"실시간 Q-러닝 학습과 에피소드 보상 차트","playgroundRlFaq1Q":"이 Playground에서 무엇을 배우나요?","playgroundRlFaq1A":"상태(각도·각속도)를 이산화한 Q-표로 왼쪽 밀기·가만히·오른쪽 밀기 행동을 학습합니다. 그네 높이에 비례한 보상과 ε-greedy 탐험으로 강화학습의 기본 루프를 체험할 수 있습니다.","playgroundRlFaq2Q":"보상은 어떻게 계산되나요?","playgroundRlFaq2A":"매 스텝 그네 높이(1−cos θ)에 비례한 보상을 주고, 충분히 높이 오르면 추가 보너스를 줍니다. 밀기 행동에는 작은 비용이 있으며, 과도한 속도·각도에서는 에피소드가 종료됩니다.","playgroundRlFaq3Q":"α, γ, ε는 무엇인가요?","playgroundRlFaq3A":"α(학습률)는 Q값 갱신 속도, γ(할인율)는 미래 보상 반영, ε(탐험률)는 무작위 행동 비율입니다. 슬라이더로 조절하며 학습 곡선 변화를 관찰할 수 있습니다.","playgroundCnnTitle":"합성곱 CNN Playground | feature map·커널 실습","playgroundCnnDescription":"16×16 K-컬쳐 이미지에 3×3 합성곱 필터를 적용하고 feature map을 실시간 확인하는 무료 CNN 실험실. Sobel·블러·샤프·엣지 프리셋 7종, ReLU·맥스풀링, 슬라이딩 애니메이션·패딩 모드로 합성곱·컴퓨터 비전 입문.","playgroundCnnKeywords":"CNN, 합성곱, convolution, 컨볼루션, feature map, 커널, 필터, ReLU, max pooling, Sobel, 가장자리 검출, 컴퓨터 비전, Playground, K-컬쳐, 딥러닝 실습, 무료 CNN 시뮬레이터, 이미지 필터","playgroundCnnAbout":"합성곱 신경망(CNN)","playgroundCnnFeature1":"태극·단청·한글·K-Pop K-컬쳐 패턴 입력","playgroundCnnFeature2":"Identity·블러·Sobel 등 3×3 커널 프리셋 7종과 직접 편집","playgroundCnnFeature3":"합성곱→ReLU→풀링 파이프라인 실시간 시각화","playgroundCnnFeature4":"▶ 재생·한 걸음으로 커널 슬라이딩 애니메이션","playgroundCnnFeature5":"Valid·Same 패딩 모드 전환","playgroundCnnFaq1Q":"합성곱은 무엇을 하나요?","playgroundCnnFaq1A":"작은 필터(커널)를 이미지 위에서 슬라이딩하며 주변 픽셀과 가중합을 계산합니다. 가장자리·질감·패턴처럼 공간적으로 반복되는 특징을 추출하는 CNN의 핵심 연산입니다.","playgroundCnnFaq2Q":"Sobel 필터는 왜 쓰나요?","playgroundCnnFaq2A":"Sobel X/Y는 밝기 변화가 큰 방향(가로·세로 에지)을 강조합니다. CNN 1층이 학습하기 전에도, 수동 필터만으로 윤곽이 feature map에 드러나는 걸 볼 수 있습니다.","playgroundCnnFaq3Q":"ReLU와 맥스풀링은?","playgroundCnnFaq3A":"ReLU는 음수 응답을 0으로 잘라 활성 특징만 남깁니다. 2×2 맥스풀링은 인접 4칸 중 최댓값만 남겨 크기를 줄이고, 작은 위치 변화에 덜 민감하게 만듭니다.","playgroundCnnFaq4Q":"어떤 커널 프리셋을 쓸 수 있나요?","playgroundCnnFaq4A":"Identity(원본 유지), Gaussian blur, Sharpen, Sobel X/Y(가로·세로 에지), Edge(라플라시안형), Emboss 7가지를 제공합니다. 각 프리셋이 feature map에서 어떤 패턴을 강조하는지 바로 비교할 수 있습니다.","playgroundCnnFaq5Q":"애니메이션은 어떻게 동작하나요?","playgroundCnnFaq5A":"▶ 재생 또는 한 걸음으로 커널이 입력 그리드를 슬라이딩하며 합성곱 출력을 한 칸씩 채웁니다. 이어 ReLU와 2×2 맥스풀링 단계도 같은 방식으로 진행되어 CNN 한 층의 흐름을 단계별로 볼 수 있습니다.","playgroundCnnFaq6Q":"설치 없이 무료로 쓸 수 있나요?","playgroundCnnFaq6A":"예. 브라우저만 있으면 바로 실행되는 무료 교육용 Playground입니다. Python·TensorFlow 없이 합성곱·feature map·풀링 개념을 시각적으로 체험할 수 있습니다.","playgroundTransformerTitle":"어텐션 놀이터 Playground | Self-Attention·QKV 실습","playgroundTransformerDescription":"짧은 문장에서 쿼리 토큰을 고르고 Q·K 내적→softmax→V 가중합을 실시간으로 확인하는 무료 Self-Attention 실험실. BERT/GPT 인과 마스크·√d_k 스케일·어텐션 행렬 히트맵·단계별 애니메이션으로 트랜스포머 입문.","playgroundTransformerKeywords":"어텐션, attention, self-attention, 셀프 어텐션, transformer, 트랜스포머, QKV, Query Key Value, softmax, causal mask, 인과 마스크, scaled dot-product, Playground, 딥러닝 실습, 무료 어텐션 시뮬레이터, NLP","playgroundTransformerAbout":"Scaled Dot-Product Self-Attention","playgroundTransformerFeature1":"언어별 7토큰 재미 예문 4종(고양이·로봇·라면·기차)","playgroundTransformerFeature2":"Q·K^T 점수와 softmax 가중치 N×N 히트맵","playgroundTransformerFeature3":"BERT(전체) vs GPT(인과) 마스크 전환","playgroundTransformerFeature4":"√d_k 스케일·수식 패널·토큰 연결 SVG","playgroundTransformerFeature5":"▶ 재생·한 걸음으로 scores→softmax→output 단계 애니메이션","playgroundTransformerFaq1Q":"Q, K, V는 무엇인가요?","playgroundTransformerFaq1A":"Query는 '무엇을 찾을지', Key는 '무엇을 담고 있는지', Value는 '실제로 가져올 정보'입니다. Q와 K의 내적로 관련도 점수를 만들고, softmax로 가중치를 만든 뒤 V를 가중합해 토큰 표현을 업데이트합니다.","playgroundTransformerFaq2Q":"softmax는 왜 쓰나요?","playgroundTransformerFaq2A":"내적 점수를 0~1 사이 가중치로 바꿔, 한 쿼리가 모든 키에 분배하는 '주의 비율'의 합이 1이 되게 합니다. 가장 관련 높은 토큰에 더 큰 비중을 주는 확률적 집중 메커니즘입니다.","playgroundTransformerFaq3Q":"인과 마스크(causal mask)는?","playgroundTransformerFaq3A":"GPT처럼 왼쪽→오른쪽으로만 생성할 때, 미래 토큰(j>i)에 대한 점수를 −∞로 막아 softmax 후 가중치가 0이 되게 합니다. BERT는 양방향이라 전체 토큰을 동시에 볼 수 있습니다.","playgroundTransformerFaq4Q":"√d_k로 나누는 이유는?","playgroundTransformerFaq4A":"차원 d_k가 커지면 내적 값이 커져 softmax가 한쪽으로만 치우칠 수 있습니다. √d_k로 나누면 점수 스케일을 안정화해 학습·해석 모두에 유리합니다.","playgroundTransformerFaq5Q":"설치 없이 무료로 쓸 수 있나요?","playgroundTransformerFaq5A":"예. 브라우저만 있으면 바로 실행되는 무료 교육용 Playground입니다. PyTorch·TensorFlow 없이 Self-Attention의 QKV→softmax→가중합 흐름을 시각적으로 체험할 수 있습니다.","communityTitle":"IT뉴스","communityDescription":"AI·IT 최신 뉴스와 개발 동향을 만나보세요. 새 글이 계속 올라오며, 검색으로 찾아보실 수 있습니다.","communityKeywords":"IT뉴스, AI 뉴스, 인공지능 뉴스, 머신러닝, 딥러닝, LLM, AI 개발 동향, IT 트렌드, AI 소식","studiesTitle":"스터디","studiesDescription":"딥러닝 스터디 모임과 학습 자료를 만나보세요.","curriculumTitle":"책읽기","curriculumDescription":"도서 기반 학습 로드맵을 만들고 공유하세요.","supportTitle":"지원·문의","supportDescription":"모두의AI 서비스 이용 방법, Chrome 확장 프로그램, 배우기·커뮤니티 관련 문의 및 지원 정보입니다.","privacyTitle":"개인정보처리방침","privacyDescription":"모두의AI(배우기·책읽기·커뮤니티·플레이그라운드 등) 개인정보 수집·이용·보관 안내입니다.","termsTitle":"이용약관","termsDescription":"모두의AI 교육 플랫폼(배우기·책읽기·커뮤니티 등) 이용약관입니다.","refundTitle":"환불 정책","refundDescription":"모두의AI 배우기 프리미엄 구독(월 4 USD) 결제·환불·해지 정책입니다.","aboutTitle":"모두의AI란?","aboutDescription":"AI 연구자가 직접 만든 기초 수학·딥러닝 교육 플랫폼. K리그 AI 경진대회 3등, 금융 AI Challenge 22등 등 경험을 바탕으로 기초 이해의 중요성을 전합니다.","kimpoPromoTitle":"김포 AI 교육 제안 | 모두의AI","kimpoPromoDescription":"김포 지역 데이터를 바탕으로 수학·딥러닝·머신러닝을 통합해 배우는 모두의AI 기반 교육 제안 페이지입니다.","kimpoCourseTitle":"김포 AI 교육 과정 소개 | 모두의AI","kimpoCourseDescription":"16차시 수업 구성, 김포 현안 데이터 연계, 팀 프로젝트 흐름을 담은 모두의AI 교육 과정 소개 페이지입니다."},"support":{"title":"지원·문의","intro":"모두의AI(mdooai.com) 서비스 이용 방법, 오류 신고, 제안 사항은 아래 내용을 참고해 주세요.","serviceTitle":"서비스 소개","serviceContent":"모두의AI는 딥러닝·AI를 본질부터 이해할 수 있도록 돕는 교육 플랫폼입니다. 배우기(챕터별 시각화, 일부 챕터 유료 구독), 책읽기(도서 기반 로드맵), 커뮤니티(학습 자료 공유), Chrome 확장 프로그램(새 탭에서 학습 페이지 열기) 등을 제공합니다.","extensionTitle":"Chrome 확장 프로그램","extensionContent":"툴바 아이콘을 클릭하면 학습 페이지(https://mdooai.com/learn)가 새 탭에서 열립니다. 설치·사용 문의는 이 지원 페이지 또는 Chrome 웹 스토어의 확장 프로그램 페이지를 통해 연락해 주세요.","extensionInstallCta":"Chrome 웹 스토어에서 설치하기","contactTitle":"문의하기","contactContent":"서비스 전반에 대한 문의·오류 신고·제안은 mdooai.com 사이트 내 문의 경로, 또는 운영팀에 공개된 연락처로 보내 주시면 됩니다. 가능한 한 빠르게 답변 드리겠습니다.","linksTitle":"관련 링크","learnLink":"배우기","privacyLink":"개인정보처리방침","termsLink":"이용약관","refundLink":"환불 정책","supportUrlLabel":"지원 URL"},"about":{"title":"모두의AI란?","intro1":"안녕하세요. 모두의AI입니다. 머신러닝과 딥러닝을 연구하고 있습니다.","intro2":"여러 AI 경진대회에 참가하며 기업에서 활용되는 다양한 모델을 직접 개발해 온 경험이 있습니다. 그 과정에서 한 가지 중요한 교훈을 얻었습니다. 바로, 테크닉도 중요하지만 성능의 차이를 결정짓는 핵심은 기초에 대한 이해라는 점입니다. 요즘은 바이브코딩으로 모델을 빠르게 구현할 수 있지만, 기대만큼 성능이 나오지 않을 때 원인을 분석하고 개선하는 일은 여전히 쉽지 않습니다. 수학적 기반과 AI 원리에 대한 이해 없이는 병목이 어디서 발생하는지 구조적으로 파악하기 어렵습니다.","intro3":"이 사이트는 그런 시행착오를 줄이기 위해, 개념과 계산을 함께 익힐 수 있도록 구성했습니다.","intro4Before":"그래서 이러한 경험과 공부를 바탕으로, 제가 직접 학습 플랫폼을 개발하여 공개했습니다. 강의나 교육이 필요하신 분은 언제든 편하게 ","intro4After":"으로 연락 주시면 안내해 드리겠습니다.","approachTitle":"학습 방식","approachContent":"개념 정리만 나열하는 것이 아니라, 연산의 흐름을 단계적으로 따라가며 '왜 이렇게 동작하는지' 이해하는 방식으로 구성했습니다. 시각화와 인터랙션을 중심으로, 직접 계산해 보고 AI 코치의 즉시 피드백으로 오개념을 바로잡을 수 있습니다.","roadmapTitle":"앞으로의 계획","roadmapContent":"앞으로는 머신러닝을 포함해 다양한 AI 교육 콘텐츠를 지속적으로 확장해 나갈 예정입니다. 관심있는 분들은 ","roadmapContactAfter":"으로 언제든 편하게 연락 바랍니다.","feedbackNote":"아직 초기 버전이지만 계속 개선 중입니다. 피드백 주시면 적극 반영하겠습니다.","ctaLearn":"배우기 시작하기","ctaDeveloper":"개발자 프로필 보기","chromeExtensionTitle":"Chrome 웹스토어 추가하기","chromeExtensionDesc":"Chrome 확장 프로그램을 설치하면 새 탭에서 학습 페이지를 바로 열 수 있습니다."},"terms":{"title":"이용약관","effectiveDate":"시행일: 2026년 5월 21일 (변경 시 이 페이지에서 안내합니다.)","intro":"모두의AI(mdooai.com)는 딥러닝·머신러닝·수학을 단계별로 학습할 수 있는 교육 플랫폼입니다. 본 약관은 웹사이트 및 관련 서비스 이용 조건을 정합니다.","section1Title":"1. 적용 범위 및 서비스 구성","section1Content":"본 약관은 모두의AI 웹사이트(https://mdooai.com) 및 다음 서비스에 적용됩니다. (1) 배우기: 기초·중급·고급 딥러닝, 수학, 머신러닝 코스, 논문 리뷰, 플레이그라운드(신경망·강화학습·CNN 등 실험), 학습 배지·프로필 등 (2) 책읽기: 도서 기반 학습 로드맵 (3) 커뮤니티·IT뉴스: 게시글·댓글 등 (4) Chrome 확장 프로그램: 새 탭에서 학습 페이지 열기 (5) 기타 소개·지원·법무 페이지. 서비스는 한국어·영어·일본어·중국어(간체)를 지원합니다. 배우기 일부 챕터는 프리미엄(유료 구독)으로 제공될 수 있으며, 유료·무료 범위는 각 챕터·화면 안내를 따릅니다.","section2Title":"2. 계정 및 이용","section2Content":"대부분의 기능은 회원가입·로그인(Clerk 등 인증 서비스 연동) 후 이용할 수 있습니다. 배우기는 챕터별 시각화·문제 풀이·AI 학습 코치(질문 응답) 등을 제공하며, 일부 챕터는 무료·일부는 프리미엄 구독 대상입니다. 책읽기·커뮤니티·플레이그라운드·논문 리뷰 등은 원칙적으로 무료입니다. 프리미엄 구독 요금·결제·환불·해지는 환불 정책 페이지를 따릅니다. 결제 기능이 「준비 중」으로 표시되는 경우에도, 추후 개시 시 본 약관 및 환불 정책이 적용됩니다.","section3Title":"3. 콘텐츠·이용자 게시물·금지 행위","section3Content":"배우기·책읽기 등의 학습 콘텐츠 저작권은 모두의AI 또는 정당한 권리자에게 있습니다. 이용자는 개인 학습 목적으로 열람·이용할 수 있으며, 무단 복제·배포·2차 판매·자동 수집(스크래핑) 등은 금지됩니다. 커뮤니티에 게시한 글·댓글·첨부에 대한 책임은 이용자에게 있으며, 운영 정책에 따라 삭제·이용 제한될 수 있습니다. 타인 계정 도용, 서비스 방해·역공학, 법령 위반, 타인 권리 침해 행위는 금지되며 위반 시 이용이 제한될 수 있습니다.","section4Title":"4. 약관 변경","section4Content":"약관 변경 시 이 페이지에 공지하며, 중요한 변경은 시행일을 명시합니다. 변경 후에도 서비스를 계속 이용하면 변경된 약관에 동의한 것으로 봅니다.","section5Title":"5. 문의","section5Content":"약관·서비스 이용 문의는 https://mdooai.com/support 또는 사이트 내 지원 페이지를 이용해 주세요.","termsUrlLabel":"이용약관 URL"},"refund":{"title":"환불 정책","effectiveDate":"시행일: 2026년 5월 21일 (변경 시 이 페이지에서 안내합니다.)","intro":"모두의AI 배우기 「프리미엄」 구독(월 4 USD, 자동 갱신)의 결제·환불·해지에 관한 정책입니다. 책읽기·커뮤니티·플레이그라운드·논문 리뷰 등은 무료입니다.","section1Title":"1. 구독 대상·요금·결제","section1Content":"프리미엄 구독은 배우기 내 일부 유료 챕터(예: 기초 딥러닝 Chapter 04~12 등, 화면·챕터별 「프리미엄」 안내 기준)와 AI 학습 코치 등 유료 기능에 적용됩니다. 구독료는 월 4 USD이며, 최초 결제일을 기준으로 매월 자동 갱신·청구됩니다. 결제는 Paddle, PayPal 등 결제 대행사를 통해 처리되며, 카드·결제 수단 정보는 당사 서버에 저장하지 않습니다. 체크아웃 화면에 표시된 금액·통화·주기가 우선합니다. 사이트에 「결제 준비 중」이 표시되는 기간에는 실제 결제가 이루어지지 않을 수 있으며, 결제가 개시되면 본 정책이 적용됩니다.","section2Title":"2. 환불","section2Content":"첫 결제일로부터 7일 이내에 서비스에 만족하지 않으신 경우 전액 환불을 요청할 수 있습니다. 7일 경과 후, 또는 두 번째 결제분부터는 해당 결제 주기(당월)에 대한 환불은 제공되지 않습니다. 부분 이용·다운로드 여부와 관계없이 동일하게 적용될 수 있습니다. 환불 요청은 https://mdooai.com/support 또는 결제 시 이용한 결제 대행사(Paddle·PayPal 등) 고객 지원을 통해 진행해 주세요.","section3Title":"3. 해지","section3Content":"구독은 언제든 해지할 수 있습니다. 해지 후에도 현재 결제 주기 종료일까지는 프리미엄 챕터·기능을 이용할 수 있으며, 다음 결제일부터는 청구되지 않습니다. 이미 결제·청구된 해당 월 이용료는 환불되지 않습니다(7일 이내 첫 결제 환불 조건에 해당하는 경우는 제2조를 따릅니다).","section4Title":"4. 적용 및 문의","section4Content":"환불·해지 절차·분쟁 처리는 결제 시점에 안내된 정책 및 해당 결제 대행사 정책을 따릅니다. 문의: https://mdooai.com/support","refundUrlLabel":"환불 정책 URL"},"privacy":{"title":"개인정보처리방침","effectiveDate":"시행일: 2026년 5월 21일 (최종 수정 시 이 페이지에서 안내합니다.)","section1Title":"1. 적용 대상","section1Content":"본 개인정보처리방침은 모두의AI(mdooai.com) 웹사이트 및 관련 서비스(배우기·책읽기·커뮤니티·플레이그라운드·논문 리뷰·Chrome 확장 프로그램·지원 페이지 등)에 적용됩니다. 배우기 일부 챕터·기능은 프리미엄(유료 구독)으로 제공될 수 있습니다.","section2Title":"2. 수집하는 정보","section2Intro":"서비스 이용 시 아래 정보가 수집·이용될 수 있습니다. 인증·호스팅·결제 등은 전문 업체를 통해 처리되며, 각 업체의 정책도 함께 적용됩니다.","section2List1":"계정·인증 정보: 회원가입·로그인 시 이메일, 표시명, 프로필 식별자 등(Clerk 등 인증 서비스를 통해 처리되며, 비밀번호 등은 당사가 직접 저장하지 않을 수 있음)","section2List2":"이용·학습 기록: 챕터 진행, 배지·학습 활동, 커뮤니티 게시·댓글·첨부, 책읽기(커리큘럼) 생성·저장, AI 학습 코치 질문·응답 내용 등","section2List3":"기기·접속 정보: 브라우저 종류, IP·접속 시각, 쿠키·세션 등(서비스 제공·통계·보안·다국어 설정)","section2List4":"결제·구독 정보: 프리미엄 구독 시 결제 대행사(Paddle, PayPal 등)를 통해 처리되며, 카드 번호 등 결제 수단 원문은 당사가 저장하지 않습니다. 구독 상태·결제 식별자·영수증 정보는 유료 기능 제공·환불·해지·고객 지원 목적으로 이용됩니다.","section2List5":"위탁·연동 처리: 커뮤니티·커리큘럼 등 일부 데이터는 Supabase 등 클라우드 DB에 저장될 수 있으며, AI 코치 응답 생성 시 질문·맥락이 AI API(예: Upstage 등)로 전송될 수 있습니다.","section2Extension":"Chrome 확장 프로그램은 사용자 데이터를 수집·전송하지 않습니다. 아이콘 클릭 시 새 탭으로 학습 페이지(https://mdooai.com/learn)를 열어 줄 뿐입니다.","section3Title":"3. 수집 정보의 이용 목적","section3Content":"수집된 정보는 회원 인증, 학습·커뮤니티·책읽기 서비스 제공, 프리미엄 구독 관리, AI 코치·검색 등 기능 운영, 서비스 개선·오류 대응, 보안·부정 이용 방지, 법령 준수 및 이용자 문의 응대에 이용됩니다.","section4Title":"4. 보관 및 파기","section4Content":"개인정보는 이용 목적 달성 후 또는 관련 법령상 보관 기간이 지나면 안전하게 파기·익명화합니다. 계정 삭제·탈퇴·삭제 요청 시 정해진 절차와 각 위탁 업체 정책에 따라 처리합니다.","section5Title":"5. 제3자 제공·위탁","section5Content":"이용자 동의 없이 개인정보를 판매하지 않습니다. 서비스 운영을 위해 Clerk(인증), Supabase(데이터 저장), Paddle·PayPal(결제), AI API 제공자(학습 코치) 등에 필요한 범위에서 처리·위탁될 수 있으며, 법령에 따른 요청이 있는 경우 관련 정보가 제공될 수 있습니다.","section6Title":"6. 정책 변경","section6Content":"개인정보처리방침 변경 시 이 페이지를 수정하여 안내하며, 중요한 변경은 시행일을 명시합니다.","section7Title":"7. 문의","section7Content":"개인정보 처리 문의는 https://mdooai.com/support 또는 사이트 내 지원 페이지를 이용해 주세요.","privacyUrlLabel":"개인정보처리방침 URL"},"common":{"appName":"모두의AI","headerBrand":"모두의 AI","loading":"로딩 중…","close":"닫기","back":"뒤로","backToHome":"← 홈","chapterSelect":"챕터 선택","chapterSearchNoResults":"검색 결과가 없어요.","chapterListEmpty":"챕터가 없어요.","chapters":"배우기","curriculum":"책읽기","community":"커뮤니티","itNews":"IT뉴스","language":"언어","openMenu":"메뉴 열기","closeMenu":"메뉴 닫기","menu":"메뉴","communityComingSoon":"커뮤니티 영역은 준비 중입니다.","searchPlaceholder":"챕터, 개념 검색…","globalSearchPlaceholder":"모든 챕터 검색…","globalSearchNoResults":"검색 결과가 없어요.","answer":"답","wrongAnswerGuideButton":"왜 틀렸을까?","mcTfFalse":"거짓","mcTfTrue":"참","mcCircled1":"①","mcCircled2":"②","mcCircled3":"③","mcCircled4":"④","signIn":"로그인","signUp":"회원가입","myAccount":"내 계정","signOut":"로그아웃","aboutLink":"모두의AI란?","myAchievements":"내 업적","moreServices":"더보기","allServices":"전체서비스","saving":"저장 중…"},"community":{"title":"IT뉴스","subtitle":"AI·IT 최신 뉴스와 개발 동향을 만나보세요.","allPosts":"전체 게시물","viewFullCommunity":"전체 커뮤니티 보기","sortNewest":"최신순","sortOldest":"오래된순","newPost":"새 글","createPost":"글 생성","uploadMaterial":"자료 올리기","uploadTitle":"제목","category":"카테고리","categoryAll":"전체","categoryPlaceholder":"카테고리 선택","category_ai_news":"AI 뉴스","category_ai_basics":"AI 기초","category_machine_learning":"기초 머신러닝","category_deep_learning":"딥러닝","category_nlp":"자연어 처리","category_computer_vision":"컴퓨터 비전","category_llm":"대규모 언어 모델","category_prompt_engineering":"프롬프트 엔지니어링","category_ai_ethics":"AI 윤리","category_ai_tools":"AI 도구 활용","category_study_material":"학습 자료","priceTypeFree":"무료","priceTypePaid":"유료","price":"금액","pricePlaceholder":"예: 10,000원","uploadTitlePlaceholder":"예: 내적 연습 워크시트","uploadDescription":"설명","uploadDescriptionPlaceholder":"자료에 대한 설명과 활용 방법을 적어 주세요.","uploadFile":"파일 첨부 (선택)","uploadSubmit":"게시","uploading":"게시 중…","download":"다운로드","postedAt":"게시","noPosts":"아직 게시물이 없어요. 첫 번째로 공유해 보세요!","searchPlaceholder":"제목·설명 검색","prevPage":"이전","nextPage":"다음","pageOf":"{current} / {total} 페이지","scrollToTop":"맨 위로","signInToPost":"자료를 올리려면 로그인해 주세요.","errorLoad":"게시물을 불러오지 못했습니다.","errorPublish":"게시에 실패했습니다. 다시 시도해 주세요.","errorPriceRequired":"유료일 경우 금액을 입력해 주세요.","backToFeed":"피드로 돌아가기","postedAnUpdate":"게시물을 올렸어요","postLabel":"게시물","inThisPost":"이 게시물에 등장","replyPlaceholder":"{name}님 게시물에 댓글 달기","replyComingSoon":"댓글 기능은 준비 중입니다.","errorPostNotFound":"게시물을 찾을 수 없어요.","deletePost":"글 삭제","deleteConfirm":"이 게시물을 삭제할까요?","errorDelete":"삭제에 실패했습니다.","editPost":"글 수정","comments":"댓글","commentPlaceholder":"댓글을 입력하세요","commentSubmit":"등록","commentSubmitting":"등록 중…","commentEdit":"수정","commentDelete":"삭제","commentDeleteConfirm":"이 댓글을 삭제할까요?","commentCancel":"취소","commentSave":"저장","noComments":"아직 댓글이 없어요.","errorComment":"댓글을 등록하지 못했습니다.","errorCommentEdit":"수정에 실패했습니다.","errorCommentDelete":"삭제에 실패했습니다.","removeFile":"제거","editForbidden":"수정 권한이 없습니다.","backToPost":"게시물로","currentFile":"현재","removeFileLabel":"첨부 파일 제거"},"curriculum":{"title":"책읽기","listTitle":"책읽기","listSubtitle":"도서 기반 학습 로드맵을 만들고 추천받은 책읽기를 확인하세요.","createNew":"새 책읽기","newTitle":"책읽기 만들기","subtitle":"교재를 검색하고, 이 트랙을 따라가면 학습 목표를 달성할 수 있는 책읽기를 만들어 보세요.","searchBooks":"도서 검색","autocompleteLabel":"자동완성","searchResults":"검색 결과에서 선택","searchResultsEmpty":"도서 검색 시 여기에 결과가 표시됩니다.","requiredBookTitle":"도서 제목을 입력해 주세요. (필수)","aiAutoLabel":"AI 자동 생성","generateHint":"도서 제목을 입력한 뒤 버튼을 누르면 AI가 학습 로드맵을 자동으로 만들어 줍니다.","generateWithAI":"AI로 책읽기 자동 생성","fillRequiredToGenerate":"도서 제목을 입력하면 버튼을 사용할 수 있습니다.","resultEmptyHint":"위에서 「AI로 책읽기 자동 생성」을 누르면 여기에 내용이 채워집니다. 수정 후 저장할 수 있습니다.","requiredToSave":"저장하려면 도서 제목과 책읽기 내용을 모두 입력해 주세요.","searchPlaceholder":"책 제목, 저자, 주제 검색…","searchButton":"검색","searching":"검색 중…","noBooks":"검색 결과가 없어요. 다른 검색어로 시도해 보세요.","selectBook":"이 도서로 책읽기 만들기","editBookInfo":"도서 정보 (편집 가능)","searchOrManualHint":"도서를 검색해 선택하거나, 아래 칸에 직접 입력할 수 있습니다. 도서가 없어도 제목만 있으면 책읽기를 만들 수 있습니다.","bookTitle":"도서 제목","bookTitlePlaceholder":"예: 딥러닝 입문","bookImageUrl":"책 표지 이미지 URL","isbnPubdate":"ISBN / 출간일","bookInfo":"책 정보","bookDescription":"책 소개","isbn":"ISBN","pubdate":"출간일","generating":"책읽기 생성 중…","generateError":"책읽기 생성에 실패했습니다. 다시 시도해 주세요.","searchError":"도서 검색에 실패했습니다.","optionalRequest":"추가 요청 (선택)","optionalRequestPlaceholder":"예: 초급자용으로, 2주 과정으로, ML 이해에 집중해서…","resultTitle":"생성된 학습 로드맵","shortDescription":"간단한 설명 (리스트에 표시)","shortDescriptionPlaceholder":"예: 이 책으로 기초부터 고급까지 단계별 학습 로드맵","shortDescriptionHint":"리스트에서 미리보기로 보입니다. 비우면 본문 요약으로 대체됩니다.","editCurriculum":"아래 내용을 필요에 맞게 수정한 뒤 저장할 수 있습니다.","save":"저장하기","saving":"저장 중…","saveSuccess":"저장되었습니다.","saveError":"저장에 실패했습니다.","signInToSave":"저장하려면 로그인해 주세요.","author":"저자","publisher":"출판사","sortNewest":"최신순","sortOldest":"오래된순","sortPopular":"추천순","curriculaSearchPlaceholder":"제목·요약 검색","prevPage":"이전","nextPage":"다음","pageOf":"{current} / {total} 페이지","scrollToTop":"맨 위로","noCurricula":"아직 저장된 책읽기가 없어요. 새로 만들어 보세요!","notFound":"책읽기를 찾을 수 없어요.","like":"추천","likes":"추천 수","createdBy":"개설자","anonymous":"익명","edit":"수정","delete":"삭제","deleteConfirm":"이 책읽기를 삭제할까요?","editCurriculumMenu":"메뉴","editTitle":"책읽기 수정","cancel":"취소","backToCurriculum":"책읽기로","backToDetail":"상세로","editForbidden":"본인만 수정할 수 있어요."},"auth":{"loading":"로딩 중…","signIn":{"title":"로그인","subtitle":"이메일 또는 사용자명과 비밀번호를 입력해 주세요.","identifierLabel":"이메일 또는 사용자명","identifierPlaceholder":"이메일 또는 사용자명 입력","passwordLabel":"비밀번호","passwordPlaceholder":"비밀번호 입력","submit":"계속하기","submitting":"로그인 중…","noAccount":"계정이 없으신가요?","signUpLink":"회원가입"},"signUp":{"title":"계정 만들기","subtitle":"아래 항목을 입력해 회원가입을 진행해 주세요.","usernameLabel":"사용자명","usernamePlaceholder":"4~64자, 영문·숫자 입력","usernameRules":"4~64자, 영문(라틴 문자)만 사용 가능. 특수문자 ^ $ ! . ` # + ~ 는 사용할 수 없어요.","emailLabel":"이메일 주소","emailPlaceholder":"이메일 주소 입력","passwordLabel":"비밀번호","passwordPlaceholder":"비밀번호 입력","submit":"계속하기","submitting":"처리 중…","hasAccount":"이미 계정이 있으신가요?","signInLink":"로그인"},"verifyEmail":{"title":"이메일 인증","subtitleSignIn":"이메일로 전송된 인증 코드를 입력해 주세요.","subtitleSignUp":"가입하신 이메일로 전송된 인증 코드를 입력해 주세요.","codeLabel":"인증 코드","codePlaceholder":"인증 코드 입력","submit":"확인","submitting":"확인 중…","verifyButton":"인증하기","back":"이전 단계로","backSignIn":"다른 방법으로 로그인"},"errors":{"generic":"요청을 처리하지 못했습니다. 다시 시도해 주세요.","username_length":"사용자명은 4~64자 사이로 입력해 주세요.","username_non_number":"사용자명에 숫자가 아닌 문자(영문 등)를 하나 이상 포함해 주세요.","username_latin_only":"사용자명은 영문(라틴 문자)만 사용할 수 있습니다. 한글은 사용할 수 없어요. 가입 후 표시 이름은 한글로 바꿀 수 있어요.","password_length":"비밀번호 길이 조건을 확인해 주세요.","form_identifier_exists":"이미 사용 중인 이메일 또는 사용자명입니다.","form_identifier_not_found":"일치하는 계정을 찾을 수 없습니다.","form_password_incorrect":"비밀번호가 올바르지 않습니다.","form_code_incorrect":"인증 코드가 올바르지 않습니다.","form_password_compromised":"비밀번호 보안 문제가 감지되었습니다. 이메일 인증 등 다른 방법으로 로그인해 주세요.","user_locked":"잠시 동안 로그인할 수 없습니다. 나중에 다시 시도해 주세요.","display_name_min_length":"사용자명은 4글자 이상 입력해 주세요.","second_factor_not_supported":"이 서비스는 아이디·비밀번호 로그인만 사용합니다. 계정에 2단계 인증(MFA)이 켜져 있으면 Clerk 관리 콘솔에서 인스턴스의 MFA 정책을 조정하거나, 사용자 프로필에서 MFA를 끈 뒤 다시 시도해 주세요."}},"paperReview":{"title":"AI논문","navTitle":"AI논문","hubTitle":"AI논문","hubDescription":"논문을 주제별로 나누어 정리합니다. 관심 분야 카테고리를 선택하세요.","hubFlatListTitle":"공개된 AI논문","hubFlatListLead":"카테고리·학회 허브와 세부 논문 페이지로 바로 이동할 수 있습니다.","hubFlatListCount":"총 {count}편","hubFlatListPaperLabel":"세부 논문","scopeHeading":"분류 대상","keywordsHeading":"키워드","seoTitleSuffix":"CPAL 2026 논문 리뷰 | 모두의AI","categories":{"theoreticalFoundations":{"sidebarTitle":"이론·수학 기반","headline":"Theoretical AI & Mathematical Foundations (이론 및 수학적 기반)","scope":"인공지능 알고리즘의 수학적 증명, 최적화 이론, 함수 해석학, 선형대수학적 접근을 다루는 논문 (예: Influence Function 관련 논문이 여기에 해당합니다).","keywords":"수리적 증명, 최적화, 알고리즘 기초, 통계적 학습 이론"},"modelOptimization":{"sidebarTitle":"모델 최적화·경량화","headline":"Model Optimization & Efficient AI (모델 최적화 및 경량화)","scope":"연산 효율성을 극대화하기 위한 Low-Rank Approximation, LoRA, 양자화(Quantization), 가지치기(Pruning) 등 모델 압축 및 가속화 관련 논문.","keywords":"경량화, 파라미터 효율성, 추론 속도 개선, 메모리 최적화"},"coreArchitecture":{"sidebarTitle":"핵심 아키텍처·알고리즘","headline":"Core Architecture & Algorithms (핵심 아키텍처 및 알고리즘)","scope":"새로운 Transformer 변형 구조, CNN, GNN 등 모델의 뼈대가 되는 새로운 신경망 구조나 학습 방법론(Loss function, Optimizer 등)을 제안하는 논문.","keywords":"모델 구조, 딥러닝 아키텍처, 학습 알고리즘"},"predictiveTabular":{"sidebarTitle":"예측 모델링·정형 데이터","headline":"Predictive Modeling & Tabular Data (예측 모델링 및 정형 데이터)","scope":"트리 기반 모델 발전, 정형 데이터(Tabular data) 분류/회귀, 이탈 예측, 스포츠 경기 지표 예측 등 캐글(Kaggle) 대회나 실제 비즈니스 환경에서 자주 쓰이는 예측 모델링 논문.","keywords":"머신러닝, 시계열, 정형 데이터, 예측 모델"},"automatedMl":{"sidebarTitle":"AutoML·ML 파이프라인","headline":"Automated ML & End-to-End ML Pipelines (자동 머신러닝 및 ML 파이프라인)","scope":"AutoML, 신경망 탐색(NAS), 하이퍼파라미터·모델 탐색, 메타러닝, 그리고 자연어 등 인터페이스로 전처리·학습·평가·배포까지 연결하는 자동화·파이프라인 논문.","keywords":"AutoML, HPO, NAS, 메타러닝, MLOps, 파이프라인 자동화"},"visionMultimodal":{"sidebarTitle":"컴퓨터 비전·멀티모달","headline":"Computer Vision & Multimodal (컴퓨터 비전 및 멀티모달)","scope":"얼굴 인식 및 분석, 객체 탐지, 이미지 분할, 또는 이미지와 텍스트를 함께 처리하는 멀티모달 모델 관련 논문.","keywords":"비전 처리, 이미지 분석, 멀티모달 딥러닝"},"nlpLlm":{"sidebarTitle":"NLP·LLM","headline":"NLP & Large Language Models (자연어 처리 및 LLM)","scope":"언어 모델링, 텍스트 분류, 번역, 다국어 처리, 프롬프트 엔지니어링, RAG(검색 증강 생성) 등 텍스트 기반 AI 논문.","keywords":"LLM, 자연어 이해/생성, 텍스트 마이닝"},"trustworthyXai":{"sidebarTitle":"신뢰성·XAI","headline":"Trustworthy AI & XAI (신뢰성 및 설명 가능한 AI)","scope":"블랙박스 모델의 해석(XAI), 아웃라이어에 대한 강건성(Robustness) 분석, 데이터 어트리뷰션, AI 윤리 및 안전성을 다루는 논문.","keywords":"설명 가능성, 강건성, 모델 진단, 신뢰할 수 있는 AI"},"dataCentricFeatures":{"sidebarTitle":"데이터 중심·특성 공학","headline":"Data-Centric AI & Feature Engineering (데이터 중심 AI 및 특성 공학)","scope":"모델 구조보다 데이터의 품질, 피처 추출 방법, 데이터 증강(Augmentation), 노이즈 라벨 처리 등에 집중하여 성능을 끌어올리는 연구.","keywords":"데이터 전처리, 특성 공학, 데이터 증강"},"edgeWebServices":{"sidebarTitle":"엣지·웹·서비스","headline":"AI Services & Edge/Web Computing (AI 서비스 및 엣지/웹 컴퓨팅)","scope":"TensorFlow.js 등을 활용한 브라우저 내 추론, 모바일 환경 탑재, 크롬 익스텐션 등 사용자 단말(Edge)에서 직접 구동되는 AI 모델이나 서비스 배포 환경을 다루는 논문.","keywords":"온디바이스 AI, 웹 AI, 배포 최적화"},"domainApplications":{"sidebarTitle":"도메인 특화 응용","headline":"Domain-Specific Applications (도메인 특화 응용 AI)","scope":"교육용 AI, AI 코치 시스템, 추천 알고리즘 등 특정 산업이나 실생활 문제 해결에 딥러닝을 응용한 사례 중심의 논문.","keywords":"교육 AI, 추천 시스템, 헬스케어, 개인화 서비스"}},"papers":{"sidebarYear2025":"2025","sidebarYear2026":"2026","sidebarVenueCpal":"CPAL","sidebarVenueIcml":"ICML","sidebarVenueIclr":"ICLR","cpal2026":{"sidebarLabel":"CPAL2026","hubTitle":"CPAL2026","hubDescription":"이론·수학 기반 분류에서 다루는 CPAL 2026 관련 논문입니다.","metaTitle":"CPAL2026","metaDescription":"CPAL 2026 논문 허브. 이론 및 수학적 기반 카테고리."},"nlpCpal2026":{"hubTitle":"CPAL2026","hubDescription":"NLP 및 대규모 언어 모델 분류에서 다루는 CPAL 2026 관련 논문입니다.","metaTitle":"CPAL2026","metaDescription":"CPAL 2026 논문 허브. NLP 및 대규모 언어 모델 카테고리."},"influenceKernelVonMises":{"sidebarTitle":"Kernel von Mises Formula of the Influence Function","title":"Kernel von Mises Formula of the Influence Function","placeholder":"리뷰 본문을 준비 중입니다.","metaTitle":"Kernel von Mises Formula of the Influence Function","metaKeywords":"Influence Function, Kernel von Mises, CPAL 2026, 논문 리뷰, 통계적 영향함수, von Mises kernel","metaDescription":"CPAL 2026 논문 리뷰: Kernel von Mises Formula of the Influence Function. Influence Function과 커널 폰미제스 공식 요약·직관."},"curseDepthLlm":{"sidebarTitle":"The Curse of Depth in Large Language Models","title":"The Curse of Depth in Large Language Models","placeholder":"리뷰 본문을 준비 중입니다.","metaTitle":"The Curse of Depth in Large Language Models","metaKeywords":"LLM, curse of depth, LayerNorm Scaling, CPAL 2026, 대규모 언어 모델, Transformer","metaDescription":"CPAL 2026 논문 리뷰: The Curse of Depth in Large Language Models. 깊이 저주와 LayerNorm Scaling 완화·실험 요약."},"polarQuant":{"sidebarTitle":"PolarQuant: Quantizing KV Caches with Polar Transformation","title":"PolarQuant: Quantizing KV Caches with Polar Transformation","description":"랜덤 전처리와 극좌표 변환으로 KV 캐시의 각도만 양자화해 정규화 오버헤드를 지우는 PolarQuant를, 수식 전개부터 실무적 의미까지 딥다이브합니다.","placeholder":"리뷰 본문을 준비 중입니다.","viewOriginalPdf":"원문 논문 PDF 보기","metaTitle":"PolarQuant 논문 리뷰 | KV 캐시 양자화 (arXiv 2502.02617)","metaKeywords":"PolarQuant, arXiv 2502.02617, KV cache, KV cache quantization, LLM inference, long context, attention cache, VRAM, polar transformation, random preconditioning, angle quantization, INT4, FP16, 모두의AI","metaDescription":"arXiv 2502.02617 PolarQuant 리뷰: 랜덤 전처리·극좌표로 KV 캐시 4.2배+ 압축, LLM 추론·VRAM 절감. 각도 양자화와 장문맥 품질을 수식·직관으로 정리합니다."},"coreCpal2026":{"hubTitle":"CPAL2026","hubDescription":"핵심 아키텍처·알고리즘 분류에서 다루는 CPAL 2026 관련 논문입니다.","metaTitle":"CPAL2026","metaDescription":"CPAL 2026 논문 허브. 핵심 아키텍처 및 알고리즘 카테고리."},"alphaFormerEndToEnd":{"sidebarTitle":"AlphaFormer: End-to-End Symbolic Regression of Alpha Factors with Transformers","title":"AlphaFormer: End-to-End Symbolic Regression of Alpha Factors with Transformers","description":"합성 시계열로 트랜스포머를 사전학습하고, 선형 알파 풀·IC·PPO로 해석 가능한 심볼릭 팩터를 엔드투엔드 생성하는 AlphaFormer 논문을 딥다이브합니다.","placeholder":"리뷰 본문을 준비 중입니다.","viewOriginalPdf":"원문 PDF 보기","metaTitle":"AlphaFormer: End-to-End Symbolic Regression of Alpha Factors with Transformers","metaKeywords":"AlphaFormer, alpha factor, symbolic regression, Transformer, CPAL 2026, 퀀트, PPO, IC","metaDescription":"CPAL 2026 AlphaFormer 논문 리뷰: 트랜스포머 알파 팩터 심볼릭 회귀, 알파 풀·IC·PPO와 수식·직관 정리."},"icml2025":{"sidebarLabel":"ICML 2025"},"iclr2025":{"sidebarLabel":"ICLR 2025","hubTitle":"ICLR 2025","hubDescription":"AutoML·ML 파이프라인 분류에서 다루는 ICLR 2025 관련 논문입니다.","metaTitle":"ICLR 2025","metaDescription":"ICLR 2025 논문 허브. 자동 머신러닝 및 ML 파이프라인 카테고리."},"autoMlIcml2025":{"hubTitle":"ICML 2025","hubDescription":"AutoML·ML 파이프라인 분류에서 다루는 ICML 2025 관련 논문입니다.","metaTitle":"ICML 2025","metaDescription":"ICML 2025 논문 허브. 자동 머신러닝 및 ML 파이프라인 카테고리."},"automlAgent":{"sidebarTitle":"AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML","title":"AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML","authors":"Patara Trirat, Wonyong Jeong, Sung Ju Hwang","venue":"ICML 2025","abstractHeading":"초록","abstract":"$1a","placeholder":"리뷰 본문을 준비 중입니다.","metaTitle":"AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML","metaKeywords":"AutoML, multi-agent, LLM, ICML 2025, full pipeline, retrieval-augmented planning, AutoML-Agent","metaDescription":"ICML 2025 AutoML-Agent 논문 리뷰: 멀티 에이전트 LLM으로 데이터 수집부터 배포까지 전체 AutoML 파이프라인을 자동화하는 프레임워크 요약."},"sela":{"sidebarTitle":"SELA: Tree-Search Enhanced LLM Agents for Automated Machine Learning","sidebarLabel":"ICLR 2025","title":"SELA: Tree-Search Enhanced LLM Agents for Automated Machine Learning","authors":"Yizhou Chi, Yizhang Lin, Sirui Hong, Duyi Pan, Yaying Fei, Guanghao Mei, Bangbang Liu, Tianqi Pang, Jacky Kwok, Ceyao Zhang, Bang Liu, Chenglin Wu","venue":"ICLR 2025 · arXiv:2410.17238","metaTitle":"SELA: Tree-Search Enhanced LLM Agents for Automated Machine Learning","metaKeywords":"SELA, MCTS, AutoML, LLM agent, UCT-DP, tree search, ICLR 2025, arXiv:2410.17238","metaDescription":"SELA 논문 리뷰: MCTS로 LLM AutoML 파이프라인을 트리 탐색하고, UCT-DP·정규화 점수(NS)로 실험을 정렬하는 방법을 수식과 직관으로 정리합니다."}}},"landing":{"heroTitle":"AI를 쉽게 배우는 곳","heroSubtext":"한 걸음씩, 제대로 배우는 곳","heroTagline":"모두가 AI를 배우는 곳.","forEveryone":"개념부터 계산까지, 직접 풀고 피드백받으며 성장하는 AI 교육 플랫폼.","heroCurriculum":"도서 기반 책읽기를 만들고 다른 학습자와 공유할 수 있어요.","heroCommunity":"커뮤니티에서 학습 자료를 공유하고 다운로드할 수 있어요.","ctaAbout":"모두의AI란?","ctaExplore":"딥러닝","ctaMath":"수학","ctaMl":"머신러닝","ctaPaperReview":"교육과정(예시)","ctaPlayground":"플레이그라운드","ctaBrowse":"책읽기 둘러보기","ctaBrowseCommunity":"커뮤니티 둘러보기","trendingLabel":"바로가기","recentChaptersSectionLabel":"새로 나온 강의","recentChaptersTitle":"최근 추가된 학습·실험","recentChaptersSubtitle":"새로 공개된 챕터와 Playground 실험을 빠르게 확인하고 바로 시작해 보세요.","recentChaptersCardCta":"챕터로 이동","recentChaptersPlaygroundTrack":"Playground","recentChaptersPlaygroundKind":"인터랙티브 실험","recentChaptersPlaygroundCta":"실험 열기","recentChaptersRecentTooltip":"최근 5일 이내에 공개된 콘텐츠입니다","homeOfTitle":"AI 학습의 허브","homeOfSubtitle":"단계별로 발견하고, 직접 풀고, AI 피드백으로 배우세요.","featurePlatformTitle":"배우기 플랫폼","featurePlatformDesc":"기초 수학, 딥러닝, 머신러닝을 챕터별로 배우며, 무제한으로 함께 학습하세요.","featureFasterTitle":"더 빠르게 성장","featureFasterDesc":"개념 정리, 연습 문제, AI 즉시 피드백으로 이해도를 높이세요.","featureExploreTitle":"기초부터 심화까지","featureExploreDesc":"기초수학·딥러닝·머신러닝을 단계별로 배웁니다. 피드백 반영하며 계속 개선 중입니다.","featureBadgeTitle":"업적 & 증명서","featureBadgeDesc":"챕터를 완료하면 업적을 획득하고, 수료 증명서를 발급받을 수 있습니다.","featurePortfolioTitle":"함께 성장","featurePortfolioDesc":"학습을 공유하고, 최신 개발 뉴스를 만나며, 다른 학습자와 소통하세요.","signUpCta":"가입하기","problemTitle":"왜 계산을 직접 해봐야 할까요?","problemBody":"API만 사용하다 보면, 모델이 왜 그런 결과를 냈는지 설명하기 어렵습니다.\n\n내적, 행렬 곱, 그라디언트—이 계산을 직접 해보지 않으면 성능이 왜 떨어졌는지, 어디서 잘못되었는지 감을 잡기 어렵습니다.\n\n대부분의 강의는 결과와 공식만 보여줄 뿐, 계산 과정을 스스로 점검할 기회를 충분히 제공하지 않습니다.","solutionSectionLabel":"이렇게 배워요","solutionTitle":"쉽게 개념을 익히고, 문제를 풀어 보세요. 막히면 AI에게 물어보면 됩니다","solutionIntro":"내적·행렬곱·기울기까지, 딥러닝의 핵심 계산을 12챕터에 걸쳐 체계적으로 배웁니다.","solutionList":"챕터마다 개념 정리와 연습 문제. 틀리거나 막히면 AI에게 물어볼 수 있어요.","solutionBody":"궁금하거나 틀렸을 때 AI 코치에게 질문할 수 있습니다.","ctaStartLearning":"딥러닝 배우기 시작","globalPlatform":"한·영·일·중 지원","learnShortDesc":"기초 딥러닝 12챕터, 내적부터 기울기까지 개념·문제·즉시 채점으로 배웁니다.","heroImageAlt":"AI 학습 배경","dlCardTitle":"기초 딥러닝","advMathCardTitle":"고급 수학","learnAdvMathShortDesc":"SVD·텐서·마르코프·MCMC·변분추론·바서슈타인·SDE·정보기하학 등. 생성 모델과 심화 최적화를 위한 고급 수학을 챕터별로 배웁니다.","ctaAdvMath":"고급 수학 보기","advMlCardTitle":"고급 머신러닝","learnAdvMlShortDesc":"특성 공학·PCA·SVM·부스팅·XGBoost·불균형·이상치·DBSCAN·XAI·SHAP·시계열·추천 시스템 등. 비선형·복잡 데이터·해석 가능성을 챕터별로 배웁니다.","ctaAdvMl":"고급 머신러닝 보기","mlCardTitle":"기초 머신러닝","learnMlShortDesc":"데이터와 특성, KNN, 선형·로지스틱 회귀부터 추천 시스템까지. 기초 머신러닝 핵심을 챕터별로 배웁니다.","learnPaperReviewShortDesc":"모두의AI를 활용한 교육과정 예시를 확인하고, 실제 수업 운영 구성을 한눈에 살펴볼 수 있습니다.","midDlCardTitle":"중급 딥러닝","learnMidDlShortDesc":"가중치 초기화·Adam·정규화·CNN·ResNet·전이학습·객체 탐지·토큰화·RNN·LSTM·어텐션까지. 안정적 학습과 비정형 데이터를 챕터별로 배웁니다.","ctaMidDl":"중급 딥러닝 보기","advDlCardTitle":"고급 딥러닝","learnAdvDlShortDesc":"트랜스포머·BERT·GPT·LoRA·QLoRA·RLHF·RAG·에이전트·GAN·확산·VLM·지식 증류·배포까지. 거대 모델과 생성형 AI를 챕터별로 배웁니다.","ctaAdvDl":"고급 딥러닝 보기","learnMathShortDesc":"함수, 벡터, 행렬부터 균등·정규 분포까지. AI 이해의 기초를 쌓습니다.","mathCardTitle":"기초 수학","midMathCardTitle":"중급 수학","learnMidMathShortDesc":"벡터·행렬·선형변환·고유값·그라디언트·야코비안·헤시안·볼록최적화·베이즈·MLE·엔트로피까지. 다변수와 불확실성의 수학을 챕터별로 배웁니다.","ctaMidMath":"중급 수학 보기","quickAccessTitle":"수학 · 딥러닝 · 머신러닝 · 교육과정","curriculumShortDesc":"도서를 기반으로 나만의 학습 로드맵을 설계하고, 다른 학습자와 함께 성장하세요.","communityShortDesc":"AI·딥러닝 학습 자료를 공유하고, 최신 개발 뉴스가 발행되며, 학습자들과 소통하는 공간입니다.","itNews":"IT뉴스","itNewsShortDesc":"AI·IT 최신 뉴스와 개발 동향을 만나보세요.","coupangBannerText":"쿠팡에서 다양한 상품을 만나보세요"},"adminPopup":{"title":"세션 소개","languageNote":"언어는 한국어로 진행합니다.","meetLinkNote":"세미나 전 구글 밋 링크를 보내드립니다.","freeSeminarNote":"무료 세미나입니다.","seminarDateLabel":"세미나 일시","seminarDateTime":"2026년 3월 27일 금요일 오후 8시~9시","competitionLinkLabel":"대회 링크","applyCta":"신청하기","speakerTitle":"발표자 소개","speakerPara1":"연세대학교에서 인공지능 전공 중인 직장인으로, 인공지능 경시대회에 참여하며 데이터 기반 머신러닝 문제 해결과 모델 성능 개선 과정을 직접 경험해 왔습니다.","speakerPara2":"대회에서 요구되는 문제 정의, 분석, 모델 설계 과정을 중심으로 실제 접근 방식과 판단 기준을 공유합니다.","sessionTitle":"세션 소개","sessionPara1":"본 세션은 인공지능 경시대회에서 제공되는 데이터를 기반으로 머신러닝 문제를 어떻게 해석하고 정의했는지, 그리고 분석 결과를 바탕으로 모델과 전략을 어떻게 개선해 나갔는지를 다룹니다.","sessionPara2":"단순한 알고리즘 설명이나 기법 나열이 아니라, 대회 환경에서 성능이 기대만큼 나오지 않았던 상황에서 어떤 관점으로 데이터를 다시 분석했고, 그 결과를 모델 구조와 추론 전략에 어떻게 반영했는지를 중심으로 설명합니다.","sessionPara3":"인공지능 경시대회라는 제한된 조건 속에서 현실적으로 선택했던 전략과 사고 과정을 공유하는 것이 본 세션의 목표입니다.","mainContentTitle":"주요 내용","mainContent1":"대회 데이터 기반 문제 정의 과정","mainContent2":"분석 결과를 모델 설계로 연결한 판단 기준","mainContent3":"성능 개선이 정체된 상황에서의 전략 수정 사례","mainContent4":"경시대회 환경에서의 일반화 관점과 접근 방법","recommendTitle":"이런 분들께 추천합니다","recommend1":"인공지능 경시대회 문제 접근 방식이 막연한 분","recommend2":"대회 데이터 분석과 모델 설계 흐름을 알고 싶은 분","recommend3":"성능 개선이 정체된 상황에서 방향성이 필요한 분","recommend4":"경시대회에서의 ML 활용 전략을 체계적으로 정리하고 싶은 분","recommend5":"AI 경시대회를 통해 실력을 키우고 싶은 개발자","dismissCheckboxLabel":"3일간 다시 보지 않기"},"home":{"introButton":"서비스 소개","intro":"인공지능을 처음 접하는 학습자가 개념과 수식 앞에서 좌절하지 않도록 돕는 AI 기반 교육 플랫폼입니다. 직접 계산하고, AI 학습 코치의 피드백으로 오개념을 바로잡아 가며, AI가 어떻게 학습하고 판단하는지 단계적으로 이해할 수 있습니다.","problem":"문제","advDlAskProblemContext":"고급 딥러닝 — {chapterTitle}. 현재 문제:\n{problem}","problemPrompt":"아래 벡터의 내적 __DOT_FORMULA__ 를 구하세요.","problemPromptMatrix":"아래 행렬곱 __MATRIX_AB__ 에서 빈 칸(?)에 들어갈 값을 구하세요.","problemPromptLinearLayer":"선형 계층 __LINEAR_FORMULA__ 에서 빈 칸(?)에 들어갈 값을 구하세요.","problemPromptActivation":"주어진 활성화 함수(Sigmoid, ReLU, Tanh₃)에 따라 X에 대한 Y 값을 구해 빈 칸(?)을 채우세요.","problemPromptArtificialNeuron":"인공 뉴런: ReLU, Sigmoid, Tanh 중 지정된 활성화를 적용해 Y를 구하고, 빈 칸(?)을 채우세요.","problemPromptBatch":"배치 연산(가중치 곱하고 편향 더하기, 더하기, 빼기, 곱하기, 평균 빼기, 합계, 평균 등)에서 빈 칸(?)을 채우세요.","prev":"이전","next":"다음","prevChapter":"이전챕터","nextChapter":"다음챕터","inputSectionTitle":"풀이 입력","askSectionTitle":"질문하기","practicePadTitle":"연습장","tabletInkFabAria":"필기 모드 열기","tabletInkFabLabel":"필기","learnToolsFabAria":"학습 도구 메뉴 열기","learnToolsFabLabel":"도구","pageInkModeTitle":"필기 모드 — 화면에 바로 필기합니다","pageInkClear":"필기 지우기","pageInkModeExit":"필기 종료","pageInkCanvasAria":"페이지 위 필기 캔버스","pageInkPaletteAria":"필기 색상 팔레트","pageInkPaletteToggleAria":"색상 팔레트 열기·닫기","pageInkScrollMode":"스크롤 모드","pageInkDrawMode":"필기 모드","pageInkColorSwatchAria":"색상 {color}","fabMenuLabel":"질문하기 메뉴","practicePadSeeMain":"메인 화면에서 문제를 풀어보세요.","drawMode":"손글씨로 쓰기","keyboardMode":"키보드 입력","drawHint":"아래 칸에 손으로 풀이를 그려 보세요. 그린 뒤 「AI에게 채점」을 누르면 피드백을 받을 수 있습니다.","keyboardHint":"아래 칸에 풀이나 답을 입력하세요. 입력한 뒤 「AI에게 채점」을 누르면 피드백을 받을 수 있습니다.","askDrawHint":"궁금한 것을 손글씨로 써 보세요. 쓴 뒤 「질문하기」를 누르면 답변을 받을 수 있습니다.","askKeyboardHint":"궁금한 것을 입력하세요. 「질문하기」를 누르면 답변을 받을 수 있습니다.","askPlaceholder":"예: 이 공식이 왜 이렇게 되나요?","askSubmit":"질문하기","asking":"질문 보내는 중…","askResponseTitle":"답변","drawQuestionLabel":"(그림으로 질문)","askEmptyAlert":"질문을 그리거나 입력한 뒤 질문하기를 눌러 주세요.","errorAsk":"질문 처리 중 오류가 났습니다. 다시 시도해 주세요.","errorAskRequest":"질문 요청 실패","askErrorEmptyQuestion":"질문을 그리거나 입력해 주세요.","solutionErrorNoContent":"풀이를 생성하지 못했습니다.","solutionErrorServer":"풀이 생성 중 오류가 났습니다.","ariaAskInput":"질문 입력","placeholder":"풀이 과정이나 최종 답을 입력하세요. 예: a·b = 3×5 = 15","ariaKeyboardInput":"키보드로 풀이 입력","clear":"지우기","grade":"AI에게 채점","gradeShort":"채점","grading":"채점 중…","correctAnswer":"정답입니다!","wrongAnswer":"오답입니다. 다시 시도해 보세요.","wrongAnswerPanelHint":"오답 시 「왜 틀렸을까?」 힌트가 자동으로 요청됩니다. 정답은 숨기고 풀이 방향만 안내합니다.","tryAgain":"다시 풀어보세요.","checkAnswer":"정답 확인","chapterCompleteTitle":"챕터 완료!","chapterCompleteBadge":"{chapterName} 업적 획득","chapterCompleteLoginHint":"로그인하면 이 챕터가 자동으로 이수 처리되며, 다시 풀지 않아도 됩니다.","chapterCompleteSignInCta":"로그인하고 이수 저장","chapterCompleteTryAgain":"다시 풀기","chapterCompleteNextChapter":"다음 챕터","badgeSaved":"업적이 저장되었습니다.","certificateTitle":"수료 증명서","certificateSubtitlePrefix":"본 증명서는 아래 명시된 자가 모두의AI(https://mdooai.com) 배우기 과정 중 아래 항목을 수료하였음을 ","certificateSubtitleEnd":"증명합니다.","certificateHolder":"발급받은 자","certificateHolderEditHint":"이름을 직접 입력할 수 있습니다.","certificateHolderModalTitle":"발급받은 자 이름을 입력하세요","certificateHolderModalConfirm":"확인","certificateHolderModalPrint":"인쇄하기","certificateHolderEdit":"수정","certificateCompleted":"수료 항목","certificateIssuer":"발급자","certificateIssuerName":"모두의AI","certificateIssuerUrl":"https://mdooai.com","certificateDate":"발급일","certificatePrint":"증명서 인쇄","certificateNoBadges":"수료한 챕터가 없습니다. 챕터를 완료하면 증명서를 발급받을 수 있습니다.","certificateSignInRequired":"증명서 발급을 위해 로그인해 주세요.","certificateIssue":"증명서 발급","profileTitle":"내 학습 현황","profileBadgesSection":"획득한 업적","profileNoBadges":"아직 완료한 챕터가 없습니다.","profileCertificateLink":"수료 증명서 발급","profileMyBadges":"내 업적","profileBadgesCta":"내 업적 보기 / 증명서 발급","badgesPageTitle":"내 업적 & 증명서","badgesPageDesc":"완료한 챕터의 업적과 수료 증명서를 확인하세요.","badgesAdminMode":"(관리자 미리보기)","badgesAdminModeDesc":"모든 업적이 표시되며 인쇄 시 전체가 출력됩니다.","mathFunctionsProblemPrompt":"함수식과 입력값을 보고 빈 칸의 값을 구하세요.","mathFunctionsProblemPromptInput":"f(?) = value일 때 x를 구해 빈 칸을 채우세요.","mathFunctionsProblemPromptCompare":"더 큰 쪽을 골라 1 또는 2를 입력하세요.","mlKnnProblemPrompt":"KNN의 거리 계산과 다수결 규칙을 사용해 정답을 구하세요.","mlLinearRegressionProblemPrompt":"선형 회귀식에서 예측값과 기울기/절편을 계산해 정답을 구하세요.","mlLinearRegressionProblemPromptPredict":"선형 회귀 모델 $\\hat y = w x + b$에서 $w={w}$, $b={b}$일 때, $x={x}$에 대한 예측값 $\\hat y$를 정수로 구하세요.","mlLinearRegressionProblemPromptSlope":"두 점 ({x1}, {y1})과 ({x2}, {y2})를 지나는 직선의 기울기 $w = \\frac{y_2-y_1}{x_2-x_1}$를 정수로 구하세요.","mlLinearRegressionProblemPromptIntercept":"기울기가 $w={w}$인 직선이 점 ({x}, {y})를 지날 때, 절편 $b = y - w x$를 정수로 구하세요.","mlLinearRegressionProblemPromptTwoPointPredict":"두 점 ({x1}, {y1})과 ({x2}, {y2})를 지나는 직선이 있습니다. $x={x}$일 때 직선 위의 $y$값을 정수로 구하세요.","mlLinearRegressionProblemPromptResidual":"직선 $\\hat y={w}x+{b}$로 예측할 때, 실제 관측값이 점 ({x}, {y})일 경우 잔차(residual) $y - \\hat y$를 정수로 구하세요.","mlLinearRegressionProblemPromptResidualSum":"점들 {points}가 있고, 직선 $\\hat y={w}x+{b}$로 예측할 때, 잔차의 합 $\\sum_i (y_i - \\hat y_i)$를 정수로 구하세요.","mlMseProblemPrompt":"오차 제곱, SSE, MSE, RMSE를 계산해 정답을 구하세요.","mlMseProblemPromptSquaredError":"실제값 $y={y}$, 예측값 $\\hat y={yHat}$일 때 오차 제곱 $(y - \\hat y)^2$를 정수로 구하세요.","mlMseProblemPromptSse":"다음 (실제값, 예측값) 쌍들에 대해 오차 제곱합 $\\sum_i (y_i - \\hat y_i)^2$를 정수로 구하세요. {pairs}","mlMseProblemPromptMse":"다음 (실제값, 예측값) 쌍들에 대해 평균 제곱 오차 MSE $= \\frac{1}{n}\\sum_i (y_i - \\hat y_i)^2$를 정수로 구하세요. {pairs}","mlMseProblemPromptMseFromLine":"점들 {points}가 있고, 직선 $\\hat y={w}x+{b}$로 예측할 때 MSE를 정수로 구하세요.","mlMseProblemPromptMissingSquaredError":"MSE $= {mse}$, $n = {n}$이고, $n-1$개 오차 제곱이 {squaredErrors}일 때 나머지 한 개의 오차 제곱을 정수로 구하세요.","mlMseProblemPromptRmse":"MSE $= {mse}$일 때 RMSE $= \\sqrt{\\text{MSE}}$를 정수로 구하세요.","mlMseProblemPromptBinaryCrossEntropyLog2Y1":"이진 분류 한 샘플의 손실 $\\ell = -\\big( y \\log_2 \\hat p + (1-y) \\log_2(1-\\hat p) \\big)$ (밑 $2$). $y=1$, $\\hat p = {pFrac}$일 때 $\\ell$을 정수로 구하세요. 참고: {logHint}","mlMseProblemPromptBinaryCrossEntropyLog2Y0":"이진 분류 한 샘플의 손실 $\\ell = -\\big( y \\log_2 \\hat p + (1-y) \\log_2(1-\\hat p) \\big)$ (밑 $2$). $y=0$, $1-\\hat p = {pFrac}$일 때 $\\ell$을 정수로 구하세요. 참고: {logHint}","mlLogisticProblemPrompt":"로지스틱 회귀의 선형 점수와 결정 경계로 예측값을 구하세요.","mlLogisticProblemPromptLinearScore":"로지스틱 회귀의 선형 점수 $z = wx + b$에서 $w={w}$, $x={x}$, $b={b}$일 때 $z$를 정수로 구하세요.","mlLogisticProblemPromptMultiScore":"선형 점수 $z = w_1 x_1 + w_2 x_2 + b$에서 가중치가 {weights}, 특성이 {features}, $b={b}$일 때 $z$를 정수로 구하세요.","mlLogisticProblemPromptClassifyFromZ":"선형 점수 $z = {z}$일 때 결정 경계($z>0 \\Rightarrow \\hat y=1$, $z \\le 0 \\Rightarrow \\hat y=0$)에 따라 예측 클래스 $\\hat y$를 구하세요.","mlLogisticProblemPromptClassifyFromProb":"확률 $p = {p}$, 임계값 $= {threshold}$일 때 $p \\ge$ 임계값이면 $\\hat y=1$, 아니면 $\\hat y=0$입니다. 예측 클래스 $\\hat y$를 구하세요.","mlLogisticProblemPromptCountClassOne":"다음 선형 점수들에 대해 $z>0$이면 class 1로 분류합니다. class 1로 분류되는 샘플의 개수를 정수로 구하세요. $z$ 목록: {zList}","mlLogisticProblemPromptCountMisclassified":"실제 라벨이 {labels}이고, 각 샘플의 선형 점수 $z$가 {zList}일 때, $\\hat y_i = 1$ if $z_i>0$ else $0$으로 예측합니다. 오분류된 샘플의 개수를 구하세요.","mlDecisionTreeProblemPrompt":"의사결정나무의 분할 규칙과 불순도 지표를 계산해 정답을 구하세요.","mlDecisionTreeProblemSolvingLabel":"문제 풀이를 위한 설명","mlDecisionTreeProblemPromptCountNodes":"의사결정나무에서 내부 노드가 {internal}개, 리프 노드가 {leaves}개일 때 총 노드 개수를 구하세요.","mlDecisionTreeProblemPromptCountLeaves":"의사결정나무에서 리프 노드가 {leaves}개일 때, 리프 노드 개수를 구하세요.","mlDecisionTreeProblemPromptTreeDepth":"의사결정나무의 최대 깊이(루트=0)가 {depth}일 때, 깊이 값을 구하세요.","mlDecisionTreeProblemPromptFollowPath":"의사결정나무에서 경로가 {path}(0=아니오/왼쪽, 1=예/오른쪽)일 때 도달한 리프의 예측 클래스를 구하세요.","mlDecisionTreeProblemPromptLeafMajority":"한 리프에 클래스 0이 {c0}개, 클래스 1이 {c1}개 있습니다. 다수결로 예측할 클래스를 구하세요.","mlDecisionTreeProblemPromptGini":"클래스별 개수가 {counts}일 때 지니 불순도 $G = 1 - \\sum_i p_i^2$를 계산하고, $100 \\times G$의 값(정수)을 구하세요.","mlDecisionTreeProblemPromptEntropy":"클래스별 개수가 {counts}일 때 엔트로피 $H = -\\sum_i p_i \\log_2 p_i$를 계산하고, $100 \\times H$의 값(정수)을 구하세요.","mlDecisionTreeProblemPromptInformationGain":"부모 노드 클래스 개수 {parentCounts}, 왼쪽 자식 {leftCounts}, 오른쪽 자식 {rightCounts}일 때 정보 이득(IG)의 $100 \\times \\text{IG}$의 값(정수)을 구하세요.","mlDecisionTreeProblemPromptWeightedGini":"분할 후 왼쪽 자식 클래스 개수 {leftCounts}, 오른쪽 자식 {rightCounts}일 때 가중 지니 불순도 $(n_L/n)G_L + (n_R/n)G_R$의 $100 \\times$ 값(정수)을 구하세요.","mlEnsembleProblemPrompt":"앙상블의 투표/평균 규칙을 적용해 최종 예측을 구하세요.","mlEnsembleProblemSolvingLabel":"문제 풀이를 위한 설명","mlEnsembleProblemPromptMajorityVote":"랜덤 포레스트에서 클래스 0에 {votes0}표, 클래스 1에 {votes1}표가 나왔습니다. 다수결로 최종 예측 클래스를 구하세요.","mlEnsembleProblemPromptCountVotes":"나무 {totalTrees}그루가 있고, 클래스 0에 {votes0}표, 클래스 1에 {votes1}표입니다. 최종 예측 클래스에 모인 표 수를 구하세요.","mlEnsembleProblemPromptRegressionMean":"회귀 앙상블에서 나무 {B}그루의 예측값이 각각 {predictions}일 때, 평균 $\\hat y = \\frac{1}{B}\\sum_{b=1}^B \\hat y_b$를 계산한 정수를 구하세요.","mlEnsembleProblemPromptNumTrees":"랜덤 포레스트에서 나무가 {B}그루일 때, 나무 개수 $B$를 구하세요.","mlEnsembleProblemPromptOobCount":"나무가 {nTrees}그루이고, 어떤 샘플이 이 중 {nInBag}그루의 부트스트랩 샘플에만 포함되었습니다. 이 샘플이 학습에 사용되지 않은 나무의 개수(OOB 개수)를 구하세요.","mlEnsembleProblemPromptFormulaMean":"앙상블에서 나무 {B}그루의 예측값 합이 {sum}일 때, 평균 $\\hat y = \\frac{1}{B}\\sum_{b=1}^B \\hat y_b$를 계산한 정수를 구하세요.","mlEnsembleProblemPromptDefinition":"다음 설명이 맞으면 1, 틀리면 0을 구하세요. {statement}","mlEnsembleProblemPromptFeatureImportance":"특성별 중요도가 {importances}일 때, 중요도가 가장 높은 특성의 번호(1번부터 시작)를 구하세요.","mlEnsembleProblemPromptWeightedVote":"나무 2그루가 있습니다. 첫 번째 나무는 클래스 {c1}에 가중치 {w1}, 두 번째 나무는 클래스 {c2}에 가중치 {w2}입니다. 가중치가 큰 클래스를 최종 예측으로 구하세요.","mlEnsembleStatement_0":"배깅에서는 각 기본 모델이 독립적으로 학습한다.","mlEnsembleStatement_1":"랜덤 포레스트는 배깅과 의사결정나무를 결합한 앙상블이다.","mlEnsembleStatement_2":"분류 앙상블에서 최종 예측은 보통 다수결(투표)로 정한다.","mlEnsembleStatement_3":"부스팅에서는 이전 모델이 틀린 샘플에 가중치를 주어 순차적으로 학습한다.","mlEnsembleStatement_4":"OOB(Out-of-Bag)는 어떤 샘플이 학습에 쓰이지 않은 나무들로 그 샘플의 예측을 내는 것을 말한다.","mlEnsembleStatement_5":"스태킹에서는 여러 기본 모델의 예측을 입력으로 하는 메타 모델을 쓴다.","mlEnsembleStatement_6":"회귀 앙상블의 최종 예측은 보통 여러 나무 예측값의 평균이다.","mlEnsembleStatement_7":"랜덤 포레스트에서 매 분할마다 전체 특성 중 일부만 무작위로 골라 분할한다.","mlEnsembleStatement_8":"앙상블은 여러 모델의 예측을 합쳐 하나의 예측을 내는 방법이다.","mlEnsembleStatement_9":"단일 의사결정나무보다 랜덤 포레스트가 분산을 줄이는 경향이 있다.","mlEnsembleStatement_10":"부스팅에서는 각 기본 모델이 독립적으로 학습한다.","mlEnsembleStatement_11":"회귀 앙상블에서 최종 예측은 다수결(투표)로 정한다.","mlEnsembleStatement_12":"OOB 평가를 쓰려면 별도의 검증 데이터가 반드시 필요하다.","mlEnsembleStatement_13":"랜덤 포레스트에서 각 나무는 전체 훈련 데이터를 모두 사용해 학습한다.","mlEnsembleStatement_14":"스태킹의 메타 모델은 기본 모델의 원래 입력 특성만 사용한다.","mlEnsembleProblemSolvingTable":"**예시 문제 1 (다수결)**\n\n클래스 0이 3표, 클래스 1이 5표이면 더 많은 쪽은 클래스 1입니다. → **정답 1**\n\n---\n\n**예시 문제 2 (회귀 평균)**\n\n나무 3그루의 예측값이 6, 9, 12이면 합은 27, 평균은 $27 \\div 3 = 9$입니다. → **정답 9**\n\n---\n\n**예시 문제 3 (OOB 개수)**\n\n전체 나무가 10그루이고, 어떤 샘플이 그중 6그루의 부트스트랩에 포함되었다면 OOB 개수는 $10-6=4$입니다. → **정답 4**\n\n---\n\n**예시 문제 4 (정의형 O/X)**\n\n\"회귀 앙상블의 최종 예측은 보통 여러 나무 예측값의 평균이다.\" 맞으면 1, 틀리면 0.\n\n설명이 맞습니다. → **정답 1**","mlKmeansProblemPrompt":"K-Means의 거리, 중심 업데이트, SSE를 계산해 정답을 구하세요.","mlKmeansProblemPromptDistanceSquared":"두 점 ({x1}, {y1})과 ({x2}, {y2}) 사이의 유클리드 거리 제곱 $(x_2-x_1)^2+(y_2-y_1)^2$를 정수로 구하세요.","mlKmeansProblemPromptAssignCluster":"점 ({px}, {py})가 중심이 각각 {centers}일 때, 가장 가까운 중심의 군집 번호(1번부터)를 구하세요.","mlKmeansProblemPromptCenterMeanX":"군집에 속한 점들이 {points}일 때, 새 중심의 $x$ 좌표(평균, 정수)를 구하세요.","mlKmeansProblemPromptCenterMeanY":"군집에 속한 점들이 {points}일 때, 새 중심의 $y$ 좌표(평균, 정수)를 구하세요.","mlKmeansProblemPromptSse":"한 군집의 점들이 {points}, 중심이 ({cx}, {cy})일 때, SSE $\\sum_i \\|\\mathbf{x}_i - \\boldsymbol{\\mu}\\|^2$(거리 제곱의 합)를 정수로 구하세요.","mlKmeansProblemPromptNumClusters":"K-Means에서 군집 개수 $K = {K}$일 때, $K$ 값을 구하세요.","mlKmeansProblemPromptDefinition":"다음 설명이 맞으면 1, 틀리면 0을 구하세요. {statement}","mlKmeansStatement_0":"K-Means는 비지도학습이다.","mlKmeansStatement_1":"K-Means에서는 군집 개수 K를 사용자가 정한다.","mlKmeansStatement_2":"K-Means의 목표는 군집 내 거리 제곱합(SSE)을 최소화하는 것이다.","mlKmeansStatement_3":"할당 단계에서는 각 점을 가장 가까운 중심에 배정한다.","mlKmeansStatement_4":"중심 갱신 단계에서는 각 군집에 속한 점들의 좌표 평균을 새 중심으로 둔다.","mlKmeansStatement_5":"K-Means는 라벨(정답) 없이 데이터만으로 군집을 만든다.","mlKmeansStatement_6":"K-Means에서 거리 비교 시 유클리드 거리(또는 거리 제곱)를 쓴다.","mlKmeansStatement_7":"K-Means는 할당과 중심 갱신을 반복하여 수렴할 때까지 진행한다.","mlKmeansStatement_10":"K-Means는 지도학습이다.","mlKmeansStatement_11":"K-Means에서 K는 알고리즘이 자동으로 정한다.","mlKmeansStatement_12":"K-Means의 목표는 군집 개수를 최대화하는 것이다.","mlKmeansStatement_13":"할당 단계에서는 각 점을 무작위로 군집에 넣는다.","mlKmeansStatement_14":"중심 갱신 시 각 군집의 중앙값(median)을 새 중심으로 둔다.","mlDecisionTreeProblemSolvingTable":"$1b","mlMseProblemSolvingTable":"$1c","mlLogisticProblemSolvingTable":"**풀이 순서**\n\n- **선형 점수** — $z = w x + b$ 또는 $z = w_1 x_1 + w_2 x_2 + b$. 가중치와 특성을 곱해 더한 값.\n- **시그모이드** — $\\sigma(z) = \\frac{1}{1+e^{-z}}$. $z$를 0~1 확률로 변환.\n- **결정 경계** — $z>0 \\Rightarrow \\hat y=1$, $z \\le 0 \\Rightarrow \\hat y=0$. (또는 $\\sigma(z)\\ge 0.5$이면 1)\n- **확률 분류** — 주어진 확률 $p$와 임계값에 따라 $p \\ge$ 임계값이면 $\\hat y=1$, 아니면 0.\n- **오분류 개수** — 각 샘플에서 예측 $\\hat y_i$와 실제 라벨 $y_i$가 다른 개수.\n\n---\n\n**예시 1 (선형 점수)**\n\n$z = 2 \\times 3 + (-1) = 5$. → **정답 5**\n\n---\n\n**예시 2 (z로 분류)**\n\n$z = -2$이면 $z \\le 0$이므로 $\\hat y=0$. → **정답 0**\n\n---\n\n**예시 3 (확률 분류)**\n\n$p=0.7$, 임계값 $0.5$일 때 $0.7 \\ge 0.5$이므로 $\\hat y=1$. → **정답 1**\n\n---\n\n**예시 4 (class 1 개수)**\n\n$z$ 목록이 $-1, 2, 0, 3$이면 $z>0$인 것은 2, 3 두 개. → **정답 2**\n\n---\n\n**예시 5 (오분류 개수)**\n\n라벨 [1, 0, 1], $z$ [2, -1, -3]. 예측: $z>0$이면 1이므로 [1, 0, 0]. 실제 [1,0,1]과 비교하면 세 번째만 다름. → **정답 1**","mathExponentialProblemPrompt":"지수식의 값을 구하세요.","mathExponentialProblemPromptExponent":"지수를 구하세요.","mathExponentialProblemPromptCompare":"더 큰 쪽을 골라 1 또는 2를 입력하세요.","mathExponentialProblemPromptProduct":"같은 밑의 곱: 지수의 합을 구하세요.","mathExponentialProblemPromptQuotient":"같은 밑의 나눗셈: 지수의 차를 구하세요.","mathExponentialProblemPromptPowerOfPower":"거듭제곱의 거듭제곱 값을 구하세요.","mathLogProblemPrompt":"로그의 값을 구하세요.","mathLogProblemPromptInput":"진수를 구하세요.","mathLogProblemPromptCompare":"더 큰 쪽을 골라 1 또는 2를 입력하세요.","mathLogProblemPromptSum":"로그합: $\\log_a(b) + \\log_a(c) = \\log_a(b \\cdot c)$.","mathLogProblemPromptDiff":"로그차: $\\log_a(b) - \\log_a(c) = \\log_a(b/c)$.","mathLimitProblemPrompt":"극한값을 구하세요. (다양한 유형: 다항식, 상수, x→∞, ε-δ 개념)","mathLimitProblemPromptDirect":"다항식의 극한값을 구하세요.","mathLimitProblemPromptConstant":"상수 함수의 극한값을 구하세요.","mathLimitProblemPromptLinear":"일차식의 극한값을 구하세요.","mathLimitProblemPromptAtInfinity":"x → ∞ 일 때 극한값을 구하세요.","mathLimitProblemPromptEpsilon":"ε-δ 정의에서 물어보는 내용에 맞는 번호를 입력하세요.","mathLimitProblemEpsilonQuestion":"ε-δ에서 δ의 의미는?","mathLimitProblemEpsilonHint":"(1=거리, 2=오차)","mathContinuityProblemPrompt":"연속성: 극한값·연속 여부를 구하세요.","mathContinuityProblemPromptLimitPoly":"다항식이 연속이므로 극한값 = 함숫값.","mathContinuityProblemPromptLimitLinear":"일차식의 극한값(연속이므로 함숫값과 같음)을 구하세요.","mathContinuityProblemPromptYesNo":"해당 점에서 연속이면 1, 불연속이면 0을 입력하세요.","mathContinuityProblemPromptLimitAtHole":"구멍이 있는 점에서의 극한값을 구하세요.","mathContinuityProblemAtPoint":"에서 ","mathContinuityProblemContinuousQ":"에서 연속인가요?","mathContinuityProblemLimitAtHoleIntro":"구멍이 있는 함수가","mathContinuityProblemLimitAtHoleQ":"에서의 극한값은?","mathDerivativeProblemPrompt":"미분: 주어진 점에서 도함수(접선의 기울기) 값을 구하세요.","mathDerivativeProblemPromptPower":"거듭제곱 미분 $(x^n)' = n x^{n-1}$. 주어진 점에서 $f'(x)$ 값을 구하세요.","mathDerivativeProblemPromptLinear":"일차식 미분 $(mx+b)' = m$. 주어진 점에서 $f'(x)$ 값을 구하세요.","mathDerivativeProblemPromptPoly2":"이차식 미분. 주어진 점에서 $f'(x)$ 값을 구하세요.","mathDerivativeProblemPromptConstMul":"상수배·거듭제곱 미분 $(c \\cdot x^n)' = c \\cdot n \\cdot x^{n-1}$. 주어진 점에서 $f'(x)$ 값을 구하세요.","mathDerivativeProblemAtPoint":"일 때","mathChainRuleProblemPrompt":"연쇄법칙: 주어진 점에서 $f'(x)$ 값을 구하세요. (다양한 유형: 거듭제곱·지수·삼각·루트·로그·이차식)","mathPartialGradientProblemPrompt":"편미분·그라디언트: 주어진 함수와 점에서 편미분 또는 그라디언트 성분 값을 구하세요.","mlKnnProblemSolvingTable":"**풀이 순서**\n\n- **입력** — 새 데이터의 특성 벡터 $\\mathbf{x}$\n- **저장된 데이터** — (특성, 라벨) 쌍들 $(\\mathbf{x}_i, y_i)$\n- **1단계** — $\\mathbf{x}$와 모든 $\\mathbf{x}_i$ 사이의 거리 $d(\\mathbf{x}, \\mathbf{x}_i)$ 계산\n- **2단계** — 거리가 작은 순으로 K개 선택\n- **3단계 (분류)** — K개의 라벨 중 **다수결**로 예측\n- **3단계 (회귀)** — K개 값의 **평균**을 예측\n\n---\n\n**예시 문제 (거리 제곱)**\n\n평면 위 두 점 A(0, 0)와 B(3, 4)가 있습니다. 거리 제곱 $(x_2-x_1)^2 + (y_2-y_1)^2$ 값을 구하세요.\n\n**풀이**\n\n$(3-0)^2 + (4-0)^2 = 9 + 16 = 25$이므로 **정답은 25**입니다.","mlLinearRegressionProblemSolvingTable":"$1d","mathIntegralProblemPrompt":"적분: 정적분 또는 원시함수 값을 구하세요.","mathIntegralProblemPromptDefiniteConst":"상수 함수의 정적분을 구하세요.","mathIntegralProblemPromptDefiniteLinear":"일차식의 정적분을 구하세요.","mathIntegralProblemPromptAntiderivative":"역도함수(부정적분)에 주어진 값을 대입한 결과를 구하세요.","mathRandomVariableProblemPrompt":"아래 지시에 따라 계산하세요.","mathRandomVariableProblemPromptProbSumSix":"세 확률의 합이 1이 되도록 빈 칸 c를 구하세요.","mathRandomVariableProblemPromptExpectedValueScale6":"6×E[X] = Σ(값×분자)를 구하세요.","mathRandomVariableProblemPromptVarianceShort":"다음 확률분포에서 분산의 36배를 구하세요.","mathRandomVariableProblemVarianceHowToCalc":"분산 = 값이 평균에서 얼마나 퍼져 있는지 재는 값. 분산 = E[X²]−(E[X])², 36×분산 = 6×Σ(nᵢ·xᵢ²) − (Σ nᵢ·xᵢ)²","mathRandomVariableProblemVarianceLabel":"36×분산","mathRandomVariableProblemPromptVarianceScale36":"같은 확률분포에서 Var(X)=E[X²]-E[X]²입니다. 36×Var(X)를 구하세요. (6×Σ(nᵢ·xᵢ²) − (Σ nᵢ·xᵢ)²)","mathRandomVariableProblemPromptVarianceIntro":"같은 확률분포에서 ","mathRandomVariableProblemPromptVarianceMid":"입니다. ","mathRandomVariableProblemPromptVarianceEnd":"를 구하세요. (6×Σ(nᵢ·xᵢ²) − (Σ nᵢ·xᵢ)²)","mathRandomVariableProblemPromptVarianceAsk":"를 구하세요. ","mathRandomVariableProblemPromptVarianceFormula":"(6×Σ(nᵢ·xᵢ²) − (Σ nᵢ·xᵢ)²)","mathRandomVariableProblemProbSumHint":"c","mathRandomVariableProblemExpectationHint":"값×분자 를 모두 더한 수","mathRandomVariableProblemVarianceHint":"36×Var(X)","mathRandomVariableProblemPromptMode":"확률이 가장 큰 X 값(최빈값)을 구하세요.","mathRandomVariableProblemPromptExpectedValueInt":"평균적으로 기대되는 값(기댓값 E[X])을 구하세요.","mathRandomVariableProblemPromptCumulativeNumerator":"X가 주어진 값 이하일 확률을 분수 (분자/6)로 쓸 때 분자 값을 구하세요.","mathRandomVariableProblemModeLabel":"확률이 가장 큰 X","mathRandomVariableProblemExpectedValueIntLabel":"기댓값 E[X]","mathRandomVariableProblemCumulativeLabel1":"X가 1 이하일 확률 = ?/6 → ?","mathRandomVariableProblemCumulativeLabel2":"X가 2 이하일 확률 = ?/6 → ?","mathMeanVarianceProblemPrompt":"아래 지시에 따라 계산하세요.","mathMeanVarianceProblemPromptProbSumSix":"세 확률의 합이 1이 되도록 빈 칸 c를 구하세요.","mathMeanVarianceProblemPromptMeanScale6":"평균의 6배 6×E[X] = Σ(값×분자)를 구하세요.","mathMeanVarianceProblemPromptVarianceShort":"다음 확률분포에서 분산의 36배를 구하세요.","mathMeanVarianceProblemVarianceHowToCalc":"분산 = 값이 평균에서 얼마나 퍼져 있는지. 36×분산 = 6×Σ(nᵢ·xᵢ²) − (Σ nᵢ·xᵢ)²","mathMeanVarianceProblemVarianceLabel":"36×분산","mathMeanVarianceProblemPromptVarianceScale36":"같은 확률분포에서 36×Var(X)를 구하세요.","mathMeanVarianceProblemProbSumHint":"c","mathMeanVarianceProblemMeanScale6Label":"6×평균","mathMeanVarianceProblemMeanIntegerLabel":"평균 E[X]","mathMeanVarianceProblemPromptMeanInteger":"평균(기댓값) E[X]를 구하세요.","mathMeanVarianceProblemPromptMode":"확률이 가장 큰 X 값(최빈값)을 구하세요.","mathMeanVarianceProblemPromptCumulativeNumerator":"X가 주어진 값 이하일 확률을 (분자/6)로 쓸 때 분자 값을 구하세요.","mathMeanVarianceProblemModeLabel":"확률이 가장 큰 X","mathMeanVarianceProblemCumulativeLabel1":"P(X≤1) = ?/6 → ?","mathMeanVarianceProblemCumulativeLabel2":"P(X≤2) = ?/6 → ?","mathUniformNormalProblemPrompt":"아래 지시에 따라 계산하세요.","mathUniformNormalProblemPromptUniformMean":"구간 [a,b]에서 균등 분포의 평균 (a+b)/2를 구하세요.","mathUniformNormalProblemPromptUniformVar12":"균등 분포 U[a,b]에서 12×분산 = (b−a)²을 구하세요.","mathUniformNormalProblemPromptUniformLength":"구간 [a,b]의 길이 b−a를 구하세요.","mathUniformNormalProblemPromptNormalPct68":"정규분포에서 평균에서 표준편차 하나 범위(μ±σ)에 약 몇 %가 들어가나요?","mathUniformNormalProblemPromptNormalPct95":"정규분포에서 평균에서 표준편차 두 배 범위(μ±2σ)에 약 몇 %가 들어가나요?","mathIntegralProblemAntiderivativeIntro":"다음이 성립할 때,","mathIntegralProblemAntiderivativeAt":" x = ","mathIntegralProblemAntiderivativeQ":"에서의 값은?","mathPartialGradientProblemAtPoint":"에서","mathPartialGradientProblemGradientFirst":"첫 번째 성분","mathPartialGradientProblemGradientSecond":"둘째 번째 성분","wrongAnswerGuideButton":"왜 틀렸을까?","wrongAnswerGuideTitle":"오답 안내","wrongAnswerGuideSubmittedAnswer":"제출한 답:","wrongAnswerGuideHint":"AI가 왜 그렇게 풀었을지 추론하고, 정답 없이 올바른 방향만 안내합니다.","wrongAnswerGuideApiQuestion":"사용자님이 아래 문제를 풀었는데, 제출한 답이 \"{answer}\" (으)로 오답이었습니다. 왜 그렇게 풀었을지 추론하고, 정답을 알려주지 않은 채 올바른 방향으로만 안내해 주세요.","wrongAnswerGuideAsking":"안내 받는 중…","wrongAnswerQuestionPrompt":"제가 {answer}라고 답했는데 왜 틀렸나요?","getSolution":"풀이받기","loadingSolution":"불러오는 중…","feedbackTitle":"AI 채점 피드백","solutionTitle":"풀이","alertDrawFirst":"손풀이를 그린 뒤 채점해 주세요.","alertInputFirst":"풀이를 입력한 뒤 채점해 주세요.","errorGrade":"채점 중 오류가 났습니다. 다시 시도해 주세요.","errorSolution":"풀이를 불러오는 중 오류가 났습니다. 다시 시도해 주세요.","errorGradeRequest":"채점 요청 실패","errorSolutionRequest":"풀이 요청 실패","errorStream":"스트림을 읽을 수 없습니다.","errorDefault":"피드백을 생성하지 못했습니다.","placeholderChapter":"이 챕터는 준비 중입니다.","conceptVisualPlaceholder":"이 개념을 표현하는 시각화는 준비 중입니다.","conceptComingSoon":"이 개념의 학습 콘텐츠는 다음 업데이트에 추가됩니다.","conceptMatrixMulIntro":"A의 한 행 × B의 한 열 (내적) → 결과 행렬의 한 칸","conceptMatrixMulCell":"해당 칸","conceptLinearLayerIntro":"입력 X에 가중치 행렬 W를 곱하고 편향 b를 더하면 출력 Y가 됩니다. __LINEAR_FORMULA__","conceptLinearLayerLegendRow0":"W 1행·X + b[0] → Y[0]","conceptLinearLayerLegendRow1":"W 2행·X + b[1] → Y[1]","conceptArtificialNeuronIntro":"인공 뉴런은 가중합 __WEIGHTED_SUM_FORMULA__ 를 계산한 뒤 ReLU·Sigmoid·Tanh 같은 활성화 함수를 적용해 출력 Y를 냅니다.","conceptArtificialNeuronCalcCaption":"계산 순서: (W·X) 곱한 값 + b 더한 값 = Z → ReLU(Z) = Y","conceptBatchIntro":"여러 샘플을 행렬의 열로 쌓은 것이 배치입니다. 같은 W, b로 한 번에 __LINEAR_FORMULA__ 를 계산합니다.","conceptBatchCaption":"열 하나 = 샘플 하나. 같은 W, b로 모든 열에 한 번에 __WEIGHTED_SUM_FORMULA__ 적용.","conceptBatchExampleTitle":"예시: 한 열(샘플)의 계산 과정","conceptBatchFormulaRow":"Z{n} = (W {row}·이 열)+b[{bi}] = ({calc})+({b}) = {result}","conceptConnectionIntro":"연결은 한 층의 뉴런이 다음 층의 뉴런과 어떻게 연결되는지 나타냅니다. 가중치 행렬 W에서 0이 아닌 위치만 실제 연결이 있고, 아래 그래프는 그런 부분 연결만 선으로 그렸습니다.","conceptConnectionGraphCaption":"연결 구조 (가중치 0인 연결은 표시하지 않음)","conceptConnectionCalcCaption":"각 출력: (W 해당 행·X) 곱한 값 + b 더한 값 = Y","conceptConnectionFormulaRow1":"Y₁ = (W 1행·X) + b₁ = ({calc}) + {b} = {wx} + {b} = {y}","conceptConnectionFormulaRow2":"Y₂ = (W 2행·X) + b₂ = ({calc}) + {b} = {wx} + {b} = {y}","conceptActivationTitleSigmoid":"Y = Sigmoid(X)","conceptActivationTitleRelu":"Y = ReLU(X)","conceptActivationTitleTanh":"Y = Tanh₃(X)","conceptActivationTableHeader":"X ~ Y","conceptDotProductIntro":"a = [{a1}, {a2}], b = [{b1}, {b2}] → a·b = {samePositionSum}","conceptDotProductSamePositionSum":"같은 위치 성분 곱의 합","problemPromptConnection":"연결 __LINEAR_FORMULA__ 에서 빈 칸(?)에 들어갈 값을 구하세요. W가 0인 입력은 해당 출력에 연결되지 않습니다.","conceptHiddenIntro":"은닉층은 입력과 출력 사이에서 선형 변환(__LINEAR_CORE__)과 ReLU를 거쳐 중간 표현 H를 만들고, 다시 선형과 ReLU를 적용해 최종 출력 Y를 냅니다.","conceptHiddenGraphCaption":"입력 → 은닉(H) → 출력(Y)","problemPromptHidden":"은닉층이 있는 순전파: X → (W₁·X+b₁) → ReLU → H → (W₂·H+b₂) → ReLU → Y 에서 빈 칸(?)을 채우세요.","conceptDeepIntro":"깊은 신경망은 은닉층이 여러 개 쌓인 구조입니다. 각 층마다 Linear(W·입력+b)와 ReLU를 적용해 중간 표현을 만든 뒤 다음 층으로 넘깁니다.","conceptDeepFormulaCaption":"각 층: Linear & ReLU","conceptDeepFormulaWithSymbols":"선형 = W·(앞층 출력) + b → ReLU","conceptDeepGraphCaption":"입력(X) → 은닉(A,B,C,D) → 출력(Y)","problemPromptDeep":"여러 층이 연속된 순전파(각 층 Linear & ReLU)에서 빈 칸(?)을 채우세요.","conceptWideIntro":"너비는 한 층에 있는 뉴런 수가 많은 것을 말해요. 층이 넓을수록 더 많은 특징을 동시에 표현하고, 각 층마다 Linear & ReLU로 계산합니다.","conceptWideFormulaCaption":"각 층: Linear & ReLU (층이 넓어짐)","conceptWideGraphCaption":"입력(X) → 은닉(A,B) → 출력(Y) — 1→2→4→8 뉴런","problemPromptWide":"층이 넓어지는 순전파(각 층 Linear & ReLU)에서 빈 칸(?)을 채우세요.","conceptSoftmaxIntro":"소프트맥스는 점수(숫자)들을 0과 1 사이로 바꾸고, 전부 더하면 1이 되게 만드는 함수예요. 점수 __Z__에 대해 지수(예: __3Z__)를 구한 뒤, 그 합으로 나누면 확률처럼 쓸 수 있어요.","conceptSoftmaxFormulaCaption":"점수(__Z__) → 지수(__3Z__) → 합으로 나누기 → 확률(__Y__)","conceptSoftmaxGraphCaption":"다중 클래스 분류에서 마지막 층에 자주 사용됩니다.","problemPromptSoftmax":"점수(__Z__) → 지수(__3Z__) → 합으로 나눈 값(확률 __Y__) 순서로 계산한 뒤 빈 칸(?)을 채우세요.","conceptSoftmaxEHint":"이 문제에서는 e 대신 3을 씁니다. __3Z__ (예: Z=1이면 3, Z=2이면 9)","conceptGradientIntro":"기울기는 함수가 변하는 방향과 크기를 나타내는 벡터예요. 손실을 줄이려면 기울기 반대 방향으로 파라미터를 조금씩 움직입니다. 순전파 __GRADIENT_FORWARD__, 역전파 __GRADIENT_BACKWARD__로 기울기를 구해요.","conceptGradientForwardLabel":"순전파","conceptGradientBackwardLabel":"역전파","conceptGradientFormulaCaption":"순전파 Z = W·X → 역전파 dZ = dW·X","conceptGradientGraphCaption":"선형 계층·은닉층 등에서 동일한 원리로 기울기를 계산합니다.","conceptGradientBlankHint":"문제에서는 빈 칸(?)이 **X** 한 칸 또는 **Z**(순전파)·**dZ**(역전파) 한 칸으로 나와요.","conceptGradientForwardDesc":"순전파: Z = W·X (W의 각 행과 X의 내적)","conceptGradientBackwardDesc":"역전파: dZ = dW·X (같은 구조, 값만 기울기)","conceptInputX":"입력 X","conceptLinear":"선형","conceptLinearReLULayer1":"Linear & ReLU (1층)","conceptLinearReLULayer2":"Linear & ReLU (2층)","conceptSoftmaxFlowCaption":"점수(__Z__) → 지수(__3Z__) → 합으로 나누기 → 확률(__Y__)","conceptSoftmaxZLabel":"Z (점수)","conceptSoftmaxExpLabel":"3^Z","conceptSoftmaxSumLabel":"Σ (합)","conceptSoftmaxProblemFlow":"점수(__Z__) → __3Z__ → 합(__SIGMA__)으로 나누기 → 확률(__Y__)","conceptSoftmaxExampleTitle":"예시: 한 번에 계산 과정","conceptSoftmaxStepZ":"Z{n} = (W {row}행·X)+b[{bi}] = {calc}+{b} = {result}","conceptSoftmaxStepExp":"3^Z{n} = 3^{z} = {result}","conceptSoftmaxStepSum":"Σ = {items} = {result}","conceptSoftmaxStepY":"Y{n} = 3^Z{n}/Σ = {num}/{den} = {result}","conceptSoftmaxProbability":"확률","conceptWideLinearReLU1":"Linear & ReLU (1층, 너비 2)","conceptWideLinearReLU2":"Linear & ReLU (2층, 너비 4)","conceptWideLayer1Formula":"1층 (너비 2): H = ReLU(W₁·X + b₁)","conceptWideLayer2Formula":"2층 (너비 4): Y = ReLU(W₂·H + b₂)","conceptMatrixMulCellDot":"A의 {row}행 · B의 {col}열 (내적 한 번)","conceptMatrixMulARow":"A의 {row}행","conceptMatrixMulBCol":"B의 {col}열","conceptBatchLinear":"표 숫자에 가중치를 곱하고 편향을 더해서 빈칸을 채우세요.","conceptBatchLinearRelu":"가중치 곱하고 편향 더한 뒤, 음수는 0으로 바꾸고 빈칸을 채우세요.","conceptBatchAdd":"각 줄마다 오른쪽 수를 더해서 빈칸을 채우세요.","conceptBatchSubtract":"각 줄마다 오른쪽 수를 빼서 빈칸을 채우세요.","conceptBatchMultiply":"각 줄마다 오른쪽 수를 곱해서 빈칸을 채우세요.","conceptBatchCenter":"각 줄에서 그 줄의 평균을 빼서 빈칸을 채우세요.","conceptBatchSum":"각 줄의 숫자를 전부 더한 합계를 구해서 빈칸을 채우세요.","conceptBatchMean":"각 줄의 숫자들의 평균(정수)을 구해서 빈칸을 채우세요.","conceptBatchRowMeanHint":"(행 평균 → 0)","conceptBatchRowSumHint":"(행별 합)","conceptBatchRowMeanIntHint":"(행별 평균, 정수)","conceptRowN":"{n}행","conceptDeepLayer1Title":"1층: A₁, A₂, A₃ (W₁ 각 행·X + b₁)","conceptDeepLayer2Title":"2층: B₁, B₂, B₃ (W₂ 각 행·A + b₂)","conceptDeepFormulaA":"A{n} = (W₁ {row}·X)+b₁[{bi}] = ({calc})+({b}) = {linear} → ReLU = {result}","conceptDeepFormulaAZero":"A{n} = (W₁ {row}·X)+b₁[{bi}] = ({calc})+({b}) = {linear} → ReLU(-1)=0 → {result}","conceptDeepFormulaB":"B{n} = (W₂ {row}·A)+b₂[{bi}] = ({calc})+({b}) = {linear} → ReLU = {result}","conceptHiddenLayer1Title":"1층: H = ReLU(W₁·X + b₁)","conceptHiddenLayer2Title":"2층: Y = ReLU(W₂·H + b₂)","conceptHiddenLinear1":"선형₁","conceptHiddenLinear2":"선형₂","conceptHiddenFormulaL1":"{linearLabel} = (W₁ {row}·X)+b₁[{bi}] = ({calc}) + ({b}) = {linear} → ReLU = {result}","conceptHiddenFormulaL2":"{linearLabel} = (W₂ {row}·H)+b₂[{bi}] = ({calc}) + ({b}) = {linear} → ReLU = {result}","conceptWideFormulaH1":"H₁ = (W₁ {row}·X)+b₁[0] = {calc} = {linear} → ReLU = {result}","conceptWideFormulaH2":"H₂ = (W₁ {row}·X)+b₁[1] = {calc} = {linear} → ReLU = {result}","conceptWideFormulaY1":"Y₁ = (W₂ {row}·H)+b₂[0] = {calc} = {linear} → ReLU = {result}","conceptWideFormulaY2":"Y₂ = (W₂ {row}·H)+b₂[1] = {calc} = {linear} → ReLU = {result}","conceptWideFormulaY3":"Y₃ = (W₂ {row}·H)+b₂[2] = {calc} = {linear} → ReLU = {result}","conceptWideFormulaY4":"Y₄ = (W₂ {row}·H)+b₂[3] = {calc} = {linear} → ReLU = {result}","conceptGradientZLine":"Z{n} = (W {row})·X = {calc} = {z}","conceptGradientDZLine":"dZ{n} = (dW {row})·X = {calc} = {dz}","problemPromptGradient":"__GRADIENT_FORWARD__ 또는 __GRADIENT_BACKWARD__ 에서 빈 칸(?)을 채우세요.","tinyNNTitle":"챕터별 딥러닝 도식화","tinyNNDescription":"챕터를 하나씩 진행할 때마다 아래 도식이 조금씩 채워져요. 지금까지의 구조예요.","tinyNNComplete":"마지막 챕터에서는 '앞으로 계산 → 오차 → 뒤로 계산 → 학습'까지 담긴 완성된 모델을 볼 수 있어요.","tinyNNAriaLabel":"챕터별 딥러닝 도식 진행","mathDiagramTitle":"챕터별 수학 도식화","mathDiagramDescription":"챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 기초 수학 흐름을 한눈에 보세요.","midMathDiagramTitle":"챕터별 수학 도식화","midMathDiagramDescription":"챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 중급 수학 흐름을 한눈에 보세요.","mathDiagramComplete":"Ch01 함수까지 보면 입력 → 함수 → 출력 구조를 모두 볼 수 있어요.","mathDiagramAriaLabel":"챕터별 수학 도식","mlDiagramTitle":"챕터별 머신러닝 도식화","mlDiagramDescription":"챕터를 선택하면 아래 도식이 해당 챕터 내용으로 바뀌어요. 머신러닝 흐름을 한눈에 보세요.","mlDiagramAriaLabel":"챕터별 머신러닝 도식","linkToPlayground":"신경망에서 이 계산이 이렇게 쓰입니다","introRoadmapHeading":"Ch01 ~ Ch12에서 배우는 것","mathIntroRoadmapIntro":"딥러닝·머신러닝을 이해하려면 **함수**, **지수·로그**, **극한·미분·적분**, **확률·분포** 같은 기초 수학이 필요해요. Ch01~Ch12에서 배우는 내용이 바로 그것입니다. **함수**는 '입력→출력'의 기본이고, **미분·그라디언트**는 모델이 학습할 때 파라미터를 **어디로 얼마나** 바꿀지 정하는 데 쓰여요. **확률·분포**는 예측과 불확실성을 다룰 때 필요해요.","midMathIntroRoadmapHeading":"Ch01 ~ Ch20에서 배우는 것","midMathIntroRoadmapIntro":"중급 수학은 AI를 설명하는 언어를 한 단계 더 깊게 만듭니다. 벡터와 행렬, 선형 변환으로 데이터가 어떻게 표현되고 변하는지 읽고, 내적·정사영으로 유사도와 방향을 계량해요. 이어서 야코비안과 헤시안으로 변화량과 곡률(손실 지형의 휘어짐)을 다루고, 테일러 급수와 볼록 최적화로 더 안정적인 학습을 설계합니다. 마지막으로 베이즈, 공분산, 다변량 정규 분포로 불확실성과 함께 사는 법을 배웁니다.","premiumBadge":"Premium","premiumTitle":"프리미엄 챕터입니다","premiumDescription":"이 챕터는 배우기 유료 구독 회원 전용 콘텐츠입니다. 구독 후 배우기 전체 챕터의 개념 설명, 문제 풀이, AI 코칭을 무제한으로 이용할 수 있습니다.","premiumFeature1":"Chapter 04~12 전체 잠금 해제","premiumFeature2":"AI 학습 코치 무제한 질문","premiumFeature3":"신규 챕터 우선 접근","premiumMonthly":"월","premiumCTA":"프리미엄 구독하기","premiumComingSoon":"결제 준비 중입니다","premiumLogin":"이미 구독 중이신가요?","premiumLoginLink":"로그인","premiumLoginFirst":"로그인 후 프리미엄을 구독할 수 있습니다.","freeChaptersNote":"Chapter 01~03은 무료로 이용할 수 있습니다."},"playground":{"title":"신경망 놀이터","seoFaqTitle":"자주 묻는 질문","relatedLearnLabel":"관련 배우기","nav":{"sectionTitle":"플레이그라운드","sectionSubtitle":"직접 만지며 배우는 AI 실험실","comingSoon":"준비 중","categories":{"dl":"딥러닝","rl":"강화학습","vision":"컴퓨터 비전","transformer":"트랜스포머"},"items":{"nnClassifier":"신경망 분류기","rl":"강화학습 에이전트","cnn":"합성곱 비전","transformer":"어텐션 놀이터"}},"classifier":{"title":"신경망 놀이터","subtitle":"브라우저에서 바로 신경망을 만져 보세요!","dataTitle":"데이터","dataHint":"어떤 K-데이터셋으로 놀아볼까요?","datasets":{"taegeuk":"태극","danjeong":"단청","hallyu":"K-웨이브","kpop":"K-Pop ♥"},"trainRatio":"학습/테스트 비율","noise":"노이즈","batchSize":"배치 크기","showTest":"테스트 데이터 표시","regenerate":"다시 생성","featuresTitle":"피처","featuresHint":"신경망에 넣을 입력을 고르세요","featuresIntro":"피처(feature)는 데이터 점의 좌표 (x₁, x₂)를 신경망에 넣기 위해 가공한 입력 값입니다. X₁·X₂ 그대로 쓰거나, 제곱·곱·sin 등을 켜서 모델이 더 복잡한 결정 경계도 학습할 수 있습니다. 켠 피처마다 입력 뉴런이 하나씩 늘어납니다.","featuresIntroToggle":"피처 설명","featuresIntroExpand":"펼치기","featuresIntroCollapse":"접기","features":{"x1":"X₁","x1Desc":"가로 좌표 그대로 — 세로로 갈린 경계에 유리","x2":"X₂","x2Desc":"세로 좌표 그대로 — 가로로 갈린 경계에 유리","x1sq":"X₁²","x1sqDesc":"가로 좌표 제곱 — 원·포물선 같은 곡선 경계","x2sq":"X₂²","x2sqDesc":"세로 좌표 제곱 — 좌우 대칭 곡선 경계","x1x2":"X₁X₂","x1x2Desc":"두 좌표의 곱 — 대각선·비틀린 경계","sinX1":"sin(X₁)","sinX1Desc":"가로 sin — 물결·주기적인 경계","sinX2":"sin(X₂)","sinX2Desc":"세로 sin — 위아래로 반복되는 경계"},"networkTitle":"은닉층","networkHint":"선 굵기 = 가중치 크기, 색 = 부호 (보라=+, 주황=−)","addLayer":"층 추가","removeLayer":"층 제거","outputTitle":"출력","outputHint":"모델이 그린 결정 경계와 데이터 점","outputLegend":"연한 배경 = 실제 데이터 패턴 · 진한 색 = 신경망 예측","outputLive":"실시간","testLoss":"테스트 손실","trainLoss":"학습 손실","epoch":"에폭","colorNegative":"음 (−1)","colorPositive":"양 (+1)","play":"시작","pause":"멈춤","step":"한 걸음","reset":"처음부터","controlsIntro":"재생·한 걸음으로 학습할 때 아래 값이 적용됩니다. 기본값으로 먼저 돌려 보고, 바꿔 가며 차이를 느껴 보세요.","controlsIntroToggle":"학습 설정 설명","learningRate":"학습률","learningRateDesc":"가중치를 한 번에 얼마나 크게 고칠지예요. 너무 크면 출렁이고, 너무 작으면 학습이 느려요. 보통 0.01~0.03부터 시도해 보세요.","activation":"활성화","activationDesc":"뉴런 출력을 비선형 곡선으로 바꿉니다. Tanh는 부드럽게 −1~1, ReLU는 0 이하는 0으로 잘라요.","activationReLU":"ReLU — 0 이하는 0, 그 이상은 그대로 (가장 흔함)","activationTanh":"Tanh — S자 곡선, 출력이 −1~1","activationSigmoid":"Sigmoid — 0~1 사이로 눌러 넣기","activationLinear":"Linear — 곡선 없이 직선 (거의 비선형 없음)","regularization":"정규화","regularizationDesc":"가중치가 너무 커지지 않게 벌점을 줍니다. 데이터를 ‘외우는’ 과적합을 줄이는 데 쓰여요.","regNone":"없음","regL1":"L1 — 가중치 절댓값 합 (희소하게 만듦)","regL2":"L2 — 가중치 제곱 합 (전반적으로 작게)","regRate":"정규화 강도","regRateDesc":"정규화 벌점의 세기예요. ‘없음’이면 이 값은 적용되지 않아요.","regRateDisabledHint":"정규화를 L1 또는 L2로 선택하면 조절할 수 있어요.","showFormulas":"수식 보기","showFormulasDesc":"역전파·활성화 등, 지금 설정에 맞는 수식을 화면 아래에 띄웁니다.","learnChapterTooltip":"배우기: {title}","relatedLearn":"관련 배우기","formulasTitle":"수식"},"rl":{"title":"그네 강화학습","subtitle":"로봇이 그네를 태우듯, 언제 밀고 언제 쉴지 Q-러닝으로 스스로 배웁니다!","seoIntro":"브라우저에서 진자 그네 환경에 Q-러닝 에이전트를 학습시키는 무료 강화학습 Playground입니다. 학습률·할인율·탐험률을 조절하고 에피소드 보상 곡선으로 정책이 어떻게 나아지는지 확인하세요.","play":"시작","pause":"멈춤","step":"한 걸음","reset":"처음부터","episode":"에피소드","alpha":"학습률 α","alphaDesc":"Q값을 한 번에 얼마나 크게 고칠지예요. 크면 빨리 바뀌지만 불안정할 수 있어요.","gamma":"할인율 γ","gammaDesc":"미래 보상을 지금 얼마나 중요하게 볼지예요. 1에 가까울수록 먼 보상도 크게 반영해요.","epsilon":"탐험 ε","epsilonDesc":"무작위로 밀거나 쉴 확률이에요. 높으면 여러 리듬을 시도하고, 낮으면 익힌 타이밍만 씁니다.","speed":"속도","showFormulas":"수식 보기","controlsIntro":"아래로 내려올 때 밀고, 올라갈 때는 가만히—이 타이밍을 Q-러닝이 표로 익힙니다.","controlsIntroToggle":"학습 설정 설명","envTitle":"그네 설정","envHint":"밧줄·마찰·바람이 달라지면 난이도가 바뀝니다","swingGoal":"보상은 그네 높이(1−cos θ)예요. 로봇이 왼쪽/오른쪽으로 밀어 진폭을 키우도록 학습합니다.","swingTip1":"아래로 스윽 내려올 때 반대 방향으로 밀면 에너지가 쌓여요","swingTip2":"높이 올라갈 때는 가만히(관성) 두는 편이 유리해요","presets":{"playground":"놀이터","playgroundDesc":"기본 길이·균형 잡힌 그네","longRope":"긴 밧줄","longRopeDesc":"느리고 크게 흔들림","shortRope":"짧은 밧줄","shortRopeDesc":"빠르게 왔다 갔다","heavySeat":"무거운 좌석","heavySeatDesc":"마찰이 커서 힘들게 올라감","breezy":"바람 부는 날","breezyDesc":"살짝 흔들리는 바람","powerPump":"파워 펌프","powerPumpDesc":"세게 밀면 금방 높아짐"},"presetRope":"밧줄","presetDamping":"마찰","presetPush":"밀기 세기","presetWind":"바람","worldTitle":"그네 시뮬레이터","worldHint":"보라 로봇 = 에이전트 · 막대 = 현재 높이","swingAria":"그네 강화학습 시뮬레이터","swingHeight":"그네 높이","swingMaxEp":"이번 최고","swingHighCount":"높이 탄 횟수","actions":{"left":"왼쪽으로 밀기","coast":"가만히 (관성)","right":"오른쪽으로 밀기"},"metricSteps":"이번 에피소드 스텝","metricEpReward":"에피소드 누적 보상","rewardTitle":"에피소드 보상","rewardHint":"그네를 높이 탈수록 보상이 커집니다","rewardChartEmpty":"학습을 시작하면 에피소드별 보상이 표시됩니다","lastReward":"최근 에피소드 보상: {value}","rewardChartSummary":"최근 완료 에피소드: {completed} · 진행 중 누적: {current}","rewardChartCurrent":"진행 중 누적 보상: {value}","formulasTitle":"진자 · Q-러닝","formulaPendulum":"그네는 진자로 모델링합니다. 각도 θ, 각속도 ω, 밀기 힘 τ로 움직입니다.","formulaBellman":"상태(θ,ω)를 칸으로 나누고, Q-러닝으로 ‘언제 밀지’를 표로 학습합니다.","formulaRewardIntro":"보상은 그네 높이에 비례합니다.","formulaRewardOutro":"위로 올라갈수록 보상이 커집니다. ε-greedy로 탐험과 활용을 섞습니다.","relatedLearn":"관련 배우기"},"cnn":{"title":"합성곱 비전 Playground","subtitle":"K-컬쳐 패턴에 필터를 씌워 feature map이 어떻게 바뀌는지 직접 확인해 보세요!","seoIntro":"브라우저에서 동작하는 무료 합성곱(CNN) Playground입니다. 태극·단청·한글·K-Pop 등 16×16 K-컬쳐 패턴에 3×3 컨볼루션 커널을 적용하고 feature map·ReLU·2×2 맥스풀링 결과를 실시간으로 확인할 수 있습니다. Sobel·블러·샤프닝 등 7가지 프리셋과 슬라이딩 애니메이션으로 컴퓨터 비전·딥러닝 입문자가 합성곱의 원리를 직관적으로 익히도록 설계되었습니다.","controlsIntro":"▶ 재생으로 커널이 입력 위를 슬라이딩하며 합성곱·ReLU·풀링이 한 칸씩 채워집니다. 한 걸음으로도 단계별로 확인할 수 있어요.","controlsIntroToggle":"설정 설명","play":"재생","pause":"멈춤","step":"한 걸음","speed":"속도","animPhase":"단계","animStep":"진행","animReady":"대기","animDone":"완료","animConvValue":"출력 값","animPoolValue":"max 값","pipelineIntroAnim":"커널(보라)이 입력 위를 지나가며 feature map이 채워집니다. 풀링 단계에서는 2×2(주황) 구역에서 최댓값을 뽑습니다.","padding":"패딩","paddingValid":"Valid (출력 축소)","paddingSame":"Same (크기 유지)","useRelu":"ReLU 적용","usePool":"2×2 맥스풀링","showFormulas":"수식 보기","reset":"처음부터","imageTitle":"입력 이미지","imageHint":"어떤 K-컬쳐 패턴으로 실험할까요?","imageIntro":"16×16 픽셀 패턴을 그레이스케일로 변환한 뒤 합성곱에 넣습니다. 태극·단청은 NN Classifier와 같은 K-데이터셋 테마입니다.","patterns":{"taegeuk":"태극","taegeukDesc":"원 안 음양 S자 경계","danjeong":"단청","danjeongDesc":"대각 줄무늬 격자","hangeul":"한글 ㄱ","hangeulDesc":"획 패턴 (세로·가로·갈고리)","kpop":"K-Pop ♥","kpopDesc":"손하트 하트 영역"},"kernelTitle":"3×3 커널","kernelHint":"필터를 고르거나 칸을 눌러 직접 편집하세요","kernelIntro":"커널(필터)은 입력의 작은 영역과 원소별 곱 후 합으로 feature map 한 칸을 만듭니다. Sobel은 에지, 블러는 부드럽게, 샤프닝은 윤곽을 강조합니다.","kernelPresets":"프리셋","kernelClickHint":"커널 칸을 클릭하면 −2~2 값이 순환합니다.","customKernel":"직접 편집한 커스텀 커널","presets":{"identity":"항등","blur":"블러","sharpen":"샤프닝","sobelX":"Sobel X","sobelY":"Sobel Y","edge":"에지","emboss":"엠보스"},"presetDesc":{"identity":"중앙만 1 — 입력을 거의 그대로 통과시킵니다","blur":"주변 9픽셀 평균 — 노이즈를 줄이고 이미지를 부드럽게 만듭니다","sharpen":"중앙 강조·주변 차감 — 윤곽과 디테일을 선명하게 합니다","sobelX":"가로 방향 밝기 변화 — 세로 에지(수직 경계)를 강조합니다","sobelY":"세로 방향 밝기 변화 — 가로 에지(수평 경계)를 강조합니다","edge":"중앙과 주변 차이 — 모든 방향의 경계를 한꺼번에 강조합니다","emboss":"대각선 밝기 경사 — 양각·음각처럼 입체 질감을 만듭니다"},"pipelineTitle":"CNN 파이프라인","pipelineHint":"입력 → 합성곱 → (ReLU) → (풀링) 순서로 feature map이 변합니다","outputTitle":"출력","outputHint":"각 단계 feature map — 재생으로 합성곱·ReLU·풀링이 한 칸씩 채워집니다","pipelineIntro":"입력 이미지 위에 마우스를 올리면 커널이 덮는 3×3 영역이 보라색으로 표시됩니다.","stageInput":"입력","stageConv":"합성곱","stageRelu":"ReLU","stagePool":"맥스풀링","stageInputRole":"16×16 원본 픽셀 — K-컬쳐 패턴을 그레이스케일로 CNN에 넣습니다","stageConvRole":"3×3 필터 슬라이딩 — 주변 픽셀 가중합으로 에지·질감 등 공간 특징을 추출합니다","stageReluRole":"max(0, x) — 음수 응답을 0으로 잘라 활성화된 특징만 남깁니다","stagePoolRole":"2×2 최댓값 — 맵 크기를 줄이고 작은 위치 이동에 덜 민감하게 만듭니다","heatmapLegend":"히트맵: 보라=양의 응답, 주황=음의 응답 · 값이 클수록 진한 색","formulasTitle":"수식","formulaConv":"합성곱","formulaPool":"맥스풀링","relatedLearn":"관련 배우기"},"transformer":{"title":"어텐션 놀이터","subtitle":"질문을 보내면, 모델이 질문 속에서 답 단서를 찾고 답변합니다","chatTitle":"질문 → 답 찾기","chatModelBadge":"질문에서 단서 찾기","chatEmptyHint":"아래 입력창에 질문을 입력하고 전송해 보세요","chatPlaceholder":"질문을 입력하세요…","chatCustomAnswer":"「{query}」와 가장 유사한 단어는 「{word}」({pct}%)입니다.","chatSend":"질문 보내기","chatTokenizing":"질문을 토큰으로 분해하는 중…","chatEmbedding":"단어 + 순서 정보를 합치는 중…","chatPipelineTitle":"모델이 하는 일","chatStepTokenize":"토큰 나누기","chatStepEmbed":"단어 이해","chatStepCompare":"관련도 비교","chatStepWeight":"주목 비율","chatStepAnswer":"답 만들기","chatStepTokenizeDesc":"문장을 작은 단어(토큰)로 나눕니다","chatStepEmbedDesc":"각 단어에 '몇 번째인지' 순서 정보를 더합니다","chatStepCompareDesc":"답을 쓸 위치에서, 다른 단어와 얼마나 관련 있는지 비교합니다","chatStepWeightDesc":"관련도를 %로 바꿉니다 · 밝기와 %가 높을수록 더 주목","chatStepAnswerDesc":"가장 유사한 단어를 찾고 → 정보를 섞어 → 답을 씁니다","chatAnswerSimilarLead":"「{query}」와 가장 유사한 단어는 「{word}」({pct}%)입니다.","chatAnswerSimilarEmpty":"「{query}」 위치에서 관련 단어를 찾지 못했습니다.","chatAnswerSimilarExplain":"답을 쓸 위치에서 주목 %가 높을수록 더 관련 깊은 단어입니다.","chatAnswerBriefTitle":"그다음 모델이 하는 일","chatAnswerBriefBody":"주목한 단어 정보를 비율대로 섞고, 다음에 쓸 말을 고른 뒤 답을 완성합니다. ChatGPT는 이 과정을 반복합니다.","chatCompareTitle":"단어 간 관련도 비교","chatCompareHint":"「{word}」 위치에서 다른 단어와 얼마나 가까운지 계산합니다","chatWeightTitle":"주목 비율 계산","chatWeightHint":"관련도를 %로 바꿉니다 — 전체 합이 100%입니다","chatPosition":"{n}번째","chatTokenTruncated":"입력이 너무 깁니다. 앞 {shown}개 토큰만 어텐션 계산 (전체 {total}개 단어)","chatSearching":"질문에서 답 단서 찾는 중…","chatCluesFound":"단서 확인됨","chatSearchExplain":"답을 쓰기 전, 질문 속 어떤 단어를 얼마나 주목하는지 애니메이션으로 보여줍니다","chatQuestionLabel":"질문","chatConnectTitle":"단어 연결 → 주목 비율","chatConnectIntro":"아래 {query} 기준 · 토큰 밝기와 %가 주목 정도입니다","chatConnectAria":"질문 단어와 답 위치 연결 그래프","chatAnswerFlow":"질문을 읽고 나면","chatAnswerSlot":"여기서 답을 씁니다","chatAnswerSlotHint":"ChatGPT가 답변을 시작하는 위치 (질문 다음 칸)","chatQueryFromToken":"지금은 「{word}」 위치에서 주목 중 · 아래 칸을 누르면 답 위치로 돌아갑니다","chatCalcTitle":"왜 이 비율일까?","chatCalcIntro":"Q({query})와 각 단어의 K를 비교한 뒤 softmax로 비율을 만듭니다.","chatCalcQueryLabel":"답 위치","chatCalcStep1":"① Q · K = 유사도 점수 (높을수록 관련)","chatCalcStep2":"② softmax — 점수를 비율로 변환 (합 100%)","chatCalcStep2Pending":"② softmax 계산 중…","chatClueSummary":"주목한 단서: {words}","chatAnswering":"답변","chatDoneHint":"토큰을 눌러 주목이 바뀌는 모습을 볼 수 있어요.","chatPickNext":"다른 질문하기","chatReadyHint":"새 질문은 아래 입력창에 입력하세요","chatReadyFooter":"아래 입력창에 질문을 입력하면 새 대화가 시작됩니다","chatFooterNote":"ChatGPT도 답하기 전, 질문 안에서 관련 단어를 먼저 찾습니다","qaQuestions":{"catCafe":"비 오는 날 카페 창가에 앉아 있는 건 뭔가요?","robotPaint":"캔버스 앞에서 보라색 하늘을 그리고 있는 건 누구인가요?","moonRamen":"달이 뜬 밤 골목에서 나는 따뜻한 냄새, 그게 뭐예요?","snowTrain":"설원을 달리는 기차, 다음에 도착하는 곳은 어디예요?"},"qaAnswers":{"catCafe":"고양이예요. 창밖 빗소리를 들으며 카페 창가에 앉아 쉬고 있어요.","robotPaint":"로봇이에요. 붓을 들고 캔버스에 보라색 하늘을 천천히 그리고 있어요.","moonRamen":"라면 냄새예요. 달빛 아래 골목을 따뜻한 국물 향이 가득 채워요.","snowTrain":"작은 마을이에요. 하얀 설원을 지나 기차가 마을 역으로 들어가요."},"qaTokens":{"catCafe":["비","카페","창가","앉아","있는","뭔"],"robotPaint":["캔버스","보라색","하늘","그리","있는","누구"],"moonRamen":["달","골목","따뜻한","냄새","라면","뭐"],"snowTrain":["설원","기차","다음","도착","하는","어디"]},"setupTitle":"입력","setupHint":"패턴 · 쿼리 토큰","patterns":{"catCafe":"패턴 A","robotPaint":"패턴 B","moonRamen":"패턴 C","snowTrain":"패턴 D"},"metricMaxAttn":"최대 주목","outputHint":"주목 비율이 섞인 새 표현","seoIntro":"브라우저에서 동작하는 무료 Self-Attention Playground입니다. 분류기와 같은 구조로, 예문·쿼리 선택 → 연결 그래프(선 굵기=주목 비율) → 출력 파이프라인을 즉시 확인할 수 있습니다. BERT/GPT 마스크, √d_k 스케일, 단계별 애니메이션 지원.","controlsIntro":"▶ 재생 시 단계별로 파이프라인이 강조됩니다. 토큰을 클릭하면 재생 없이도 연결·색상이 즉시 바뀝니다.","controlsIntroToggle":"설정 설명","play":"재생","pause":"멈춤","step":"한 걸음","speed":"속도","reset":"처음부터","animReady":"대기","animDone":"완료","animPhase":{"label":"단계","scores":"Q·K^T 점수","softmax":"softmax","output":"V 가중합"},"maskLabel":"마스크","maskFull":"전체 (BERT)","maskCausal":"인과 (GPT)","scaleDk":"√d_k 스케일","showFormulas":"수식 보기","sentenceTitle":"입력 문장","sentenceHint":"어떤 예문으로 실험할까요?","sentenceIntro":"예문과 쿼리(Q) 토큰을 고르세요. 오른쪽 출력과 왼쪽 연결 그래프가 바로 갱신됩니다 — 분류기의 데이터·피처 선택과 같습니다.","queryHint":"쿼리 토큰 선택 (Q)","presets":{"catCafe":"고양이와 카페","catCafeDesc":"비 오는 날 창가 — 고양이·카페·창가가 서로 주목해요","robotPaint":"로봇과 그림","robotPaintDesc":"캔버스 앞 보라 하늘 — 로봇·그리다·캔버스가 연결돼요","moonRamen":"달과 라면","moonRamenDesc":"달빛 골목 라면 — 밤·달·라면 향이 어우러져요","snowTrain":"눈과 기차","snowTrainDesc":"설원을 가로지르는 기차 — 눈·마을·달려가다가 이어져요"},"presetTokens":{"catCafe":["고양이가","비","오는","날","카페","창가에","앉아"],"robotPaint":["로봇이","캔버스","앞에서","보라색","하늘을","천천히","그려요"],"moonRamen":["달이","뜬","밤","골목","라면","냄새가","퍼져요"],"snowTrain":["기차가","하얀","설원을","가로질러","작은","마을","향해"]},"matrixTitle":"어텐션 행렬","matrixHint":"행=Query, 열=Key — 색이 진할수록 가중치·점수가 큽니다","storyTitle":"어텐션 이야기","storyHint":"막대·스포트라이트로 '누가 누구를 주목하는지' 따라가 보세요","storyStep":{"scores":"비교하기","softmax":"비율로 바꾸기","output":"정보 모으기"},"storyExplainIdle":"▶ 재생을 누르면 「{query}」가 문장 속 다른 단어들과 얼마나 잘 맞는지부터 보여 줍니다.","storyExplainScores":"① Q(질문)와 K(이름표)를 비교해 점수를 매깁니다. 「{query}」와 비슷한 단어일수록 점수가 높아요.","storyExplainSoftmax":"② 점수를 0~100% 비율로 바꿉니다. 합이 1이 되도록 나눠 '주목 비율'이 됩니다.","storyExplainOutput":"③ 각 단어의 V(내용)를 주목 비율만큼 섞어 새 표현을 만듭니다.","storyExplainPause":"한 바퀴 끝! 다음 쿼리로 넘어가거나 다른 토큰을 눌러 보세요.","metaphorQ":"질문","metaphorK":"이름표","metaphorV":"내용","metaphorQDesc":"지금 주목하는 단어","metaphorKDesc":"다른 단어와 맞는지 비교","metaphorVDesc":"실제로 가져올 정보","storySentenceLabel":"문장 속 주목","distributionScoresTitle":"「{query}」와 각 단어의 유사 점수","distributionTitle":"「{query}」가 주목하는 비율","distributionHint":"막대가 길수록 더 많이 주목합니다. 재생 중 단계에 따라 점수 또는 %가 표시됩니다.","storyOutputSummary":"「{query}」의 새 표현 = 주목 비율 × 각 단어의 V 를 모두 더한 값입니다.","showMatrixToggle":"고급: 전체 N×N 행렬 보기","networkTitle":"어텐션 연결","networkHint":"선 굵기 = 주목 비율 (분류기 가중치와 같음)","networkIntro":"쿼리(Q)에서 다른 토큰으로 이어지는 선이 '얼마나 주목하는지'를 보여 줍니다. 토큰을 클릭하면 즉시 바뀝니다.","networkLegend":"선이 굵고 %가 클수록 더 많이 주목한 토큰입니다.","networkAria":"쿼리에서 키 토큰으로 이어지는 어텐션 연결 그래프","outputTitle":"출력","outputIntro":"입력 문장 → 주목(색 진함) → 출력 벡터 순으로 데이터가 흐릅니다.","outputIntroAnim":"▶ 재생하면 흐릿한 연결 → 비율 확정 → 출력 완성 순으로 점점 선명해집니다.","outputProgressLabel":"선명도","outputLive":"실시간","outputTop1":"1순위 주목","outputTop2":"2순위","outputSelf":"자기 자신","outputLegend":"「{query}」가 주목한 비율이 색 농도로 표시됩니다. 진할수록 더 많이 봅니다.","pipelineInput":"입력","pipelineInputRole":"문장 토큰","pipelineAttend":"주목","pipelineAttendRole":"softmax 비율","pipelineOut":"출력","pipelineOutRole":"V 가중합","matrixIntroScores":"Q·K^T 내적 점수입니다. softmax 전 원시 관련도를 보여 줍니다.","matrixIntroWeights":"softmax 후 가중치입니다. 각 행의 합은 1입니다.","matrixAria":"어텐션 행렬 히트맵","flowTitle":"토큰 연결","flowHint":"선 굵기 = softmax 가중치","flowIntro":"선택한 쿼리 토큰에서 다른 토큰으로 향하는 곡선 두께가 '얼마나 주목하는지'를 나타냅니다.","flowQueryLabel":"쿼리","flowOutputLabel":"가중합 출력 (d=4)","formulasTitle":"수식","formulaQkv":"Q / K / V","formulaAttention":"Scaled Dot-Product Attention","formulaMask":"인과 마스크","formulaScaleNote":"d_k = {dk}","relatedLearn":"관련 배우기"},"configTitle":"모델 설정","inputNodes":"입력 노드 수","hiddenNeurons":"은닉층 뉴런 수","activation":"활성화 함수","createModel":"모델 생성","inputTarget":"입력과 타깃","runForward":"순전파 실행","forwardSteps":"순전파 단계","training":"학습","oneStep":"한 스텝","epochs50":"50 에폭","weightsAndGradients":"가중치와 기울기","linkFromProblem":"이 계산이 신경망에서 이렇게 쓰입니다","fromDotBanner":"손풀이와 연결됨. 아래 모델의 첫 번째 뉴런이 입력과 가중치의 내적을 계산합니다. Forward를 실행해 보세요.","inputXLabel":"입력 X (쉼표 구분)","targetLabel":"타깃 (쉼표 구분)","trainingInProgress":"학습 중…","weightsW1":"W₁ (은닉층 가중치)","weightsW2":"W₂ (출력층 가중치)","gradientsDW1":"dW₁ (기울기)","gradientsDW2":"dW₂ (기울기)","createModelHint":"위에서 설정을 선택한 뒤 「모델 생성」을 누르세요.","lossGraphEmpty":"학습을 실행하면 에폭별 손실 그래프가 표시됩니다.","lossGraphTitle":"에폭별 손실 (Loss)","epochLabel":"에폭","lastLossLabel":"마지막 손실: {value} (총 {count} 에폭)"},"tinyNN":{"batchPhase0":"샘플 1, 2, 3이 따로 따로 있어요.","batchPhase1":"이렇게 한 표로 묶으면 → 같은 W, b로 한 번에 계산해요.","batchPhase2":"같은 W, b가 한 번에 모든 열(샘플)에 적용돼요.","batchPhase3":"그래서 결과 Y도 한 표로 한 번에 나와요.","batchInputSeparate":"입력 (샘플들이 따로)","batchInputTable":"입력 표 X","batchSample1":"샘플 1","batchSample2":"샘플 2","batchSample3":"샘플 3","batchOneColOneSample":"한 열 = 한 샘플","batchMergeHint":"묶으면 한 표가 돼요","batchSameWb":"같은 W, b","batchComputeOnce":"한 번에 계산","batchResultY":"결과 Y","batchResultCaption":"← 같은 W, b로 한 번에 나온 결과","batchFooter1":"샘플들을 한 표(행렬)로 붙이면, 같은 W, b로 한 번에 계산할 수 있어요.","batchFooter2":"그래서 입력을 한 표로 묶으면, 결과 Y도 한 표로 한 번에 나와요.","batchFooter3":"표 한 장이 통째로 같은 W, b를 거쳐요. 열마다 다른 건 입력뿐이고, 계산 규칙(W, b)은 모두 같아요.","connDescription":"층과 층 사이의 각 선이 가중치(w)예요. 입력에 가중치를 곱해 더한 뒤 편향(b)을 더하면 다음 층 Y가 나와요.","connWeightLabel":"가중치(w)","connBiasLabel":"+편향(b)","connFooter":"동그라미는 값, 선은 가중치(w)예요. 가중합에 편향(b)을 더한 값이 다음 층 Y예요.","hiddenDescription":"우리가 보는 건 입력(X)과 출력(Y)뿐이에요. 그 사이 층은 네트워크 안에서만 쓰이는 표현이라서 은닉층이에요.","hiddenVisibleInput":"보임: 입력","hiddenHiddenH":"안 보임: 은닉(H)","hiddenVisibleOutput":"보임: 출력","hiddenBoxLabel":"은닉층 (바깥에서 보이지 않음)","hiddenFooter":"값이 입력 → 은닉층 → 출력으로 한 경로씩 흘러요. 은닉층은 우리가 보지 않는 내부 표현이에요.","deepDescription":"깊다 = 은닉층(중간 단계)이 많다. 딥러닝의 딥이 바로 이 깊이예요.","deepLayerN":"{n}층","deepFooter":"단계가 많을수록 깊은 신경망. 깊을수록 더 정교한 패턴을 배울 수 있어요.","wideWidthN":"너비 {count}","wideNeuronsN":"뉴런 {count}개","wideFooter":"한 층의 뉴런 개수가 너비예요. 넓을수록 그 단계에서 더 많은 특징을 동시에 다룰 수 있어요.","softmaxScoreToProb":"점수 → 확률","softmaxExample":"(예시: e를 3으로 가정)","softmaxScore":"점수","softmaxMid":"중간","softmaxPowerOf3":"3의 거듭제곱","softmaxProb":"확률","softmaxDivideBySum":"합으로 나누기","softmaxRaise":"를 키우면","softmaxPowerLabel":"(3의 {n}제곱)","activationDescription":"입력 X에 따라 출력 Y가 비선형으로 바뀌는 대표적인 활성화 함수입니다. (3단계 양자화 버전)","activationSigmoid":"Sigmoid(X)","activationRelu":"ReLU(X)","activationTanh":"Tanh₃(X)","hiddenLayer1Formula":"W₁·X+b₁ → ReLU","hiddenLayer2Formula":"W₂·H+b₂ → ReLU","captionDotProduct":"왼쪽 X1, X2, X3와 오른쪽 Y1, Y2, Y3가 선으로 이어져 있어요. 오른쪽 노드 하나는 왼쪽이랑 가중치를 곱해서 더한 값(내적)이에요.","captionMatrixMul":"왼쪽은 행렬 A의 한 행, 오른쪽 Y1~Y3는 행렬 B의 열과 내적한 결과예요. 이게 모여 A·B 행렬곱 결과가 됩니다.","captionLinearLayer":"이 구간이 선형 계층이에요. Y = W·X + b로 입력이 다음 층으로 한 번에 계산돼요.","captionActivation":"노드 값이 ReLU나 σ를 거치면 구불구불하게 바뀌어요. 마지막 층 Y1, Y2, Y3가 그렇게 나온 거예요.","captionArtificialNeuron":"점선 원 안이 인공 뉴런 하나예요. 입력(X)에 가중치(w)를 곱해 더하고(w·x+b), ReLU를 거쳐 출력(Y)이 나옵니다.","captionBatch":"표에서 한 열 = 한 사람(한 샘플)이에요. 같은 W, b를 모든 열에 한 번에 적용해서 Y = W·X + b를 한꺼번에 계산해요.","captionConnection":"층과 층 사이 선이 가중치(w)예요. 노드들이 이 선들을 타고 다음 층으로 값이 전달돼요.","captionHidden":"입력(X)과 출력(Y)만 우리가 보고, 그 사이 층 H는 네트워크 안에서만 쓰이는 표현이라서 은닉층이에요. 데이터는 입력 → 은닉 → 출력 순으로 흘러요.","captionDeep":"깊다는 은닉층(중간 단계)이 많다는 뜻이에요. X → A → B → C → … → Y처럼 단계가 많을수록 깊고, 깊을수록 더 정교한 패턴을 배워요.","captionWide":"한 층의 뉴런 개수가 너비예요. 뉴런 1개면 특징 1가지, 256개면 256가지를 동시에 표현할 수 있어요. 층마다 다를 수 있어요(예: 1→2→4→8 또는 256→128→64).","captionSoftmax":"마지막 층 Y1, Y2, Y3를 더하면 1이 되게 나누는 게 소프트맥스예요. 확률처럼 쓸 수 있어요.","captionGradient":"오른쪽에서 왼쪽으로 기울기(∇)가 흐르면서, 손실을 줄이려고 각 층을 조금씩 바꿔요.","captionSummary":"Ch01~Ch12에서 배운 내용을 한 신경망에 모아 둔 모습이에요. 순전파·역전파·가중치·활성화·기울기가 모두 담겨 있어요.","labelWeightedSum":"가중합","labelWeightBias":"가중치·입력+편향","labelWeight":"가중치","labelProbSum":"(확률, 합=1)","labelResult":"결과","labelMatrixResult":"행렬곱 결과","labelNeuron":"뉴런"},"categories":{"math":{"title":"기초 수학","navTitle":"수학"},"midMath":{"title":"중급 수학"},"advMath":{"title":"고급 수학"},"dl":{"title":"기초 딥러닝","navTitle":"딥러닝"},"midDl":{"title":"중급 딥러닝"},"advDl":{"title":"고급 딥러닝"},"ml":{"title":"기초 머신러닝","navTitle":"머신러닝"},"midMl":{"title":"중급 머신러닝"},"advMl":{"title":"고급 머신러닝"},"comingSoon":"이 챕터의 콘텐츠는 준비 중이며, 곧 만나보실 수 있습니다.","preparing":"(준비 중)","completed":"수료"},"concepts":{"sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"딥러닝에서 왜 중요한지","howUsed":"어떻게 사용되는지","problemSolving":"문제 풀이를 위한 설명"},"dl00":{"sectionTitle":"딥러닝이란?","whatIs":["**딥러닝은 스스로 배우는 똑똑한 계산기예요** — 사람이 하나하나 규칙을 정해주는 대신, 컴퓨터가 수많은 데이터를 보며 스스로 규칙을 찾아내는 방법입니다. 사람의 뇌 속에 있는 **뉴런**들이 서로 신호를 주고받는 모습에서 아이디어를 얻어, 작은 계산 단위들을 **여러 층(Layer)**으로 두껍게 쌓아 올렸기 때문에 **딥(Deep)러닝**이라고 부릅니다.","**우리 삶의 모든 곳에 딥러닝이 있어요** — 여러분이 매일 쓰는 **ChatGPT**나 **Gemini** 같은 대화형 AI부터, 카메라로 길을 읽는 **자율주행 자동차**, 나보다 내 취향을 더 잘 아는 **넷플릭스나 유튜브의 추천 시스템**까지 모두 딥러닝의 결과물입니다. 복잡한 이미지나 목소리를 **숫자**로 바꾸고, 그 숫자들을 더하고 곱하며 정답을 찾아내는 것이 핵심 원리입니다.","**기초를 알아야 더 강력한 AI를 만들 수 있어요** — 단순히 만들어진 모델을 가져다 쓰는 것을 넘어, 그 모델을 내 목적에 맞게 고치고 활용하려면 내부에서 일어나는 **기초 수학**을 아는 것이 중요합니다. 숫자들이 어떻게 묶여서 계산되는지 이해하면, AI가 왜 그런 판단을 내렸는지 명확히 파악하고 더 좋은 성능을 낼 수 있도록 튜닝할 수 있습니다.","**딥러닝의 한 층이 하는 일** — 각각의 층은 들어온 숫자에 **가중치**라는 중요도를 곱하고 더해서 다음 층으로 전달합니다. 층이 깊어질수록 인공지능은 데이터에서 점과 선을 넘어서 눈, 코, 입, 그리고 최종적으로는 강아지나 고양이 같은 **큰 특징**을 구별하게 됩니다. 이때 정답에 가까워지도록 가중치를 정밀하게 조정하는 지도가 바로 **기울기(그라디언트)**입니다.","**이 코스의 학습 로드맵** — 딥러닝은 결국 효율적인 곱하기와 더하기의 반복입니다. **Ch01 내적**과 **Ch02 행렬 곱**을 통해 데이터가 이동하는 기본 원리를 배우고, **Ch03~05 인공 뉴런과 활성화 함수**를 거쳐, **Ch06~10 깊고 넓은 신경망의 구조**를 파악합니다. 마지막으로 **Ch11~12**에서 AI가 스스로 학습하는 핵심 원리인 기울기까지 한 걸음씩 정복해 나갑니다.","아래의 **로드맵**을 따라 각 챕터의 목표를 확인해 보세요. 차근차근 따라오시다 보면, 최첨단 AI 시스템들이 내부적으로 어떤 수학적 언어를 쓰는지 스스로 해석할 수 있는 힘이 생길 것입니다."],"whyImportant":[],"howUsed":[],"problemSolving":[]},"dl01":{"sectionTitle":"딥러닝에서 보는 내적","whatIs":["**내적(Dot Product)**은 두 줄의 숫자(벡터)에서 **같은 자리끼리 곱한 다음, 그 결과를 전부 더해서 숫자 하나로 만드는 계산**이에요. 예를 들어 [2, 3]과 [4, 1]이 있으면 2×4 + 3×1 = 11, 이 11이 내적 결과예요.","내적에는 **'두 벡터가 얼마나 같은 방향을 가리키는지'**를 재는 의미가 숨어 있어요. 내적이 **클수록 비슷한 방향**, **0이면 직각(관계없음)**, **음수면 반대 방향**이에요. 그래서 '비슷한 정도(유사도)'를 숫자 하나로 표현할 때 아주 유용해요.","수식으로 쓰면 __DOT_FORMULA__ 이에요. 벡터 길이(원소 개수)가 같아야만 내적을 할 수 있다는 점을 기억하세요.","실제 AI에서는 **수백~수천 차원** 벡터끼리 내적을 해요. 사람은 손으로 하기 어렵지만, 컴퓨터는 순식간에 계산해요. 그래서 '이 문장과 저 문장이 얼마나 비슷한지', '이 이미지와 이 글 설명이 얼마나 맞는지'를 **숫자 하나**로 비교할 수 있어요."],"whyImportant":["딥러닝에서 **뉴런 하나가 출력을 내는 핵심 계산이 바로 내적**이에요. '입력 숫자들'과 '가중치 숫자들'을 같은 자리끼리 곱해서 전부 더하면, 그 뉴런이 '이 입력에 얼마나 반응하는지' 점수가 나와요.","내적이 딥러닝의 **가장 기본 연산**인 이유는, **행렬 곱도 결국 내적을 여러 번 모아놓은 것**이기 때문이에요. 선형 계층, ‘어디에 집중할지’ 점수, **비슷한 글 찾기(검색)**·**사진과 설명 문장 매칭**처럼 거의 모든 곳에서 내적이 반복돼요.","**비슷한지 비교**가 필요한 곳엔 항상 내적이 들어가요. ‘질문을 숫자로 바꾼 것’과 ‘문서를 숫자로 바꾼 것’의 내적, ‘사진을 숫자로 바꾼 것’과 ‘문장을 숫자로 바꾼 것’의 내적처럼, **같은 길이의 벡터**끼리 내적하면 ‘얼마나 비슷한지’ 점수가 나와요. 이걸 **코사인 유사도**(벡터 길이로 나누면)로 쓰기도 해요."],"howUsed":["**검색·비슷한 글 찾기**: 질문을 숫자(벡터)로 바꾸고, 미리 저장해 둔 문서들도 숫자로 바꾼 뒤 **내적**으로 ‘얼마나 비슷한지’ 점수를 매겨요. 점수가 큰 문서만 골라서 답을 만드는 데 써요. 도서관에서 ‘이 주제와 비슷한 책 찾기’처럼요.","**추천**: ‘사용자를 숫자로 바꾼 것’과 ‘영화·상품을 숫자로 바꾼 것’을 내적해서 맞춤 점수를 매겨요. 넷플릭스·유튜브 추천, 쇼핑몰 ‘이런 거 좋아해요’ 추천이 같은 원리예요.","**사진–문장 매칭**: 사진과 문장을 같은 방식의 숫자(벡터)로 바꾼 뒤, **사진 벡터**와 **문장 벡터**의 내적으로 ‘이 사진을 가장 잘 설명하는 문장은 어느 것인지’ 점수를 냅니다. 포토 앨범에서 ‘이 사진에 어울리는 설명 고르기’처럼요.","**번역·요약에서 집중할 단어 정하기**: 문장에서 ‘지금 어떤 단어에 더 집중할지’를 정할 때, 현재 단어와 다른 단어들을 **내적**으로 비교해서 관련도 점수를 구해요. 번역기·요약기가 문맥을 볼 때 쓰는 방식이에요."],"problemSolving":["**계산법**: 두 벡터의 **같은 자리 숫자끼리 곱한 뒤, 결과를 전부 더하면** 내적이에요. 예: [1, 2, 3] · [4, 5, 6] = 1×4 + 2×5 + 3×6 = 4 + 10 + 18 = 32.","**빈 칸 찾기**: 최종 내적 값과 나머지 곱들이 주어져 있으면, 나머지 곱의 합을 먼저 구하고 전체에서 빼면 빈 칸의 곱을 알 수 있어요. 그 곱을 해당 자리 숫자로 나누면 빈 칸 값이 나와요.","**주의할 점**: 두 벡터의 **길이(원소 개수)가 반드시 같아야** 해요. 또 곱한 것들을 **빠짐없이 모두 더해야** 하니까, 원소를 하나씩 체크하면서 계산하면 실수를 줄일 수 있어요.","**검산**: 한 자리라도 빠뜨리면 결과가 달라져요. 곱셈을 모두 한 뒤 **덧셈을 다시 한 번** 확인하는 습관을 들이면 좋아요."],"paragraphs":["**내적**은 두 벡터의 **같은 위치 성분**을 곱한 뒤 모두 더한 값입니다. 수식으로는 __DOT_FORMULA__ 입니다.","딥러닝에서는 선형 변환의 한 스텝, 즉 **가중치 벡터**와 **입력 벡터**의 내적이 **뉴런** 하나의 출력이 됩니다. 여러 뉴런이 있으면 **가중치 행렬**과 입력의 곱(**행렬 곱**)으로 한 번에 계산하고, 그 안에서 각 원소가 바로 내적 한 번씩입니다.","또한 두 벡터의 내적이 클수록 **방향이 비슷하다**고 해석할 수 있어서, **attention**·**유사도**·**임베딩 비교**처럼 '얼마나 비슷한지'를 숫자 하나로 잴 때 자주 쓰입니다."]},"dl02":{"sectionTitle":"딥러닝에서 보는 행렬 곱","whatIs":["**행렬 곱(Matrix Multiplication)**은 두 개의 숫자 표(행렬)를 합쳐서 새로운 표를 만드는 계산이에요. 앞 표의 **가로 한 줄(행)**과 뒤 표의 **세로 한 줄(열)**을 **내적**(같은 자리 곱해서 더하기)하면, 결과 표의 **한 칸**이 채워져요.","이걸 **모든 행·열 조합**에 대해 반복하면 결과 행렬이 완성돼요. 예를 들어 앞 표가 2행 3열, 뒤 표가 3행 2열이면, 결과는 2행 2열짜리 표가 돼요.","행렬 곱이 가능하려면 **앞 행렬의 열 개수**와 **뒤 행렬의 행 개수**가 반드시 같아야 해요. 이 규칙만 기억하면 어떤 크기의 행렬이든 곱할 수 있는지 바로 알 수 있어요.","**왜 행렬로 묶나요?** 한 번에 하나씩 계산하는 대신, **여러 입력을 표로 묶어서** 한 번에 곱하면 컴퓨터(GPU)가 동시에 처리할 수 있어요. 그래서 이미지 한 장, 문장 한 줄이 아니라 **수십 장, 수십 문장**을 한꺼번에 처리할 수 있어요."],"whyImportant":["딥러닝에서 **선형 층(Linear Layer)**은 입력에 가중치 행렬을 곱하는 것이 핵심인데, 이 곱이 바로 **행렬 곱**이에요. 뉴런이 10개면 내적을 10번 해야 하는데, 행렬 곱 한 번이면 **10개 뉴런의 출력을 동시에** 구할 수 있어요.","**GPU**는 이 행렬 곱을 **수천~수만 개 동시에 병렬 처리**하도록 만들어져 있어요. 그래서 **번역기**·**음성 인식**(말을 글자로)·**이미지 인식**(사진에서 물체 찾기)이 실시간에 가깝게 돌아갈 수 있어요. 휴대폰에 올리는 **작은 모델**도 행렬 곱을 줄이거나 압축해서 돌려요.","딥러닝의 **거의 모든 연산**이 행렬 곱으로 귀결돼요. 번역에서 ‘어느 단어에 집중할지’ 계산, 이미지에서 ‘선·모서리·물체’를 뽑는 합성곱, **이미지 생성** 모델까지 내부를 보면 결국 행렬 곱이에요. 행렬 곱을 이해하면 딥러닝 전체의 뼈대를 이해한 거예요."],"howUsed":["**이미지 생성**: 노이즈(잡음)를 단계적으로 줄여가며 그림을 만드는 모델은, 각 단계마다 **행렬 곱**을 반복해요. ‘지금 이 픽셀을 얼마나 바꿀지’를 행렬 곱으로 계산해요.","**번역·챗봇**: 문장을 숫자 행렬로 바꾼 뒤, **가중치 행렬과 곱하는 과정**을 여러 번 반복해요. 이 곱하기 과정이 전체 연산의 대부분을 차지해요.","**이미지 인식**: 사진을 행렬로 넣고, 여러 층의 행렬 곱을 거쳐 ‘선·모서리’ → ‘눈·코’ → ‘강아지·고양이’ 같은 특징을 단계적으로 뽑아요. 휴대폰에서 돌리는 작은 모델도 같은 원리예요.","**추천**: 여러 사용자와 여러 상품을 숫자로 바꾼 뒤 **한꺼번에 행렬 곱**으로 곱해서, ‘누구에게 무엇을 추천할지’ 점수를 한 번에 구해요."],"problemSolving":["**한 칸 구하기**: 결과 표의 **(i, j) 칸** = **A의 i번째 행(가로줄)**과 **B의 j번째 열(세로줄)**을 내적한 값이에요. 같은 자리끼리 곱해서 전부 더하면 돼요.","**빈 칸 전략**: 빈 칸이 결과 행렬에 있으면, 해당 행과 열을 찾아서 내적만 하면 돼요. 빈 칸이 A나 B에 있으면, 결과 값과 나머지 곱들을 이용해 역으로 계산할 수 있어요.","**크기 확인**: 곱하기 전에 반드시 앞 행렬의 **열 수**와 뒤 행렬의 **행 수**가 같은지 확인하세요. 결과 행렬의 크기는 (앞 행렬의 행 수) × (뒤 행렬의 열 수)가 돼요.","**검산**: 한 칸이라도 잘못 계산하면 전체가 틀어질 수 있어요. **한 행 또는 한 열**만 먼저 다 구한 뒤, 그걸 기준으로 나머지를 맞춰 보면 실수를 찾기 쉬워요."],"paragraphs":["**행렬 곱**은 앞 행렬의 **각 행**과 뒤 행렬의 **각 열**을 **내적**해서, 그 결과를 새 행렬의 한 원소로 채우는 연산입니다.","딥러닝에서 **선형 층**(Linear layer)은 입력 벡터에 **가중치 행렬**을 곱하고 **편향**을 더하는데, 이때 곱하는 부분이 바로 **행렬 곱**입니다. (m개 뉴런, n개 입력이면 m×n 행렬과 n차원 입력의 곱으로 m개 출력이 나옵니다.)","**GPU**는 이런 **행렬 곱**을 대량으로 **병렬 계산**하도록 최적화되어 있어서, 딥러닝의 대부분 연산이 **행렬 곱**으로 이루어집니다."]},"dl03":{"sectionTitle":"딥러닝에서 보는 선형 계층","whatIs":["**선형 계층(Linear Layer)**은 입력 숫자들에 **가중치(W)**를 곱하고 **편향(b)**을 더해서 출력을 만드는 단계예요. 수식으로 쓰면 __LINEAR_FORMULA__ 예요. 여기서 W·X는 행렬 곱(내적의 모음)이고, b는 기준선을 올리거나 내리는 역할이에요.","쉽게 비유하면, 시험 점수를 예측하는 공식 '국어×0.3 + 수학×0.5 + 영어×0.2 + 10'이 바로 선형 계산이에요. 여기서 0.3, 0.5, 0.2가 **가중치(W)**, 10이 **편향(b)**, 국어·수학·영어 점수가 **입력(X)**이에요.","선형 계층 하나는 **'입력을 얼마씩 곱하고 얼마를 더해서 출력을 만들지'**를 정하는 장치예요. 출력이 여러 개면 각 출력마다 다른 가중치와 편향을 써서, 한 번에 여러 점수를 낼 수 있어요.","**왜 '선형'이에요?** 입력이 두 배로 늘어나면 출력도 비례해서 늘어나는 **직선 관계**라서 그래요. 이런 관계만으로는 곡선이나 복잡한 패턴을 못 그리기 때문에, 다음 단계에 **활성화 함수**를 꼭 붙여요."],"whyImportant":["딥러닝의 **거의 모든 모델**이 선형 계층을 기본 블록으로 써요. 번역기, 챗봇, **이미지 인식**(강아지/고양이 구분), **추천**(영화·상품 맞춤)까지, __LINEAR_CORE__ 계산이 수백~수천 번 반복돼요. 딥러닝의 **벽돌 한 장**이에요.","**모델 크기**를 정할 때 '입력 몇 개 → 출력 몇 개'로 선형 계층의 크기를 결정해요. 휴대폰에 올리는 **작은 모델**은 이 숫자를 줄이고, 서버에서 돌리는 **큰 모델**은 크게 잡아요. 이 크기가 **용량**과 **과적합** 사이의 균형을 정해요.","선형 계층만 여러 개 쌓으면 **결국 한 번의 곱셈+덧셈과 같아져요**(직선밖에 못 그려요). 그래서 반드시 **활성화 함수**를 붙여 **비선형(꺾임)**을 넣어야, **곡선·복잡한 패턴**을 배울 수 있어요."],"howUsed":["**번역·챗봇**: 문장을 숫자(벡터)로 바꾼 뒤, 선형 계층을 여러 번 거치면서 문맥을 이해하고 다음 단어·답을 만들어요.","**이미지 생성**: 노이즈를 줄이는 각 단계에서 '현재 상태'에 선형 계층을 적용해 '다음에 픽셀을 얼마나 바꿀지'를 예측해요.","**이미지 인식**: 사진에서 뽑은 특징을 선형 계층에 넣어 '강아지·고양이·자동차·표지판' 점수를 한 번에 구해요. 휴대폰에서 돌리는 작은 모델도 같은 구조예요.","**추천**: 사용자·상품을 숫자로 바꾼 뒤 선형 계층에 넣어 '이 사용자에게 이 상품이 얼마나 맞는지' 점수를 구해요."],"problemSolving":["**식 한 줄**: 입력 **X**에 **가중치 행렬 W**를 곱하고 **편향 b**를 더하면 **출력 Y**가 됩니다. __LINEAR_FORMULA__ 예요. 아래 보라색 상자에 나온 것처럼 **X, W, b**를 주고 **Y**를 구하는 게 선형 계층 문제예요.","**숫자 예시**: X = [2, 1], W = [[1,0],[1,1]], b = [1, -1]이면, W·X = (2, 3)이고 여기에 편향 b를 더해 **Y = (2+1, 3-1) = [3, 2]**가 돼요. 편향은 각 출력에 **기준선을 올리거나 내리는** 역할을 해요. **Y의 한 칸**은 **W의 그 행**과 **X**를 내적한 뒤 **b의 그 칸**을 더하면 됩니다.","**빈 칸 전략**: 빈 칸이 **Y**에 있으면 해당 행만 __LINEAR_CORE__ 계산하면 돼요. 빈 칸이 **W나 b**에 있으면, Y와 X는 알고 있으니 식을 정리해서 빈 칸만 구하면 됩니다. 끝나면 __LINEAR_FORMULA__ 에 다시 넣어서 검산하세요."],"paragraphs":["**선형 계층**(Linear layer)은 입력 벡터 X에 **가중치 행렬** W를 곱하고, **편향** 벡터 b를 더해 출력 __LINEAR_FORMULA__ 를 만드는 층입니다.","각 출력 **뉴런**은 자신의 가중치 행(벡터)와 입력 전체의 **내적** 한 번으로 계산됩니다. 그래서 **내적**·**행렬 곱**이 선형 계층의 기본 단위입니다.","선형만으로는 **비선형** 함수를 잘 못 표현하므로, 보통 선형 계층 뒤에 **활성화 함수**를 붙여 비선형성을 넣습니다."]},"dl04":{"sectionTitle":"딥러닝에서 보는 활성화 함수","whatIs":["**활성화 함수(Activation Function)**는 뉴런이 계산한 숫자(가중합)를 **특정 범위나 형태로 변환해 주는 함수**예요. 대표적으로 **ReLU**(음수→0, 양수→그대로), **Sigmoid**(0~1 사이로 압축), **Tanh**(-1~1 사이로 압축)가 있어요.","비유하면 **수도꼭지** 같아요. 물(신호)이 들어오면 '일정 이상만 통과시키거나(ReLU)', '너무 세면 줄여서 내보내는(Sigmoid, Tanh)' 역할을 해요. 이렇게 변환해야 다음 층에서 쓰기 좋은 형태가 돼요.","**ReLU**가 가장 많이 쓰이는 이유는 계산이 간단하고(0보다 크면 그대로, 작으면 0), 학습이 빠르기 때문이에요. **Sigmoid**는 결과를 확률처럼 쓸 때, **Tanh**는 값을 중심(0) 기준으로 대칭시킬 때 써요.","**GELU, SiLU** 같은 변형도 있어요. ReLU보다 부드럽게 꺾여서 번역·챗봇·이미지 생성 같은 모델에서 자주 써요. 어떤 활성화를 쓰느냐에 따라 **학습 속도**와 **성능**이 조금씩 달라져요."],"whyImportant":["**선형 연산만 반복하면 결국 한 번의 곱+더하기와 똑같아요**. 직선을 아무리 이어 붙여도 직선이듯, 선형만으로는 **곡선이나 복잡한 패턴을 절대 표현 못 해요**.","활성화 함수가 **꺾임(비선형)**을 만들어 줘요. 이 꺾임이 있어야 여러 층을 쌓았을 때 **곡선, 복잡한 경계**를 만들 수 있고, 이미지·말·글·소리 같은 복잡한 데이터에서 패턴을 배울 수 있어요.","활성화가 없으면 층을 아무리 깊게 쌓아도 **직선 하나로 할 수 있는 일**밖에 못 해요. 그래서 활성화 함수는 딥러닝이 '딥'해질 수 있게 해주는 **필수 장치**예요."],"howUsed":["**이미지·비디오 인식**: 각 층에서 __LINEAR_CORE__ 뒤 **ReLU**를 거쳐요. 음수를 0으로 잘라내고 양수만 다음 층으로 넘겨서 '선→질감→물체 부분→물체 전체'처럼 특징을 단계적으로 뽑아요.","**번역·챗봇**: 중간 층에는 **ReLU**나 **GELU**를 써서 비선형을 넣고, 마지막에는 **Sigmoid**(예/아니오)나 **Softmax**(여러 후보 확률)로 최종 답을 만들어요.","**이미지 생성**: 노이즈를 줄이는 네트워크 안에서 **ReLU·SiLU** 같은 활성화가 각 층마다 들어가요. ‘지금 이 픽셀을 얼마나 바꿀지’를 비선형으로 계산해요.","**음성 인식**: 소리를 숫자로 바꾼 뒤, 선형+활성화를 여러 번 거쳐 ‘어떤 말인지’를 판단해요. 스마트폰 음성 비서도 같은 구조예요."],"problemSolving":["표에서 X 구간만 보면 Y가 정해져요.","함수 | 규칙","ReLU | 0 이하면 0, 양수면 X 그대로","Sigmoid | 작으면 0, 중간이면 0.5, 크면 1","Tanh₃ | 작으면 -1, 중간이면 0, 크면 1","주의 | 구간 경계는 문제 표를 먼저 보세요"],"paragraphs":["**활성화 함수**는 뉴런의 선형 출력(**가중합**)을 **비선형**으로 바꾸는 함수입니다. **ReLU**, **sigmoid**, **tanh** 등이 대표적입니다.","**선형 층**만 여러 개 쌓으면 결국 하나의 큰 선형 변환과 같아지기 때문에, 층 사이에 **비선형** 활성화를 넣어야 **깊은 신경망**이 복잡한 패턴을 학습할 수 있습니다.","딥러닝에서 '어디에 어떤 **활성화**를 쓸지'는 **모델 설계**의 핵심 선택 중 하나입니다."],"problemDiagramCaption":"노드 값이 ReLU나 σ를 거치면 구불구불하게 바뀌어요. 마지막 층 Y1, Y2, Y3가 그렇게 나온 거예요.","solutionIntro":"활성화 함수 문제는 ‘X가 어느 구간인지’만 보면 Y가 정해져요. 아래는 ReLU, Sigmoid, Tanh₃ 각각의 풀이 방법이에요.","solutionRelu":"**ReLU**: X ≤ 0 → Y = 0, X > 0 → Y = X. 빈 칸이 Y면 X 부호만 보면 돼요.","solutionSigmoid":"**Sigmoid**: X < -1.5 → 0, -1.5~1.5 → 0.5, X > 1.5 → 1. 표·그래프에서 X 구간만 찾아서 해당 Y를 쓰면 돼요. 경계는 문제 표를 먼저 확인하세요.","solutionTanh":"**Tanh₃**: X ≤ -1 → -1, -1 < X < 1 → 0, X ≥ 1 → 1. 표에서 X 구간을 보고 Y(-1, 0, 1)를 넣으면 돼요. 경계값은 문제에서 어느 쪽에 포함하는지 확인하세요.","solutionCaption":"문제마다 구간 경계가 다를 수 있으니, 반드시 문제에 주어진 표(또는 그래프)를 먼저 확인하세요."},"dl05":{"sectionTitle":"딥러닝에서 보는 인공 뉴런","whatIs":["**인공 뉴런(Artificial Neuron)**은 딥러닝의 **가장 작은 계산 단위**예요. 하는 일은 딱 두 단계: ① 입력에 가중치를 곱해 더하고 편향을 더하기(**가중합**: __WEIGHTED_SUM_FORMULA__), ② 그 결과에 활성화 함수 씌우기(__Y_RELU_Z__ 또는 __Y_SIGMOID_Z__).","우리 뇌의 뉴런에서 영감을 받았어요. 뇌 뉴런도 '여러 신호가 들어오면 → 각각 세기를 다르게 해서 합치고 → 일정 이상이면 반응(발화)'하잖아요. 인공 뉴런은 이걸 **수식으로 단순화**한 거예요.","정리하면: **입력(X)** → **가중합(__WEIGHTED_SUM_FORMULA__)** → **활성화(__Y_F_Z__)** → **출력(Y)**. 이 흐름이 인공 뉴런의 전부예요.","**한 뉴런의 출력**이 다음 층의 **여러 뉴런의 입력**이 되고, 그렇게 이어져서 **수천~수억 개**가 연결되면 이미지 인식, 글 생성, 음성 인식 같은 복잡한 일이 가능해져요."],"whyImportant":["번역기, 챗봇, **이미지 인식**(강아지/고양이), **추천**(영화·상품), 스팸 필터 같은 모델은 모두 이 **뉴런을 엄청 많이 이어 붙인 것**이에요. 뉴런 하나를 이해하면 **'모델이 뭘 하고 있는지'** 전체 그림을 읽을 수 있어요.","AI **학습**이란, 이 뉴런들의 **가중치(W)와 편향(b)을 조금씩 조정**해서 '정답에 더 가까운 출력'을 내게 만드는 과정이에요. 한 뉴런의 W, b가 출력에 어떻게 영향을 주는지 알면, **역전파·경사 하강**의 의미도 이해할 수 있어요.","뉴런 하나는 **내적 + 편향 + 활성화**이니까, 지금까지 배운 **내적, 행렬 곱, 선형 계층, 활성화 함수가 모두 합쳐진 것**이에요. 이 챕터가 앞선 개념들을 하나로 묶어주는 역할을 해요."],"howUsed":["**실생활 비유 - 시험 합격 예측**: '국어×0.4 + 수학×0.4 + 영어×0.2 + 5 = 75'를 구한 뒤(가중합), '60 이상이면 합격(1), 미만이면 불합격(0)'으로 바꾸는 것(활성화)이 바로 뉴런 하나의 동작이에요.","**이미지·비디오 인식**: 사진의 한 부분을 입력받아 가중합 후 ReLU를 거쳐 '가로선', '모서리', '눈·코' 같은 특징 점수를 내요. 이런 뉴런이 많이 모이면 '강아지', '차량', '표지판'을 구분해요.","**번역·챗봇**: 문장의 각 부분을 숫자로 바꾼 뒤, 뉴런들이 '어떤 패턴·의미인지' 점수를 내고, 다음 층으로 전달되면서 문맥을 이해하고 답을 만들어요. **이미지 생성**에서는 '노이즈가 얼마나 줄어들지'를 뉴런들이 단계마다 예측해요."],"problemSolving":["**1단계 - 가중합(Z)**: __WEIGHTED_SUM_FORMULA__를 계산해요. W의 한 행과 X를 내적한 뒤 b를 더하면 돼요. 빈 칸이 Z에 있으면 이 단계에서 채울 수 있어요.","**2단계 - 활성화(Y)**: 구한 Z에 문제에서 지정한 활성화 함수를 적용해요. **ReLU**면 Z > 0일 때 __RELU_YZ__, Z ≤ 0일 때 __RELU_Y0__. **Sigmoid**면 표를 보고 Z가 어느 구간인지 확인해서 Y를 정해요.","**빈 칸이 W나 b에 있을 때**: Y와 X가 주어져 있으면, 활성화를 역추적해서 Z를 먼저 구하고, __WEIGHTED_SUM_FORMULA__ 식에서 빈 칸을 풀면 돼요. **한 단계씩 거꾸로** 올라가는 게 핵심이에요."],"paragraphs":["**인공 뉴런**은 입력들에 **가중치**를 곱해 더한 뒤(**가중합** __WEIGHTED_SUM_FORMULA__), **활성화 함수**를 적용해 하나의 출력(__Y_F_Z__)을 내는 단위입니다.","가중합 단계가 **내적**(입력 벡터와 가중치 벡터의 내적)이고, 그 다음 **비선형** 활성화가 붙는 구조입니다.","**딥러닝 모델**은 이런 **뉴런**을 많이 이어 붙여서, 입력에서 출력까지 복잡한 변환을 여러 단계로 나누어 계산합니다."]},"dl06":{"sectionTitle":"딥러닝에서 보는 배치","whatIs":["**배치(Batch)**는 **여러 개의 입력(샘플)을 하나의 표(행렬)로 묶어서, 같은 가중치로 한 번에 계산하는 방식**이에요. 표에서 **한 열 = 한 샘플**(한 장의 이미지, 한 문장, 한 사용자 등)이라고 보면 돼요.","비유하면, 시험지를 **한 장씩** 채점하는 것보다 **30장을 한꺼번에** 채점 기계에 넣는 게 훨씬 빠르죠? 배치도 마찬가지로, 여러 입력을 묶으면 **GPU가 동시에 처리**할 수 있어서 **수십~수백 배** 빨라요.","배치의 핵심: **같은 W(가중치)와 b(편향)**를 모든 샘플에 똑같이 적용해요. 샘플마다 다른 건 **입력 X**뿐이고, 계산 규칙(W, b)은 모두 같아요. 그래서 **행렬 곱 한 번**으로 여러 샘플의 결과를 동시에 구할 수 있어요.","**미니배치**: 학습할 때 데이터 전체를 한 번에 넣지 않고, **32개·64개·128개**처럼 작은 묶음(**미니배치**)으로 나눠서 한 묶음씩 계산하고 가중치를 조금씩 수정해요. 이렇게 하면 메모리도 덜 쓰고, 학습도 더 안정적이에요."],"whyImportant":["**속도**: GPU는 **동시에 많은 연산**을 하는 데 최적화되어 있어요. 배치로 묶으면 GPU를 꽉 채워서 쓰기 때문에, 하나씩 계산할 때보다 **훨씬 빠르게** 학습하고 추론할 수 있어요.","**학습 안정성**: 데이터 1개만 보고 가중치를 바꾸면 **결과가 들쭉날쭉**해요. 미니배치 **평균**으로 기울기를 구해서 수정하면 **안정적으로** 학습돼요. 배치 크기(32, 64, 128 등)는 학습 속도와 품질을 정하는 **핵심 설정**이에요.","**메모리**: 데이터가 수백만 개면 한 번에 GPU에 올릴 수 없어요. **미니배치**로 나눠서 한 묶음씩 처리하고, **기울기**를 구한 뒤 가중치를 업데이트하는 걸 반복해요."],"howUsed":["**챗봇·번역 서비스**: 여러 사용자의 질문을 **배치로 묶어서** 한 번에 GPU에 넣어요. 동시 접속이 많아도 응답 지연을 줄일 수 있어요. 휴대폰에서는 배치 크기를 1에 가깝게 줄여서 메모리를 아끼기도 해요.","**이미지 인식 학습**: 수백만 장의 사진(강아지·고양이 등)으로 학습할 때 **미니배치**(예: 64장)씩 나눠서, 한 묶음마다 예측하고 기울기를 구한 뒤 가중치를 수정해요.","**추천**: 수천 명의 사용자에게 추천 점수를 줄 때, 사용자를 **배치(행렬)**로 묶어서 한 번에 행렬 곱으로 점수를 구해요. 검색에서 여러 문서를 한꺼번에 비교할 때도 배치로 처리해요.","**여러 입력 동시 처리**: 여러 장의 사진을 한꺼번에 ‘강아지/고양이’로 분류하거나, 여러 문장을 한꺼번에 번역할 때도 배치 구조를 써요."],"problemSolving":["**__WEIGHTED_SUM_FORMULA__ 에서 X가 여러 열**: 각 열이 하나의 샘플이에요. **같은 W, 같은 b**를 써서 **각 열마다** 결과를 구하면 돼요. 빈 칸이 어느 열의 어느 행인지 확인하고, **그 열의 숫자만** 사용해서 계산하세요.","**덧셈/뺄셈/곱/평균**: 배치 연산에서 덧셈·뺄셈·곱은 **같은 위치(같은 행, 같은 열)끼리** 해요. 평균(영평균 등)은 **열 단위**로 평균을 내요. 빈 칸이 있으면 해당 열의 숫자들로만 계산하면 돼요.","**검산 팁**: 배치의 각 열은 독립적이에요. 한 열의 결과가 다른 열에 영향을 주지 않으니까, **한 열씩 따로 검산**하면 실수를 찾기 쉬워요."],"paragraphs":["**배치**는 여러 **샘플**(입력)을 묶어 한 번에 **행렬**로 넣고, 같은 **가중치**로 한꺼번에 계산하는 방식을 말합니다.","한 샘플씩 계산하는 것보다 **행렬 연산** 한 번으로 여러 샘플을 처리하면 **GPU**를 잘 활용할 수 있어 훨씬 빠릅니다.","학습 시 **미니배치** 단위로 **gradient**를 구하고 가중치를 **갱신**하는 방식이 일반적입니다."]},"dl07":{"sectionTitle":"딥러닝에서 보는 연결","whatIs":["**연결(Connection)**은 한 층의 뉴런이 다음 층의 뉴런과 **어떻게 이어져 있는지**를 나타내요. 각 연결선에는 **가중치(숫자)**가 있어서, '이 입력이 이 출력에 **얼마나** 영향을 줄지'를 정해요.","**완전 연결(Fully Connected)**: 앞 층의 **모든 뉴런**이 뒤 층의 **모든 뉴런**과 연결된 거예요. 지금까지 배운 선형 계층(__LINEAR_FORMULA__)이 바로 완전 연결이에요. W 표의 모든 칸에 숫자가 있으니까요.","**부분 연결**: W 표에 **0이 있으면** 그 자리는 '연결 없음'이에요. **이미지 인식(CNN)**에서는 '가까운 픽셀만' 연결하고, **번역**에서는 '어느 단어와 어느 단어를 연결할지'를 데이터에서 배워요.","**연결이 많을수록** 모델이 더 많은 것을 표현할 수 있지만, **연산량·메모리**도 늘어나요. 그래서 휴대폰에 올리는 **작은 모델**은 연결을 줄이거나 압축해서 가볍게 돌려요."],"whyImportant":["**연결 구조가 모델의 성격을 결정해요**. 완전 연결은 **정보를 많이** 보지만 파라미터가 많고, 부분 연결은 **효율적**이지만 일부 정보를 놓칠 수 있어요. **어텐션**은 '연결을 데이터가 스스로 정하는' 방식이에요.","**학습**은 이 연결의 **세기(가중치)**를 조절하는 과정이에요. '이 연결은 강하게, 이 연결은 약하게' 하면서 정답에 가까운 출력을 내도록 수정해요. 대형 모델은 이런 연결이 **수십억 개**예요.","**W가 0에 가까운 연결**은 '거의 쓰지 않는 정보'라는 뜻이에요. 학습 후 이런 연결을 잘라 내는 **가지치기(pruning)**로 모델을 작고 빠르게 만들어 휴대폰에 올리기도 해요."],"howUsed":["**이미지 인식(CNN)**: 가까운 픽셀끼리만 연결하는 **부분 연결**로 선·모서리·물체 같은 특징을 뽑아요.","**번역**: '어느 단어가 어느 단어와 관련 있는지' 연결 세기를 **데이터에서 학습**해요. 검색에서 '질문과 어떤 문서가 연결될지'도 비슷한 방식으로 정해요.","**추천·검색**: 사용자와 상품(또는 질문과 문서)이 어떤 가중치로 연결되는지가 곧 **점수**가 돼요. 점수가 높은 것을 추천하거나 검색 결과로 보여 줘요."],"problemSolving":["**W가 0이면 그 연결은 없는 것**: 예를 들어 W의 (2,1) 칸이 0이면, 입력의 1번째 값은 출력의 2번째 값에 **아무 영향도 안 줘요**. 그래서 계산할 때 **건너뛰어도** 돼요.","**Y의 한 칸 구하기**: 해당 출력에 **연결된 입력(W가 0이 아닌 위치)**만 찾아서, 그 위치의 W×X를 곱해 더하고 b를 더하면 돼요. 0인 곳은 곱해도 0이니까 무시해도 같은 결과예요.","**빈 칸 전략**: 먼저 **W 표에서 0인 곳을 파악**하세요. 그다음 0이 아닌 연결만 가지고 식을 세우면 됩니다. W의 빈 칸이라면 Y와 X 값으로 역계산하고, Y의 빈 칸이라면 W와 X로 순서대로 계산하세요."],"paragraphs":["**연결**은 한 층(Layer)의 **뉴런**이 다음 층의 뉴런과 **어떻게 연결되어 있는지** 나타내는 구조를 말합니다.","신경망에서는 **완전 연결**(Fully connected), **부분 연결**(Partially connected), **재귀/순환 연결**(Recurrent connection) 등으로 분류됩니다. 완전 연결은 한 층의 모든 뉴런이 다음 층의 모든 뉴런과 연결되어 보통 **Linear layer**와 같은 형태로 표현되고, 부분 연결은 일부 뉴런만 다음 층과 연결됩니다(예: CNN에서 필터별로 일부 입력만 다음 층으로 연결). 재귀 연결은 출력이 자기 자신이나 이전 단계 입력으로 다시 들어가는 경우를 말합니다.","각 연결에는 **가중치(Weight)**가 할당되어 있어 입력 신호의 **영향력**을 조절할 수 있습니다. 가중치 행렬 W의 (i, j) 원소는 j번째 입력에서 i번째 출력 뉴런으로 가는 연결의 세기이며, 이 값들이 학습으로 조정됩니다.","딥러닝에서는 이런 연결 가중치가 수백만~수십억 개가 되며, __LINEAR_FORMULA__ 에서 W가 0인 위치는 해당 입력이 해당 출력에 기여하지 않는 **부분 연결**을 나타냅니다."]},"dl08":{"sectionTitle":"딥러닝에서 보는 은닉층","whatIs":["**은닉층(Hidden Layer)**은 **입력**과 **출력 사이에 있는 중간 단계**예요. 사용자가 보는 건 입력(사진, 문장, 소리)과 출력(답, 레이블)뿐인데, 그 사이에서 **'숨겨진 특징'**을 만들어내는 층이 은닉층이에요.","동작 순서는 **X → 선형(__LINEAR_CORE__) → ReLU → H(은닉 표현) → 선형(__LINEAR_CORE__) → ReLU → Y(출력)** 이에요. (각 선형 단계의 W, b는 층마다 다름) **H**가 은닉층의 결과물이고, 이 H 속에 '입력의 핵심 특징'이 압축되어 있어요.","**비유**: 사진을 보고 '강아지'라고 답하기까지, '색상 → 선/모서리 → 눈/코/귀 → 강아지!' 순서로 특징을 뽑아가잖아요. 이 **중간 사고 과정**이 은닉층이에요.","은닉층의 **뉴런 수(너비)**가 크면 그 단계에서 더 **다양한 특징**을 담을 수 있어요. 층이 **많을수록(깊을수록)** 더 추상적인 개념까지 배울 수 있어요."],"whyImportant":["은닉층은 **입력을 단계마다 요약·변형**해요. **앞쪽**은 '밝기, 선, 질감'처럼 단순한 특징을, **뒤쪽**은 '눈, 바퀴, 물체 전체'처럼 복잡한 특징을 만들어요.","은닉층이 **없으면** 입력을 바로 출력으로만 바꿀 수 있어서 **단순한 관계**만 표현해요. **있으면** 곡선, 여러 조건의 조합 같은 **복잡한 관계**를 배울 수 있어요.","은닉층의 **너비**와 **깊이**가 모델의 **표현력**을 결정해요. 너무 작으면 성능이 나쁘고, 너무 크면 **과적합**(외우기만 함)이 생길 수 있어요. 휴대폰용 **작은 모델**은 이 크기를 줄여서 가볍게 만들어요."],"howUsed":["**이미지 인식**: '픽셀 → 선/모서리 → 질감 → 물체 부분 → 물체 전체'로 가는 **중간 단계**가 모두 은닉층이에요.","**번역·챗봇**: 문장을 숫자로 바꾼 뒤, **여러 개의 은닉층**을 거치면서 '단어 의미 → 문맥 → 답'을 구체화해요. 검색에서는 '찾은 문서'를 은닉층을 거쳐 요약·통합해요.","**음성 인식**: 소리 → 음소 → 단어 → 문장으로 가는 **중간 표현**이 모두 은닉층이에요."],"problemSolving":["**앞에서부터 순서대로**: X → (1층 __LINEAR_CORE__) → ReLU → H → (2층 __LINEAR_CORE__) → ReLU → Y. 각 단계를 **차례로** 계산하면 돼요. 빈 칸이 H에 있으면 첫 번째 선형+ReLU까지만 계산하면 되고, Y에 있으면 H까지 구한 뒤 두 번째 선형+ReLU를 계산하면 돼요.","**ReLU 주의**: 선형 결과(__LINEAR_CORE__)가 **음수이면 ReLU가 0으로 만들어요**. 그러면 다음 층에서 그 값은 0이 되니까, 해당 항은 **아예 무시**해도 돼요. 이게 은닉층 계산에서 자주 나오는 포인트예요.","**빈 칸이 W나 b에 있을 때**: 은닉층 문제는 **두 단계(2개의 선형+활성화)**로 나눠져 있으니까, 빈 칸이 어느 단계에 있는지 먼저 파악하세요. 해당 단계의 입력과 출력을 알면, 그 단계만의 식으로 빈 칸을 구할 수 있어요."],"paragraphs":["**은닉층**은 **입력층**과 **출력층** 사이에 있는 층들입니다. 입력·출력에 직접 드러나지 않고 '숨겨진' **표현**을 학습합니다.","은닉층이 하는 일은 입력을 점점 **고수준의 특징**(representation)으로 변환하는 것입니다. **낮은 층**은 단순한 패턴, **높은 층**은 더 추상적인 패턴을 담게 됩니다.","은닉층의 **뉴런 수**와 **층 수**가 모델의 **표현력**과 **용량**을 결정하는 핵심 요소입니다."]},"dl09":{"sectionTitle":"딥러닝에서 보는 깊이","whatIs":["**깊다(Deep)**는 것은 **은닉층(중간 단계)이 많다**는 뜻이에요. '**딥**러닝'의 **딥**이 바로 이 **깊이**를 말해요! 각 층에서 선형(__LINEAR_CORE__)+활성화(ReLU)를 하고, 그 결과를 다음 층으로 넘기는 걸 반복해요.","**X → A → B → C → … → Y**처럼 **단계가 많을수록** 깊은 거예요. 비유하면, **1단계**로는 '선 긋기'만 할 수 있고, **10단계**면 '단순한 도형', **100단계**면 '사람 얼굴'을 그릴 수 있는 것처럼, 깊을수록 **더 정교하고 복잡한 패턴**을 배울 수 있어요.","다만 깊다고 무조건 좋은 건 아니에요. 층이 너무 많으면 **기울기 소실**(학습 신호가 앞층까지 잘 안 전달됨)이나 **과적합**(데이터만 외움)이 생길 수 있어요. **지름길(Skip Connection)**처럼 기울기가 앞층까지 잘 전달되게 하는 기법으로 깊은 모델을 안정적으로 학습해요.","**이미지 생성** 모델도 '노이즈를 줄이는 단계'가 많을수록 **깊은** 구조예요. **번역·챗봇** 모델은 블록을 여러 개 쌓아서 **깊은** 구조예요."],"whyImportant":["**단계가 많을수록 더 복잡한 함수를 표현**할 수 있어요. 각 층의 활성화가 '꺾임'을 만들기 때문에, 층이 쌓이면 **수많은 꺾임이 조합**되어 복잡한 곡선·경계를 그릴 수 있어요.","**앞쪽 층**은 '선, 모서리', **중간**은 '눈, 바퀴', **뒤쪽**은 '강아지, 자동차'처럼 **점점 더 추상적인 개념**을 배워요. **깊이** 덕분에 이런 단계적 학습이 가능해요.","**이미지 인식(ResNet)**, **번역(Transformer)** 같은 모델은 **수십~수백 층**인데도 학습이 잘 돼요. **Skip Connection**(지름길), **Layer Norm** 같은 기법으로 기울기가 앞쪽까지 잘 전달되게 해서 '깊이의 한계'를 극복했어요."],"howUsed":["**번역·챗봇**: 문장을 점점 깊이 이해하기 위해 **여러 개의 블록(층)**을 쌓아요. 각 블록이 문맥을 이해해서 마지막에 답을 만들어요. 검색해서 가져온 문서도 깊은 층을 거쳐 요약해요.","**이미지 생성**: 노이즈를 단계적으로 줄이는 구조는 **많은 층**으로 되어 있어요. 각 층이 '지금 픽셀을 얼마나 바꿀지'를 단계적으로 계산해요.","**이미지 인식**: 사진을 넣어 '강아지, 자동차, 표지판'을 여러 단계로 구분해요. 휴대폰용은 층 수를 줄인 **얕은** 버전을 쓰기도 해요.","**음성 인식·번역**: 소리→글자, 언어 간 번역도 **깊은 네트워크**를 거쳐 '음소 → 단어 → 문맥 → 의미'를 단계적으로 파악해요."],"problemSolving":["**예시 문제**: 입력 X = [3, 1, 2]. 1층에서 W₁·X+b₁ = [4, -1, 2](선형), ReLU 후 A = [4, 0, 2]. 2층에서 W₂·A+b₂ = [2, 1, 5], ReLU 후 B = [2, 1, 5]. 여기서 **A₂가 빈 칸**이면?","**풀이**: 1층 선형 결과의 두 번째 성분이 -1이므로, ReLU(-1) = 0. 따라서 **A₂ = 0**이에요. 중간 층 빈 칸은 **그 층의 선형(__LINEAR_CORE__)**을 먼저 구한 뒤, **ReLU(음수→0)**를 적용하면 돼요.","**일반적으로**: 빈 칸이 어느 층의 몇 번째 뉴런이든, **그 층의 입력**까지는 앞에서부터 순서대로 다 구한 다음, 해당 층의 **W의 그 행**과 입력의 내적에 **b의 그 칸**을 더해 선형 값을 구하고, ReLU를 적용하면 답이에요."],"paragraphs":["**깊다**는 것은 **은닉층**이 많은, 즉 **층 수**가 많은 **신경망**을 말합니다. '**딥러닝**'의 '딥'이 바로 이 **깊이**를 가리킵니다.","깊을수록 여러 단계의 **비선형 변환**을 거쳐 **복잡한 함수**를 표현할 수 있지만, **학습 난이도**·**과적합**·**연산 비용**도 함께 늘어납니다.","**ResNet**, **Transformer** 등은 깊은 네트워크를 **안정적으로 학습**하기 위한 **구조적 기법**들을 담고 있습니다."]},"dl10":{"sectionTitle":"딥러닝에서 보는 너비","whatIs":["**너비(Width)**는 **한 층 안에 뉴런이 몇 개 있는지**를 말해요. 뉴런이 많을수록(넓을수록) 그 단계에서 **동시에 여러 가지 특징을 표현**할 수 있어요. 뉴런 1개면 특징 1가지, 256개면 256가지를 동시에 볼 수 있어요.","비유하면, **시험지에 문제가 1개**면 한 가지만 평가하지만, **문제가 100개**면 다양한 능력을 동시에 평가하는 것처럼, 넓은 층은 **한 번에 더 다양한 정보**를 처리해요.","층마다 너비가 다를 수 있어요. '64 → 128 → 256'처럼 **점점 넓어지는** 구조, '256 → 128 → 64'처럼 **점점 좁아지는** 구조, 또는 중간만 넓은 **병목(bottleneck)** 구조를 써요.","**큰 모델**(서버용 번역·챗봇)은 한 층의 너비가 **수천 단위**로 넓어요. 휴대폰에 올리는 **작은 모델**은 이 숫자를 줄여서 연산량과 메모리를 아껴요."],"whyImportant":["**깊이(층 수)**와 **너비(뉴런 수)**가 모델의 **전체 크기(파라미터 수)**를 결정해요. 같은 파라미터 수라도 '**깊고 좁게**' 쌓을지 '**얕고 넓게**' 펼칠지에 따라 성능이 달라져요.","너비가 크면 **한 단계에서 더 많은 특징**을 다루지만 **연산량·메모리**가 늘어나요. 너무 크면 **과적합** 위험도 커져요.","**병목 구조**는 중간만 넓게 해서 **핵심 특징**을 넓은 층에서 추출하고, 앞뒤는 좁게 해서 압축해요. 이미지 인식·번역 모델이 이런 설계를 활용해요."],"howUsed":["**이미지 인식(CNN)**: 각 층의 **채널 수**가 그 층의 너비예요. 3(RGB) → 64 → 128 → 256 → 512처럼 **점점 넓어지며** 선·모서리·물체 같은 다양한 특징을 뽑아요.","**번역·챗봇**: 각 층에서 한 번에 다루는 **숫자 개수(차원)**가 그 층의 너비예요. 큰 모델은 이 값이 **수천**으로 넓고, 휴대폰용 **작은 모델**은 256, 512처럼 줄여서 써요.","**추천·검색**: 사용자·상품·문서를 숫자(벡터)로 바꿀 때 **차원 수**가 그 단계의 너비예요. 256차원이면 256가지 특징을 동시에 담아 더 세밀한 매칭이 가능해요."],"problemSolving":["**넓어지는 구조에서도 각 층은 똑같이 선형(__LINEAR_CORE__) → ReLU**: 빈 칸이 어느 층의 몇 번째 뉴런인지 확인하고, **그 층의 입력**과 **W의 해당 행, b의 해당 칸**만 써서 계산하면 돼요.","**W 크기 주의**: 층마다 너비가 달라지면 **W의 크기도 달라져요**. W는 (현재 층 너비 × 앞 층 너비) 크기니까, 빈 칸에 해당하는 **행**을 찾아서 앞 층 출력과 내적하고 b를 더하세요.","**한 층씩 앞에서부터**: 깊이 문제와 마찬가지로, **앞 층의 출력을 먼저 구한 뒤** 다음 층으로 넘겨요. 각 층의 ReLU(음수→0)를 빠뜨리지 않도록 주의하세요."],"paragraphs":["**너비**는 한 층에 있는 **뉴런**(또는 **채널**)의 개수를 말합니다. **넓은 층**은 같은 단계에서 더 많은 **특징**을 동시에 표현할 수 있습니다.","**깊이**(층 수)와 **너비**(층당 뉴런 수)를 어떻게 맞추느냐에 따라 모델의 **용량**과 **효율**이 달라집니다. 같은 **파라미터** 수라도 깊게 쌓을지 넓게 펼칠지 선택할 수 있습니다.","실제 모델에서는 층마다 **너비**를 다르게 두어, 필요한 만큼만 **표현력**을 키우는 경우가 많습니다."]},"dl11":{"sectionTitle":"딥러닝에서 보는 소프트맥스","whatIs":["**소프트맥스(Softmax)**는 **여러 개의 점수(숫자)를 확률로 바꿔주는 함수**예요. 모든 값이 **0~1 사이**가 되고, **전부 더하면 정확히 1**이 돼요. 그래서 '확률'처럼 읽을 수 있어요.","점수를 **한 번 키운 뒤**(예: __SOFTMAX_EXP__), 그 **합(__SOFTMAX_SUM__)으로 나누면** 확률이 돼요. 이렇게 하면 가장 큰 점수가 **더욱 크게 부각**되고 나머지는 상대적으로 작아져요. 1등과 2등의 차이가 원래보다 뚜렷해지는 거예요.","예: 점수 [3, 1, 0]을 키우면 [약 20, 2.7, 1]이고, 합은 약 23.7이에요. 이걸 합으로 나누면 [0.84, 0.11, 0.04]처럼 확률이 됩니다. 3이 1보다 3배인데, 확률로는 약 8배 차이가 나요!","**왜 '키운 뒤 나누기'인가요?** 점수 차이를 **뚜렷하게** 만들기 위해서예요. 차이가 작아도 키우고 나누면 확률 차이가 커져서, '가장 그럴듯한 답'을 골라내기 쉬워요."],"whyImportant":["**분류 문제의 마지막 층**에서 거의 항상 소프트맥스를 써요. '강아지 70%, 고양이 25%, 새 5%'처럼 **각 클래스별 확률**을 구할 수 있어서, 모델이 **얼마나 확신하는지**도 알 수 있어요.","학습할 때 소프트맥스와 **교차 엔트로피 손실**을 함께 쓰면 **기울기가 깔끔하게** 나와서 학습이 안정적이에요. '정답 확률을 높이고 나머지를 낮추는' 방향으로 자연스럽게 학습돼요.","'모든 값이 양수 + 합이 1'이면 **확률 분포**의 정의와 맞아요. 그래서 통계적으로 **가장 자연스러운 확률 변환** 방법이에요."],"howUsed":["**이미지 분류**: 마지막 층 점수에 소프트맥스를 적용해 **각 클래스 확률**(강아지 70%, 고양이 25%, 새 5% 등)을 구해요. 가장 높은 확률이 최종 답이에요.","**번역·챗봇**: 다음 **단어**를 고를 때, 후보 단어들에 대한 점수를 소프트맥스로 확률로 바꾸고, 그 확률에 따라 단어를 뽑아요. 높은 확률이 자주 뽑히지만 낮은 확률도 가끔 뽑혀서 **다양한 문장**이 나와요.","**번역에서 집중할 단어 정하기**: '어느 단어에 얼마나 집중할지' 관련도 점수에 소프트맥스를 씌워 **가중치(확률)**로 만들어요. 이 가중치로 **가중 평균**하면 '집중할 부분'이 강조돼요. 검색에서 '어느 문서를 더 쓸지' 정할 때도 비슷해요.","**스팸 필터**: '스팸일 확률 / 정상일 확률'을 소프트맥스로 구한 뒤, 더 높은 쪽으로 분류해요."],"problemSolving":["**계산 순서**: ① 점수(Z) 구하기 → ② 각 점수를 '키운 값'으로 바꾸기(문제에서는 3의 거듭제곱 사용) → ③ 키운 값들을 전부 더한 '합' 구하기 → ④ 각 키운 값을 합으로 나누면 확률(Y). 이 순서를 따르면 돼요.","**빈 칸 찾기**: Y가 빈 칸이면 '해당 키운 값 ÷ 합'으로 구해요. 키운 값이 빈 칸이면 '확률 × 합'으로 역계산하고, Z가 빈 칸이면 키운 값에서 역으로 구해요. 합이 빈 칸이면 키운 값들을 전부 더하면 돼요.","**검산**: 계산이 끝나면 Y의 **모든 값이 0~1 사이**인지, **전부 더하면 1**이 되는지 확인하세요. 1이 안 되면 어딘가 계산이 틀린 거예요. 문제에서 '3의 거듭제곱'을 쓰는지 **꼭 확인**하세요."],"paragraphs":{"0":"**소프트맥스**는 실수 벡터를 **0과 1 사이**의 값으로 바꾸고, 전체 **합이 1**이 되게 만드는 함수입니다. 따라서 **확률 분포**처럼 해석합니다.","1":"**분류 문제**에서 마지막 층 출력에 소프트맥스를 붙이면 각 **클래스**에 대한 **확률**로 볼 수 있어, 보통 **교차 엔트로피 손실**과 함께 씁니다.","2":"점수를 키운 뒤 합으로 나누기 때문에, 가장 큰 값이 두드러지게 **확대**됩니다."}},"dl12":{"sectionTitle":"딥러닝에서 보는 기울기","whatIs":["**기울기(Gradient)**는 '**가중치(파라미터)를 아주 조금 바꿀 때, 틀린 정도(손실)가 얼마나, 어느 방향으로 변하는지**'를 알려주는 숫자예요. '지금 어느 쪽으로 가야 손실이 줄어드는지' 방향을 알려주는 **나침반** 같아요.","**비유**: 눈을 감고 산에서 내려올 때 **발밑의 경사(기울기)**를 느끼고, '이쪽이 내리막이구나' 하고 한 걸음씩 내딛는 거예요. 기울기 **반대 방향**으로 가면 골짜기(손실 최소)에 도달해요. 이게 **경사 하강법(Gradient Descent)**이에요.","**역전파(Backpropagation)**는 출력 쪽에서 입력 쪽으로 기울기를 **한 층씩 전달하는 방법**이에요. **연쇄 법칙(Chain Rule)**을 이용해서, 모든 층의 모든 가중치에 대한 기울기를 **한 번에 효율적으로** 구해요.","**순전파**는 입력 → 출력 방향으로 계산하고, **역전파**는 손실에서 나온 기울기를 출력 → 입력 방향으로 전달해요. 이 둘이 짝으로 돌아가면서 학습이 진행돼요."],"whyImportant":["**AI 학습 = 기울기를 보고 가중치를 수정하는 과정**이에요. 기울기가 없으면 '어느 방향으로 수정할지' 알 수 없어서 **학습이 불가능**해요. 기울기는 딥러닝 학습의 **심장**이에요.","**학습률(Learning Rate)**은 '한 번에 얼마나 움직일지'를 정하는 값이에요. **Adam**, **AdamW** 같은 **옵티마이저**는 기울기 크기에 맞춰 **걸음 크기를 자동으로 조절**해 줘요. 이미지 인식·번역·챗봇 학습에서도 기울기가 핵심이에요.","기울기가 **너무 크면(폭발)** 학습이 불안정하고, **너무 작으면(소실)** 앞쪽 층이 거의 학습 안 돼요. **Gradient Clipping**, **Batch Norm**, **Skip Connection**으로 이를 줄여요."],"howUsed":["**모든 학습 가능한 모델**: 번역기, 챗봇, **이미지 인식**(강아지/고양이), **추천**, 스팸 필터까지, 학습은 모두 **순전파 → 손실 → 역전파(기울기) → 가중치 수정**을 반복하는 과정이에요.","**추가 학습(파인튜닝)**: 이미 학습된 모델을 **특정 용도**(예: 우리 회사 문서만 답하기)에 맞게 **조금 더 학습**할 때도 새 데이터로 기울기를 구해서 가중치를 조금씩 수정해요. 휴대폰에서 조금씩 학습할 때도 같은 방식이에요.","**순전파와 역전파**: 순전파는 __GRADIENT_FORWARD__ 처럼 **앞으로** 계산하고, 역전파는 **dZ, dW, dX** 같은 기울기를 **뒤에서 앞으로** 전달해요. 층이 아무리 많아도 연쇄 법칙으로 한 번에 기울기를 구할 수 있어요."],"problemSolving":["**문제 구조**: 식은 **순전파 __GRADIENT_FORWARD__** 또는 **역전파 __GRADIENT_BACKWARD__** 중 하나예요. 빈 칸(?)은 **X의 한 성분** 또는 **Z(또는 dZ)의 한 성분** 중 하나만 나와요. W와 dW는 모두 채워져 있어요.","**순전파(__GRADIENT_FORWARD__)**: 결과 Z의 한 칸 = **W의 해당 행**과 **X**의 내적이에요. 빈 칸이 **Z**에 있으면 → 그 행의 W 성분과 X를 곱해서 더하면 돼요. 빈 칸이 **X**에 있으면 → 다른 Z와 W 행으로 식을 세워 그 X 성분만 구하면 돼요.","**역전파(__GRADIENT_BACKWARD__)**: **순전파와 같은 계산 구조**에요. dZ의 한 칸 = **dW의 해당 행**과 **X**의 내적. 빈 칸이 **dZ**에 있으면 → dW 그 행과 X를 곱해 더하고, 빈 칸이 **X**에 있으면 → 식으로 그 X 성분을 구하면 돼요."],"paragraphs":["**기울기**(gradient)는 **손실 함수**를 각 **파라미터**로 **편미분**한 벡터입니다. '파라미터를 조금 바꿀 때 손실이 얼마나, 어떤 **방향**으로 변하는지'를 나타냅니다.","딥러닝 **학습**은 보통 '기울기 **반대 방향**으로 파라미터를 조금씩 움직여 **손실**을 줄이는' 방식(**경사 하강**)입니다. 이때 기울기는 **역전파**(backpropagation)로 효율적으로 계산합니다.","**학습률**, **옵티마이저**, **gradient clipping** 등은 이 기울기를 어떻게 사용할지를 결정하는 **핵심 설정**입니다."]},"dl13":{"sectionTitle":"전체 요약","whatIs":["아래 도식은 **Ch01~Ch12**에서 배운 내용을 **한 신경망**에 모아 둔 것이에요. 입력 X → 은닉층(A, B, C, D) → 출력 Y, 그 사이 **가중치(W)**·**활성화(ReLU 등)**·**배치**·**기울기(∇)**가 어떻게 붙는지 한눈에 볼 수 있어요.","실제 학습은 **순전파**(앞으로 계산) → **손실** → **역전파**(기울기) → **가중치 수정**을 반복하는 과정이에요. 이 코스를 다 끝내면 그 흐름을 계산으로 따라갈 수 있게 됩니다."],"whyImportant":[],"howUsed":[],"problemSolving":[]}},"kimpoMdooai":{"layoutEyebrow":"모두의AI 기반 수업계획서","layoutTitle":"김포 「AI로 김포를 읽다」 강의·교육 페이지","layoutLearnCta":"모두의AI 배우기","layoutNavAria":"김포 교육 프로그램 페이지 이동","navPromo":"플랫폼 소개","navCourse":"교육 과정 소개","promoMetaTitle":"김포 AI·SW 수업계획서","promoMetaDescription":"모두의AI를 활용한 김포 데이터 기반 AI·SW 수업계획서와 강의 운영 구조를 정리한 교육 소개 페이지입니다.","promoPosterAlt":"김포시·연세대 AI·SW 교육과정 아이디어 공모전 포스터","promoBadge":"모두의AI 기반 강의 설계","promoTitle":"김포의 실제 문제를 데이터로 읽고, AI로 해결해 보는 수업","promoDescription":"모두의AI는 기초 수학, 딥러닝, 머신러닝을 한 흐름으로 연결해 학생이 개념에서 프로젝트까지 자연스럽게 넘어가도록 돕습니다. 이번 교육안은 김포의 인구·교통·환경·상권 데이터를 바탕으로, 지역 문제를 스스로 정의하고 AI로 분석하는 경험을 만드는 데 초점을 맞추었습니다.","promoFormulaTitle":"글로벌 AI 학습 플랫폼 소개","promoFormulaDescription":"모두의AI는 전 세계 다양한 국가의 AI 연구자와 개발자들이 활용하는 글로벌 학습 플랫폼입니다.","promoPlatformGeneralDescription":"활성 사용자도 500명 이상으로, 기초 학습부터 실전 적용까지 폭넓은 AI 학습 커뮤니티가 형성되어 있습니다.","promoPrimaryCta":"16차시 교육 과정 보기","promoSecondaryCta":"모두의AI 바로가기","overviewAudienceLabel":"대상","overviewSessionsLabel":"운영 규모","overviewFormatLabel":"수업 형태","overviewRegionLabel":"지역 연계","overviewPlatformLabel":"핵심 플랫폼","overviewEnrollmentLabel":"권장 인원","strengthsEyebrow":"모두의AI 선택 이유","strengthsTitle":"왜 모두의AI를 중심 플랫폼으로 선택했는가","strengthsDescription":"단순 체험 도구가 아니라, 수학적 이해와 데이터 기반 문제 해결을 함께 키우는 교육 흐름이 필요했습니다.","bestChoiceEyebrow":"선정 근거","bestChoiceTitle":"왜 모두의AI가 AI·SW 교육의 최선인지","bestChoiceDescription":"모두의AI 선택 근거를 교육 효과와 학교 현장 적용 관점에서 한눈에 확인할 수 있도록 정리했습니다.","bestWhyLabel":"선정 이유","bestSchoolFitLabel":"학교 현장 적합성","bestQuoteLabel":"원문 핵심 문장","flowEyebrow":"학습 흐름","flowTitle":"학생이 따라가게 될 학습 여정","outcomesEyebrow":"학습 성과","outcomesTitle":"이 수업이 남기는 변화","toolsEyebrow":"운영 도구","toolsTitle":"학교 현장에서 바로 쓸 수 있는 도구 구성","toolsDescription":"브라우저 기반 학습과 공개 데이터, Colab 실습을 결합해 별도 설치 없이 수업-실습-프로젝트를 한 번에 운영할 수 있습니다.","toolsCta":"교육 과정 상세 보기","courseMetaTitle":"김포시-연세대 AI·SW 융합 교육과정","courseMetaDescription":"모두의AI 기반 16차시 수업계획, 차시별 운영, 평가 계획 및 강의 준비 요소를 정리한 교육 페이지입니다.","courseBadge":"교육 계획안 개요","courseTitle":"16차시로 완성하는 김포시-연세대 AI·SW 융합 교육과정","courseDescription":"기초 수학, 기초 딥러닝, 기초 머신러닝, 팀 프로젝트를 한 흐름으로 엮어 학생이 도시 문제를 데이터 문제로 바꾸고 해석하는 경험을 설계했습니다.","coursePosterAlt":"김포 AI·SW 수업계획 소개 이미지","coursePosterEyebrow":"Contest Context","coursePosterDescription":"이번 제안안은 공모전 제출용으로 구성한 웹 교안이며, 포스터의 시각 톤을 그대로 이어 받아 발표 자료처럼 읽히도록 설계합니다.","goalsTitle":"수업 목표","materialsTitle":"운영 준비와 사용 도구","materialsLabel":"준비물","toolsLabel":"주요 플랫폼","quickStartEyebrow":"바로 시작","quickStartTitle":"바로 학습 시작하기","quickStartDescription":"수업 운영 전에 바로 접속해 사용할 수 있도록 모두의AI 주요 챕터 링크를 준비했습니다.","quickMath":"기초 수학 시작","quickDl":"기초 딥러닝 시작","quickMl":"기초 머신러닝 시작","quickMidMath":"중급 수학","quickMidDl":"중급 딥러닝","quickMidMl":"중급 머신러닝","quickAdvMath":"고급 수학","quickAdvDl":"고급 딥러닝","quickAdvMl":"고급 머신러닝","phaseEyebrow":"4단계 학습","phaseTitle":"16차시 운영 로드맵","phaseDescription":"기초 이해 → 딥러닝 구조화 → 머신러닝 적용 → 지역 문제 해결의 4단계로 수업이 누적되도록 설계했습니다.","phaseOutputLabel":"산출물","assessmentEyebrow":"평가 설계","assessmentTitle":"평가 계획 및 방식","assessmentDescription":"정답률만이 아니라 과정, 설명력, 윤리 인식, 협력 태도까지 평가에 반영해 실제 문제해결 역량을 확인합니다.","curriculumEyebrow":"16차시 구성","curriculumTitle":"차시별 교육 구성","curriculumDescription":"각 차시는 모두의AI 챕터 학습, 실습 도구, 성취 기준, 김포 지역 문제 연결까지 한 번에 보이도록 정리했습니다.","tableSession":"차시","tableTopic":"주제","tableSummary":"주요 내용","tableMaterials":"자료·도구","tableAchievement":"성취 기준","tableKimpoConnection":"김포 연계","courseChapterCta":"해당 챕터로 이동","track":{"math":"기초 수학","dl":"기초 딥러닝","ml":"기초 머신러닝","project":"프로젝트"},"issueEyebrow":"김포 지역 현안","issueTitle":"김포 지역 현안과 데이터 연결","issueDescription":"이 과정은 추상적인 AI 체험이 아니라, 김포의 실제 현안을 데이터와 함께 읽고 모델링하는 수업으로 설계했습니다.","issueTableArea":"현안 분야","issueTableDetail":"구체적 내용","issueTableDataSource":"활용 데이터 출처","issueTableLinkedSessions":"연계 차시","finalOutcomeTitle":"최종 산출물과 기대 효과","courseBackCta":"플랫폼 소개로 돌아가기","courseLearnCta":"모두의AI 배우기 연결"},"locale":{"ko":"한국어","ja":"日本語","en":"English","zh":"中文"},"chapters":{"dl00":{"chapter":"Chapter 00","title":"딥러닝의 첫걸음: AI는 어떻게 생각할까?","description":"딥러닝이 무엇인지, Ch01~Ch12에서 무엇을 배우는지 한눈에 알아봅니다."},"dl01":{"chapter":"Chapter 01","title":"벡터 내적: 데이터 사이의 닮은꼴 찾기","description":"두 벡터의 방향과 크기를 곱하여 하나의 값으로 나타내는 가장 기본적인 연산이다."},"dl02":{"chapter":"Chapter 02","title":"행렬 곱셈: 한꺼번에 계산하는 마법","description":"두 행렬의 곱은 앞 행렬의 행과 뒤 행렬의 열을 내적한 값으로 채워진 새 행렬이다."},"dl03":{"chapter":"Chapter 03","title":"선형 계층: 중요도를 결정하는 가중치","description":"선형 계층(또는 선형 변환층). 입력에 가중치 행렬을 곱하고 편향을 더하는 층이다."},"dl04":{"chapter":"Chapter 04","title":"활성화 함수: 인공지능에 판단력을 더하다","description":"활성화 함수. 뉴런의 출력을 비선형으로 만드는 함수이다."},"dl05":{"chapter":"Chapter 05","title":"인공 뉴런: 정보를 모아 신호를 보내는 단위","description":"인공 뉴런. 입력을 받아 가중합을 계산하고 활성화 함수를 적용한 단위이다."},"dl06":{"chapter":"Chapter 06","title":"배치 처리: 묶어서 한 번에 학습하기","description":"배치. 여러 샘플을 묶어 한 번에 계산하는 단위이다."},"dl07":{"chapter":"Chapter 07","title":"가중치 연결: 지능을 만드는 수조 개의 사슬","description":"연결. 층과 층, 뉴런과 뉴런 사이의 가중치 연결이다."},"dl08":{"chapter":"Chapter 08","title":"은닉층: 눈에 보이지 않는 생각의 깊이","description":"은닉. 입력·출력 층 사이에 있는 층이다."},"dl09":{"chapter":"Chapter 09","title":"깊은 신경망: 더 복잡한 문제를 푸는 힘","description":"깊이. 은닉층이 많은 신경망을 깊은 신경망이라 한다."},"dl10":{"chapter":"Chapter 10","title":"너비와 뉴런: 한 번에 더 많은 특징 찾기","description":"너비. 한 층의 뉴런 수가 많은 것을 넓은 층이라 한다."},"dl11":{"chapter":"Chapter 11","title":"소프트맥스: 결과를 확신으로 바꾸기","description":"소프트맥스 함수(확률 분포화). 출력을 0~1 사이로 바꾸고 합이 1이 되게 한다."},"dl12":{"chapter":"Chapter 12","title":"기울기와 역전파: 실수를 통해 배우는 법","description":"기울기. 손실을 줄이기 위해 파라미터를 어느 방향으로 움직일지 알려준다."},"dl13":{"chapter":"Chapter 13","title":"총정리: 한눈에 보는 인공지능 지도","description":"Ch01~Ch12에서 배운 내용을 하나의 신경망 도식으로 모아서 볼 수 있다."}},"midMathChapters":{"midMath00":{"chapter":"Chapter 00","title":"중급 수학과 인공지능: 한 걸음 더 깊어지는 수학의 세계"},"midMath01":{"chapter":"Chapter 01","title":"벡터와 벡터 공간: 크기와 방향을 한 번에"},"midMath02":{"chapter":"Chapter 02","title":"벡터의 내적과 정사영: 얼마나 닮았는지 숫자로 재기"},"midMath03":{"chapter":"Chapter 03","title":"행렬과 데이터 묶음: 여러 벡터를 한 장에 담는 법"},"midMath04":{"chapter":"Chapter 04","title":"행렬 곱셈과 선형 변환: 공간을 돌리고 늘리는 마법"},"midMath05":{"chapter":"Chapter 05","title":"역행렬과 행렬식: 되감기와 넓이의 비밀"},"midMath06":{"chapter":"Chapter 06","title":"선형 독립과 랭크: 진짜 차원은 몇 개일까?"},"midMath07":{"chapter":"Chapter 07","title":"고유값과 고유벡터: 변해도 변하지 않는 방향"},"midMath08":{"chapter":"Chapter 08","title":"방향 도함수와 그라디언트: 올라가야 할 길 찾기"},"midMath09":{"chapter":"Chapter 09","title":"야코비안 행렬: 여러 입력이 움직일 때 출력은?"},"midMath10":{"chapter":"Chapter 10","title":"헤시안 행렬: 곡면이 휘어진 정도 읽기"},"midMath11":{"chapter":"Chapter 11","title":"테일러 급수: 복잡한 함수를 다항식으로 따라하기"},"midMath12":{"chapter":"Chapter 12","title":"볼록 최적화: 함정 없이 최저점 찾기"},"midMath13":{"chapter":"Chapter 13","title":"조건부 확률과 종속성: 하나를 알면 다른 하나가 보일 때"},"midMath14":{"chapter":"Chapter 14","title":"베이즈 정리: 새 정보로 믿음을 업데이트하기"},"midMath15":{"chapter":"Chapter 15","title":"공분산과 상관계수: 둘이 함께 움직이는 정도"},"midMath16":{"chapter":"Chapter 16","title":"다변량 정규 분포: 여러 변수가 만드는 종 모양"},"midMath17":{"chapter":"Chapter 17","title":"최대 가능도 추정: 데이터가 말해 주는 가장 그럴듯한 값"},"midMath18":{"chapter":"Chapter 18","title":"엔트로피: 얼마나 알 수 없는지 재기"},"midMath19":{"chapter":"Chapter 19","title":"크로스 엔트로피와 KL 발산: 두 분포가 얼마나 다른가"},"midMath20":{"chapter":"Chapter 20","title":"중급 수학 총정리: 지금까지의 수학 한눈에"}},"midMathCh00":{"chapter":"Chapter 00","title":"중급 수학과 인공지능: 한 걸음 더 깊어지는 수학의 세계","description":"중급 수학은 AI가 세상을 계산할 때 쓰는 ‘언어’를 더 정밀하게 만드는 과정이에요. 이 코스에서는 데이터를 단순한 숫자 묶음이 아니라 **벡터**와 **행렬**로 보고, 그 사이를 오가는 규칙을 **선형 변환(Linear Transformation)**으로 이해합니다. 또한 여러 변수에서의 변화량을 다루는 **야코비안(Jacobian)**과 곡률 정보를 담는 **헤시안(Hessian)**으로, 학습이 왜 빠르거나 느려지는지까지 해석해요.","sectionTitle":"벡터·행렬·민감도: 중급 수학이 AI를 설명하는 방식","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","problemSolving":"문제 풀이를 위한 설명"},"whatIs":{"0":"**벡터 공간(Vector Space)**은 ‘방향과 크기’로 데이터를 다루는 틀입니다. 이미지를 한 장의 픽셀로 보지 않고, 특징(feature)들의 좌표로 바꿔 모델이 다루기 쉬운 형태로 만드는 거죠.","1":"**행렬(Matrix)**은 여러 벡터를 동시에 변환하는 도구이고, 특히 **선형 변환**은 ‘기저(좌표계)가 바뀌면 어떻게 값이 움직이는지’를 일관된 규칙으로 표현합니다. 그래서 신경망의 각 층이 수학적으로 설명됩니다.","2":"**야코비안(Jacobian)**과 **헤시안(Hessian)**은 “여러 입력이 있을 때 출력이 얼마나 민감하게 변하는가”, “손실 표면이 얼마나 휘어져 있는가”를 수치로 보여주는 지도입니다. 이 지도 위에서 학습률(학습 속도)과 업데이트 방향을 더 똑똑하게 설계할 수 있어요."},"whyImportant":{"0":"AI가 실제로 하는 일은 수많은 연산을 반복하며 ‘오차를 줄이는 것’이고, 그 오차 변화의 원리를 이해하려면 다변수 변화(기울기·민감도)가 필요해요. 그래서 중급 수학은 단순한 지식이 아니라 모델을 해석하는 도구가 됩니다.","1":"**선형 대수**는 표현(표상)을 바꾸는 규칙을 제공합니다. 임베딩(embedding), 주성분 같은 아이디어도 결국 “벡터를 어떻게 재배치하느냐”의 문제로 바뀝니다. 중급 수학을 알면 결과를 더 정확히 설명할 수 있어요.","2":"**헤시안**을 이해하면 ‘학습이 왜 어떤 지점에서 느려지는지/빨라지는지’를 더 정교하게 볼 수 있습니다. 또한 두 번째 미분은 최적화에서 뉴턴법, 신뢰영역 같은 방법의 핵심 근거가 됩니다."},"howUsed":{"0":"모델의 **순전파(Forward)**에서는 입력 벡터가 행렬 곱과 선형 변환을 거치며 표현이 바뀝니다. 이때 어떤 특징이 강조되고 무엇이 억제되는지가 수학으로 드러나요.","1":"**역전파(Backward)**에서는 변화량이 필요하므로 야코비안이 등장합니다. 연쇄법칙은 “작은 변화가 출력으로 전달되는 경로”를 정리해 주는 언어이고, 그 덕분에 정확한 기울기 계산이 가능해집니다.","2":"최적화에서는 학습을 안정적으로 만들기 위해 곡률(헤시안)을 활용할 수 있습니다. 헤시안은 ‘바닥이 완만한지/급한지’를 알려줘서 업데이트 폭을 설계하는 데 쓰여요."},"problemSolving":{"0":"| 구분 | AI에서의 역할 | 중급 수학 개념 |\n| --- | --- | --- |\n| **유사도와 방향** | 비슷한 특징을 더 가깝게, 다른 특징을 멀게 | 내적, 정사영 |\n| **레이어의 작동 방식** | 한 층이 입력 벡터를 어떤 규칙으로 바꾸는가 | 행렬, 선형 변환 |\n| **민감도(변화량)** | 입력이 조금 변할 때 출력이 얼마나 달라지는가 | 야코비안, 그라디언트 |\n| **학습의 곡률** | 손실 표면이 휘어진 정도와 최적화 속도 | 헤시안, 고유값 |\n| **불확실성의 언어** | 공분산/상관으로 여러 변수의 함께 움직임 표현 | 공분산, 다변량 정규 분포 |"}},"midMathCh01":{"chapter":"Chapter 01","title":"벡터와 벡터 공간: 크기와 방향을 한 번에","description":"벡터는 **관련된 숫자를 순서 있게 묶은 표현**이면서, 기하적으로는 **크기와 방향을 한 번에 담는 화살표**입니다. 머신러닝에서는 한 데이터 샘플이 특성 벡터 $\\mathbf x$가 되고, 딥러닝에서는 임베딩·가중치가 모두 벡터로 표현됩니다. 이 장에서 $\\mathbb R^n$의 공통 규칙을 익히고, 다음 장 **내적**으로 자연스럽게 이어지도록 기초를 다집니다.","sectionTitle":"벡터와 벡터 공간: 크기와 방향을 한 번에","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","problemSolving":"문제 풀이를 위한 설명"},"visualShort":"벡터: 성분 · 크기 · 방향 · $\\mathbb R^n$","visualIntro":"입력은 성분 $(v_x,v_y)$이고, 스칼라배 $k\\mathbf v$와 합 $\\mathbf u+\\mathbf v$는 성분별 연산으로 구합니다. $\\mathbb R^n$은 $n$개의 실수 성분을 가진 모든 벡터들이 모인 공간이며 차원은 $n$입니다.","visualStep1":"데이터·가중치 → 벡터 $\\mathbf v\\in\\mathbb R^n$","visualStep2":"스칼라배 $k\\mathbf v$, 합 $\\mathbf u+\\mathbf v$ (성분별)","visualStep3":"공간 $\\mathbb R^n$: 차원 $n$, 성분 $n$개","visualStepsLabel":"보는 순서","whatIs":{"intro":"**벡터(Vector)**란 무엇일까요? 아주 쉽게 말해 **‘관련된 숫자들을 순서대로 예쁘게 담아놓은 상자’**라고 생각하시면 됩니다. 수학적으로는 $\\mathbf v=(v_1,v_2,\\ldots,v_n)$처럼 괄호 안에 숫자들을 나열해서 표현하죠. 기하학에서는 이를 **‘크기와 방향을 가진 화살표’**로 상상합니다. 기초 수학에서 함수에 여러 개의 값을 입력해야 할 때, 이 숫자들을 하나의 벡터 상자에 담아 전달하면 계산과 표기가 훨씬 깔끔해집니다. 마치 롤플레잉 게임에서 캐릭터의 능력치를 (체력, 마나, 공격력) = (100, 50, 15)처럼 한 묶음으로 묶어 표현하는 것과 같습니다!","plain":"우리가 일상에서 쓰는 내비게이션 앱을 떠올려 볼까요? ‘현재 위치에서 동쪽으로 3km, 북쪽으로 4km 이동하세요.’라고 안내한다면, 여기에는 **이동할 방향**과 **이동할 거리(크기)**가 모두 포함되어 있습니다. 이것을 평면 도화지(좌표평면) 위에 화살표로 쓱 그려보면, 그것이 바로 **2차원 벡터**의 가장 직관적인 모습입니다!\n\n숫자로 적을 때는 $(3,4)$라는 두 성분으로 간단히 쓸 수 있습니다. 이때 화살표의 실제 길이(크기)는 우리가 중학교 때 배운 피타고라스의 정리를 사용해 $\\sqrt{3^2+4^2}=5$로 쉽게 구할 수 있답니다.","definition":"조금만 더 수학적인 언어를 빌리자면, $n$개의 실수를 담을 수 있는 상자들의 모임을 **실수 벡터 공간** $\\mathbb R^n$이라고 부릅니다. 여기서 꼭 알아야 할 핵심 규칙이 있습니다.\n\n* **벡터의 덧셈**: 같은 위치(성분)에 있는 숫자끼리 더합니다. (예: $(1,2)+(3,4)=(4,6)$)\n* **스칼라배(상수곱)**: 벡터 밖에서 어떤 숫자(스칼라)를 곱하면, 상자 안의 모든 숫자에 공평하게 똑같이 곱해집니다. (예: $2(1,3)=(2,6)$)\n* **영벡터 $\\mathbf 0$**: 상자 안의 모든 숫자가 $0$인 텅 빈 상태입니다. (예: $(0,0,0)$)\n* **벡터의 놈(Norm, 크기)**: 기호로는 $\\|\\mathbf v\\|$로 쓰며, 화살표의 길이를 뜻합니다. 가장 흔히 쓰는 ‘유클리드 놈’의 핵심 수식은 $\\|\\mathbf v\\|=\\sqrt{v_1^2+v_2^2+\\cdots+v_n^2}$입니다. 각 숫자를 제곱해서 더한 뒤 루트를 씌우는 것이죠. 컴퓨터는 연산을 가볍게 하기 위해 종종 루트를 벗긴 제곱 형태인 $\\|\\mathbf v\\|^2$를 사용하기도 합니다.","inAI":"인공지능 분야에서 벡터는 어떻게 쓰일까요? AI에게 데이터를 학습시킬 때, 데이터 하나하나의 특징을 담은 그릇이 바로 벡터입니다. 예를 들어 어떤 사람의 데이터가 (나이, 키, 몸무게)라면, 입력 데이터는 $\\mathbf x=(25,175,70)$이라는 3차원 벡터가 됩니다. AI가 정답을 맞히기 위해 조절하는 **가중치(Weight)** 역시 $\\mathbf w$라는 벡터로 표현되죠. 최신 딥러닝 모델들은 내부에 이런 벡터들의 덧셈과 곱셈을 수백만 번 반복하는 거대한 수학 공장과 같습니다. 즉, **벡터를 이해하는 것은 AI의 데이터 처리 방식을 이해하는 첫 단추**입니다. 나중에 중급 과정으로 넘어가면, 이 벡터들을 바탕으로 데이터 공간의 굴곡을 계산하는 **헤시안(Hessian)** 같은 고급 개념도 자연스럽게 배우게 됩니다."},"whyImportant":{"bridge":"기초 수학 시간에 하나씩 따로 놀던 숫자(예: $x=3$)를 다루는 데 익숙해졌다면, 이제는 **여러 숫자를 하나의 묶음(벡터)으로 한 번에 다루는 습관**으로 넘어가는 징검다리를 건널 차례입니다. 머신러닝에서 비슷한 데이터를 찾기 위해 거리를 재거나 분류할 때, 그리고 딥러닝에서 인공 신경망이 데이터를 다음 층으로 넘길 때 사용되는 모든 언어가 바로 **‘벡터와 행렬’**입니다. 벡터 없이 AI를 공부하는 것은 알파벳을 모르고 영어를 배우려는 것과 같습니다.","language":"우리가 일상에서 대화할 때 문법을 지키듯, 수학에도 문법이 있습니다. ‘같은 크기의 벡터 상자끼리만 더할 수 있다’, ‘스칼라(숫자)를 곱하면 상자 안의 모든 숫자에 곱해준다’는 규칙들이 바로 **벡터 공간의 문법(구조)**입니다. 초보자 때 이 기본적인 문법을 탄탄하게 몸에 익혀두면, 이후에 등장하는 조금 무서운 이름들의 개념들—예를 들어 **선형 독립, 기저, 랭크, 고유값**—을 마주했을 때 당황하지 않고 원리를 파악할 수 있는 든든한 무기가 됩니다."},"howUsed":{"features":"**특성 벡터(Feature Vector)**라는 말을 들어보셨나요? 고객 정보를 담은 엑셀 표를 상상해 보세요.\n\n| 이름 | 키(cm) | 몸무게(kg) | 나이 |\n| :--- | :--- | :--- | :--- |\n| A번 고객 | 170 | 65 | 30 |\n\n여기서 A번 고객의 정보 한 줄을 떼어내어 $\\mathbf x=(170,65,30)$이라는 하나의 묶음으로 만들면, 그것이 바로 특성 벡터입니다! 데이터를 다듬는 전처리 과정이나, 비슷한 성향의 고객끼리 그룹을 묶는 알고리즘(예: **k-최근접 이웃(kNN)**이나 **클러스터링**)에서 고객 사이의 ‘유사성’을 파악할 때 바로 이 벡터들 사이의 거리(벡터 차이의 놈)를 계산하여 활용합니다.","dlWeights":"**딥러닝(Deep Learning)**에서 벡터는 신경망을 흐르는 혈액과도 같습니다. 우리 뇌의 신경세포(뉴런)를 모방한 인공 뉴런은, 들어온 ‘입력 벡터’와 중요도를 나타내는 ‘가중치 벡터’를 서로 짝지어 곱하고 더하는 연산(이를 **내적**이라고 합니다)을 수행합니다. 챗GPT 같은 언어 모델이 단어를 이해할 때도, ‘사과’나 ‘바나나’ 같은 단어를 컴퓨터가 계산할 수 있는 긴 숫자의 나열, 즉 **임베딩(Embedding) 벡터**로 변환하여 처리합니다. 결론적으로 **벡터는 AI가 우리의 복잡한 세상을 숫자라는 언어로 읽어내는 가장 최소 단위의 묶음**입니다."},"summary":"**핵심 요약 노트**\n\n* **벡터의 두 얼굴**: 기하학적으로는 ‘크기와 방향을 가진 화살표’, 대수학적으로는 ‘숫자들의 순서 있는 나열’입니다.\n* **$\\mathbb R^n$의 의미**: $n$개의 실수 성분으로 이루어진 $n$차원 벡터들이 살아가는 수학적 공간입니다.\n* **연산의 기본**: 덧셈과 스칼라배는 끼리끼리, 공평하게 성분별로 이루어집니다.\n\n이러한 벡터의 기본 규칙이라는 튼튼한 기초 공사 위에, 딥러닝의 핵심인 내적, 행렬, 그리고 미분이라는 건물이 세워집니다. 지금 이 개념들이 완벽하게 머릿속에 그려지신다면 아주 잘하고 계신 겁니다! 다음 장인 **[Ch.02 내적]**에서는 두 화살표(벡터)가 ‘얼마나 같은 방향을 바라보고 있는지(닮았는지)’를 숫자로 측정하는 흥미로운 도구에 대해 알아보겠습니다.","problemSolving":{"focus":"아래 표에는 문제 풀이에 필요한 **수식과 기호 의미**를 요약했고, 바로 이어지는 **항목별 자세한 설명**에서 왜 그렇게 정의되는지까지 짚습니다. **풀이 예시**에는 대표 유형별로 단계를 적어 두었습니다.","examplesHeading":"풀이 예시","examplesTable":"$1e"},"problemSolvingLabel":"문제 풀이를 위한 설명","problemSolvingTable":"$1f","visualFlowTitle":"학습 흐름","visualFlowStep0":"개념: 벡터·성분·$\\mathbb R^n$","visualFlowStep1":"직관: 화살표(방향·크기)","visualFlowStep2":"수식: 합·스칼라배·놈·내적","visualFlowStep3":"적용: 특성벡터·임베딩·가중치","visualArrowTitle":"벡터 = 방향 + 크기","visualComponentTitle":"같은 방향 · 길이 k배","visualAriaLabel":"벡터 합과 스칼라배 도식. 왼쪽은 u, v와 합 u+v. 오른쪽은 같은 직선 위 기준 u와 k배 u.","visualLegendGray":"기준 u","visualLegendBlue":"k·u","visualRnLabel":"$$\\mathbb R^2$ 안에서 닫힘","problemPromptIntro":"문제를 읽고 벡터 연산 결과를 정수로 입력하세요.","promptDefinition":"다음 설명이 **참**이면 보기 **1**, **거짓**이면 보기 **0**을 고르세요.","promptDefinitionChoice":"아래 (가)·(나)·(다) 중 옳은 것을 고르세요.","promptMagnitudeSquared2D":"$$\\mathbf v=({vx},{vy})$일 때 $\\|\\mathbf v\\|^2$(정수)은?","promptDotProduct2D":"$$\\mathbf u=({ux},{uy})$, $\\mathbf v=({vx},{vy})$일 때 $\\mathbf u\\cdot\\mathbf v$(정수)은?","promptSumComponent2D":"$$\\mathbf u=({ux},{uy})$, $\\mathbf v=({vx},{vy})$일 때 $(\\mathbf u+\\mathbf v)_{axis}$의 값(정수)은? (성분: {axis})","promptScalarMultComponent2D":"$$\\mathbf u=({ux},{uy})$일 때 $({k}\\mathbf u)_{axis}$의 값(정수)은? (성분: {axis})","promptDimensionRn":"$$\\mathbb R^{n}$의 차원(정수)은? ($n={n}$)","promptNumComponentsRn":"$$\\mathbb R^{n}$ 벡터의 성분 개수(정수)은? ($n={n}$)","promptCrossZ2D":"$$\\mathbf u=({ux},{uy})$, $\\mathbf v=({vx},{vy})$일 때 $u_x v_y - u_y v_x$(정수)은?","promptNormMinusSquared2D":"$$\\mathbf u=({ux},{uy})$, $\\mathbf v=({vx},{vy})$일 때 $\\|\\mathbf u\\|^2-\\|\\mathbf v\\|^2$(정수)은?","promptDefault":"아래 보기 중 정답을 고르세요.","mcDefChoice1":"(가)","mcDefChoice2":"(나)","mcDefChoice3":"(다)","mcDefChoice4":"(라) (가)~(다) 중 어느 것도 옳지 않다","definitionStatements":{"0":"벡터는 크기와 방향을 가진 양으로, 성분으로 표현할 수 있다.","1":"$$\\mathbb R^n$의 벡터는 $n$개의 실수 성분을 가진다.","2":"두 벡터의 합은 같은 차원일 때 성분별로 더해 정의된다.","3":"스칼라배 $k\\mathbf v$는 벡터 $\\mathbf v$의 각 성분에 $k$를 곱한 것이다.","4":"영벡터는 모든 성분이 0인 벡터이다.","5":"벡터 공간은 덧셈과 스칼라배에 대해 닫혀 있어야 한다.","6":"$$\\mathbb R^2$는 실수 위에서 차원이 2인 벡터 공간이다.","7":"한 벡터가 다른 벡터의 실수배이면 두 벡터는 같은 직선 위에 놓인다고 말할 수 있다.","10":"벡터의 유클리드 놈 $\\|\\mathbf v\\|$는 음수가 될 수 있다.","11":"$$\\mathbb R^3$의 차원은 2이다.","12":"서로 다른 차원의 두 벡터는 덧셈 $\\mathbf u+\\mathbf v$를 정의할 수 있다.","13":"벡터 덧셈은 결합법칙 $(\\mathbf u+\\mathbf v)+\\mathbf w=\\mathbf u+(\\mathbf v+\\mathbf w)$이 성립하지 않는다.","14":"실수 벡터의 내적 $\\mathbf u\\cdot\\mathbf v$의 결과는 항상 벡터이다."},"definitionChoiceQuestions":{"0":"(가) $4$\n(나) $5$\n(다) $6$\n\n질문: $\\mathbb R^5$의 차원은?","1":"(가) $2$\n(나) $3$\n(다) $1$\n\n질문: $\\mathbb R^2$의 차원은?","2":"(가) $16$\n(나) $25$\n(다) $9$\n\n질문: $\\mathbf v=(3,4)$일 때 $\\|\\mathbf v\\|^2$는?","3":"(가) $3$\n(나) $2$\n(다) $5$\n\n질문: $(2\\mathbf e_1+3\\mathbf e_2)$의 $y$성분은? ($\\mathbf e_1=(1,0),\\mathbf e_2=(0,1)$)","4":"(가) 항상 $\\mathbf v$와 같다\n(나) 항상 영벡터\n(다) 정의할 수 없다\n\n질문: $k=0$일 때 $k\\mathbf v$는?","5":"(가) 평행\n(나) 수직(직교)\n(다) 같은 벡터\n\n질문: $\\mathbf u\\cdot\\mathbf v=0$이면 두 벡터는?","6":"(가) $n-1$\n(나) $n$\n(다) $2n$\n\n질문: $\\mathbb R^n$ 벡터의 성분 개수는?","7":"(가) $5$\n(나) $4$\n(다) $3$\n\n질문: $(1,2)+(3,4)$의 $x$성분은?"}},"midMathCh02":{"chapter":"Chapter 02","title":"벡터의 내적과 정사영: 얼마나 닮았는지 숫자로 재기","description":"**내적(Dot Product)**은 두 개의 데이터(벡터)가 '얼마나 비슷한 방향을 향하고 있는지'를 **단 하나의 숫자**로 알려주는 마법 같은 도구입니다. **정사영(Orthogonal Projection)**은 한 데이터를 다른 데이터라는 벽에 비췄을 때 생기는 **그림자**라고 생각하면 쉽습니다. 이번 장에서는 복잡한 데이터를 숫자로 비교하는 방법을 배우고, 이것이 인공지능이 어떻게 비슷한 이미지를 찾고(유사도), 중요한 정보에 집중하는지(어텐션) 알아봅니다.","sectionTitle":"벡터의 내적과 정사영: 얼마나 닮았는지 숫자로 재기","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","problemSolving":"문제 풀이를 위한 설명"},"visualShort":"내적 · 각도 · 정사영 · 코사인 유사도","visualIntro":"두 화살표 $\\mathbf{u},\\mathbf{v}$가 있을 때, 내적 $\\mathbf{u}\\cdot\\mathbf{v}$는 길이와 각을 동시에 반영합니다. $\\mathbf{v}$를 $\\mathbf{u}$ 위에 그림자처럼 내려쌓은 벡터가 정사영 $\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$이고, 잔차 $\\mathbf{v}-\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$는 $\\mathbf{u}$와 **직교**합니다.","visualStep1":"개념: $\\mathbf{u}\\cdot\\mathbf{v}=\\sum_i u_i v_i=\\|\\mathbf{u}\\|\\|\\mathbf{v}\\|\\cos\\theta$","visualStep2":"직관: 같은 방향이면 양수, 직교면 0, 반대면 음수","visualStep3":"정사영: $\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}=\\frac{\\mathbf{u}\\cdot\\mathbf{v}}{\\mathbf{u}\\cdot\\mathbf{u}}\\mathbf{u}$","visualStep4":"적용: 임베딩 유사도, 선형층, 최소제곱의 투영 해석","visualStepsLabel":"보는 순서","visualFlowTitle":"학습 흐름","visualFlowStep0":"개념: 내적·각·직교","visualFlowStep1":"직관: 그림자(정사영)·잔차","visualFlowStep2":"수식: 사영·코사인·피타고라스","visualFlowStep3":"적용: 추천·딥러닝 층·차원축소","dotVisualAriaLabel":"내적·정사영·코사인 유사도: 회전하는 벡터와 실시간 수치 패널","dotVisualMainTitle":"회전하는 v로 보는 닮음 점수","dotVisualPlotTitle":"좌표 평면: u, v, 정사영","dotVisualMetricsTitle":"방향·유사도·수치","dotVisualHudDot":"내적 u·v","dotVisualHudCos":"cos θ (방향)","dotVisualHudProj":"|proj| / |v|","dotVisualLegendU":"기준 u","dotVisualLegendV":"회전 v","dotVisualLegendProj":"그림자","dotVisualLegendRes":"잔차 ⊥ u","dotVisualInsetLabel":"방향","dotVisualCaption":"**초록 벡터** $v$가 한 바퀴 돌면 각도 **$\\theta$**가 바뀌고, **호박색 그림자(정사영)** 길이와 **내적**·$\\cos\\theta$가 함께 변합니다. 같은 방향에 가까울수록 **내적**이 커지고, **직교**하면 $0$, **반대**면 **음수**가 됩니다. 오른쪽 작은 원은 $v$의 **방향**만 추려 본 것입니다.","whatIs":{"intro":"앞서 배운 벡터가 숫자들을 담은 '상자'라면, **내적**은 두 상자를 열어서 같은 위치에 있는 숫자끼리 짝지어 곱한 뒤 모두 더하는 작업입니다. 수학적으로는 두 데이터의 크기와 그 사이의 각도를 이용해 계산할 수도 있습니다. **정사영**은 이렇게 구한 내적을 이용해, 한 데이터가 다른 데이터의 방향으로 얼만큼 뻗어 나가는지를 **그림자** 형태로 만들어내는 과정입니다.","plain":"아주 쉽게 말해서, 내적은 두 데이터의 **'궁합 점수'**를 계산하는 것과 같습니다. 방향이 완전히 같으면 양수로 높은 점수가 나오고, 연관성이 없으면(수직) 0점, 정반대면(반대 방향) 음수가 나옵니다. 정사영은 한 쪽의 데이터를 다른 쪽 데이터의 기준에 맞춰 **투영(그림자)**해 보는 것과 같습니다.","definition":"$20","inAI":"인공지능, 특히 **딥러닝**에서는 이 '내적'이 숨 쉬듯이 사용됩니다. 인공지능이 수많은 데이터 속에서 패턴을 찾을 때 계산하는 '가중치와 입력값의 곱'이 바로 내적입니다. 또한, 챗GPT 같은 언어 모델이 문장 속에서 어떤 단어에 집중해야 할지 결정하는 **어텐션(Attention)** 메커니즘이나, 넷플릭스가 내가 좋아할 만한 영화를 찾아주는 **추천 시스템** 모두 내적과 코사인 유사도를 바탕으로 작동합니다."},"whyImportant":{"bridge":"이전 장에서 벡터라는 '숫자 상자'를 만드는 법을 배웠다면, 이제는 그 상자들을 **서로 비교하고 관계를 맺어주는 법**을 배우는 단계입니다. 데이터들 사이의 **거리, 각도, 유사도**를 하나의 숫자로 명확하게 표현할 수 있게 되면, 컴퓨터는 비로소 데이터 간의 관계를 이해하고 더 복잡한 인공지능 모델로 나아갈 수 있습니다.","similarity":"컴퓨터에게 '강아지와 고양이가 닮았어?'라고 물어보면 이해하지 못합니다. 오직 숫자만 알기 때문이죠. 내적과 코사인 유사도는 이런 모호한 '닮음'이라는 개념을 **명확한 점수(수치)**로 바꿔줍니다. 데이터의 크기(길이)와 특징(방향)을 분리해서 분석할 수 있게 해주기 때문에, 수만 개의 특징을 가진 고차원 데이터를 다룰 때 없어서는 안 될 필수 도구입니다."},"howUsed":{"ml":"**머신러닝**에서는 나와 가장 비슷한 취향을 가진 사람을 찾는 **k-최근접 이웃(kNN)** 알고리즘에서 데이터 간의 유사도를 잴 때 쓰입니다. 또한, 정상적인 데이터와 방향이 완전히 다른 데이터를 찾아내는 **이상치 탐지(Anomaly Detection)**에도 활약합니다. 스팸 메일을 걸러내거나 환자의 데이터를 보고 질병을 예측할 때도 내부적으로 무수히 많은 내적이 계산됩니다.","geometry":"**기하학적 관점**에서 정사영은 복잡한 세상을 단순하게 보는 안경과 같습니다. 수많은 변수를 가진 복잡한 데이터를 우리가 이해하기 쉬운 2차원이나 3차원 평면 위로 **그림자(사영)**를 내려 시각화하는 **주성분 분석(PCA)** 같은 차원 축소 기법의 핵심 원리가 바로 여기에 있습니다."},"summary":"**한 줄 요약:** **내적**은 두 데이터가 얼마나 닮았는지 보여주는 '궁합 점수'이고, **정사영**은 한 데이터를 다른 데이터의 기준에 맞춰 비춘 '그림자'입니다. **코사인 유사도**는 크기를 무시하고 오직 '방향(특징)'만 비교할 때 최고의 도구입니다. 이 개념들은 앞으로 배울 복잡한 인공지능 모델의 뼈대가 됩니다.","problemSolving":{"focus":"아래 표에는 문제 풀이에 필요한 **수식과 기호 의미**를 요약했고, 바로 이어지는 **항목별 자세한 설명**에서 왜 그렇게 정의되는지까지 짚습니다. **풀이 예시**에는 대표 유형별로 단계를 적어 두었습니다.","examplesHeading":"풀이 예시","examplesTable":"$21"},"problemSolvingLabel":"문제 풀이를 위한 설명","problemSolvingTable":"$22","practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"아래는 **60문제 은행**에서 무작위로 뽑은 **10문제**입니다(쉬움 4·중간 3·어려움 3, 순서는 쉬움→중간→어려움). 각 문항은 **객관식**이며, 보기 번호를 선택하세요.","practiceProblemsInstruction":"문제를 읽고 가장 알맞은 선택지를 고르세요.","problems":{"definition_0":"$$\\mathbb{R}^n$에서 두 벡터 $\\mathbf{u},\\mathbf{v}$의 **내적** $\\mathbf{u}\\cdot\\mathbf{v}$를 성분으로 쓴 것으로 가장 알맞은 것은?\n\n① $\\sum_i u_i v_i$ (같은 위치 성분끼리 곱해 더함)\n② $\\sum_i u_i + v_i$\n③ $\\max_i u_i v_i$\n④ $\\prod_i u_i v_i$","definition_1":"두 벡터가 **직교**(수직)할 때 내적 $\\mathbf{u}\\cdot\\mathbf{v}$의 값은?\n\n① 항상 $0$\n② 항상 $1$\n③ 항상 양수\n④ 항상 벡터","definition_2":"$$\\|\\mathbf{u}\\|\\|\\mathbf{v}\\|\\cos\\theta$ 꼴에서 $\\theta$가 의미하는 것은?\n\n① 두 벡터 사이의 **각**(작은 쪽)\n② 벡터의 차원\n③ 벡터의 놈만\n④ 행렬의 랭크","definition_3":"$$\\mathbf{0}$이 아닌 $\\mathbf{u}$ 위로의 $\\mathbf{v}$의 **정사영 벡터** $\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$는?\n\n① $\\dfrac{\\mathbf{u}\\cdot\\mathbf{v}}{\\mathbf{u}\\cdot\\mathbf{u}}\\,\\mathbf{u}$\n② $\\mathbf{v}-\\mathbf{u}$\n③ $\\dfrac{\\mathbf{v}}{\\|\\mathbf{u}\\|}$\n④ $\\mathbf{u}\\times\\mathbf{v}$","definition_4":"**코사인 유사도** $\\dfrac{\\mathbf{u}\\cdot\\mathbf{v}}{\\|\\mathbf{u}\\|\\|\\mathbf{v}\\|}$의 값의 범위는? (실수 벡터, 일반적으로)\n\n① $[-1,1]$\n② $[0,\\infty)$\n③ $(-\\infty,\\infty)$만\n④ 항상 $0$ 또는 $1$만","definition_5":"내적 $\\mathbf{u}\\cdot\\mathbf{v}$의 결과의 타입으로 맞는 것은?\n\n① **스칼라**(실수 하나)\n② 항상 벡터\n③ 항상 행렬\n④ 항상 불린","definition_6":"$$\\|\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}\\|$와 $\\|\\mathbf{v}\\|$의 관계로 항상 성립하는 것은?\n\n① $\\|\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}\\|\\le \\|\\mathbf{v}\\|$\n② $\\|\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}\\|> \\|\\mathbf{v}\\|$가 항상 성립\n③ 둘은 항상 같다\n④ 비교 불가","definition_7":"로지스틱 회귀에서 선형부 $z=\\mathbf{w}\\cdot\\mathbf{x}+b$의 $\\mathbf{w}\\cdot\\mathbf{x}$는 무엇과 직결되는가?\n\n① 가중치 벡터와 특성 벡터의 **유사도/정렬**을 수치화한 항\n② 벡터의 외적\n③ 행렬식\n④ 확률 자체","definition_8":"다음 중 **내적의 성질**으로 옳은 것은? ($\\mathbf{a},\\mathbf{b},\\mathbf{c}$는 같은 차원, $c$는 실수)\n\n① $(c\\mathbf{a})\\cdot\\mathbf{b}=c(\\mathbf{a}\\cdot\\mathbf{b})$\n② $(\\mathbf{a}\\cdot\\mathbf{b})\\cdot\\mathbf{c}$는 항상 정의된다\n③ $\\mathbf{a}\\cdot\\mathbf{b}=\\mathbf{a}+\\mathbf{b}$\n④ 내적은 교환법칙이 성립하지 않는다","definition_9":"Ch.01에서 배운 $\\mathbb{R}^n$과 연결할 때, 내적이 잘 정의되려면 $\\mathbf{u}$와 $\\mathbf{v}$는?\n\n① 같은 $n$으로 **같은 차원**이어야 한다\n② 차원이 달라도 된다\n③ 반드시 단위벡터여야 한다\n④ 한쪽은 반드시 영벡터","trueFalse_0":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n$\\mathbf{u}\\cdot\\mathbf{v}=0$이면 항상 두 벡터가 영벡터이다.\n\n① 참\n② 거짓\n③ 둘 다 아님\n④ 문장이 비어 있다","trueFalse_1":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n모든 $\\mathbf{v}$에 대해 $\\mathbf{0}\\cdot\\mathbf{v}=0$이다.\n\n① 참\n② 거짓\n③ 둘 다 아님\n④ 문장이 비어 있다","trueFalse_2":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n$\\mathbf{u}\\cdot\\mathbf{v}=\\mathbf{v}\\cdot\\mathbf{u}$는 항상 성립한다(내적이 정의될 때).\n\n① 참\n② 거짓\n③ 둘 다 아님\n④ 문장이 비어 있다","trueFalse_3":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n정사영 $\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$는 항상 $\\mathbf{u}$와 평행하다($\\mathbf{u}\\neq\\mathbf{0}$).\n\n① 참\n② 거짓\n③ 둘 다 아님\n④ 문장이 비어 있다","trueFalse_4":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n코사인 유사도는 항상 0 이상이다.\n\n① 참\n② 거짓\n③ 둘 다 아님\n④ 문장이 비어 있다","trueFalse_5":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n$\\|\\mathbf{u}+\\mathbf{v}\\|^2=\\|\\mathbf{u}\\|^2+\\|\\mathbf{v}\\|^2$는 항상 성립한다.\n\n① 참\n② 거짓\n③ 둘 다 아님\n④ 문장이 비어 있다","trueFalse_6":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n내적은 선형성: $\\mathbf{u}\\cdot(\\mathbf{v}+\\mathbf{w})=\\mathbf{u}\\cdot\\mathbf{v}+\\mathbf{u}\\cdot\\mathbf{w}$.\n\n① 참\n② 거짓\n③ 둘 다 아님\n④ 문장이 비어 있다","trueFalse_7":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n$\\mathbf{u}\\cdot\\mathbf{u}=\\|\\mathbf{u}\\|^2$이다.\n\n① 참\n② 거짓\n③ 둘 다 아님\n④ 문장이 비어 있다","trueFalse_8":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n추천 시스템에서 사용자·아이템 임베딩의 유사도로 내적/코사인을 쓸 수 있다.\n\n① 참\n② 거짓\n③ 둘 다 아님\n④ 문장이 비어 있다","trueFalse_9":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n정사영 후 남는 벡터 $\\mathbf{v}-\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$는 $\\mathbf{u}$와 직교한다($\\mathbf{u}\\neq\\mathbf{0}$).\n\n① 참\n② 거짓\n③ 둘 다 아님\n④ 문장이 비어 있다","calc_0":"$$\\mathbf{u}=(2,3)$, $\\mathbf{v}=(4,-1)$일 때 $\\mathbf{u}\\cdot\\mathbf{v}$는?\n\n① $5$\n② $11$\n③ $-5$\n④ $14$","calc_1":"$$\\mathbf{a}=(1,1,1)$, $\\mathbf{b}=(2,-3,1)$일 때 $\\mathbf{a}\\cdot\\mathbf{b}$는?\n\n① $0$\n② $3$\n③ $6$\n④ $-1$","calc_2":"$$\\|\\mathbf{u}\\|$가 $5$이고 $\\|\\mathbf{v}\\|$가 $4$이며 두 벡터가 같은 방향일 때 $\\mathbf{u}\\cdot\\mathbf{v}$는?\n\n① $20$\n② $9$\n③ $1$\n④ $0$","calc_3":"$$\\mathbf{u}=(3,4)$일 때 $\\mathbf{u}\\cdot\\mathbf{u}$는?\n\n① $25$\n② $5$\n③ $12$\n④ $7$","calc_4":"$$\\mathbf{u}=(2,0)$, $\\mathbf{v}=(1,\\sqrt{3})$일 때 코사인 유사도 $\\dfrac{\\mathbf{u}\\cdot\\mathbf{v}}{\\|\\mathbf{u}\\|\\|\\mathbf{v}\\|}$는?\n\n① $\\dfrac{1}{2}$\n② $1$\n③ $0$\n④ $\\dfrac{\\sqrt{3}}{2}$","calc_5":"$$\\mathbf{u}=(1,2)$, $\\mathbf{v}=(2,4)$일 때 $\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}=\\alpha\\mathbf{u}$의 $\\alpha$는?\n\n① $2$\n② $1$\n③ $0$\n④ $4$","calc_6":"$$\\mathbf{e}_1=(1,0,0)$, $\\mathbf{v}=(3,-2,6)$일 때 $\\mathrm{proj}_{\\mathbf{e}_1}\\mathbf{v}$의 첫 성분(즉 $x$좌표)은?\n\n① $3$\n② $6$\n③ $-2$\n④ $0$","calc_7":"$$\\mathbf{u}=(1,0)$, $\\mathbf{v}=(0,5)$일 때 $\\|\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}\\|$는?\n\n① $0$\n② $1$\n③ $5$\n④ $25$","calc_8":"$$\\mathbf{a}=(1,2,2)$의 놈 $\\|\\mathbf{a}\\|$는?\n\n① $3$\n② $9$\n③ $\\sqrt{5}$\n④ $5$","calc_9":"$$\\mathbf{u}=(-1,2)$, $\\mathbf{v}=(4,2)$일 때 $\\mathbf{u}\\cdot\\mathbf{v}$는?\n\n① $0$\n② $10$\n③ $-4$\n④ $6$","concept_0":"딥러닝에서 ‘어텐션 스코어’를 내적 형태로 두는 직관에 가장 가까운 설명은?\n\n① 쿼리·키 벡터의 **정렬(닮음)**을 점수로 본다\n② 항상 놈만 본다\n③ 역전파를 끈다\n④ 활성화만 본다","concept_1":"선형 회귀의 잔차 제곱합 최소화에서 설계행렬 열들이 직교하면(정규직교 기저) 어떤 해석이 쉬워지는가?\n\n① 각 계수를 **독립적으로** 해석하기 쉬워진다\n② 항상 발산한다\n③ 학습률이 0이 된다\n④ 내적이 항상 0이 된다","concept_2":"‘특성 스케일’이 제각각일 때 코사인 유사도가 유클리드 거리보다 나은 경우가 많은 이유는?\n\n① **길이(크기)**보다 **방향**을 보고 싶을 때\n② 길이를 키우기 위해\n③ 미분이 불가능해서\n④ 항상 더 느려서","concept_3":"Gram–Schmidt 과정이 사용하는 핵심 연산으로 가장 가까운 것은?\n\n① 직교하지 않는 벡터에서 **다른 방향 성분을 빼서** 직교화\n② 행렬식 계산\n③ 고유값만 구하기\n④ 확률 적분","concept_4":"PCA에서 주성분 방향을 고를 때 공분산 행렬의 고유벡터가 등장하는 이유와 연결되는 기초 개념은?\n\n① 이차형식과 **직교** 좌표축에서의 분산 최대화\n② 내적이 항상 0\n③ 벡터의 외적만\n④ 확률만","concept_5":"손실 $L(\\mathbf{w})=\\|\\mathbf{y}-X\\mathbf{w}\\|^2$를 볼 때, $X\\mathbf{w}$는?\n\n① $\\mathbf{y}$를 $X$의 열공간에 **사영**한 값에 가깝게 두려는 구조\n② 무작위 노이즈\n③ 항상 영벡터\n④ 활성화 함수","concept_6":"ReLU 뉴런 이전의 선형층 $\\mathbf{z}=W\\mathbf{x}$의 한 행 $\\mathbf{w}_i^{\\mathsf T}\\mathbf{x}$는 무엇인가?\n\n① **가중치 행 벡터**와 입력의 내적(선형 특징 한 개)\n② 외적 하나\n③ 소프트맥스\n④ 배치 정규화만","concept_7":"수치적으로 $\\|\\mathbf{u}\\|$가 매우 작을 때 코사인 유사도가 불안정해지는 이유는?\n\n① 분모 $\\|\\mathbf{u}\\|\\|\\mathbf{v}\\|$에서 **0에 가까워져** 스케일이 폭주\n② 내적이 항상 0이라서\n③ 코사인이 항상 1이라서\n④ 직교라서","concept_8":"‘두 단어 임베딩이 가깝다’를 코사인으로 볼 때, 임베딩을 먼저 **단위벡터로 정규화**하면?\n\n① 코사인 $\\approx$ **순수 내적**이 되어 방향만 비교\n② 항상 오류가 난다\n③ 내적이 정의되지 않는다\n④ 차원이 바뀐다","concept_9":"다음 중 **정사영**이 **선형 변환**임을 바로 떠올리게 하는 설명은?\n\n① 벡터 합과 스칼라배를 **보존**하는 사영(행렬 $P$로 표현 가능)\n② 항상 비선형이다\n③ 항상 회전만 한다\n④ 확률만 바꾼다","projection_0":"$$\\mathbf{u}=(1,1)$, $\\mathbf{v}=(3,0)$일 때 $\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$를 $(a,a)$꼴로 두면 $a$는?\n\n① $\\dfrac{3}{2}$\n② $3$\n③ $\\dfrac{1}{2}$\n④ $0$","projection_1":"$$\\mathbf{u}=(2,1)$, $\\mathbf{v}=(1,2)$일 때 $\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$의 $x$성분은?\n\n① $\\dfrac{8}{5}$\n② $2$\n③ $1$\n④ $0$","projection_2":"$$\\mathbf{v}=(6,8)$를 $\\mathbf{e}_1=(1,0)$에 사영한 벡터의 놈은?\n\n① $6$\n② $8$\n③ $10$\n④ $0$","projection_3":"단위벡터 $\\mathbf{\\hat{u}}$에 대한 정사영은 어떤 형태로 단순해지는가?\n\n① $(\\mathbf{v}\\cdot\\mathbf{\\hat{u}})\\,\\mathbf{\\hat{u}}$\n② $\\mathbf{v}-\\mathbf{\\hat{u}}$\n③ $\\|\\mathbf{v}\\|\\mathbf{\\hat{u}}$만\n④ $\\mathbf{\\hat{u}}/\\|\\mathbf{v}\\|$","projection_4":"$$\\mathbf{a}=(1,1,1)$, $\\mathbf{b}=(1,0,0)$일 때 $\\mathrm{proj}_{\\mathbf{a}}\\mathbf{b}$의 세 성분 합은?\n\n① $1$\n② $3$\n③ $0$\n④ $\\dfrac{1}{3}$","projection_5":"$$\\mathbf{r}=\\mathbf{v}-\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$일 때 $\\mathbf{r}\\cdot\\mathbf{u}$는? ($\\mathbf{u}\\neq\\mathbf{0}$)\n\n① $0$\n② $\\|\\mathbf{u}\\|^2$\n③ $\\|\\mathbf{v}\\|^2$\n④ $1$","projection_6":"$$\\mathbf{u}=(4,3)$ 방향 단위벡터를 $\\mathbf{\\hat{u}}$라 할 때, $\\mathbf{v}=(1,0)$의 $\\mathrm{proj}_{\\mathbf{\\hat{u}}}\\mathbf{v}$의 길이는? (내적만으로)\n\n① $\\dfrac{4}{5}$\n② $1$\n③ $\\dfrac{3}{5}$\n④ $5$","projection_7":"평면 위 두 벡터로 만든 평행사변형 넓이는 $\\|\\mathbf{u}\\|\\|\\mathbf{v}\\||\\sin\\theta|$이다. 이는 $\\|\\mathbf{u}\\times\\mathbf{v}\\|$와 같다(3D). 내적과 연결하면?\n\n① $\\sin^2\\theta = 1-\\cos^2\\theta$로 **직교 성분**과 연결\n② 내적과 무관\n③ 항상 0\n④ 놈이 항상 1","projection_8":"$$\\mathbf{v}$를 $\\mathbf{u}$에 사영한 뒤 **직교분해** $\\mathbf{v}=\\mathbf{p}+\\mathbf{r}$에서 $\\|\\mathbf{v}\\|^2$와 $\\|\\mathbf{p}\\|^2+\\|\\mathbf{r}\\|^2$의 관계(피타고라스)는?\n\n① 항상 $\\|\\mathbf{v}\\|^2=\\|\\mathbf{p}\\|^2+\\|\\mathbf{r}\\|^2$\n② 항상 $\\|\\mathbf{v}\\|^2=\\|\\mathbf{p}\\|^2-\\|\\mathbf{r}\\|^2$\n③ 항상 같지 않다\n④ $\\|\\mathbf{p}\\|=\\|\\mathbf{r}\\|$","projection_9":"행렬 $A$의 각 행 $\\mathbf{a}_i^{\\mathsf T}$와 열 벡터 $\\mathbf{x}$의 곱 $y_i=\\mathbf{a}_i\\cdot\\mathbf{x}$는 무엇의 관점인가?\n\n① **선형 변환** $A\\mathbf{x}$의 각 좌표(행·내적)\n② 외적의 크기\n③ 행렬식\n④ 분산","scenario_0":"문서 임베딩 두 개의 **코사인 유사도**가 0.92이다. 추천 시스템에서 의미하기 쉬운 해석은?\n\n① 주제 방향이 **꽤 비슷**하다(스케일 정규화된 경우)\n② 확률이 92%다\n③ 두 문서 길이가 같다\n④ 반드시 같은 단어만 쓴다","scenario_1":"이미지 특성 벡터와 텍스트 특성 벡터의 차원이 다르다. 바로 코사인 유사도를 쓰려면?\n\n① 먼저 **같은 차원**으로 맞추는 투영/임베딩 공간 설계가 필요\n② 차원만 다르면 항상 가능\n③ 내적은 차원 무관\n④ 확률만 맞추면 된다","scenario_2":"미니배치 SGD에서 손실이 거칠게 요동한다. 그라디언트 벡터 $\\mathbf{g}$와 갱신 방향의 관계에서 직관적으로 맞는 것은?\n\n① 한 스텝은 **$-\\mathbf{g}$ 방향**(경사 반대) 성분이 핵심\n② 항상 $\\mathbf{g}$와 같은 방향\n③ 항상 $\\mathbf{g}$와 무관\n④ 내적이 항상 0","scenario_3":"유저 벡터 $\\mathbf{u}$와 아이템 벡터 $\\mathbf{v}$의 내적으로 평점을 $\\hat{r}=\\mathbf{u}\\cdot\\mathbf{v}$로 두는 협업 필터링에서, 내적이 크면?\n\n① 선호·특성이 **맞물림**이 크다(모델 가정상)\n② 항상 싫어한다\n③ 학습이 불가능하다\n④ 확률 1","scenario_4":"Transformer에서 스케일드 닷-프로덕트 어텐션에 $\\sqrt{d_k}$로 나누는 이유로 가장 가까운 것은?\n\n① 내적 분산이 커져 소프트맥스가 **포화**하는 것을 완화\n② 내적을 없애기 위해\n③ 역전파를 끄기 위해\n④ 항상 직교 만들기 위해","scenario_5":"특성 벡터를 표준화한 뒤 선형 SVM의 마진 해석과 연결될 때, 내적·커널 논의로 자연스럽게 이어지는 단계는?\n\n① 데이터가 **내적 공간**에서의 거리·각을 통해 분리된다\n② 확률만 본다\n③ 군집만 한다\n④ 항상 비지도만","scenario_6":"오토인코더의 잠복 벡터 두 개의 유클리드 거리 대신 코사인을 쓰면 좋은 경우는?\n\n① 벡터 **길이**보다 **방향**(패턴)이 중요할 때\n② 항상 거리가 더 정확할 때만\n③ 이미지가 없을 때만\n④ 항상 안 된다","scenario_7":"다음 중 **정사영**이 머신러닝 파이프라인에서 쓰이는 예에 가까운 것은?\n\n① 고차원 특성을 **저차원 부분공간**에 맞춰 시각화(PCA 등)\n② 확률만 추정\n③ 항상 데이터 삭제\n④ 배치 크기만 조절","scenario_8":"벡터 정규화 후 내적이 커졌다고 해서 반드시 의미적 유사도가 보장되지 않는 이유는?\n\n① 임베딩이 **학습 데이터·목적함수**에 의존하기 때문\n② 내적이 항상 틀리기 때문\n③ 코사인이 항상 0이기 때문\n④ 직교이기 때문","scenario_9":"Ch.03에서 배울 행렬·벡터 곱 $A\\mathbf{x}$를 ‘내적 관점’으로 보면?\n\n① $A$의 **각 행**과 $\\mathbf{x}$의 내적들로 이루어진 벡터\n② 행렬식만\n③ 항상 스칼라 하나\n④ 외적만"},"problemAnswers":{"definition_0":1,"definition_1":1,"definition_2":1,"definition_3":1,"definition_4":1,"definition_5":1,"definition_6":1,"definition_7":1,"definition_8":1,"definition_9":1,"trueFalse_0":2,"trueFalse_1":1,"trueFalse_2":1,"trueFalse_3":1,"trueFalse_4":2,"trueFalse_5":2,"trueFalse_6":1,"trueFalse_7":1,"trueFalse_8":1,"trueFalse_9":1,"calc_0":1,"calc_1":1,"calc_2":1,"calc_3":1,"calc_4":1,"calc_5":1,"calc_6":1,"calc_7":1,"calc_8":1,"calc_9":1,"concept_0":1,"concept_1":1,"concept_2":1,"concept_3":1,"concept_4":1,"concept_5":1,"concept_6":1,"concept_7":1,"concept_8":1,"concept_9":1,"projection_0":1,"projection_1":1,"projection_2":1,"projection_3":1,"projection_4":1,"projection_5":1,"projection_6":1,"projection_7":1,"projection_8":1,"projection_9":1,"scenario_0":1,"scenario_1":1,"scenario_2":1,"scenario_3":1,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1},"problemSolutions":{"definition_0":"**1) 개념:** 내적은 **같은 인덱스** 성분끼리 곱한 뒤 전부 더합니다. **2) 예시:** $\\mathbf{u}=(1,2)$, $\\mathbf{v}=(3,-1)$이면 $1\\cdot3+2\\cdot(-1)=1$. **3) 정답 ①**","definition_1":"**1) 개념:** 직교는 각이 $90^\\circ$라 $\\cos\\theta=0$이어서 내적이 $0$입니다. **2) 예시:** $(1,0)\\cdot(0,1)=0$. **3) 정답 ①**","definition_2":"**1) 개념:** $\\mathbf{u}\\cdot\\mathbf{v}=\\|\\mathbf{u}\\|\\|\\mathbf{v}\\|\\cos\\theta$에서 $\\theta$는 두 화살표가 이루는 각입니다. **2) 예시:** 같은 방향이면 $\\theta=0$, $\\cos\\theta=1$. **3) 정답 ①**","definition_3":"**1) 개념:** $\\mathbf{u}$ 방향 성분만 남기려면 $\\mathbf{u}$에 사영합니다. 계수는 $\\dfrac{\\mathbf{u}\\cdot\\mathbf{v}}{\\|\\mathbf{u}\\|^2}$. **2) 예시:** $\\mathbf{u}=(1,0)$, $\\mathbf{v}=(3,4)$이면 사영은 $(3,0)$. **3) 정답 ①**","definition_4":"**1) 개념:** 코사인은 $-1$~$1$. **2) 예시:** 같은 방향 $\\approx1$, 반대 $\\approx-1$, 직교 $0$. **3) 정답 ①**","definition_5":"**1) 개념:** 내적은 ‘곱해서 더한’ **하나의 수**입니다. **2) 예시:** $(1,2)\\cdot(3,1)=5$. **3) 정답 ①**","definition_6":"**1) 개념:** 사영은 ‘그림자’라 길이가 원래보다 길어질 수 없습니다(직각 삼각형 빗변). **2) 예시:** $\\mathbf{v}$가 이미 $\\mathbf{u}$와 평행이면 등호. **3) 정답 ①**","definition_7":"**1) 개념:** 선형 모델은 특성과 가중치의 내적으로 ‘얼마나 맞는지’를 봅니다. **2) 예시:** 텍스트 임베딩 유사도도 내적·코사인과 같은 계열입니다. **3) 정답 ①**","definition_8":"**1) 개념:** 스칼라배는 한쪽에만 곱해도 내적으로 밖으로 빠집니다. **2) 예시:** $(2\\mathbf{a})\\cdot\\mathbf{b}=2(\\mathbf{a}\\cdot\\mathbf{b})$. **3) 정답 ①**","definition_9":"**1) 개념:** 성분별 곱·합은 길이(성분 개수)가 같아야 합니다. **2) 예시:** $(1,2)\\in\\mathbb{R}^2$와 $(1,2,0)\\in\\mathbb{R}^3$는 내적 불가. **3) 정답 ①**","trueFalse_0":"**1) 예시:** $(1,0)\\cdot(0,1)=0$인데 둘 다 영벡터가 아닙니다(직교). **2) 정답 ②**","trueFalse_1":"**1) 개념:** 영벡터 성분이 모두 0이라 내적은 0. **2) 정답 ①**","trueFalse_2":"**1) 개념:** 교환법칙. **2) 정답 ①**","trueFalse_3":"**1) 개념:** $\\mathbf{u}$ 위의 그림자입니다. **2) 정답 ①**","trueFalse_4":"**1) 예시:** 반대 방향이면 음수가 됩니다. **2) 정답 ②**","trueFalse_5":"**1) 개념:** 일반적으로 $\\|\\mathbf{u}+\\mathbf{v}\\|^2=\\|\\mathbf{u}\\|^2+\\|\\mathbf{v}\\|^2+2\\mathbf{u}\\cdot\\mathbf{v}$. **2) 정답 ②**","trueFalse_6":"**1) 개념:** 분배됩니다. **2) 정답 ①**","trueFalse_7":"**1) 예시:** $(3,4)\\cdot(3,4)=25=\\|\\mathbf{u}\\|^2$. **2) 정답 ①**","trueFalse_8":"**1) 실전:** 닮은 정도를 점수화합니다. **2) 정답 ①**","trueFalse_9":"**1) 개념:** 잔차는 $\\mathbf{u}$에 수직. **2) 정답 ①**","calc_0":"**1) 계산:** $2\\cdot4+3\\cdot(-1)=8-3=5$. **2) 정답 ①**","calc_1":"**1) 계산:** $2-3+1=0$. **2) 정답 ①**","calc_2":"**1) 개념:** 같은 방향이면 $\\cos\\theta=1$, 내적 $=5\\cdot4=20$. **2) 정답 ①**","calc_3":"**1) 계산:** $9+16=25=\\|\\mathbf{u}\\|^2$. **2) 정답 ①**","calc_4":"**1) 계산:** 내적 $2$, $\\|\\mathbf{u}\\|=2$, $\\|\\mathbf{v}\\|=2$ → $\\dfrac{2}{4}=\\dfrac{1}{2}$. **2) 정답 ①**","calc_5":"**1) 계산:** $\\mathbf{u}\\cdot\\mathbf{v}=10$, $\\mathbf{u}\\cdot\\mathbf{u}=5$ → $\\alpha=10/5=2$. **2) 정답 ①**","calc_6":"**1) 개념:** 축 사영은 해당 성분만 남김 → $(3,0,0)$의 $x=3$. **2) 정답 ①**","calc_7":"**1) 계산:** $\\mathbf{v}$가 $\\mathbf{u}$에 수직이면 사영 길이 $0$. **2) 정답 ①**","calc_8":"**1) 계산:** $\\sqrt{1+4+4}=\\sqrt{9}=3$. **2) 정답 ①**","calc_9":"**1) 계산:** $-4+4=0$(직교). **2) 정답 ①**","concept_0":"**1) 실전:** 유사한 내적→큰 값→더 주목. **2) 정답 ①**","concept_1":"**1) 개념:** 직교하면 기울기 방향이 섞이지 않습니다. **2) 정답 ①**","concept_2":"**1) 직관:** 문서 길이 차이를 줄이고 주제 방향을 본다. **2) 정답 ①**","concept_3":"**1) 개념:** 사영을 빼서 수직 성분만 남깁니다. **2) 정답 ①**","concept_4":"**1) 다리:** 내적·직교·투영이 PCA의 언어입니다. **2) 정답 ①**","concept_5":"**1) 실전:** 최소제곱은 투영 해석과 연결됩니다. **2) 정답 ①**","concept_6":"**1) 실전:** 딥러닝 층은 내적의 연속입니다. **2) 정답 ①**","concept_7":"**1) 실무:** L2 정규화·클리핑으로 완화합니다. **2) 정답 ①**","concept_8":"**1) 개념:** $\\|\\mathbf{u}\\|=\\|\\mathbf{v}\\|=1$이면 $\\mathbf{u}\\cdot\\mathbf{v}=\\cos\\theta$. **2) 정답 ①**","concept_9":"**1) 개념:** 사영 행렬 $P=\\dfrac{\\mathbf{u}\\mathbf{u}^{\\mathsf T}}{\\mathbf{u}^{\\mathsf T}\\mathbf{u}}$. **2) 정답 ①**","projection_0":"**1) 계산:** $\\mathbf{u}\\cdot\\mathbf{v}=3$, $\\mathbf{u}\\cdot\\mathbf{u}=2$ → 계수 $3/2$, 사영 $(3/2,3/2)$. **2) 정답 ①**","projection_1":"**1) 계산:** 내적 $4$, $\\|\\mathbf{u}\\|^2=5$ → 사영 $\\dfrac{4}{5}(2,1)$의 $x=8/5$. **2) 정답 ①**","projection_2":"**1) 개념:** $x$축 사영은 $(6,0)$, 놈 $6$. **2) 정답 ①**","projection_3":"**1) 개념:** $\\|\\mathbf{\\hat{u}}\\|=1$이면 계수가 곧 내적. **2) 정답 ①**","projection_4":"**1) 계산:** $\\mathbf{a}\\cdot\\mathbf{b}=1$, $\\mathbf{a}\\cdot\\mathbf{a}=3$ → 사영 $\\dfrac{1}{3}(1,1,1)$, 합 $=1$. **2) 정답 ①**","projection_5":"**1) 개념:** 잔차는 $\\mathbf{u}$와 직교. **2) 정답 ①**","projection_6":"**1) 계산:** $\\mathbf{\\hat{u}}=(4/5,3/5)$, 내적 $4/5$. 단위벡터 사영 길이 $=|\\mathbf{v}\\cdot\\mathbf{\\hat{u}}|=4/5$. **2) 정답 ①**","projection_7":"**1) 다리:** $\\cos\\theta$는 내적, $\\sin\\theta$는 외적/넓이. **2) 정답 ①**","projection_8":"**1) 개념:** $\\mathbf{p}\\perp\\mathbf{r}$이면 성립. **2) 정답 ①**","projection_9":"**1) 실전:** 행렬·벡터 곱은 행과의 내적 모음입니다(Ch.03 예고). **2) 정답 ①**","scenario_0":"**1) 실전:** 임베딩은 근사적 유사도입니다. **2) 정답 ①**","scenario_1":"**1) 실전:** 내적은 같은 $\\mathbb{R}^n$에서 정의됩니다. **2) 정답 ①**","scenario_2":"**1) 연결:** 다음 장(최적화)과 연결되는 직관입니다. **2) 정답 ①**","scenario_3":"**1) 실전:** 행렬분해 계열의 기본 형태입니다. **2) 정답 ①**","scenario_4":"**1) 실전:** 내적 크기·분산 제어가 안정 학습에 중요합니다. **2) 정답 ①**","scenario_5":"**1) 다리:** 기초 벡터→내적→커널 방법으로 이어집니다. **2) 정답 ①**","scenario_6":"**1) 실전:** 표현 학습에서 자주 쓰는 선택입니다. **2) 정답 ①**","scenario_7":"**1) 실전:** 차원 축소=정보를 부분공간에 사영하는 관점. **2) 정답 ①**","scenario_8":"**1) 실전:** 수학 도구는 전제를 가집니다. **2) 정답 ①**","scenario_9":"**1) 예고:** 행·내적은 딥러닝 층의 기본 조각입니다. **2) 정답 ①**"},"problemTestCodes":{"definition_0":"answer = 1\nassert answer == 1","definition_1":"answer = 1\nassert answer == 1","definition_2":"answer = 1\nassert answer == 1","definition_3":"answer = 1\nassert answer == 1","definition_4":"answer = 1\nassert answer == 1","definition_5":"answer = 1\nassert answer == 1","definition_6":"answer = 1\nassert answer == 1","definition_7":"answer = 1\nassert answer == 1","definition_8":"answer = 1\nassert answer == 1","definition_9":"answer = 1\nassert answer == 1","trueFalse_0":"answer = 2\nassert answer == 2","trueFalse_1":"answer = 1\nassert answer == 1","trueFalse_2":"answer = 1\nassert answer == 1","trueFalse_3":"answer = 1\nassert answer == 1","trueFalse_4":"answer = 2\nassert answer == 2","trueFalse_5":"answer = 2\nassert answer == 2","trueFalse_6":"answer = 1\nassert answer == 1","trueFalse_7":"answer = 1\nassert answer == 1","trueFalse_8":"answer = 1\nassert answer == 1","trueFalse_9":"answer = 1\nassert answer == 1","calc_0":"answer = 1\nassert answer == 1","calc_1":"answer = 1\nassert answer == 1","calc_2":"answer = 1\nassert answer == 1","calc_3":"answer = 1\nassert answer == 1","calc_4":"answer = 1\nassert answer == 1","calc_5":"answer = 1\nassert answer == 1","calc_6":"answer = 1\nassert answer == 1","calc_7":"answer = 1\nassert answer == 1","calc_8":"answer = 1\nassert answer == 1","calc_9":"answer = 1\nassert answer == 1","concept_0":"answer = 1\nassert answer == 1","concept_1":"answer = 1\nassert answer == 1","concept_2":"answer = 1\nassert answer == 1","concept_3":"answer = 1\nassert answer == 1","concept_4":"answer = 1\nassert answer == 1","concept_5":"answer = 1\nassert answer == 1","concept_6":"answer = 1\nassert answer == 1","concept_7":"answer = 1\nassert answer == 1","concept_8":"answer = 1\nassert answer == 1","concept_9":"answer = 1\nassert answer == 1","projection_0":"answer = 1\nassert answer == 1","projection_1":"answer = 1\nassert answer == 1","projection_2":"answer = 1\nassert answer == 1","projection_3":"answer = 1\nassert answer == 1","projection_4":"answer = 1\nassert answer == 1","projection_5":"answer = 1\nassert answer == 1","projection_6":"answer = 1\nassert answer == 1","projection_7":"answer = 1\nassert answer == 1","projection_8":"answer = 1\nassert answer == 1","projection_9":"answer = 1\nassert answer == 1","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 1\nassert answer == 1","scenario_3":"answer = 1\nassert answer == 1","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1"}},"midMathCh03":{"chapter":"Chapter 03","title":"행렬과 데이터 묶음: 여러 벡터를 한 장에 담는 법","description":"**행렬(Matrix)**은 숫자를 가로와 세로로 가지런히 정리해 둔 **'마법의 엑셀 표'**와 같습니다. 머신러닝에서는 이 표의 가로 한 줄(행)을 **'한 사람의 데이터(샘플)'**로, 세로 한 줄(열)을 **'키, 몸무게 같은 특징(피처)'**으로 읽는 경우가 많습니다. 이번 장에서는 앞서 배운 한 줄짜리 벡터(Ch.01)와 내적(Ch.02)이 어떻게 여러 개로 묶여 한 장의 거대한 행렬이 되는지 알아보고, 딥러닝의 핵심인 **행렬 곱과 선형층(Ch.04)**으로 자연스럽게 넘어갈 준비를 합니다.","sectionTitle":"행렬과 데이터 묶음: 여러 벡터를 한 장에 담는 법","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","problemSolving":"문제 풀이를 위한 설명"},"visualShort":"행렬 · 열/행 · 전치 · 데이터 행렬","visualIntro":"$$m\\times n$ 행렬 $A$는 **$m$개의 행**과 **$n$개의 열**을 가집니다. **열**을 나란히 붙이면 “여러 벡터를 한 장에 묶은 것”이 되고, **행**은 “한 번에 처리할 한 줄의 식(또는 한 샘플)”이 됩니다. **전치** $A^{\\mathsf T}$는 행과 열을 바꿔 “표를 뒤집는” 연산입니다.","visualStep1":"개념: $A\\in\\mathbb{R}^{m\\times n}$, 원소 $a_{ij}$","visualStep2":"직관: 열=특징 벡터 묶음 / 행=샘플 한 줄","visualStep3":"연산: 합·스칼라배·전치(곱은 다음 장)","visualStep4":"적용: 설계행렬, 미니배치, 가중치 표","visualStepsLabel":"보는 순서","visualFlowTitle":"학습 흐름","visualFlowStep0":"개념: 격자 표로 보는 행렬","visualFlowStep1":"직관: 열 벡터·행 벡터 읽기","visualFlowStep2":"수식: 차원 맞추기·전치","visualFlowStep3":"연결: 행·내적과 $A\\mathbf{u}$ 예고","visualFlowStep4":"적용: 데이터 행렬·배치 텐서","dotVisualAriaLabel":"행렬과 열 강조: 회전하는 하이라이트와 차원 패널","dotVisualMainTitle":"열이 바뀌면 보이는 ‘묶음’","dotVisualPlotTitle":"격자: 3x3에서 열 하이라이트","dotVisualMetricsTitle":"모양 · 하이라이트 · 요약","dotVisualHudDot":"행 수 m","dotVisualHudCos":"열 수 n","dotVisualHudProj":"강조 열 번호","dotVisualLegendU":"격자","dotVisualLegendV":"강조 열","dotVisualLegendProj":"축","dotVisualLegendRes":"라벨","dotVisualInsetLabel":"열 인덱스","dotVisualCaption":"**보라색 열**이 차례로 강조됩니다. 각 열은 **같은 길이**를 가진 벡터이고, 세 열을 나란히 붙이면 **한 장의 행렬**이 됩니다. 오른쪽 패널에서는 **$m\\times n$**의 의미와 **어떤 열을 보고 있는지**를 함께 표시합니다. 행을 기준으로 읽으면 **샘플별 한 줄**이 됩니다(데이터 표의 흔한 관례와 연결).","whatIs":{"intro":"앞서 배운 **벡터**가 숫자를 가로나 세로로 한 줄만 적은 '기차'라면, **행렬**은 이런 기차들을 여러 대 나란히 세워둔 **'거대한 주차장(직사각형 표)'**입니다. 크기가 $m\\times n$이라고 하면, 대략 \"$m$개의 가로줄(행)과 $n$개의 세로줄(열)이 만나는 격자\"라고 읽습니다. 수학이나 AI를 공부할 때 이 **'모양(차원)을 먼저 확인하는 습관'**은 실수를 줄이는 가장 중요한 비법입니다!","plain":"가장 쉬운 비유는 우리가 흔히 쓰는 **엑셀 스프레드시트**입니다. 표 안의 각 칸은 하나의 숫자를 담고 있습니다. 표를 **세로(열)**로 쭉 읽어 내리면 \"모든 사람의 키 데이터 묶음\"이라는 하나의 특징 벡터가 되고, 표를 **가로(행)**로 쭉 읽으면 \"A라는 사람의 키, 몸무게, 나이 기록\"이라는 한 사람의 샘플 벡터가 됩니다. 즉, 같은 표라도 **어느 방향으로 읽느냐**에 따라 데이터의 의미가 완전히 달라집니다.","definition":"핵심 수학 규칙은 다음과 같습니다.\n\n1. **크기(모양)**: 행렬 $A$가 $m\\times n$이라는 것은 $m$개의 행(가로줄)과 $n$개의 열(세로줄)을 가졌다는 뜻입니다.\n2. **원소의 주소**: $i$번째 가로줄, $j$번째 세로줄에 있는 숫자는 $a_{ij}$라고 부릅니다. (예: 2층 3호실)\n3. **전치(Transpose)**: 행렬의 가로와 세로를 휙 뒤집는 연산입니다. 기호로는 $A^{\\mathsf T}$라고 쓰며, $m\\times n$ 행렬을 $n\\times m$ 모양으로 바꿉니다. ($(A^{\\mathsf T})_{ji}=a_{ij}$)\n4. **벡터와의 관계**: 열 벡터 $\\mathbf{a}_j$들을 나란히 이어 붙이면 $A=[\\mathbf{a}_1\\ \\cdots\\ \\mathbf{a}_n]$ 형태의 표가 됩니다.\n5. **덧셈과 스칼라배**: 벡터와 마찬가지로 **모양이 완벽히 같은 행렬끼리만** 계산할 수 있으며, 같은 위치의 숫자끼리 더하거나 모든 숫자에 동일하게 곱해줍니다.","inAI":"**딥러닝**에서는 AI가 생각하는 뇌 구조(가중치)가 바로 이 **행렬**로 이루어져 있습니다. 수만 장의 고양이와 강아지 사진을 학습할 때, 이 사진들을 하나하나 계산하지 않고 커다란 행렬로 묶어서 한 번에 곱해버립니다(배치 학습). 머신러닝에서 흔히 등장하는 **설계행렬(Design Matrix)** 역시, 수많은 데이터 특징들을 행이나 열로 겹겹이 쌓아 만든 튼튼한 데이터 묶음입니다."},"whyImportant":{"bridge":"Ch.01에서 벡터, Ch.02에서 내적을 배웠다면 Ch.03은 이 둘을 **실전 규모로 확장하는 핵심 관문**입니다. 중요한 포인트는 \"계산식을 외우는 것\"이 아니라 **연산 단위를 벡터 1개에서 행렬 전체로 올리는 사고 전환**입니다. $A\\mathbf{x}$를 이해하면 \"행마다 내적이 한 번씩 일어나 결과 벡터가 만들어진다\"는 구조가 보이고, 이 구조는 다음 장의 행렬곱, 선형층, 역전파까지 그대로 이어집니다. 즉, 행렬은 단순한 표가 아니라 **딥러닝 계산 그래프의 기본 문장**입니다.","similarity":"현실 데이터는 거의 항상 여러 축을 동시에 가집니다. 기본은 **샘플 수 $\\times$ 특징 수(행렬)**이고, 여기에 배치·시간·채널 축이 추가되면 곧바로 텐서가 됩니다. 예를 들어 영상 데이터는 `(배치, 시간, 높이, 너비, 채널)`처럼 5차원 텐서로 다루지만, 내부에서는 특정 축을 합치거나 펼쳐 2차원 행렬 연산으로 처리한 뒤 다시 원래 축 구조로 복원합니다. 그래서 **행렬을 정확히 이해하는 사람은 텐서도 빠르게 이해**합니다. 반대로 이 감각이 없으면 shape mismatch, 브로드캐스팅 오해, 축 순서 실수 같은 오류가 반복됩니다."},"howUsed":{"ml":"**머신러닝 파이프라인**에서는 대부분의 입력이 설계 행렬 $X\\in\\mathbb{R}^{m\\times n}$로 시작합니다. 전처리(표준화/결측치 처리)도 열 단위로 적용되고, 학습은 $X\\mathbf{w}$ 같은 행렬-벡터 연산으로 진행됩니다. 추천 시스템은 사용자-아이템 행렬의 빈칸을 채우는 문제로, NLP/비전은 임베딩을 행렬 또는 텐서로 쌓아 유사도/점수를 계산하는 문제로 귀결됩니다. **핵심은 도메인이 달라도 계산의 뼈대는 같다**는 점입니다: 쌓고, 곱하고, 축을 맞춥니다.","geometry":"**선형대수/기하 관점**에서는 행렬이 \"공간을 어떻게 바꾸는지\"를 설명합니다. 회전, 스케일, 축 혼합, 투영이 모두 행렬로 표현됩니다. 텐서는 이런 변환을 여러 축에서 동시에 수행하는 확장판입니다. 예를 들어 배치가 64개인 입력 텐서에 같은 선형층을 적용한다는 말은, 사실상 **같은 행렬 변환을 64번 병렬 적용**한다는 뜻입니다. 따라서 \"텐서가 어렵다\"고 느껴질 때 가장 효과적인 접근은 텐서를 행렬 블록으로 분해해 읽는 것입니다. 이 습관이 생기면 모델 구조를 해석하고 디버깅하는 속도가 크게 빨라집니다."},"summary":"**한 줄 요약:** 행렬은 **여러 개의 벡터를 한 장에 예쁘게 묶어 놓은 거대한 표**입니다. **어느 방향(가로/세로)**으로 읽느냐에 따라 샘플이 되기도 하고 특징이 되기도 합니다. 표를 휙 뒤집는 **전치(Transpose)**는 데이터의 짝(차원)을 맞출 때 사용하는 필수 도구이며, 이 개념들을 단단히 다져두면 다음 장의 **행렬 곱과 선형 변환**을 아주 매끄럽게 소화할 수 있습니다.","problemSolving":{"focus":"아래 표에는 문제 풀이에 필요한 **기호와 차원 규칙**을 요약했습니다. **풀이 예시**는 대표 유형별로 단계를 적어 두었습니다.","examplesHeading":"풀이 예시","examplesTable":"**예시 1 — 모양 읽기**\n\n문제: $A$가 $4\\times 7$이면 원소 개수는?\n\n풀이: $4\\times 7=28$개.\n\n→ 보기 중 **$28$**에 해당.\n\n---\n\n**예시 2 — 전치의 모양**\n\n문제: $A$가 $3\\times 5$일 때 $A^{\\mathsf T}$의 모양은?\n\n풀이: $5\\times 3$.\n\n---\n\n**예시 3 — 합**\n\n문제: $A,B$가 둘 다 $2\\times 2$일 때 $(A+B)_{11}$은?\n\n풀이: $a_{11}+b_{11}$.\n\n---\n\n**예시 4 — 열 벡터**\n\n문제: $A=[\\mathbf{a}_1\\ \\mathbf{a}_2]$에서 $\\mathbf{a}_1\\in\\mathbb{R}^m$이면 $A$의 행 수는?\n\n풀이: 각 열 길이가 $m$이므로 **$m$행**.\n\n---\n\n**예시 5 — Ch.02와 연결**\n\n문제: $A\\mathbf{u}$의 $i$번째 성분은?\n\n풀이: $A$의 **$i$번째 행**과 $\\mathbf{u}$의 **내적**."},"problemSolvingLabel":"문제 풀이를 위한 설명","problemSolvingTable":"| 기호 | 의미 |\n| :--- | :--- |\n| $m\\times n$ | $m$행 $n$열(행이 $m$개, 열이 $n$개) |\n| $a_{ij}$ | $i$행 $j$열 원소 |\n| $A^{\\mathsf T}$ | 전치: $(A^{\\mathsf T})_{ji}=a_{ij}$ |\n| 열 벡터 $\\mathbf{a}_j$ | $A$의 $j$번째 열을 벡터로 본 것 |\n| 같은 모양 | $A+B$는 $A$와 $B$의 모양이 같을 때만 |\n| $A\\mathbf{u}$ (예고) | 각 행과 $\\mathbf{u}$의 내적들로 이루어진 벡터 |\n\n**항목별 자세한 설명**\n\n**① 모양** 행렬곱·덧셈에서 가장 먼저 확인할 것은 **차원(모양)**입니다.\n\n**② 전치** 데이터 파이프라인에서 **특징 축과 샘플 축을 바꿔** 맞출 때 자주 씁니다.\n\n**③ 열/행 관점** 같은 $A$라도 ‘열을 특징으로 볼지, 행을 샘플로 볼지’는 **문제 설정**에 따릅니다.\n\n**④ Ch.02 연결** 행 벡터와 열 벡터의 내적이 곧 행렬·벡터 곱의 한 줄입니다.","practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"","practiceProblemsInstruction":"문제를 읽고 가장 알맞은 선택지를 고르세요.","problems":{"definition_0":"$$m\\times n$ 행렬의 **원소 개수**는?\n\n① $m+n$\n② $m\\times n$\n③ $\\max(m,n)$\n④ $m-n$","definition_1":"행렬 $A$의 $(i,j)$ 원소를 쓰는 일반적인 기호는?\n\n① $a_{ij}$\n② $a_{ji}$만 허용\n③ $A_i$\n④ $\\det(A)$","definition_2":"$$A$가 $m\\times n$일 때 **열 벡터**의 길이(차원)로 옳은 것은?\n\n① $m$\n② $n$\n③ $m+n$\n④ $mn$","definition_3":"**전치** $A^{\\mathsf T}$의 모양은 $A$가 $m\\times n$일 때?\n\n① $n\\times m$\n② $m\\times n$\n③ $m\\times m$\n④ $n\\times n$","definition_4":"**정사각 행렬**의 의미로 가장 가까운 것은?\n\n① 행 수와 열 수가 같다\n② 모든 원소가 1이다\n③ 반드시 역행렬이 존재한다\n④ 항상 영행렬이다","definition_5":"**영행렬**의 성질로 옳은 것은?\n\n① 모든 원소가 0이다\n② 대각원소만 0이다\n③ 행렬식이 항상 1이다\n④ 전치가 불가능하다","definition_6":"단위행렬 $I_n$의 크기는?\n\n① $n\\times n$\n② $n\\times 1$\n③ $1\\times n$\n④ $2n\\times 2n$","definition_7":"$$\\mathbb{R}^{m\\times n}$이 의미하는 것은?\n\n① $m\\times n$ 크기의 실수 행렬 전체의 집합\n② $m+n$차원 벡터 공간\n③ 행렬식 값의 집합\n④ 정사각 행렬만","definition_8":"행렬 $A$를 **열 벡터들의 나열** $[\\mathbf{a}_1\\ \\cdots\\ \\mathbf{a}_n]$로 볼 때, $\\mathbf{a}_j\\in\\mathbb{R}^m$이면 $A$의 모양은?\n\n① $m\\times n$\n② $n\\times m$\n③ $m\\times 1$\n④ $1\\times n$","definition_9":"**행 벡터**를 $1\\times n$으로 둘 때, 그 길이는?\n\n① $n$\n② $1$\n③ $n+1$\n④ $0$","trueFalse_0":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n행렬 덧셈 $A+B$는 $A$와 $B$의 모양이 같을 때만 정의된다.\n\n① 참\n② 거짓","trueFalse_1":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n$(A^{\\mathsf T})^{\\mathsf T}=A$이다.\n\n① 참\n② 거짓","trueFalse_2":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n$2\\times 3$ 행렬과 $3\\times 2$ 행렬은 같은 원소 개수를 가질 수 있다.\n\n① 참\n② 거짓","trueFalse_3":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n모든 정사각 행렬은 가역이다.\n\n① 참\n② 거짓","trueFalse_4":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n$A$가 $m\\times n$이면 $A^{\\mathsf T}$는 $n\\times m$이다.\n\n① 참\n② 거짓","trueFalse_5":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n행렬의 흔한 데이터 관례 중 하나는 ‘한 행이 한 샘플’이다.\n\n① 참\n② 거짓","trueFalse_6":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n$A+B=B+A$가 성립한다(덧셈이 정의될 때).\n\n① 참\n② 거짓","trueFalse_7":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n$(cA)^{\\mathsf T}=cA^{\\mathsf T}$이다.\n\n① 참\n② 거짓","trueFalse_8":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n$I_n A=A$가 성립하려면 $A$는 $n\\times n$이어야만 한다.\n\n① 참\n② 거짓","trueFalse_9":"다음 문장이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\nCh.02의 내적은 행렬·벡터 곱의 ‘한 줄’과 연결된다.\n\n① 참\n② 거짓","calc_0":"$$A=\\begin{pmatrix}1&2\\\\3&4\\end{pmatrix}$일 때 $\\mathrm{tr}(A)=a_{11}+a_{22}$는?\n\n① $5$\n② $4$\n③ $6$\n④ $7$","calc_1":"$$A=\\begin{pmatrix}1&0\\\\2&-1\\end{pmatrix}$, $B=\\begin{pmatrix}0&1\\\\1&1\\end{pmatrix}$일 때 $(A+B)_{12}$는?\n\n① $1$\n② $0$\n③ $2$\n④ $-1$","calc_2":"$$A=\\begin{pmatrix}2&-1\\end{pmatrix}$이고 $c=3$일 때 $(cA)_{11}$은?\n\n① $6$\n② $2$\n③ $-3$\n④ $9$","calc_3":"$$A$가 $2\\times 3$일 때 $A^{\\mathsf T}$의 원소 개수는?\n\n① $5$\n② $6$\n③ $8$\n④ $9$","calc_4":"$$A=\\begin{pmatrix}1&2\\\\3&4\\end{pmatrix}$일 때 $A^{\\mathsf T}$의 $(2,1)$ 원소는?\n\n① $2$\n② $3$\n③ $4$\n④ $1$","calc_5":"$$A=\\begin{pmatrix}0&1\\\\2&3\\end{pmatrix}$, $B=\\begin{pmatrix}1&-1\\\\0&2\\end{pmatrix}$일 때 $(A+B)_{21}$은?\n\n① $2$\n② $3$\n③ $1$\n④ $0$","calc_6":"$$A=\\begin{pmatrix}1&2&3\\end{pmatrix}$는 $1\\times 3$이다. $A^{\\mathsf T}$의 모양은?\n\n① $3\\times 1$\n② $1\\times 3$\n③ $3\\times 3$\n④ $1\\times 1$","calc_7":"$$A=\\begin{pmatrix}5\\end{pmatrix}$일 때 $\\det$를 논하지 않고, 단순히 $A^{\\mathsf T}$의 모양만 말하면?\n\n① $1\\times 1$\n② $0\\times 0$\n③ $1\\times 0$\n④ 정의 불가","calc_8":"$$A=\\begin{pmatrix}1&2\\\\3&4\\\\5&6\\end{pmatrix}$의 모양은?\n\n① $3\\times 2$\n② $2\\times 3$\n③ $6\\times 1$\n④ $1\\times 6$","calc_9":"$$A=\\begin{pmatrix}1&2\\\\3&4\\end{pmatrix}$에서 첫 번째 **열 벡터**를 $\\mathbf{a}_1$이라 할 때 $\\mathbf{a}_1$의 두 번째 성분은?\n\n① $3$\n② $1$\n③ $2$\n④ $4$","concept_0":"선형 회귀에서 흔히 쓰는 **설계행렬**을 ‘샘플이 행’으로 두는 관례와 맞는 설명은?\n\n① 한 행이 한 관측(샘플)이다\n② 한 열이 한 관측이다\n③ 항상 $1\\times n$만 쓴다\n④ 행렬을 쓰지 않는다","concept_1":"딥러닝 미니배치에서 **배치 차원**을 앞에 두는 표기와 가장 잘 맞는 것은?\n\n① $(\\text{배치 크기})\\times(\\text{특징 수})$ 같은 2차원 표를 자주 본다\n② 항상 스칼라만 쓴다\n③ 배치는 항상 0이다\n④ 행렬은 사용하지 않는다","concept_2":"Ch.02의 내적과 연결하여, $A\\mathbf{u}$의 **$i$번째 좌표**를 설명하면?\n\n① $A$의 $i$번째 행과 $\\mathbf{u}$의 내적\n② $A$의 $i$번째 열과 $\\mathbf{u}$의 내적만 항상 맞다\n③ 항상 0\n④ 대각합","concept_3":"행렬을 ‘**열 벡터들의 묶음**’으로 보면 좋은 경우는?\n\n① 각 열이 같은 의미의 특징 벡터일 때\n② 항상 열이 샘플일 때만\n③ 항상 행이 특징일 때만\n④ 전치가 불가능할 때","concept_4":"이미지를 한 줄로 **펼친(flatten)** 벡터로 두는 이유로 가장 가까운 것은?\n\n① 선형층이 기대하는 벡터 입력과 차원을 맞추기 위해\n② 이미지가 항상 1픽셀이기 때문\n③ 행렬을 금지하기 때문\n④ softmax 때문","concept_5":"데이터 전처리에서 **표준화**를 열마다 적용한다는 것은 보통 무엇을 열 기준으로 보냐는 뜻에 가깝나?\n\n① 같은 특징(같은 열)끼리 스케일을 맞춘다\n② 같은 행끼리만 맞춘다\n③ 항상 상수를 더한다\n④ 행렬 크기를 바꾼다","concept_6":"추천 시스템에서 사용자-아이템 **평점 행렬**을 생각할 때, 흔한 직관은?\n\n① 행은 사용자, 열은 아이템(또는 그 반대)처럼 축에 의미를 둔다\n② 항상 $1\\times 1$이다\n③ 항상 영행렬이다\n④ 내적과 무관하다","concept_7":"행렬의 **랭크**를 직관적으로 말하면(세부는 후속 장)?\n\n① ‘진짜로 독립인 열(또는 행) 방향이 몇 개인지’와 연결\n② 항상 행렬식과 같다\n③ 항상 0이다\n④ 전치하면 항상 증가한다","concept_8":"행렬 표기에서 **브로드캐스팅**과 혼동하기 쉬운 점은?\n\n① 모양을 확인하지 않고 덧셈을 하면 조용히 틀릴 수 있다\n② 모양 확인은 불필요하다\n③ 행렬은 항상 $1\\times 1$이다\n④ 전치는 항등이다","concept_9":"Ch.04에서 다룰 **행렬 곱** $AB$의 직관적 전제로 맞는 것은?\n\n① $A$의 열 수와 $B$의 행 수가 같아야 한다\n② $A$와 $B$가 반드시 정사각이어야 한다\n③ 항상 $AB=BA$이다\n④ 곱은 항상 벡터다","projection_0":"$$A\\in\\mathbb{R}^{m\\times n}$, $\\mathbf{u}\\in\\mathbb{R}^n$일 때 $A\\mathbf{u}\\in\\mathbb{R}^?$의 차원은?\n\n① $m$\n② $n$\n③ $m+n$\n④ $mn$","projection_1":"행 벡터 $\\mathbf{r}_i^{\\mathsf T}$가 $A$의 $i$번째 행이라면 $(A\\mathbf{u})_i$는?\n\n① $\\mathbf{r}_i\\cdot\\mathbf{u}$\n② $\\mathbf{r}_i+\\mathbf{u}$\n③ $\\|\\mathbf{r}_i\\|$\n④ $\\det(A)$","projection_2":"모든 $\\mathbf{u}$에 대해 $A\\mathbf{u}=\\mathbf{0}$이면, $A$의 열들은 어떤 관계가 강하게 의심되나(직관)?\n\n① 열들이 선형 종속적일 수 있다\n② 항상 $A=I$이다\n③ 항상 $A$는 가역이다\n④ 열의 길이는 항상 1이다","projection_3":"$$\\mathbf{u}\\mathbf{v}^{\\mathsf T}$가 만드는 행렬(외적 형태)의 랭크 직관은?\n\n① 대부분 1 이하(비영 벡터의 경우 1)\n② 항상 $n$\n③ 항상 0만\n④ 항상 가역","projection_4":"$$A$의 열공간 $\\mathrm{Col}(A)$에 대한 설명으로 가장 가까운 것은?\n\n① $A$의 열 벡터들의 선형결합으로 만들 수 있는 벡터들의 집합\n② 항상 전체 공간과 같다\n③ 항상 $\\{\\mathbf{0}\\}$뿐이다\n④ 행렬식 집합","projection_5":"$$A\\mathbf{x}=\\mathbf{b}$가 해를 가질 때, $\\mathbf{b}$는 어디에 속해야 하나(직관)?\n\n① $\\mathrm{Col}(A)$\n② 항상 단위구만\n③ 항상 영벡터만\n④ $\\mathbb{R}$","projection_6":"행렬 $A$를 ‘행들의 집합’으로 볼 때, 각 행은 어떤 공간의 원소인가(원소 길이 관점)?\n\n① $\\mathbb{R}^n$\n② $\\mathbb{R}^m$\n③ $\\mathbb{R}^{mn}$\n④ $\\mathbb{R}$","projection_7":"$$A\\in\\mathbb{R}^{m\\times n}$이고 $\\mathbf{e}_j\\in\\mathbb{R}^n$가 표준기저일 때 $A\\mathbf{e}_j$는?\n\n① $A$의 $j$번째 열\n② $A$의 $j$번째 행\n③ 항상 0\n④ $j$행 $j$열 원소만","projection_8":"데이터 행렬 $X$가 ‘샘플이 행’일 때, $X^{\\mathsf T}$를 취하면 흔히 어떤 축이 바뀌나?\n\n① 샘플 축과 특징 축이 바뀐다\n② 아무것도 안 바뀐다\n③ 항상 정사각이 된다\n④ 항상 영행렬이 된다","projection_9":"Ch.02 정사영과 연결해, ‘선형 변환’ 관점에서 $A\\mathbf{u}$는?\n\n① $\\mathbf{u}$를 $\\mathbb{R}^n$에서 $\\mathbb{R}^m$으로 보내는 선형 변환의 값\n② 항상 길이를 보존한다\n③ 항상 회전만 한다\n④ 항상 확률 벡터다","scenario_0":"사이킷런에서 특성행렬 **X**를 ‘샘플이 행’으로 둘 때, 보통 $X$의 모양은?\n\n① $(\\text{샘플 수})\\times(\\text{특성 수})$\n② $(\\text{특성 수})\\times(\\text{샘플 수})$만 허용\n③ 항상 $1\\times 1$\n④ $(\\text{클래스 수})\\times(\\text{배치})$","scenario_1":"배치 크기 32, 특징 차원 128인 **2차원 텐서** 한 덩어리를 행렬로 읽으면 흔한 모양은?\n\n① $32\\times 128$\n② $128\\times 32$만 가능\n③ $32\\times 32$\n④ $128\\times 128$","scenario_2":"컨볼루션 이후 **flatten**하여 완전연결층에 넣는 이유로 맞는 것은?\n\n① FC층이 벡터 입력을 기대하기 때문\n② softmax 때문만\n③ 항상 이미지가 1차원이기 때문\n④ 역전파를 끄기 위해","scenario_3":"표 형 데이터에서 ‘결측치를 열별 평균으로’ 채우면, 보통 어떤 축을 따라 평균을 내나?\n\n① 같은 열(같은 특징) 내에서\n② 같은 행만\n③ 대각선만\n④ 전체 스칼라 하나","scenario_4":"협업 필터링에서 평점 행렬 $R$이 매우 희소(sparse)할 때의 직관은?\n\n① 대부분의 칸이 관측되지 않았다\n② 모든 원소가 1이다\n③ 항상 가역이다\n④ 행렬을 쓰지 않는다","scenario_5":"자연어에서 ‘문장 임베딩을 행으로 쌓는’ 표기는 어떤 직관을 주나?\n\n① 각 행이 한 문장(또는 한 토큰 시퀀스의 풀링 벡터)이다\n② 항상 열이 문장이다\n③ 항상 $1\\times 1$이다\n④ softmax만 쓴다","scenario_6":"행렬을 GPU에 올릴 때 성능 이슈와 연결되는 기본 개념은?\n\n① 연속된 메모리 레이아웃(레이아웃/stride)과 모양\n② 행렬은 항상 스칼라\n③ 전치는 항상 무료\n④ 랭크는 항상 0","scenario_7":"다음 중 **Ch.03에서 배운 것만**으로 과장하기 쉬운 진술은?\n\n① ‘행렬이 있으면 항상 바로 딥러닝이 최적’이다\n② 데이터는 표로 표현되는 경우가 많다\n③ 모양을 맞추는 것이 중요하다\n④ 전치는 축을 바꾼다","scenario_8":"이미지를 $H\\times W$ 그레이스케일 행렬로 두고 flatten하면 벡터 길이는?\n\n① $H\\times W$\n② $H+W$\n③ $\\max(H,W)$\n④ $1$","scenario_9":"Ch.04 예고: 선형층 $\\mathbf{y}=W\\mathbf{x}+\\mathbf{b}$에서 $W$가 의미하는 것은?\n\n① 선형 변환(행렬)로 특징을 섞는다\n② 항상 스칼라 곱 하나\n③ 항상 softmax\n④ 항상 손실"},"problemAnswers":{"definition_0":2,"definition_1":1,"definition_2":1,"definition_3":1,"definition_4":1,"definition_5":1,"definition_6":1,"definition_7":1,"definition_8":1,"definition_9":1,"trueFalse_0":1,"trueFalse_1":1,"trueFalse_2":1,"trueFalse_3":2,"trueFalse_4":1,"trueFalse_5":1,"trueFalse_6":1,"trueFalse_7":1,"trueFalse_8":2,"trueFalse_9":1,"calc_0":1,"calc_1":1,"calc_2":1,"calc_3":2,"calc_4":1,"calc_5":1,"calc_6":1,"calc_7":1,"calc_8":1,"calc_9":1,"concept_0":1,"concept_1":1,"concept_2":1,"concept_3":1,"concept_4":1,"concept_5":1,"concept_6":1,"concept_7":1,"concept_8":1,"concept_9":1,"projection_0":1,"projection_1":1,"projection_2":1,"projection_3":1,"projection_4":1,"projection_5":1,"projection_6":1,"projection_7":1,"projection_8":1,"projection_9":1,"scenario_0":1,"scenario_1":1,"scenario_2":1,"scenario_3":1,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1},"problemSolutions":{"definition_0":"**1) 개념:** $m\\times n$ 격자의 칸 수는 행 수와 열 수를 곱한 값입니다. **2) 예시:** $2\\times 3$이면 $6$개 칸입니다. **3) 정답 ②**","definition_1":"**1) 개념:** $i$행 $j$열 원소는 보통 $a_{ij}$로 씁니다. **2) 예시:** $a_{23}$은 2행 3열입니다. **3) 정답 ①**","definition_2":"**1) 개념:** 각 열은 길이 $m$인 벡터(행이 $m$개이므로). **2) 예시:** $4\\times 7$이면 열 벡터는 $\\mathbb{R}^4$입니다. **3) 정답 ①**","definition_3":"**1) 개념:** 전치는 행·열을 바꿔 $n\\times m$이 됩니다. **2) 예시:** $2\\times 5$의 전치는 $5\\times 2$입니다. **3) 정답 ①**","definition_4":"**1) 개념:** 정사각 행렬은 $m=n$입니다. **2) 예시:** $3\\times 3$은 정사각, $2\\times 3$은 아닙니다. **3) 정답 ①**","definition_5":"**1) 개념:** 영행렬은 모든 $a_{ij}=0$입니다. **2) 예시:** $2\\times 2$ 영행렬은 네 칸이 모두 0입니다. **3) 정답 ①**","definition_6":"**1) 개념:** $I_n$은 $n\\times n$이며 대각선이 1입니다. **2) 예시:** $I_2$는 $2\\times 2$ 단위행렬입니다. **3) 정답 ①**","definition_7":"**1) 개념:** $\\mathbb{R}^{m\\times n}$는 실수 원소로 이루어진 $m\\times n$ 행렬 전체입니다. **2) 예시:** 여기서 ‘크기’는 벡터 차원 $m+n$과 다릅니다. **3) 정답 ①**","definition_8":"**1) 개념:** 열이 $n$개이고 각 열 길이가 $m$이면 $m\\times n$입니다. **2) 예시:** 두 열이면 $m\\times 2$입니다. **3) 정답 ①**","definition_9":"**1) 개념:** $1\\times n$ 행 벡터의 성분 개수는 $n$입니다. **2) 예시:** $1\\times 4$면 네 개의 수가 한 행에 있습니다. **3) 정답 ①**","trueFalse_0":"**1) 개념:** 덧셈은 같은 모양에서만 성분별로 합니다. **2) 예시:** $2\\times 2$와 $2\\times 3$은 더할 수 없습니다. **3) 정답 ①**","trueFalse_1":"**1) 개념:** 전치 두 번이면 원래 행렬입니다. **2) 예시:** 작은 $2\\times 2$로 칸을 적어 두 번 뒤집어 확인합니다. **3) 정답 ①**","trueFalse_2":"**1) 계산:** 둘 다 원소 $6$개라 개수는 같을 수 있습니다. **2) 예시:** $2\\times 3$도 $3\\times 2$도 $6$칸입니다. **3) 정답 ①**","trueFalse_3":"**1) 반례:** 영행렬은 정사각이지만 가역이 아닙니다. **2) 예시:** 특이행렬도 가역이 아닐 수 있습니다. **3) 정답 ②**","trueFalse_4":"**1) 개념:** 전치의 크기는 $n\\times m$입니다. **2) 예시:** $3\\times 5$를 전치하면 $5\\times 3$입니다. **3) 정답 ①**","trueFalse_5":"**1) 실무:** 표에서 한 행이 한 레코드(샘플)인 경우가 흔합니다. **2) 예시:** 사이킷런의 기본 관례와 잘 맞습니다. **3) 정답 ①**","trueFalse_6":"**1) 개념:** 성분별 덧셈은 교환 가능합니다. **2) 예시:** $(A+B)_{11}=a_{11}+b_{11}=b_{11}+a_{11}$입니다. **3) 정답 ①**","trueFalse_7":"**1) 개념:** 스칼라는 전치 밖으로 나오며 성분에 곱해집니다. **2) 예시:** $(2A)^{\\mathsf T}$의 $(i,j)$는 $2a_{ji}$입니다. **3) 정답 ①**","trueFalse_8":"**1) 반례:** $I_n$은 $n\\times p$ 행렬 $A$에 왼쪽에서 곱해져 $A$가 됩니다(정사각일 필요 없음). **2) 예시:** $n\\times 2$ 행렬에도 성립합니다. **3) 정답 ②**","trueFalse_9":"**1) 연결:** $A\\mathbf{u}$의 각 좌표는 행·내적입니다. **2) 예시:** Ch.02의 내적을 행마다 반복한 구조입니다. **3) 정답 ①**","calc_0":"**1) 계산:** $\\mathrm{tr}(A)=1+4=5$입니다. **2) 예시:** 대각합은 $a_{11}+a_{22}$입니다. **3) 정답 ①**","calc_1":"**1) 계산:** $(A+B)_{12}=a_{12}+b_{12}=0+1=1$입니다. **2) 예시:** 성분별로 더합니다. **3) 정답 ①**","calc_2":"**1) 계산:** $(3A)_{11}=3\\cdot 2=6$입니다. **2) 예시:** 스칼라배는 모든 성분에 곱합니다. **3) 정답 ①**","calc_3":"**1) 개념:** 전치는 원소 개수를 바꾸지 않습니다. **2) 예시:** $2\\times 3$은 $6$개, 전치해도 $6$개입니다. **3) 정답 ②**","calc_4":"**1) 계산:** $A^{\\mathsf T}$의 $(2,1)$은 $A$의 $(1,2)$와 같습니다. **2) 예시:** $a_{12}=2$이므로 답은 $2$입니다. **3) 정답 ①**","calc_5":"**1) 계산:** $(A+B)_{21}=a_{21}+b_{21}=2+0=2$입니다. **2) 예시:** 2행 1열을 더합니다. **3) 정답 ①**","calc_6":"**1) 개념:** $1\\times 3$의 전치는 $3\\times 1$입니다. **2) 예시:** 열 벡터가 됩니다. **3) 정답 ①**","calc_7":"**1) 개념:** $1\\times 1$ 행렬의 전치는 $1\\times 1$입니다. **2) 예시:** 스칼라와 동일한 모양입니다. **3) 정답 ①**","calc_8":"**1) 읽기:** 행이 3개, 열이 2개이므로 $3\\times 2$입니다. **2) 예시:** 세 줄·두 열입니다. **3) 정답 ①**","calc_9":"**1) 읽기:** 첫 열은 $(1,3)^{\\mathsf T}$이므로 두 번째 성분은 $3$입니다. **2) 예시:** 아래쪽 항목이 두 번째 행입니다. **3) 정답 ①**","concept_0":"**1) 실무:** 표에서 한 행이 한 샘플인 경우가 많습니다. **2) 예시:** 선형 회귀의 설계행렬 관례와 맞습니다. **3) 정답 ①**","concept_1":"**1) 실무:** 배치×특징 형태의 2D 텐서를 자주 봅니다. **2) 예시:** 프레임워크마다 축 순서는 문서를 확인합니다. **3) 정답 ①**","concept_2":"**1) 연결:** $i$번째 행 벡터와 $\\mathbf{u}$의 내적입니다. **2) 예시:** Ch.02의 내적을 행마다 적용합니다. **3) 정답 ①**","concept_3":"**1) 직관:** 열이 ‘특징 묶음’일 때 해석이 잘 맞습니다. **2) 예시:** 열이 샘플인 경우도 있어 항상 모양을 확인합니다. **3) 정답 ①**","concept_4":"**1) 실전:** FC층은 벡터 입력을 기대하는 경우가 많습니다. **2) 예시:** CNN 뒤의 flatten이 대표적입니다. **3) 정답 ①**","concept_5":"**1) 실무:** 같은 특징(열)끼리 평균·분산을 맞춥니다. **2) 예시:** 키(cm) 열과 몸무게(kg) 열의 스케일이 다릅니다. **3) 정답 ①**","concept_6":"**1) 직관:** 사용자×아이템 격자에 점수를 둡니다. **2) 예시:** 행/열 의미는 팀 규약에 따릅니다. **3) 정답 ①**","concept_7":"**1) 예고:** 랭크는 ‘독립인 방향’ 개수와 연결됩니다. **2) 예시:** 세부는 선형독립·랭크 장에서 다룹니다. **3) 정답 ①**","concept_8":"**1) 실무:** 라이브러리가 브로드캐스팅을 허용해도 모양을 확인해야 합니다. **2) 예시:** 의도치 않은 축 확장을 피합니다. **3) 정답 ①**","concept_9":"**1) 규칙:** $A$의 열 수와 $B$의 행 수가 같아야 곱이 정의됩니다. **2) 예시:** $3\\times 2$와 $2\\times 4$는 가능, $3\\times 2$와 $3\\times 2$는 일반적으로 불가입니다. **3) 정답 ①**","projection_0":"**1) 차원:** $A\\mathbf{u}$는 $m$개의 행·내적 결과이므로 $m$차원입니다. **2) 예시:** $4\\times 3$에 $\\mathbb{R}^3$ 벡터를 곱하면 $\\mathbb{R}^4$입니다. **3) 정답 ①**","projection_1":"**1) 정의:** $i$번째 좌표는 $i$번째 행과 $\\mathbf{u}$의 내적입니다. **2) 예시:** Ch.02의 내적 공식을 그대로 씁니다. **3) 정답 ①**","projection_2":"**1) 직관:** 모든 입력을 0으로 보내려면 열들이 지나치게 ‘겹치는’ 경우가 많습니다. **2) 예시:** 영행렬은 모든 $\\mathbf{u}$에 대해 0입니다. **3) 정답 ①**","projection_3":"**1) 직관:** 외적 형태는 한 벡터 방향으로만 퍼진 정보를 담기 쉬워 랭크가 1 이하입니다. **2) 예시:** 비영이면 보통 랭크 1입니다. **3) 정답 ①**","projection_4":"**1) 정의:** 열들의 모든 선형결합이 열공간입니다. **2) 예시:** $A\\mathbf{x}$는 항상 열공간에 속합니다. **3) 정답 ①**","projection_5":"**1) 정리:** $A\\mathbf{x}=\\mathbf{b}$가 해를 가지면 $\\mathbf{b}\\in\\mathrm{Col}(A)$입니다. **2) 예시:** ‘열들이 span하는 곳’에 $\\mathbf{b}$가 있어야 합니다. **3) 정답 ①**","projection_6":"**1) 차원:** 각 행은 $n$개 성분이므로 $\\mathbb{R}^n$의 원소입니다. **2) 예시:** $m\\times n$ 행렬의 행 벡터 길이는 $n$입니다. **3) 정답 ①**","projection_7":"**1) 계산:** 표준기저 $\\mathbf{e}_j$는 $j$번째만 1이므로 $A\\mathbf{e}_j$는 $j$번째 열입니다. **2) 예시:** 작은 $2\\times 2$로 곱해 확인합니다. **3) 정답 ①**","projection_8":"**1) 전치:** 샘플이 행이면 전치 후 샘플이 열이 됩니다. **2) 예시:** 축 이름을 바꿔 다시 그립니다. **3) 정답 ①**","projection_9":"**1) 관점:** 행렬은 선형 변환을 나타냅니다. **2) 예시:** 다음 장에서 행렬곱과 함께 정식화합니다. **3) 정답 ①**","scenario_0":"**1) 실무:** `n_samples × n_features`가 흔합니다. **2) 예시:** 1000명×20특성이면 $1000\\times 20$입니다. **3) 정답 ①**","scenario_1":"**1) 표기:** 배치×특징을 $32\\times 128$처럼 두는 경우가 많습니다. **2) 예시:** 프레임워크 문서로 축 순서를 확인합니다. **3) 정답 ①**","scenario_2":"**1) 실전:** FC는 보통 벡터·행렬의 마지막 축이 특징이 되게 맞춥니다. **2) 예시:** conv 출력을 펼쳐 차원을 맞춥니다. **3) 정답 ①**","scenario_3":"**1) 실무:** 같은 열은 같은 변수이므로 열 평균이 자연스럽습니다. **2) 예시:** ‘키’ 열 결측을 다른 사람 키 평균으로 채웁니다. **3) 정답 ①**","scenario_4":"**1) 직관:** 관측된 평점만 있고 나머지는 비어 있는 행렬입니다. **2) 예시:** 추천에서 흔한 설정입니다. **3) 정답 ①**","scenario_5":"**1) 표기:** 행이 문장 임베딩이면 배치처럼 쌓입니다. **2) 예시:** 문서 검색·클러스터링에서 사용합니다. **3) 정답 ①**","scenario_6":"**1) 실무:** 연속 메모리·stride·전치 비용은 구현 이슈와 연결됩니다. **2) 예시:** `.contiguous()` 같은 조치를 쓰기도 합니다. **3) 정답 ①**","scenario_7":"**1) 비판적 사고:** 행렬만으로 딥러닝이 항상 최선은 아닙니다. **2) 예시:** 데이터·목적·제약에 따라 모델을 고릅니다. **3) 정답 ①**","scenario_8":"**1) 계산:** $H\\times W$ 픽셀을 한 줄로 펼치면 길이 $HW$입니다. **2) 예시:** $28\\times 28$이면 784차원입니다. **3) 정답 ①**","scenario_9":"**1) 예고:** $W$는 선형 변환(특징 혼합)입니다. **2) 예시:** 다음 장에서 행렬곱과 함께 자세히 다룹니다. **3) 정답 ①**"},"problemTestCodes":{"definition_0":"answer = 2\nassert answer == 2","definition_1":"answer = 1\nassert answer == 1","definition_2":"answer = 1\nassert answer == 1","definition_3":"answer = 1\nassert answer == 1","definition_4":"answer = 1\nassert answer == 1","definition_5":"answer = 1\nassert answer == 1","definition_6":"answer = 1\nassert answer == 1","definition_7":"answer = 1\nassert answer == 1","definition_8":"answer = 1\nassert answer == 1","definition_9":"answer = 1\nassert answer == 1","trueFalse_0":"answer = 1\nassert answer == 1","trueFalse_1":"answer = 1\nassert answer == 1","trueFalse_2":"answer = 1\nassert answer == 1","trueFalse_3":"answer = 2\nassert answer == 2","trueFalse_4":"answer = 1\nassert answer == 1","trueFalse_5":"answer = 1\nassert answer == 1","trueFalse_6":"answer = 1\nassert answer == 1","trueFalse_7":"answer = 1\nassert answer == 1","trueFalse_8":"answer = 2\nassert answer == 2","trueFalse_9":"answer = 1\nassert answer == 1","calc_0":"answer = 1\nassert answer == 1","calc_1":"answer = 1\nassert answer == 1","calc_2":"answer = 1\nassert answer == 1","calc_3":"answer = 2\nassert answer == 2","calc_4":"answer = 1\nassert answer == 1","calc_5":"answer = 1\nassert answer == 1","calc_6":"answer = 1\nassert answer == 1","calc_7":"answer = 1\nassert answer == 1","calc_8":"answer = 1\nassert answer == 1","calc_9":"answer = 1\nassert answer == 1","concept_0":"answer = 1\nassert answer == 1","concept_1":"answer = 1\nassert answer == 1","concept_2":"answer = 1\nassert answer == 1","concept_3":"answer = 1\nassert answer == 1","concept_4":"answer = 1\nassert answer == 1","concept_5":"answer = 1\nassert answer == 1","concept_6":"answer = 1\nassert answer == 1","concept_7":"answer = 1\nassert answer == 1","concept_8":"answer = 1\nassert answer == 1","concept_9":"answer = 1\nassert answer == 1","projection_0":"answer = 1\nassert answer == 1","projection_1":"answer = 1\nassert answer == 1","projection_2":"answer = 1\nassert answer == 1","projection_3":"answer = 1\nassert answer == 1","projection_4":"answer = 1\nassert answer == 1","projection_5":"answer = 1\nassert answer == 1","projection_6":"answer = 1\nassert answer == 1","projection_7":"answer = 1\nassert answer == 1","projection_8":"answer = 1\nassert answer == 1","projection_9":"answer = 1\nassert answer == 1","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 1\nassert answer == 1","scenario_3":"answer = 1\nassert answer == 1","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1"}},"midMathCh04":{"chapter":"Chapter 04","title":"행렬 곱셈과 선형 변환: 데이터를 디자인하는 스마트 필터","description":"행렬 곱셈은 단순히 수많은 숫자를 더하고 곱하는 지루한 연산이 아닙니다. 사실 행렬은 원본 데이터를 회전시키고, 비틀고, 압축하는 '디지털 사진 편집기의 스마트 필터'와 완벽하게 같은 역할을 합니다. 이번 장에서는 하나의 데이터(벡터)를 편집기(행렬)에 넣어 전혀 다른 차원으로 변환시키는 **'선형 변환(Linear Transformation)'**의 심연을 들여다봅니다. 딥러닝 모델의 가장 근본적인 뼈대인 $\\mathbf{y} = W\\mathbf{x} + \\mathbf{b}$가 어떤 수학적 의미를 품고 작동하는지 자세히 파헤쳐 보겠습니다.","sectionTitle":"행렬 곱셈과 선형 변환: 공간을 자유자재로 편집하기","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","problemSolving":"문제 풀이를 위한 설명"},"visualShort":"행렬×벡터 = 한 번에 좌표 옮기기 · 두 변환 이어 붙이기 = 행렬곱","visualIntro":"행렬 $A$를 벡터에 곱한다는 건, **숫자들을 섞어서 새 벡터를 만든다**는 뜻이에요. **$AB$**는 “먼저 $B$로 옮기고, 그다음 $A$로 옮긴다”를 **한 번에** 적는 방법이에요. 격자가 기울어지는 그림만 떠올려도 충분해요.","visualStep1":"개념: $A\\in\\mathbb{R}^{m\\times n}$가 $\\mathbb{R}^n\\to\\mathbb{R}^m$ 선형 사상","visualStep2":"직관: 격자·벡터가 기울어지고 늘어남(원점 고정)","visualStep3":"수식: $(AB)_{ij}$는 $i$행과 $j$열의 내적, $(AB)\\mathbf{x}=A(B\\mathbf{x})$","visualStep4":"적용: 선형층, 배치 행렬곱, 어텐션 스코어","visualStepsLabel":"보는 순서","visualFlowTitle":"학습 흐름","visualFlowStep0":"개념: 선형 변환 = 행렬 × 벡터","visualFlowStep1":"직관: 평면 격자 변형·합성","visualFlowStep2":"수식: 곱셈 규칙·전치·합성","visualFlowStep3":"연결: Ch.02 내적 = 행렬곱의 한 줄","visualFlowStep4":"적용: 선형층·배치·스코어 행렬","mapVisualStep1":"① 여기서 입력 x","mapVisualStep2":"② 행렬 A가 옮김","mapVisualStep3":"③ 결과 Ax · 파란 면 위","mapVisualPanelLeft":"입력","mapVisualPanelRight":"출력","dotVisualAnimateHint":"같은 평면에서 정사각 격자가 행렬 A로 평행사변형되고, 점이 x에서 Ax로 옮겨집니다.","dotVisualPhaseHint0":"**1/4** $x_1$만 움직이고 $x_2$는 고정이에요. 출력은 **첫 번째 열** 방향(주황 점선 첫째 구간)으로만 움직입니다.","dotVisualPhaseHint1":"**2/4** $x_2$만 움직이고 $x_1$은 고정이에요. 출력은 **두 번째 열** 방향(청록 점선 둘째 구간)으로만 갑니다.","dotVisualPhaseHint2":"**3/4** $x_1=x_2$로 같이 움직여요. 출력은 **두 열의 합 벡터** 방향으로 갑니다.","dotVisualPhaseHint3":"**4/4** $(x_1,x_2)$가 원을 그려요. 출력은 **파란 면** 위를 한 바퀴 돕니다.","dotVisualHudCoeffLine":"$$x_1={x1}$, $x_2={x2}$","dotVisualDecompKey":"","dotVisualEasyHook":"**한 줄:** 행렬 $A$에 벡터를 곱하면($A\\mathbf{x}$) **입력을 한 번에 새 위치로 옮깁니다.** 오른쪽 **큰 초록 상자**는 ‘나올 수 있는 값의 큰 틀’, **파란 면**은 ‘실제로 갈 수 있는 바닥’이에요.","dotVisualAriaLabel":"단위 정사각형 격자가 행렬 A로 평행사변형되며, 점 x가 Ax로 옮겨집니다","dotVisualMainTitle":"정사각 격자 → $A$ → 기울어진 격자","dotVisualPlotTitle":"왼쪽 **같은 좌표**의 점이 오른쪽으로 **한 번에** 옮겨져요. 격자 전체가 같이 늘어납니다.","dotVisualMetricsTitle":"이 그림만 기억해요","dotVisualHudDot":"","dotVisualHudCos":"$$T(\\mathbf{x})=A\\mathbf{x}$. **$T$**는 “벡터를 행렬 $A$로 옮기는 **선형 변환**”을 가리키는 **이름(함수 기호)**이에요. 그래서 **$T(\\mathbf{x})$**는 “$\\mathbf{x}$에 $T$를 적용한 결과”이고, 계산으로는 **$A\\mathbf{x}$**와 **같은 말**입니다.","dotVisualHudPlain":"**파란 영역** = 행렬 $A$의 **두 열 벡터**가 만든 평행사변형(열들이 펼치는 면). 선형 변환의 결과 **$T(\\mathbf{x})=A\\mathbf{x}$**는 항상 그 **안**(두 열의 조합으로만 만들 수 있는 범위)에만 찍혀요.","dotVisualHudProj":"열공간","dotVisualLegendU":"입력 / 큰 틀","dotVisualLegendV":"$$A$","dotVisualLegendProj":"도달 면","dotVisualLegendRes":"$$\\mathbf{x} \\mapsto A\\mathbf{x}$","dotVisualInsetLabel":"t","mapVisualDomainCaption":"입력","mapVisualCodomainCaption":"나올 수 있는 큰 틀","mapVisualRangeCaption":"실제로 갈 수 있는 면","mapVisualRnLabel":"ℝ²","mapVisualRnSubLabel":"실수 좌표평면 · 입력","mapVisualRnSvgTitle":"ℝ²: 입력용 2차원 실수 공간(좌표 쌍). 회귀분석의 R제곱과는 다른 기호입니다.","mapVisualRnA11y":"ℝ²: 입력용 2차원 실수 공간(좌표 쌍). 회귀분석의 R제곱과는 다른 기호입니다.","mapVisualRmLabel":"ℝ²","mapVisualRmSubLabel":"실수 좌표평면 · 출력","mapVisualRmSvgTitle":"ℝ²: 변환 결과를 그리는 2차원 실수 공간. 이 그림에서는 입력과 같은 차원입니다.","mapVisualRmA11y":"ℝ²: 변환 결과를 그리는 2차원 실수 공간. 이 그림에서는 입력과 같은 차원입니다.","mapVisualLabelX":"x","mapVisualLabelTx":"Ax","mapVisualLabelMap":"A","mapVisualMapHint":"**주황 배지의 A:** 이 그림에서 쓰는 **행렬 $A$**(선형 변환)입니다. 왼쪽 좌표 $\\mathbf{x}$에 곱해 오른쪽 점 $A\\mathbf{x}$를 만듭니다.","mapVisualCol1Tag":"a₁","mapVisualCol2Tag":"a₂","mapVisualGhostHint":"회색 점선 = A=I 일 때 정사각형","dotVisualCaption":"**행렬×벡터** $A\\mathbf{x}$는 ‘숫자를 섞는 규칙’이에요. 왼쪽에서 **입력** $\\mathbf{x}$가 움직이면, 오른쪽 **파란 면 위**에만 결과가 찍혀요. **행렬의 곱** $AB$는 이 변환을 **이어 붙인 것**($B$ 다음 $A$)으로 생각하면 됩니다.","whatIs":{"0":"**1. 선형 변환 (Linear Transformation): 이미지 편집기의 '자유 변형' 툴**\n\n**개념:** 투명한 격자무늬(모눈) 위에 그려진 이미지를 포토샵으로 불러왔다고 상상해 보세요. 마우스로 모서리를 잡고 이미지를 대각선으로 쭉 늘리거나, 45도 회전시키거나, 비스듬하게 눕혀서 찌그러뜨리는 모든 작업이 기하학에서 말하는 **'선형 변환'**입니다.\n\n**엄격한 규칙:** 단, 이 변형 툴에는 절대 깨져서는 안 되는 두 가지 프로그램 규칙이 있습니다. 첫째, 이미지의 정중앙인 **원점 $(0,0)$은 변형 후에도 반드시 같은 자리**에 있어야 합니다. 둘째, **원래 직선이었던 선은 변형 후에도 휘어짐 없이 꼿꼿한 직선**을 유지해야 하며, 서로 평행했던 선들은 끝까지 평행해야 합니다.","1":"**2. 행렬과 벡터의 곱 ($A\\mathbf{x}$): 원본 사진에 필터 적용하기**\n\n**개념:** 여기서 **벡터 $\\mathbf{x}$**는 아직 아무런 효과도 주지 않은 '원본 데이터(점의 위치)'이고, **행렬 $A$**는 특정한 각도와 비율로 찌그러뜨리는 '스마트 필터(변환 규칙)'입니다. 원본에 필터를 씌우는 행동을 수학으로는 $A\\mathbf{x}$ (행렬 $A$가 벡터 $\\mathbf{x}$에 작용한다)라고 표기합니다.\n\n**딥러닝에서의 활용:** 인공 신경망의 한 층(Layer)은 이 기법을 이용해 **$\\mathbf{y} = W\\mathbf{x} + \\mathbf{b}$** 라는 핵심 수식을 만들어냅니다.\n* $W$ (가중치 행렬): 데이터를 AI가 분석하기 좋은 새로운 각도와 비율로 찌그러뜨립니다(선형 변환).\n* $\\mathbf{b}$ (편향 벡터): 찌그러진 이미지를 마우스로 드래그해서 통째로 옆으로 살짝 이동시킵니다(평행 이동).\n이렇게 '변형'과 '이동'을 거쳐 탄생한 결과물 $\\mathbf{y}$가 다음 층으로 전달되는 것입니다.","2":"**3. 행렬과 행렬의 곱 ($AB$): 여러 개의 필터 순서대로 겹쳐 바르기**\n\n**개념:** 행렬 $A$와 행렬 $B$를 곱한다는 것은, 두 가지 편집 필터를 **연속해서 적용**한다는 뜻입니다. 주의할 점은 $AB$라고 적혀 있다면, 수식은 오른쪽에서 왼쪽으로 흐르기 때문에 **$B$ 필터를 먼저 적용하고, 그 결과물에 $A$ 필터를 덮어씌운다**는 뜻입니다.\n\n**핵심 수식 ($AB \\neq BA$):** 순서가 왜 중요할까요? 이미지를 '가로로 2배 길게 늘리기' 한 다음 '90도 회전'을 하면 **위아래로 길쭉한 이미지**가 됩니다. 반대로 '90도 회전'을 먼저 한 다음 '가로로 2배 길게 늘리기'를 하면 **양옆으로 뚱뚱한 이미지**가 됩니다. 이처럼 행렬 곱셈은 순서를 바꾸면 전혀 다른 결과가 나오므로 **$AB \\neq BA$ (교환 법칙 성립 안 함)**라는 사실이 매우 중요합니다.","3":"**4. 행렬 곱의 차원 맞추기: 규격이 맞는 케이블 연결하기**\n\n**개념:** 여러 개의 필터를 겹칠 때는 앞뒤 단자의 규격이 맞아야 연결할 수 있습니다. 즉, 앞 행렬의 '가로 길이(열)'와 뒤 행렬의 '세로 길이(행)'가 완벽히 일치해야만 두 데이터가 맞물려 연산이 진행됩니다.\n\n**핵심 수식:** $(m \\times n)$ 크기의 행렬과 $(n \\times p)$ 크기의 행렬을 곱하면, 맞닿은 $n$ 차원은 연산 과정을 통해 흡수되어 사라지고 **$(m \\times p)$**라는 새로운 크기의 행렬이 출력됩니다. 실무 코드에서는 내가 가진 데이터 묶음 $X$와 모델의 가중치 $W$의 규격을 강제로 맞추기 위해, 표의 가로세로를 휙 뒤집는 전치(Transpose) 연산을 사용하여 **$Y = XW^{\\mathsf{T}}$** 형태로 규격을 깔끔하게 맞춰 연산합니다.","4":"**5. 변환 예시: 3차원을 평면에 ‘눌러’ 표현하기**\n\n**예시 1** 3차원 점 $(x_1,x_2,x_3)$을 $z=0$인 $xy$평면으로 내려놓는(세 번째 좌표를 버리는) 선형 변환을 행렬로 쓰면 다음과 같습니다.\n\n$$A=\\begin{pmatrix}1&0&0\\\\0&1&0\\\\0&0&0\\end{pmatrix}$$\n\n**규칙:** $\\mathbf{x}\\mapsto A\\mathbf{x}$. 아래는 같은 곱을 **행마다 내적**으로 풀어 쓴 과정입니다.\n\n**1단계 — 식 세우기** 입력 $\\mathbf{x}=(x_1,x_2,x_3)^{\\mathsf T}$에 대해\n\n$$A\\mathbf{x}=\\begin{pmatrix}1&0&0\\\\0&1&0\\\\0&0&0\\end{pmatrix}\\begin{pmatrix}x_1\\\\x_2\\\\x_3\\end{pmatrix}$$\n\n**2단계 — 각 행과 $\\mathbf{x}$의 내적** ($i$번째 성분 = $A$의 $i$번째 행 · $\\mathbf{x}$)\n\n$$\\begin{aligned}\ny_1 &= 1\\cdot x_1+0\\cdot x_2+0\\cdot x_3 = x_1,\\\\\ny_2 &= 0\\cdot x_1+1\\cdot x_2+0\\cdot x_3 = x_2,\\\\\ny_3 &= 0\\cdot x_1+0\\cdot x_2+0\\cdot x_3 = 0.\n\\end{aligned}$$\n\n**3단계 — 결과 벡터**\n\n$$A\\mathbf{x}=\\begin{pmatrix}y_1\\\\y_2\\\\y_3\\end{pmatrix}=\\begin{pmatrix}x_1\\\\x_2\\\\0\\end{pmatrix}$$\n\n즉 **$x_1,x_2$는 그대로 두고 $x_3$만 0으로 만듭니다.** 기하적으로는 원점을 지나는 $xy$평면에 대한 **정사영(orthogonal projection)**이며, “한 축의 정보를 제거하는” 필터를 **행렬 한 번의 곱**으로 적은 예입니다. Ch.02에서 다룬 내적·투영 직관과도 연결됩니다."},"whyImportant":{"bridge":"**수십만 개의 픽셀을 단 한 번에 처리하는 병렬 처리의 마법**\n\n고해상도 사진 한 장만 해도 픽셀이 수백만 개입니다. 이걸 '픽셀 하나씩' for 문으로 돌리면 CPU는 숨이 차고, 학습은 현실적으로 불가능에 가깝습니다. 행렬 곱셈은 이 수많은 숫자를 **하나의 거대한 표(행렬)**로 묶은 뒤, 변환 규칙 역시 **또 하나의 행렬**로 표현합니다. 그래서 '필터를 씌운다'는 직관이 곧바로 **단 한 번의 곱셈 연산**으로 번역됩니다.\n\nGPU(그래픽 카드)는 이 행렬 곱을 **수천 개의 코어가 동시에** 나눠 맡도록 설계되어 있습니다. 텐서플로·파이토치에서 흔히 보는 **배치 GEMM**(General Matrix Multiply)은, 샘플 여러 개를 행으로 쌓은 $X$에 가중치 $W$를 한꺼번에 곱해 **$Y = XW^{\\mathsf{T}}$** 한 방으로 미니배치 전체를 밀어 넣는 연산입니다. 딥러닝이 '엄청난 데이터'를 '눈 깜짝할 새'에 소화하는 이유는, 결국 **행렬이라는 공통 포맷** 덕분에 하드웨어가 병렬을 극대화할 수 있기 때문입니다.","similarity":"**모든 인공지능 모델을 관통하는 단 하나의 공통 언어**\n\n넷플릭스 추천, 자율주행의 차선 인식, 챗GPT의 문장 생성처럼 겉모습은 전부 다르지만, 속을 들여다보면 **'행렬로 특징을 섞고, 차원을 맞추고, 다음 층으로 넘긴다'**는 문법이 반복됩니다. 완전연결층·임베딩·어텐션 스코어까지 이름만 바뀔 뿐, 뿌리에는 **$Y = XW^{\\mathsf{T}}$** 같은 **행렬 × 행렬** 패턴이 자주 등장합니다.\n\n이 감각이 있으면 **Shape mismatch**가 났을 때 '어느 블록 크기가 안 맞는지'를 빨리 짚을 수 있습니다. 앞 행렬의 열과 뒤 행렬의 행이 같아야만 곱이 정의된다는 규칙은, 마치 **케이블 규격**을 맞추는 것과 같습니다. 한 번 이 '공통 언어'에 익숙해지면, 분야가 달라도 논문·코드·로그를 읽을 때 **같은 지도**로 길을 찾는 느낌이 납니다."},"howUsed":{"ml":"**1) 트랜스포머와 어텐션: 단어들 사이의 '관심 지도'를 행렬로**\n\n챗GPT류 모델의 심장인 **어텐션**은, 문장 안의 단어들이 서로 얼마나 관련 있는지 **점수 행렬**로 한꺼번에 계산합니다. 대표적으로 쿼리 $Q$와 키 $K$를 곱한 **$QK^{\\mathsf{T}}$** 는 '이 단어가 저 단어를 얼마나 볼지'에 대한 원시 점수를 빠르게 채워 넣습니다. 여기에 소프트맥스·$V$ 가중합이 얹혀 **스케일된 닷-프로덕트 어텐션**이 완성되죠. 한 줄로 말하면, **행렬 곱으로 관계도를 찍고**, 그다음 **같은 문법으로 가중합**을 하는 구조입니다.\n\n**2) 선형층·배치 학습: 미니배치 전체를 한 번에**\n\n완전연결층은 $\\mathbf{y} = W\\mathbf{x} + \\mathbf{b}$의 반복입니다. 실제 학습에서는 샘플 $N$개를 행으로 쌓은 $X$에 대해 **$Y = XW^{\\mathsf{T}} + \\mathbf{1}\\mathbf{b}^{\\mathsf{T}}$**처럼 한 번에 처리합니다. 합성곱도 채널·공간을 펼치면 결국 **큰 행렬 곱**으로 이해할 수 있어, 프레임워크가 내부적으로 **GEMM**을 쓰는 이유와도 맞닿아 있습니다.\n\n**3) 임베딩·추천: '의미 벡터'끼리 맞대보기**\n\n단어·사용자·아이템을 벡터로 만든 뒤, **내적이나 행렬 곱**으로 유사도·점수를 내면 추천·검색·랭킹이 돌아갑니다. 결국 '누가 누구와 가까운가'를 **행렬 한 장**으로 요약해 버리는 셈입니다.","geometry":"**1) PCA·차원 축소: 천 차원을 '그림자'로 낮추기**\n\n인간은 3차원 이상을 직관적으로 그리기 어렵지만, 데이터는 흔히 수백·수천 차원입니다. **PCA** 같은 방법은 공분산을 행렬로 두고, **고유벡터 방향**(분산이 큰 축)을 골라 데이터를 그 위에 **투영**합니다. 이 투영은 선형 변환(행렬 곱)으로 쓰면, '불필요한 방향은 눌러 없애고 핵심 축만 남긴다'는 뜻이 됩니다. 시각화용 2D 산점도 한 장이 사실은 **고차원 구름을 행렬로 눌러 만든 그림자**라고 보면 됩니다.\n\n**2) 기하 직관: 나중에 나오는 고유값·행렬식의 예습**\n\n같은 선형 변환이라도 **어떤 방향은 늘고 줄고** 다르게 작용합니다. 그 '특별한 방향'이 고유벡터이고, 늘림 비율이 고유값입니다. 지금 장에서 익힌 **열이 만드는 평행사변형·합성 $AB$** 감각이 있으면, Ch.05 이후의 **가역성·행렬식·스펙트럼** 이야기가 한결 덜 낯설어집니다.\n\n**3) 컴퓨터 그래픽스: 화면에 올리기까지도 행렬**\n\n게임·CAD에서 물체를 회전·이동·원근 투영할 때도 **동차 좌표**와 **행렬 곱**이 쓰입니다. '3D 장면을 2D 화면에 찍는다'는 것도 결국 **좌표를 행렬로 한 번에 옮긴다**는 이야기입니다. 딥러닝과 CG가 다른 분야처럼 보여도, **공간을 행렬로 다룬다**는 점에서는 같은 도구상자를 공유합니다."},"summary":"**실무자를 위한 핵심 요약:** 행렬 곱셈은 데이터를 1차원적인 숫자로 보지 않고, 다차원 공간에서 찌그러뜨리고 회전시키는 **'동적인 공간 변환 툴($\\mathbf{y} = W\\mathbf{x} + \\mathbf{b}$)'**입니다. 여러 층을 쌓아 올릴 때는 규격($(m \\times n) \\times (n \\times p)$)을 맞추는 것이 가장 중요하며, 변환의 순서($AB \\neq BA$)가 결과를 완전히 뒤바꾼다는 사실을 항상 명심해야 합니다.","problemSolving":{"focus":"아래 표는 **차원 규칙**과 **자주 쓰는 공식**을 모았습니다. 풀이 예시는 대표 유형별로 단계를 적었습니다.","examplesHeading":"풀이 예시","examplesTable":"**예시 1 — 곱의 모양**\n\n문제: $A$가 $4\\times 7$, $B$가 $7\\times 3$이면 $AB$는?\n\n풀이: $4\\times 3$.\n\n---\n\n**예시 2 — 합성 순서**\n\n문제: $\\mathbf{x}$에 $B$ 다음 $A$를 적용한 행렬은?\n\n풀이: $AB$.\n\n---\n\n**예시 3 — 전치**\n\n문제: $(AB)^{\\mathsf T}$는?\n\n풀이: $B^{\\mathsf T}A^{\\mathsf T}$.\n\n---\n\n**예시 4 — 열 관점**\n\n문제: $A\\mathbf{e}_2$는?\n\n풀이: $A$의 두 번째 **열**.\n\n---\n\n**예시 5 — 배치**\n\n문제: 행이 샘플인 $X$에 선형층을 한 번에?\n\n풀이: $XW^{\\mathsf T}$ 형태를 자주 씁니다."},"problemSolvingLabel":"문제 풀이를 위한 설명","problemSolvingTable":"| 기호 | 의미 |\n| :--- | :--- |\n| $AB$ | $A$의 열 수 = $B$의 행 수일 때 정의 |\n| $(AB)_{ij}$ | $A$의 $i$행과 $B$의 $j$열의 내적 |\n| $A\\mathbf{x}$ | $A$의 행들과 $\\mathbf{x}$의 내적들로 이루어진 벡터 |\n| $(AB)^{\\mathsf T}$ | $B^{\\mathsf T}A^{\\mathsf T}$ |\n| 합성 | $\\mathbf{x}\\mapsto A(B\\mathbf{x})=(AB)\\mathbf{x}$ |\n| 선형층 | $\\mathbf{y}=W\\mathbf{x}+\\mathbf{b}$ (가중치 $W$, 편향 $\\mathbf{b}$) |\n\n**① 차원** 곱하기 전 **안쪽 두 수**가 같아야 합니다.\n\n**② 배치** 행이 샘플이면 같은 $W$를 행마다 적용해 `GEMM`으로 처리합니다.","practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"","practiceProblemsInstruction":"문제를 읽고 가장 알맞은 선택지를 고르세요.","problems":{"definition_0":"$$A\\in\\mathbb{R}^{m\\times n}$, $B\\in\\mathbb{R}^{p\\times q}$일 때 곱 $AB$가 **정의되기 위해** 필요한 조건은?\n\n① $m=p$\n② $n=p$\n③ $m=q$\n④ $n=m$","definition_1":"$$(AB)_{ij}$의 정의로 옳은 것은? ($A$의 $i$번째 **행**, $B$의 $j$번째 **열**)\n\n① $a_{ij}b_{ij}$\n② $A$의 $i$행과 $B$의 $j$열의 **내적**\n③ $a_{ij}+b_{ij}$\n④ $a_{ji}b_{ji}$","definition_2":"$$A\\in\\mathbb{R}^{m\\times n}$, $B\\in\\mathbb{R}^{n\\times p}$일 때 $AB$의 모양은?\n\n① $m\\times p$\n② $n\\times n$\n③ $m\\times n$\n④ $p\\times m$","definition_3":"$$A\\in\\mathbb{R}^{m\\times n}$일 때 $AI_n=A$가 되려면 단위행렬 $I_n$의 크기는?\n\n① $n\\times n$\n② $m\\times m$\n③ $m\\times n$\n④ $n\\times m$","definition_4":"$$A\\in\\mathbb{R}^{m\\times n}$일 때 $I_m A=A$가 되도록 하는 $I_m$의 크기는?\n\n① $m\\times m$\n② $n\\times n$\n③ $m\\times n$\n④ $n\\times m$","definition_5":"$$(AB)^{\\mathsf T}$에 대한 전치 규칙으로 옳은 것은?\n\n① $A^{\\mathsf T}B^{\\mathsf T}$\n② $B^{\\mathsf T}A^{\\mathsf T}$\n③ $(A^{\\mathsf T})^{\\mathsf T}B$\n④ $AB^{\\mathsf T}$","definition_6":"$$A\\in\\mathbb{R}^{m\\times n}$, 열 벡터 $\\mathbf{u}\\in\\mathbb{R}^n$일 때 $A\\mathbf{u}$는 어느 공간의 벡터인가?\n\n① $\\mathbb{R}^m$\n② $\\mathbb{R}^n$\n③ $\\mathbb{R}^{mn}$\n④ $\\mathbb{R}^{m+n}$","definition_7":"선형 변환 $T(\\mathbf{x})=A\\mathbf{x}$가 만족해야 하는 성질로 **항상** 옳은 것은?\n\n① $T(\\mathbf{0})=\\mathbf{0}$\n② $T(\\mathbf{x})=\\mathbf{x}$\n③ $\\|T(\\mathbf{x})\\|=\\|\\mathbf{x}\\|$\n④ $T(\\mathbf{x}+\\mathbf{y})=T(\\mathbf{x})T(\\mathbf{y})$","definition_8":"$$\\mathrm{rank}(AB)$와 $\\mathrm{rank}(A)$, $\\mathrm{rank}(B)$ 사이에 **항상** 성립하는 부등식은?\n\n① $\\mathrm{rank}(AB)\\ge \\mathrm{rank}(A)$\n② $\\mathrm{rank}(AB)\\le \\min(\\mathrm{rank}(A),\\mathrm{rank}(B))$\n③ $\\mathrm{rank}(AB)=\\mathrm{rank}(A)+\\mathrm{rank}(B)$\n④ $\\mathrm{rank}(AB)=mn$","definition_9":"유클리드 공간에서 ‘먼저 $B$로 보낸 뒤 $A$로 보내는’ 합성 변환의 행렬 표현(열 벡터 관례)은?\n\n① $AB$\n② $BA$\n③ $A+B$\n④ $A^{\\mathsf T}B^{\\mathsf T}$","trueFalse_0":"다음이 **참**이면 ①, **거짓**이면 ②를 고르세요.\n\n모든 정사각 행렬 $A,B$에 대해 $AB=BA$이다.\n\n① 참\n② 거짓","trueFalse_1":"곱셈이 정의될 때 $(AB)C=A(BC)$이다.\n\n① 참\n② 거짓","trueFalse_2":"곱셈·덧셈이 정의될 때 $A(B+C)=AB+AC$이다.\n\n① 참\n② 거짓","trueFalse_3":"$$AB=O$이면 반드시 $A=O$ 이거나 $B=O$이다.\n\n① 참\n② 거짓","trueFalse_4":"정사각 행렬에서 항상 $(A+B)^2=A^2+2AB+B^2$ 이다.\n\n① 참\n② 거짓","trueFalse_5":"같은 크기의 정사각 행렬 $A,B$에 대해 $\\det(AB)=\\det(A)\\det(B)$ 이다.\n\n① 참\n② 거짓","trueFalse_6":"선형 변환 $T(\\mathbf{x})=A\\mathbf{x}$는 항상 $T(\\mathbf{0})=\\mathbf{0}$ 이다.\n\n① 참\n② 거짓","trueFalse_7":"직교 행렬 $Q$에 대해 $Q^{\\mathsf T}Q=I$ 이다.\n\n① 참\n② 거짓","trueFalse_8":"모든 벡터에 스칼라 $c$를 곱하는 변환은 행렬 $cI$로 쓸 수 있다.\n\n① 참\n② 거짓","trueFalse_9":"배치 행렬 $X$의 **각 행**이 샘플 벡터일 때, 선형층 $\\mathbf{y}^{\\mathsf T}=\\mathbf{x}^{\\mathsf T}W^{\\mathsf T}$를 행마다 적용하는 것은 각 샘플에 **같은** $W^{\\mathsf T}$를 곱하는 것과 같다.\n\n① 참\n② 거짓","calc_0":"$$A=\\begin{pmatrix}1&2\\\\3&4\\end{pmatrix}$, $B=\\begin{pmatrix}0&1\\\\1&0\\end{pmatrix}$일 때 $(AB)_{11}$은?\n\n① $2$\n② $1$\n③ $3$\n④ $0$","calc_1":"$$A=\\begin{pmatrix}1&0\\\\0&2\\end{pmatrix}$, $\\mathbf{x}=\\begin{pmatrix}3\\\\4\\end{pmatrix}$일 때 $A\\mathbf{x}$의 첫 번째 성분은?\n\n① $3$\n② $4$\n③ $7$\n④ $12$","calc_2":"$$R=\\begin{pmatrix}0&-1\\\\1&0\\end{pmatrix}$ (반시계 방향 $90^\\circ$ 회전)일 때 $R\\begin{pmatrix}1\\\\0\\end{pmatrix}$는?\n\n① $\\begin{pmatrix}0\\\\1\\end{pmatrix}$\n② $\\begin{pmatrix}1\\\\0\\end{pmatrix}$\n③ $\\begin{pmatrix}-1\\\\0\\end{pmatrix}$\n④ $\\begin{pmatrix}0\\\\-1\\end{pmatrix}$","calc_3":"$$\\begin{pmatrix}2&1\\\\0&3\\end{pmatrix}\\begin{pmatrix}1&1\\\\0&1\\end{pmatrix}$의 $(2,2)$ 원소는?\n\n① $3$\n② $4$\n③ $6$\n④ $0$","calc_4":"$$\\begin{pmatrix}1&2&3\\end{pmatrix}\\begin{pmatrix}4\\\\5\\\\6\\end{pmatrix}$의 값은?\n\n① $32$\n② $21$\n③ $18$\n④ $720$","calc_5":"$$A=\\begin{pmatrix}1&1\\\\0&1\\end{pmatrix}^2$일 때 $A$의 $(1,2)$ 원소는?\n\n① $2$\n② $1$\n③ $0$\n④ $3$","calc_6":"$$\\begin{pmatrix}1&2\\\\3&4\\end{pmatrix}\\begin{pmatrix}1&0\\\\0&0\\end{pmatrix}$의 $(2,1)$ 원소는?\n\n① $3$\n② $1$\n③ $0$\n④ $4$","calc_7":"$$B=\\begin{pmatrix}1&2\\\\3&4\\end{pmatrix}$일 때 $B\\mathbf{e}_1$ (첫 번째 표준기저)는?\n\n① $B$의 첫 번째 **열**\n② $B$의 첫 번째 **행**\n③ 영벡터\n④ $(1,0)^{\\mathsf T}$","calc_8":"$$A=\\begin{pmatrix}1&0\\\\0&0\\end{pmatrix}$, $B=\\begin{pmatrix}0&0\\\\0&1\\end{pmatrix}$일 때 $AB$는?\n\n① 영행렬\n② $I_2$\n③ $\\begin{pmatrix}1&0\\\\0&1\\end{pmatrix}$\n④ $\\begin{pmatrix}0&1\\\\1&0\\end{pmatrix}$","calc_9":"$$\\begin{pmatrix}3\\end{pmatrix}\\begin{pmatrix}2\\end{pmatrix}$ (둘 다 $1\\times 1$)의 곱은?\n\n① $\\begin{pmatrix}6\\end{pmatrix}$\n② $5$\n③ 정의 안 됨\n④ $13$","concept_0":"완전연결층에서 $\\mathbf{y}=W\\mathbf{x}+\\mathbf{b}$의 $W$가 하는 일로 가장 가까운 것은?\n\n① 입력 특징을 **선형 결합**으로 섞어 새 특징을 만든다\n② 항상 확률을 만든다\n③ 항상 이미지를 회전한다\n④ 손실을 직접 최소화한다","concept_1":"배치 크기 $B$, 입력 차원 $d_{in}$, 출력 차원 $d_{out}$일 때, 선형층 파라미터 $W\\in\\mathbb{R}^{d_{out}\\times d_{in}}$의 **원소 개수**는?\n\n① $d_{out}\\times d_{in}$\n② $B\\times d_{in}$\n③ $d_{in}+d_{out}$\n④ $B\\times d_{out}$","concept_2":"행렬-벡터 곱 $A\\mathbf{u}$의 $i$번째 좌표는 Ch.02의 어떤 연산과 같은가?\n\n① $A$의 $i$번째 행과 $\\mathbf{u}$의 내적\n② $A$의 $i$번째 열과 $\\mathbf{u}$의 외적\n③ $\\mathbf{u}$의 노름\n④ 행렬식","concept_3":"딥러닝에서 ‘층을 깊게’ 쌓는다는 것이 선형층만으로 이루어질 때, 수학적으로는 무엇의 반복인가?\n\n① 행렬 곱(및 편향)의 합성\n② 항상 같은 행렬을 더함\n③ 행렬식만 계산\n④ 전치만 반복","concept_4":"미니배치 입력 $X\\in\\mathbb{R}^{B\\times d_{in}}$와 가중치 $W\\in\\mathbb{R}^{d_{out}\\times d_{in}}$일 때, 한 줄(한 샘플)씩 동일한 선형 변환을 적용한 결과를 한 번에 쓰는 식은?\n\n① $XW^{\\mathsf T}$\n② $WX$ (항상 정의)\n③ $X+X$\n④ $W^{\\mathsf T}X^{\\mathsf T}$만 가능","concept_5":"활성화 함수 $\\sigma$ **앞**의 선형 부분만 보면, 한 층은 무엇에 해당하는가?\n\n① 선형 변환(행렬)\n② 항상 비선형만\n③ softmax만\n④ 손실 함수","concept_6":"Ch.03의 ‘샘플이 행’인 데이터 행렬 $X$에 선형층을 적용해 특징을 바꿀 때, **차원** 관점에서 먼저 할 일은?\n\n① $X$와 $W$의 모양을 맞춰 곱이 정의되게 한다\n② 항상 전치를 금지한다\n③ 행렬을 스칼라로 만든다\n④ 샘플 수를 1로 만든다","concept_7":"행렬 곱이 **교환법칙**이 성립하지 않는 직관적 이유는?\n\n① ‘나중에 적용할 변환’과 ‘먼저 적용할 변환’의 순서가 바뀌면 결과가 달라질 수 있기 때문\n② 행렬은 항상 대칭이기 때문\n③ 내적이 없기 때문\n④ 역행렬이 없기 때문","concept_8":"선형 회귀에서 예측 $\\hat{\\mathbf{y}}=X\\boldsymbol{\\beta}$에서 $X\\boldsymbol{\\beta}$를 선형대수적으로 보면?\n\n① 설계행렬 열들의 선형결합(계수 $\\boldsymbol{\\beta}$)\n② 항상 벡터의 노름\n③ 행렬식\n④ 고유값 분해만 가능","concept_9":"행렬 $A$가 나타내는 선형 변환의 ‘출력이 도달할 수 있는 범위’를 직관적으로 가리키는 말로 가장 가까운 것은?\n\n① 열공간(Column space)\n② 단위구\n③ 스칼라 1개\n④ 항상 전체 공간","projection_0":"표준기저 벡터 $\\mathbf{e}_j\\in\\mathbb{R}^n$에 대해 $A\\mathbf{e}_j$는?\n\n① $A$의 $j$번째 **열**\n② $A$의 $j$번째 **행**\n③ 항상 영벡터\n④ $j$행 $j$열만 남은 벡터","projection_1":"모든 $\\mathbf{x}$에 대해 $A\\mathbf{x}=\\mathbf{0}$이면 $\\mathrm{rank}(A)$는?\n\n① $0$\n② 항상 $n$\n③ 항상 $m$\n④ 항상 $\\min(m,n)$","projection_2":"$$A\\in\\mathbb{R}^{m\\times n}$일 때 $\\{A\\mathbf{x}: \\mathbf{x}\\in\\mathbb{R}^n\\}$는 무엇인가?\n\n① $A$의 **열공간**\n② 항상 $\\mathbb{R}^m$\n③ 항상 $\\{\\mathbf{0}\\}$\n④ 행공간과 항상 같다","projection_3":"합성 $A(B\\mathbf{x})=(AB)\\mathbf{x}$가 의미하는 것은?\n\n① 선형 변환의 **합성**이 행렬 곱에 대응한다\n② 항상 $AB=BA$이다\n③ 행렬 곱은 교환 가능하다\n④ 내적과 무관하다","projection_4":"$$P$가 투영행렬($P^2=P$)일 때, $P\\mathbf{x}$는 $\\mathbf{x}$를 어디로 보내는 변환인가(직관)?\n\n① 어떤 부분공간으로의 투영\n② 항상 회전만\n③ 항상 전체 공간으로의 가역 변환\n④ 항상 스칼라 배만","projection_5":"$$A\\in\\mathbb{R}^{m\\times n}$, $m0$인 $2\\times2$ 실행렬 $A$가 나타내는 선형 변환의 방향(orientation)은?\n\n① 반시계 방향을 보존(시계/반시계 판별에서 부호 양)\n② 항상 대칭이다\n③ 항상 회전만 한다\n④ 항상 대각화된다","concept_9":"$$\\mathbb{R}^3$에서 세 열 벡터가 만드는 **평행육면체 부피**는?\n\n① $\\lvert\\det([\\mathbf{a}_1\\ \\mathbf{a}_2\\ \\mathbf{a}_3])\\rvert$\n② $\\lVert\\mathbf{a}_1\\rVert+\\lVert\\mathbf{a}_2\\rVert+\\lVert\\mathbf{a}_3\\rVert$\n③ $\\mathrm{tr}(A)$\n④ 항상 $1$","projection_0":"행렬식의 **여인수 전개**(한 행/열 기준)는?\n\n① 정의상 항상 성립하는 표준 방법 중 하나\n② $3\\times3$에서만 정의된다\n③ 대칭행렬에서만 성립한다\n④ 전치하면 항상 $0$이 된다","projection_1":"수반행렬(adjugate) $\\mathrm{adj}(A)$에 대한 관계식은?\n\n① $A\\,\\mathrm{adj}(A)=\\det(A)\\,I$\n② $A\\,\\mathrm{adj}(A)=I$\n③ $\\mathrm{adj}(A)=A^{-1}$\n④ $\\det(\\mathrm{adj}(A))=0$","projection_2":"가역 행렬 $A$에 대해 $\\det(A^{-1}BA)$는?\n\n① $\\det(B)$\n② $\\det(A)$\n③ $\\det(A^{-1})$\n④ $\\det(A)+\\det(B)$","projection_3":"스칼라 $\\lambda$가 $A$의 고유값일 때 반드시 성립하는 것은?\n\n① $\\det(A-\\lambda I)=0$\n② $\\det(A-\\lambda I)=1$\n③ $\\det(A)=\\lambda$\n④ $A=\\lambda I$","projection_4":"$$3\\times3$ 크래머 법칙으로 세 좌표를 모두 구할 때 필요한 행렬식 개수(일반적으로)는?\n\n① $4$개\n② $1$개\n③ $9$개\n④ $3$개만","projection_5":"$$A\\in\\mathbb{R}^{n\\times n}$, $D\\in\\mathbb{R}^{m\\times m}$일 때 $\\det\\begin{pmatrix}A&0\\\\0&D\\end{pmatrix}$는?\n\n① $\\det(A)\\det(D)$\n② $\\det(A)+\\det(D)$\n③ $\\det(AD)$\n④ $0$","projection_6":"행렬의 **두 행을 맞바꾸면** 행렬식은?\n\n① 부호가 반대로 바뀐다\n② 변하지 않는다\n③ 항상 $0$이 된다\n④ 두 배가 된다","projection_7":"한 행의 **다른 행의 배수를 더하는** 기본 행 연산은 행렬식을?\n\n① 그대로 둔다\n② 부호만 바꾼다\n③ $0$으로 만든다\n④ 두 배로 만든다","projection_8":"$$n\\times n$ 실행렬에서 $AB$가 가역이면?\n\n① $A$와 $B$ 모두 가역이다\n② $A$만 가역이면 된다\n③ $B$만 가역이면 된다\n④ $A,B$ 중 하나는 반드시 영행렬이다","projection_9":"$$\\mathbb{R}^n$에서 가역 선형 변환 $A$가 임의의 부피 $V$를 가진 도형에 작용하면 부피는?\n\n① $\\lvert\\det(A)\\rvert\\cdot V$\n② $V/\\lvert\\det(A)\\rvert$\n③ 항상 $V$\n④ $\\mathrm{tr}(A)\\cdot V$","scenario_0":"PyTorch에서 `torch.linalg.det(A)`는 배치 차원을 유지하며 마지막 두 축의 행렬식을 반환한다. 이 동작이 의미하는 것은?\n\n① 여러 $2\\times2$ 행렬을 한 번에 처리할 수 있다\n② 항상 스칼라 하나만 반환한다\n③ 역행렬을 함께 반환한다\n④ GPU에서만 정의된다","scenario_1":"`torch.linalg.solve(A, b)`가 `inv(A) @ b`보다 권장되는 이유로 가장 가까운 것은?\n\n① 수치적으로 안정적이고 보통 더 빠른 직접 해법을 쓴다\n② 행렬식을 계산하지 못해서\n③ 역행렬이 항상 존재하지 않아서\n④ `b`가 벡터가 아니어서","scenario_2":"학습 중 헤시안(또는 가우스-뉴턴 근사)이 거의 특이하면 어떤 현상이 잘 발생하는가?\n\n① 스텝 방향이 폭주하거나 불안정해진다\n② 항상 즉시 수렴한다\n③ 손실이 항상 $0$이 된다\n④ 그라디언트가 사라진다","scenario_3":"릿지 회귀에서 $X^{\\mathsf T}X+\\lambda I$를 쓰는 주된 이유 중 하나는?\n\n① $\\lambda>0$이면 행렬이 가역(양정부호)으로 만들기 쉽다\n② 행렬식을 $0$으로 만든다\n③ 역행렬을 금지한다\n④ 배치 크기를 줄인다","scenario_4":"다변량 정규분포의 밀도에 $\\det(\\Sigma)^{-1/2}$ 꼴이 등장하는 이유와 직결되는 개념은?\n\n① 선형 변환 후 부피 스케일(야코비안)\n② softmax 온도\n③ ReLU의 기울기\n④ 드롭아웃 비율","scenario_5":"과결정 시스템 $A\\mathbf{x}=\\mathbf{b}$에서 최소제곱해를 구할 때 자주 쓰는 `pinv`의 역할에 가까운 것은?\n\n① 가역이 아닐 때 의미 있는 최소 노름 해 등을 제공한다\n② 항상 $\\det(A)$를 $1$로 만든다\n③ 항상 정확해를 준다\n④ softmax를 계산한다","scenario_6":"손실 곡면에서 헤시안이 거의 특이한 방향이 많다는 것은?\n\n① 평평하거나 경계가 애매한 골짜기/고리띠에서 흔하다\n② 항상 전역 최솟값만 존재한다\n③ 그라디언트가 항상 $0$이다\n④ 학습률이 무의미하다","scenario_7":"일반행렬의 `det`가 $0$에 매우 가깝다는 것만으로 확실히 말할 수 있는 것은?\n\n① 수치적으로 역이 불안정할 **수 있다**\n② 반드시 학습이 불가능하다\n③ 모델 파라미터가 최적이다\n④ softmax가 발산한다","scenario_8":"고유분해 $A=Q\\Lambda Q^{-1}$가 가능한 경우 $\\det(A)$는?\n\n① 고유값들의 곱\n② 고유값들의 합\n③ $\\mathrm{tr}(Q)$\n④ 항상 $0$","scenario_9":"미니배치 공분산 행렬 $S=\\frac{1}{N-1}\\tilde X^{\\mathsf T}\\tilde X$가 거의 특이할 때 로그우도에 $\\log\\det S$ 항을 안정적으로 다루려면 흔히 쓰는 방법은?\n\n① Cholesky 분해로 $\\det$를 대각원소 곱으로 계산하거나 작은 정칙화를 더한다\n② 행렬식을 항상 $0$으로 둔다\n③ $S$를 영행렬로 만든다\n④ softmax를 $S$에 적용한다"},"problemAnswers":{"definition_0":2,"definition_1":1,"definition_2":2,"definition_3":3,"definition_4":1,"definition_5":1,"definition_6":2,"definition_7":1,"definition_8":1,"definition_9":2,"trueFalse_0":2,"trueFalse_1":1,"trueFalse_2":2,"trueFalse_3":1,"trueFalse_4":1,"trueFalse_5":1,"trueFalse_6":2,"trueFalse_7":1,"trueFalse_8":2,"trueFalse_9":1,"calc_0":1,"calc_1":1,"calc_2":3,"calc_3":1,"calc_4":1,"calc_5":1,"calc_6":1,"calc_7":1,"calc_8":1,"calc_9":1,"concept_0":1,"concept_1":1,"concept_2":2,"concept_3":2,"concept_4":1,"concept_5":1,"concept_6":1,"concept_7":1,"concept_8":1,"concept_9":1,"projection_0":1,"projection_1":1,"projection_2":1,"projection_3":1,"projection_4":1,"projection_5":1,"projection_6":1,"projection_7":1,"projection_8":1,"projection_9":1,"scenario_0":1,"scenario_1":1,"scenario_2":1,"scenario_3":1,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1},"problemSolutions":{"definition_0":"**1) 정의:** $\\det(A)=ad-bc$입니다. **2) 예시:** $\\begin{pmatrix}2&1\\\\0&3\\end{pmatrix}$이면 $2\\cdot3-1\\cdot0=6$입니다. **3) 정답 ②**","definition_1":"**1) 정리:** 정사각 실행렬은 $\\det(A)\\neq 0$일 때만 가역입니다. **2) 예시:** $\\det\\begin{pmatrix}1&1\\\\0&1\\end{pmatrix}=1$이므로 가역입니다. **3) 정답 ①**","definition_2":"**1) 규칙:** 합성의 역은 **역순**으로 곱합니다. $(AB)(B^{-1}A^{-1})=I$입니다. **2) 예시:** 회전 두 번의 되감기 순서를 떠올립니다. **3) 정답 ②**","definition_3":"**1) 정의:** 단위행렬은 부피(면적)를 바꾸지 않으므로 $\\det(I_n)=1$입니다. **2) 예시:** $I_2$의 대각곱 $1\\cdot1=1$입니다. **3) 정답 ③**","definition_4":"**1) 성질:** 전치는 행렬식을 바꾸지 않습니다. **2) 예시:** $2\\times2$로 직접 전치해 확인합니다. **3) 정답 ①**","definition_5":"**1) 계산:** 대각행렬의 역은 대각원소의 역수입니다. **2) 예시:** $\\det A=6\\neq0$입니다. **3) 정답 ①**","definition_6":"**1) 규칙:** 각 행에 $2$를 곱하면 행렬식에 $2$가 한 번씩 두 번 곱해져 $4\\det(A)$입니다. **2) 예시:** $A=I_2$이면 $\\det(2I_2)=4$입니다. **3) 정답 ②**","definition_7":"**1) 기하:** 단위 정사각형의 이미지 면적이 $\\lvert\\det(A)\\rvert$입니다. **2) 예시:** $2I_2$는 면적을 $4$배합니다. **3) 정답 ①**","definition_8":"**1) 연결:** 가역이면 열들이 일차독립이어 랭크가 $n$입니다(Ch.06 예고). **2) 예시:** $\\det(A)\\neq0$이면 만사입니다. **3) 정답 ①**","definition_9":"**1) 정리:** $\\det(AB)=\\det(A)\\det(B)$입니다. **2) 예시:** $2\\times2$로 직접 곱해 확인합니다. **3) 정답 ②**","trueFalse_0":"**1) 용어:** 특이는 $\\det(A)=0$입니다. **2) 예시:** $\\begin{pmatrix}1&2\\\\2&4\\end{pmatrix}$는 $\\det=0$입니다. **3) 정답 ②**","trueFalse_1":"**1) 정리:** 곱의 행렬식은 행렬식의 곱입니다. **2) 예시:** $2\\times2$로 검산합니다. **3) 정답 ①**","trueFalse_2":"**1) 반례:** $\\begin{pmatrix}0&0\\\\0&0\\end{pmatrix}$는 $\\det=0$입니다. **2) 결론:** 거짓입니다. **3) 정답 ②**","trueFalse_3":"**1) 유도:** $AA^{-1}=I$에서 $\\det(A)\\det(A^{-1})=1$입니다. **2) 예시:** $\\det(A)=2$이면 $\\det(A^{-1})=1/2$입니다. **3) 정답 ①**","trueFalse_4":"**1) 예시:** $A=\\begin{pmatrix}1&0\\\\0&0\\end{pmatrix}$, $B=\\begin{pmatrix}0&0\\\\0&1\\end{pmatrix}$이면 $A+B=I_2$입니다. **2) 결론:** 참입니다. **3) 정답 ①**","trueFalse_5":"**1) 정리:** $Q^{\\mathsf T}Q=I$이면 $\\det(Q)^2=1$입니다. **2) 예시:** 회전행렬입니다. **3) 정답 ①**","trueFalse_6":"**1) 반례:** $A=B=I$이면 좌변 $\\det(2I)$, 우변 $2$로 다릅니다. **2) 결론:** 거짓입니다. **3) 정답 ②**","trueFalse_7":"**1) 정리:** 삼각행렬은 대각곱입니다. **2) 예시:** $\\begin{pmatrix}2&5\\\\0&3\\end{pmatrix}$는 $6$입니다. **3) 정답 ①**","trueFalse_8":"**1) 연결:** $\\det=0$이면 열들이 종속입니다. **2) 예시:** 한 열이 다른 열의 배수인 경우입니다. **3) 정답 ②**","trueFalse_9":"**1) 유도:** $\\det(A^2)=\\det(AA)=\\det(A)^2$입니다. **2) 예시:** $\\det(A)=-1$이면 $\\det(A^2)=1$입니다. **3) 정답 ①**","calc_0":"**1) 계산:** $1\\cdot4-2\\cdot3=-2$입니다. **2) 예시:** 부호가 음이면 방향이 뒤집힙니다. **3) 정답 ①**","calc_1":"**1) 계산:** 대각곱 $2\\cdot3=6$입니다. **3) 정답 ①**","calc_2":"**1) 계산:** 두 열이 같아 $\\det=0$입니다. **3) 정답 ③**","calc_3":"**1) 계산:** $A^{-1}=\\mathrm{diag}(1,1/2)$입니다. **3) 정답 ①**","calc_4":"**1) 계산:** $3\\cdot1-1\\cdot2=1$입니다. **3) 정답 ①**","calc_5":"**1) 계산:** $0\\cdot0-1\\cdot(-1)=1$입니다(반시계 $90^\\circ$). **3) 정답 ①**","calc_6":"**1) 계산:** $A^{-1}=\\frac12 I$, 대각합 $1/2+1/2=1$입니다. **3) 정답 ①**","calc_7":"**1) 계산:** 두 번째 행이 첫 행의 $2$배이므로 $\\det=0$입니다. **3) 정답 ①**","calc_8":"**1) 계산:** 역행렬은 $\\begin{pmatrix}1&-1\\\\0&1\\end{pmatrix}$입니다. **3) 정답 ①**","calc_9":"**1) 계산:** $\\cos^2 t+\\sin^2 t=1$입니다(회전은 면적 보존). **3) 정답 ①**","concept_0":"**1) 연결:** 가역일 때만 방향 $\\mathbf{s}$가 안정적으로 정해집니다. **2) 예시:** $H$가 특이하면 수치적으로 불안정합니다. **3) 정답 ①**","concept_1":"**1) 실무:** `solve`류가 `inv`보다 유리한 경우가 많습니다. **3) 정답 ①**","concept_2":"**1) 순서:** 먼저 $B$를 되돌리고 $A$를 되돌려야 하므로 $B^{-1}A^{-1}$입니다. **3) 정답 ②**","concept_3":"**1) 직관:** 열들이 한 직선 위에 놓여 차원이 줄어듭니다. **3) 정답 ②**","concept_4":"**1) 연결:** $X^{\\mathsf T}X$ 가역 $\\Leftrightarrow$ 열 풀랭크입니다. **3) 정답 ①**","concept_5":"**1) 수치해석:** 거의 특이에 가까우면 역이 폭주합니다. **3) 정답 ①**","concept_6":"**1) 연결:** SVD 관점에서 부피 배율은 특이값 곱입니다(고급). **3) 정답 ①**","concept_7":"**1) 공식:** 분모는 $\\det(A)$입니다. **3) 정답 ①**","concept_8":"**1) 기하:** $\\det>0$이면 방향이 뒤집히지 않습니다. **3) 정답 ①**","concept_9":"**1) 기하:** 행렬식의 절댓값이 부피입니다. **3) 정답 ①**","projection_0":"**1) 정리:** 라플라스 전개는 일반적입니다. **3) 정답 ①**","projection_1":"**1) 정의:** 클래식 adjugate 공식입니다. **3) 정답 ①**","projection_2":"**1) 계산:** $\\det(A^{-1})\\det(B)\\det(A)=\\det(B)$입니다. **3) 정답 ①**","projection_3":"**1) 연결:** 고유값은 특성다항식의 근입니다(Ch.07 예고). **3) 정답 ①**","projection_4":"**1) 설명:** $A$의 $\\det$와 각 열을 $\\mathbf{b}$로 바꾼 세 행렬의 $\\det$로 총 $4$개입니다. **3) 정답 ①**","projection_5":"**1) 정리:** 블록 대각의 행렬식은 곱입니다. **3) 정답 ①**","projection_6":"**1) 성질:** 행 교환은 $\\det\\mapsto-\\det$입니다. **3) 정답 ①**","projection_7":"**1) 성질:** 이런 연산은 $\\det$ 불변입니다. **3) 정답 ①**","projection_8":"**1) 정리:** $(AB)^{-1}$ 존재 $\\Rightarrow$ $\\det(A)\\det(B)\\neq0$이므로 둘 다 가역입니다. **3) 정답 ①**","projection_9":"**1) 기하:** 행렬식 절댓값이 부피 배율입니다. **3) 정답 ①**","scenario_0":"**1) 실무:** 배치 행렬식은 미니배치 공분산 등에서 쓰입니다. **3) 정답 ①**","scenario_1":"**1) 실무:** 명시적 역은 조건수를 악화시키기 쉽습니다. **3) 정답 ①**","scenario_2":"**1) 연결:** 역(의사역)이 민감해집니다. **3) 정답 ①**","scenario_3":"**1) 통계/ML:** 다중공선성 완화와 안정적 역입니다. **3) 정답 ①**","scenario_4":"**1) 연결:** 공분산 $\\Sigma$의 ‘틀’이 부피를 바꿉니다(Ch.09·확률). **3) 정답 ①**","scenario_5":"**1) 실무:** SVD 기반 의사역행렬입니다. **3) 정답 ①**","scenario_6":"**1) 최적화:** 조건이 나쁜 곡면입니다. **3) 정답 ①**","scenario_7":"**1) 주의:** 부동소수와 조건수 문제입니다. **3) 정답 ①**","scenario_8":"**1) 정리:** $\\det(A)=\\prod \\lambda_i$입니다(Ch.07 예고). **3) 정답 ①**","scenario_9":"**1) 실무:** 대칭 양(반)정부호 행렬에서 Cholesky·작은 $\\varepsilon I$ 추가가 흔합니다. **3) 정답 ①**"},"problemTestCodes":{"definition_0":"answer = 2\nassert answer == 2","definition_1":"answer = 1\nassert answer == 1","definition_2":"answer = 2\nassert answer == 2","definition_3":"answer = 3\nassert answer == 3","definition_4":"answer = 1\nassert answer == 1","definition_5":"answer = 1\nassert answer == 1","definition_6":"answer = 2\nassert answer == 2","definition_7":"answer = 1\nassert answer == 1","definition_8":"answer = 1\nassert answer == 1","definition_9":"answer = 2\nassert answer == 2","trueFalse_0":"answer = 2\nassert answer == 2","trueFalse_1":"answer = 1\nassert answer == 1","trueFalse_2":"answer = 2\nassert answer == 2","trueFalse_3":"answer = 1\nassert answer == 1","trueFalse_4":"answer = 1\nassert answer == 1","trueFalse_5":"answer = 1\nassert answer == 1","trueFalse_6":"answer = 2\nassert answer == 2","trueFalse_7":"answer = 1\nassert answer == 1","trueFalse_8":"answer = 2\nassert answer == 2","trueFalse_9":"answer = 1\nassert answer == 1","calc_0":"answer = 1\nassert answer == 1","calc_1":"answer = 1\nassert answer == 1","calc_2":"answer = 3\nassert answer == 3","calc_3":"answer = 1\nassert answer == 1","calc_4":"answer = 1\nassert answer == 1","calc_5":"answer = 1\nassert answer == 1","calc_6":"answer = 1\nassert answer == 1","calc_7":"answer = 1\nassert answer == 1","calc_8":"answer = 1\nassert answer == 1","calc_9":"answer = 1\nassert answer == 1","concept_0":"answer = 1\nassert answer == 1","concept_1":"answer = 1\nassert answer == 1","concept_2":"answer = 2\nassert answer == 2","concept_3":"answer = 2\nassert answer == 2","concept_4":"answer = 1\nassert answer == 1","concept_5":"answer = 1\nassert answer == 1","concept_6":"answer = 1\nassert answer == 1","concept_7":"answer = 1\nassert answer == 1","concept_8":"answer = 1\nassert answer == 1","concept_9":"answer = 1\nassert answer == 1","projection_0":"answer = 1\nassert answer == 1","projection_1":"answer = 1\nassert answer == 1","projection_2":"answer = 1\nassert answer == 1","projection_3":"answer = 1\nassert answer == 1","projection_4":"answer = 1\nassert answer == 1","projection_5":"answer = 1\nassert answer == 1","projection_6":"answer = 1\nassert answer == 1","projection_7":"answer = 1\nassert answer == 1","projection_8":"answer = 1\nassert answer == 1","projection_9":"answer = 1\nassert answer == 1","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 1\nassert answer == 1","scenario_3":"answer = 1\nassert answer == 1","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1"}},"midMathCh06":{"chapter":"Chapter 06","title":"선형 독립과 랭크: 진짜 차원은 몇 개일까?","description":"규모가 제법 큰 스타트업에 100명의 직원이 있다고 상상해 봅시다. 회사 명부(데이터셋)를 보면 100명이라는 숫자가 든든해 보입니다. 그런데 업무 실태를 자세히 들여다보니, 20명은 스스로 새로운 아이디어를 내고 일을 추진하지만, 나머지 80명은 그저 앞선 20명의 기안서를 복사해서 이름만 바꿔 결재를 올리고 있었습니다. 이 회사가 실제로 만들어내는 '진짜 업무의 차원'은 100일까요, 20일까요?\n\n이전 장에서 우리는 행렬이 공간을 주무르는 수학적 장치라는 것을 배웠습니다. 이번 장에서는 그 공간을 구성하는 수많은 데이터 화살표들 속에서 **'가짜'와 '진짜'를 가려내는 감식안**을 기릅니다. 어떤 화살표가 자신만의 **대체 불가능한 새로운 방향(일차독립)**을 개척하고 있는지, 아니면 그저 다른 화살표들의 경로를 베껴서 **무임승차(일차종속)**하고 있는지를 수식으로 판별해 봅니다. 그리고 중복되는 그림자들을 모두 걷어낸 후 남은 **진짜 알짜배기 뼈대의 개수, 즉 랭크(Rank)**를 세는 방법을 알아봅니다. 겉으로 보이는 데이터의 덩치에 속지 않고, 그 이면에 숨겨진 '진짜 차원'을 꿰뚫어 보는 안목을 갖춰봅시다.","sectionTitle":"선형 독립과 랭크: 진짜 차원은 몇 개일까?","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","problemSolving":"문제 풀이를 위한 설명"},"visualShort":"같은 줄 vs 새 방향 · 랭크 1↔2","visualIntro":"**점선**은 첫 번째 방향(한 줄)이에요. **주황**이 그 **위**에 있다 **밖**으로 나가면서 **랭크 1**과 **2** 예시가 바뀝니다.","visualStep1":"개념: $c_1\\mathbf{v}_1+\\cdots+c_k\\mathbf{v}_k=\\mathbf{0}$이면 반드시 $c_i=0$ → 일차독립","visualStep2":"직관: **한 줄**에 붙으면 **종속**에 가깝고, **비키면** 독립 · 랭크","visualStep3":"수식: $\\mathrm{rank}(A)$ = 열공간 차원 = 피벗 개수","visualStep4":"적용: 다중공선성, 릿지, 신경망 **정보 병목**","visualStepsLabel":"보는 순서","visualFlowTitle":"학습 흐름","visualFlowStep0":"개념: 독립·종속·기저·랭크","visualFlowStep1":"직관: 같은 줄·독립·랭크","visualFlowStep2":"기하↔대수: 축·식","visualFlowStep3":"연결: Ch.05 가역·$\\det$","visualFlowStep4":"적용: 회귀·딥러닝","rankVisualAriaLabel":"첫 방향 점선과 두 벡터 화살표, 모서리에 랭크 1과 2가 번갈아 보입니다.","rankVisualMainTitle":"선형 독립과 랭크: 진짜 차원은 몇 개일까?","rankVisualSubtitle":"**독립**이면 두 방향이 **안 겹침**. **랭크**는 그래서 **남는 차원 개수**(이 그림 예시는 1 또는 2)예요.","rankVisualCaption":"**주황** 화살표가 **점선(첫 방향)** 위에 있으면 같은 방향만 쓰는 **종속**에 가깝고, 이 예시에서는 **랭크 1**이에요.\n\n**선 밖**으로 벗어나면 두 방향이 달라져 **일차독립**이 되고, 이 예시에서는 **랭크 2**예요.","whatIs":{"0":"**1. 일차독립(Linear Independence): 대체 불가능한 '빛의 삼원색(RGB)'**\n\n물감이나 빛을 섞을 때 빨강(Red), 초록(Green), 파랑(Blue)은 서로를 아무리 섞어도 다른 색을 만들어낼 수 없는 근본적인 색상입니다. 이처럼 여러 개의 데이터(벡터)가 있을 때, 어떤 벡터도 나머지 벡터들의 조합으로 만들어낼 수 없는 고유한 상태를 **일차독립**이라고 합니다. 수식으로는 $c_1\\mathbf{v}_1 + c_2\\mathbf{v}_2 + \\dots + c_k\\mathbf{v}_k = \\mathbf{0}$을 만족하려면 오직 모든 가중치가 $c_i = 0$일 때만 가능하다는 의미입니다. 데이터 공간에서 일차독립인 벡터가 추가된다는 것은, 완전히 새로운 차원의 문이 하나 더 열렸다는 뜻입니다.","1":"**2. 일차종속(Linear Dependence): 메아리와 그림자, 숨어있는 '무임승차자'**\n\n반대로, 이미 빨강과 초록 불빛이 있는데 '노랑(빨강+초록)' 불빛을 하나 더 가져왔다고 해봅시다. 전구의 개수는 3개로 늘었지만, 표현할 수 있는 색의 범위(차원)는 늘어나지 않습니다. 수학적으로 $\\mathbf{v}_3 = 2\\mathbf{v}_1 + 3\\mathbf{v}_2$ 처럼, 한 벡터가 이미 존재하는 다른 벡터들의 선형결합(덧셈과 곱셈)으로 완벽하게 설명되는 상태를 **일차종속**이라고 합니다. 겉보기엔 데이터가 방대해 보여도, 실제로는 기존 데이터의 '메아리'나 '그림자'에 불과하여 새로운 정보를 주지 못합니다.","2":"**3. 랭크(Rank): 거품을 걷어낸 '정보의 진짜 순도'**\n\n행렬 $A$의 **랭크($\\mathrm{rank}$)**는 100개의 데이터가 있든 1000개의 데이터가 있든, 그 안에서 서로 겹치는 '종속' 데이터를 전부 지워버리고 남은 **일차독립인 벡터의 최대 개수**를 뜻합니다. 예를 들어, 허공에 100개의 화살표를 던졌는데 그 화살표들이 우연히도 모두 하나의 평면(2차원) 위에만 납작하게 떨어졌다면, 화살표의 개수는 100개라도 이 데이터의 랭크는 고작 **2**가 됩니다. 즉, 랭크는 데이터가 뻗어나갈 수 있는 '진짜 유효한 차원의 수'이자 행렬의 '정보 순도'입니다.","3":"**4. 기저(Basis): 3D 게임 공간을 짓는 '최소한의 철골 구조'**\n\n어떤 공간(부분공간)의 모든 좌표를 빠짐없이, 그리고 중복 없이 표현하기 위해 필요한 **최소한의 일차독립 벡터 모음**을 **기저**라고 부릅니다. 건물을 지을 때 수많은 벽돌이 들어가지만, 건물의 형태를 결정하는 핵심 철골 뼈대는 정해져 있는 것과 같습니다. 이 기저를 이루는 철골 벡터의 개수가 바로 그 공간의 **차원(Dimension)**이 됩니다.","4":"**5. Ch.05와의 연결: 행렬식($\\det$)이란, 그리고 랭크와**\n\n**행렬식 $\\det(A)$**는 $n\\times n$ 정사각 행렬이 선형 변환으로 **단위 부피**(2차원에서는 단위 정사각형 **넓이**)를 **몇 배**로 늘리거나 줄이는지를 나타내는 **하나의 숫자**입니다. $\\det(A)=0$이면 공간이 한 방향 이상 **찌그러져 부피가 사라지고**, $\\det(A)\\neq 0$이면 **역행렬**로 변환을 한 번에 되돌릴 수 있습니다(Ch.05).\n\n$n \\times n$에서 랭크가 $n$과 같다면($\\mathrm{rank}(A) = n$), 모든 열이 일차독립인 **풀 랭크(Full Rank)** 상태입니다. 겹치는 정보가 없으니 공간이 위처럼 완전히 눌리지 않아 **$\\det(A) \\neq 0$**이고 **역행렬이 존재**합니다. 반면 랭크가 부족하면 공간이 납작해져 **$\\det(A)=0$**이 되고, 되감기(역행렬)는 불가능합니다."},"whyImportant":{"bridge":"범인에 대한 단서를 수집하는 탐정의 상황을 상상해 봅시다. 5명의 목격자를 확보했는데, 알고 보니 이 5명이 모두 '같은 건물, 같은 창문'에서 범행을 지켜본 사람들이었습니다(일차종속). 탐정은 단서가 5개나 있다고 기뻐하겠지만, 실제로는 1개의 단서(랭크=1)를 5번 반복해서 듣는 것과 같습니다. 차라리 서로 다른 각도의 길거리, 옥상, CCTV에서 본 3명의 목격자(일차독립, 랭크=3)가 훨씬 가치 있는 정보를 제공합니다.\n\n머신러닝에서도 똑같은 일이 벌어집니다. 집값을 예측할 때 '집의 면적(제곱미터)'과 '집의 면적(평)'이라는 두 가지 데이터를 넣으면, 컴퓨터는 이 둘이 완전히 같은 방향을 가리키는 일차종속이라는 것을 스스로 깨닫지 못합니다. 이처럼 겹치는 변수가 많은 현상을 **다중공선성(Multicollinearity)**이라고 하며, 모델은 어떤 변수가 정답에 진짜 기여하는지 헷갈려하다가 계산을 포기하거나 엉터리 가중치를 매기게 됩니다.","similarity":"따라서 **랭크(Rank)**는 우리에게 \"이 데이터 뭉치 안에 진짜 영양가 있는 정보는 몇 개나 있는가?\"를 묻는 아주 날카로운 질문입니다. 데이터의 거품(종속)을 걷어내고 뼈대(독립)만 남기는 것은 계산 속도를 극적으로 높이고 인공지능이 헛갈리지 않게 돕는 가장 중요한 밑작업입니다."},"howUsed":{"ml":"**1. 선형 회귀의 붕괴 막기 (릿지 회귀의 마법)**\n최적의 예측선을 긋는 선형 회귀에서는 수식적으로 $(X^T X)^{-1}$라는 역행렬을 반드시 구해야 합니다. 그런데 데이터 $X$ 안에 앞서 말한 '평'과 '제곱미터'처럼 일차종속인 열이 섞여 있으면, 행렬의 랭크가 떨어지면서 공간이 찌그러져 역행렬을 계산할 수 없는 에러(Singular Matrix)가 발생합니다. 이때 릿지(Ridge) 회귀는 수식 대각선에 아주 작은 임의의 숫자들을 더해줍니다. 이는 마치 납작하게 찌그러진 샌드위치 빵 사이에 인공적으로 얇은 이쑤시개를 꽂아 넣어 억지로 숨구멍(독립성)과 부피를 만들어 역행렬을 구출해 내는 수학적 응급처치입니다.","geometry":"**2. 딥러닝의 정보 병목 (Information Bottleneck)과 고속도로**\n딥러닝의 신경망은 데이터를 여러 층의 선형 행렬을 통해 통과시킵니다. 이를 100차선짜리 초고속 도로에 비유해 봅시다. 만약 수많은 정보의 자동차들이 이 도로를 달리다가, 갑자기 **랭크가 10**밖에 안 되는 층(Layer)을 만나면 어떻게 될까요? 100차선 도로가 갑자기 10차선 좁은 국도로 좁아지는 것과 같습니다. 엄청난 교통체증이 발생하고, 나머지 90차선 분량의 고화질 이미지나 정교한 텍스트 정보는 영구적으로 파괴되어 사라집니다(정보 병목). 따라서 AI 설계자들은 각 층이 데이터를 온전히 실어 나를 수 있도록 랭크의 크기를 모니터링하고 차원을 신중하게 설계해야 합니다."},"summary":"**한 줄:** RGB처럼 **대체 불가**한 방향이 독립, **노란 조합**처럼 겹치면 종속, **랭크**는 거품 걷어낸 **진짜 차원**입니다.","problemSolving":{"focus":"아래 표에는 **기호와 요령**을, **풀이 예시**는 연습 문제의 **대표 유형**(정의 고르기·참·거짓·수로 랭크·차원·성질·짧은 상황)을 **문제 / 풀이** 형식으로 짧게 적어 두었습니다.","examplesHeading":"풀이 예시","examplesTable":"**예시 1 — 정의·개념 고르기**\n\n문제: $\\mathrm{rank}(A)$의 정의로 옳은 것은?\n\n풀이: **열공간의 차원**에 해당하는 보기를 고릅니다.\n\n---\n\n**예시 2 — 참·거짓**\n\n문제: $\\mathbb{R}^2$에서 서로 다른 두 벡터는 항상 일차독립인가?\n\n풀이: **항상**은 거짓입니다. 같은 직선 위(공선)이면 종속입니다.\n\n---\n\n**예시 3 — 수로 랭크**\n\n문제: $\\begin{pmatrix}1&2\\\\2&4\\end{pmatrix}$의 랭크는?\n\n풀이: 두 열이 비례하므로 **1**. 애매하면 **행간소화 후 피벗 개수**를 셉니다.\n\n---\n\n**예시 4 — 차원·널리티**\n\n문제: $A\\mathbf{x}=\\mathbf{0}$의 해공간 차원이 $k$이고 열이 $n$개일 때 $\\mathrm{rank}(A)$는?\n\n풀이: $\\mathrm{rank}(A)=n-k$.\n\n---\n\n**예시 5 — 랭크 성질**\n\n문제: 가역 행렬 $P,Q$에 대해 $\\mathrm{rank}(PAQ)$는?\n\n풀이: $\\mathrm{rank}(PAQ)=\\mathrm{rank}(A)$.\n\n---\n\n**예시 6 — 짧은 상황**\n\n문제: $\\mathbf{a}_3=2\\mathbf{a}_1-\\mathbf{a}_2$이면 세 열의 랭크는?\n\n풀이: 세 열이 **종속**이므로 $\\mathrm{rank}\\le 2$입니다."},"problemSolvingLabel":"문제 풀이를 위한 설명","problemSolvingTable":"| 기호 | 의미 |\n| :--- | :--- |\n| 일차독립 | $\\sum c_i\\mathbf{v}_i=\\mathbf{0}\\Rightarrow c_i=0$ |\n| 일차종속 | 적어도 하나가 나머지의 선형결합 |\n| $\\mathrm{rank}(A)$ | 열공간 차원(=행간소화 피벗 수) |\n| 기저 | 독립이면서 생성하는 최소 집합 |\n| $\\mathrm{rank}(AB)$ | $\\le\\min\\{\\mathrm{rank}A,\\mathrm{rank}B\\}$ |\n| $\\det(A)$ | 단위 부피·넓이가 변환으로 몇 배가 되는지(Ch.05); $\\det(A)=0$이면 역행렬 없음 |\n\n**①** 먼저 **종속 관계**가 보이면 식으로 적습니다. **②** 안 보이면 **행간소화**합니다. **③** 정사각이면 **Ch.05**와 연결해 $\\det$도 점검합니다.","practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"문제 은행 60문항 중 **무작위 10문**이 출제됩니다.","practiceProblemsInstruction":"문제를 읽고 가장 알맞은 선택지를 고르세요.","problems":{"definition_0":"$$\\mathbf{v}_1,\\mathbf{v}_2$가 일차독립일 필요충분조건으로 가장 가까운 것은?\n\n① 항상 $\\lVert\\mathbf{v}_1\\rVert=\\lVert\\mathbf{v}_2\\rVert$\n② $c_1\\mathbf{v}_1+c_2\\mathbf{v}_2=\\mathbf{0}\\Rightarrow c_1=c_2=0$\n③ 두 벡터의 내적이 0\n④ 두 벡터가 모두 단위벡터","definition_1":"$$\\mathrm{rank}(A)$의 정의로 옳은 것은?\n\n① 행 개수\n② 열공간의 차원\n③ 모든 성분의 합\n④ 대각합","definition_2":"기저의 크기(벡터 개수)는?\n\n① 공간마다 달라질 수 있음\n② 같은 부분공간에서는 항상 같음\n③ 항상 행 개수와 같음\n④ 항상 1","definition_3":"$$\\mathbb{R}^3$에서 일차독립인 벡터는 최대 몇 개까지 가능한가?\n\n① 2\n② 3\n③ 4\n④ 무한히 많음","definition_4":"행렬 $A$의 열들이 일차종속이면?\n\n① $\\mathrm{rank}(A)$는 열 개수와 같다\n② $\\mathrm{rank}(A)$는 열 개수보다 작다\n③ $\\det(A)$는 항상 1이다\n④ $A$는 반드시 정사각이다","definition_5":"$$A\\in\\mathbb{R}^{m\\times n}$일 때 $\\mathrm{rank}(A)\\le$?\n\n① $\\min(m,n)$\n② $m+n$\n③ $\\max(m,n)$\n④ $mn$","definition_6":"벡터 $\\mathbf{0}$ 하나만 있는 집합은 $\\mathbb{R}^n$에서?\n\n① 항상 일차독립\n② 일차독립이 아니다(자명한 종속)\n③ $n\\ge2$일 때만 독립\n④ 기저이다","definition_7":"$$\\mathrm{rank}(A^{\\mathsf T})$와 $\\mathrm{rank}(A)$는?\n\n① 항상 같다\n② 항상 다르다\n③ 전치하면 항상 1 감소\n④ 항상 0","definition_8":"부분공간 $W$의 차원 $\\dim(W)$는?\n\n① $W$의 기저 벡터 개수\n② $W$에 속한 모든 벡터 개수\n③ 항상 0\n④ 항상 전체공간 차원과 같다","definition_9":"$$\\mathbf{v}_1,\\ldots,\\mathbf{v}_k$가 일차독립이면 $k$와 $\\mathrm{rank}([\\mathbf{v}_1\\ \\cdots\\ \\mathbf{v}_k])$는?\n\n① $k$보다 작다\n② 같다($=k$)\n③ 항상 0\n④ 관계 없음","trueFalse_0":"벡터가 많을수록 항상 일차독립이다.\n\n① 참\n② 거짓","trueFalse_1":"$$\\mathrm{rank}(A+B)\\le \\mathrm{rank}(A)+\\mathrm{rank}(B)$이다.\n\n① 참\n② 거짓","trueFalse_2":"정사각행렬이 가역이면 $\\mathrm{rank}(A)=n$이다($n\\times n$).\n\n① 참\n② 거짓","trueFalse_3":"열들이 일차독립이면 반드시 정사각행렬이다.\n\n① 참\n② 거짓","trueFalse_4":"$$\\mathrm{rank}(A^{\\mathsf T}A)=\\mathrm{rank}(A)$이다(실수).\n\n① 참\n② 거짓","trueFalse_5":"$$\\mathbb{R}^2$에서 서로 다른 두 벡터는 항상 일차독립이다.\n\n① 참\n② 거짓","trueFalse_6":"랭크는 열 개수보다 클 수 없다.\n\n① 참\n② 거짓","trueFalse_7":"피벗 개수는 행간소화 후 주축열의 개수와 같다.\n\n① 참\n② 거짓","trueFalse_8":"모든 행렬의 행랭크와 열랭크는 같다.\n\n① 참\n② 거짓","trueFalse_9":"일차독립 집합의 부분집합은 항상 일차독립이다.\n\n① 참\n② 거짓","calc_0":"$$\\mathrm{rank}\\begin{pmatrix}1&2\\\\2&4\\end{pmatrix}$는?\n\n① 0\n② 1\n③ 2\n④ 3","calc_1":"$$\\mathrm{rank}\\begin{pmatrix}2&1\\\\4&2\\end{pmatrix}$는?\n\n① 0\n② 1\n③ 2\n④ 3","calc_2":"$$\\mathrm{rank}\\begin{pmatrix}1&1&0\\\\0&1&1\\end{pmatrix}$는?\n\n① 1\n② 2\n③ 3\n④ 0","calc_3":"$$\\mathbb{R}^4$에서 일차독립인 벡터는 최대 몇 개?\n\n① 3\n② 4\n③ 5\n④ 2","calc_4":"$$\\mathrm{rank}\\begin{pmatrix}1&3\\\\2&6\\end{pmatrix}$는?\n\n① 2\n② 1\n③ 0\n④ 3","calc_5":"$$\\mathrm{rank}\\begin{pmatrix}1&2&3\\\\2&4&6\\end{pmatrix}$는?\n\n① 0\n② 1\n③ 2\n④ 3","calc_6":"$$\\mathrm{rank}\\begin{pmatrix}1&2&3\\\\0&1&1\\end{pmatrix}$는?\n\n① 0\n② 1\n③ 2\n④ 3","calc_7":"$$A$가 $3\\times5$이면 $\\mathrm{rank}(A)$의 최댓값은?\n\n① 5\n② 4\n③ 3\n④ 8","calc_8":"$$\\mathrm{rank}\\begin{pmatrix}1&0&1\\\\0&1&1\\end{pmatrix}$는? (세 번째 열=앞 두 열의 합)\n\n① 3\n② 2\n③ 1\n④ 0","calc_9":"$$\\mathrm{rank}\\begin{pmatrix}1&1&2\\\\0&1&1\\\\1&2&3\\end{pmatrix}$는? (세 번째 행=첫 행+둘째 행)\n\n① 0\n② 1\n③ 2\n④ 3","concept_0":"$$m\\times n$ 행렬 $A$의 열이 3개이고 서로 일차독립이면 $\\mathrm{rank}(A)$는?\n\n① 3\n② 최대 2\n③ 0\n④ 열 개수와 무관","concept_1":"벡터 집합이 일차종속일 때, 반드시 성립하는 것은?\n\n① 모두 영벡터이다\n② 적어도 하나는 나머지의 선형결합으로 쓸 수 있다\n③ 모두 단위벡터이다\n④ 모두 서로 직교한다","concept_2":"행간소화(RREF) 후 피벗(주축) 개수와 열랭크의 관계는?\n\n① 같다\n② 항상 다르다\n③ 항상 행 개수와 같다\n④ 항상 0이다","concept_3":"$$\\mathbb{R}^5$의 부분공간 $W$의 차원이 3일 때, $W$ 안에서 일차독립인 벡터는 최대 몇 개까지 가능한가?\n\n① 2\n② 3\n③ 5\n④ 무한히 많음","concept_4":"$$\\mathbf{v}_1,\\mathbf{v}_2,\\mathbf{v}_3$가 일차독립이면 $\\mathbf{v}_1,\\mathbf{v}_2$는?\n\n① 항상 일차종속이다\n② 항상 일차독립이다\n③ 반드시 직교한다\n④ 독립 여부를 알 수 없다","concept_5":"$$m\\times n$ 행렬 $A$의 열들이 일차독립이려면(가능하려면) 반드시 필요한 것은?\n\n① $m\\ge n$\n② $m\\le n$\n③ $m=n$만 가능\n④ $n>m$","concept_6":"$$m\\times n$ 행렬 $A$에 대해 $A\\mathbf{x}=\\mathbf{0}$의 해 공간 차원(널리티)이 $k$이면 $\\mathrm{rank}(A)$는?\n\n① $n-k$\n② $m-k$\n③ $k$\n④ $m+n$","concept_7":"한 열이 다른 열들의 선형결합으로 쓰이면 그 행렬의 열랭크는?\n\n① 열 개수와 같다\n② 열 개수보다 작다\n③ 항상 0이다\n④ 무한히 크다","concept_8":"$$2\\times2$ 행렬이 가역일 필요충분조건으로 맞는 것은?\n\n① $\\mathrm{rank}=0$\n② $\\mathrm{rank}=1$\n③ $\\mathrm{rank}=2$\n④ 랭크와 무관","concept_9":"항상 성립하는 것은?\n\n① $\\mathrm{rank}(AB)\\ge \\mathrm{rank}(A)$\n② $\\mathrm{rank}(AB)\\le \\mathrm{rank}(A)$\n③ $\\mathrm{rank}(AB)=\\mathrm{rank}(A)$\n④ $AB$는 항상 풀랭크","projection_0":"$$\\mathrm{rank}(A^{\\mathsf T})$는?\n\n① $\\mathrm{rank}(A)$\n② $\\mathrm{rank}(A)+1$\n③ $0$\n④ $\\det(A)$","projection_1":"$$\\mathrm{rank}(AB)$의 상한은?\n\n① $\\min\\{\\mathrm{rank}A,\\mathrm{rank}B\\}$\n② $\\mathrm{rank}A+\\mathrm{rank}B$\n③ $mn$\n④ 항상 $\\mathrm{rank}A$","projection_2":"가역 행렬 $P,Q$에 대해 $\\mathrm{rank}(PAQ)$는?\n\n① $\\mathrm{rank}(A)$\n② 0\n③ $\\mathrm{rank}(P)$\n④ $\\det(A)$","projection_3":"영행렬의 랭크는?\n\n① 0\n② 1\n③ 열 수\n④ 행 수","projection_4":"삼각행렬(대각에 0 없음)의 랭크는?\n\n① 0\n② 비영 대각 원소 개수\n③ 항상 1\n④ 항상 전체","projection_5":"$$A\\in\\mathbb{R}^{5\\times3}$이면 $\\mathrm{rank}(A)$의 최댓값은?\n\n① 5\n② 4\n③ 3\n④ 15","projection_6":"열 치환(열 순서 바꿈)은 랭크를?\n\n① 바꾸지 않는다\n② 항상 1 올린다\n③ 항상 0\n④ 항상 2배","projection_7":"한 열에 다른 열의 배수를 더하는 기본열연산은 랭크를?\n\n① 보존\n② 항상 1 감소\n③ 항상 0으로\n④ 항상 2배","projection_8":"투영행렬 $P$가 대칭이고 $P^2=P$일 때(고급) 랭크는 trace와 같다는 성질이 있다. $2\\times2$에서 $P=\\begin{pmatrix}1&0\\\\0&0\\end{pmatrix}$의 랭크는?\n\n① 0\n② 1\n③ 2\n④ 3","projection_9":"$$A$와 $A^{\\mathsf T}A$의 랭크(실수)는?\n\n① 같다\n② 항상 다르다\n③ 항상 $A$가 더 크다\n④ 항상 0","scenario_0":"행렬에서 서로 다른 두 열이 완전히 같으면?\n\n① 열들은 일차종속이고 열랭크는 열 개수보다 작을 수 있다\n② 항상 풀랭크이다\n③ 항상 랭크는 0이다\n④ 열랭크는 항상 열 개수와 같다","scenario_1":"세 열 $\\mathbf{a}_1,\\mathbf{a}_2,\\mathbf{a}_3$에 대해 $\\mathbf{a}_3=2\\mathbf{a}_1-\\mathbf{a}_2$이면 $[\\mathbf{a}_1\\ \\mathbf{a}_2\\ \\mathbf{a}_3]$의 랭크는?\n\n① 항상 3\n② 최대 2\n③ 항상 0\n④ 항상 4","scenario_2":"$$4\\times4$ 행렬 $A$의 $\\mathrm{rank}(A)=3$이면 $\\dim(\\mathrm{Col}(A))$는?\n\n① 4\n② 3\n③ 2\n④ 0","scenario_3":"$$m\\times n$ 행렬 $A$의 행들을 $\\mathbb{R}^n$의 벡터로 볼 때 서로 일차독립이면 행랭크는?\n\n① $m$\n② 항상 0\n③ $n$\n④ 항상 1","scenario_4":"임의의 $m\\times n$ 행렬 $A$에 대해 $\\mathrm{rank}(A)$와 $\\mathrm{rank}(A^{\\mathsf T})$는?\n\n① 항상 같다\n② 항상 다르다\n③ 항상 $A$가 더 크다\n④ 항상 0이다","scenario_5":"$$m\\times n$ 행렬의 $n$개 열이 모두 일차독립이면 반드시?\n\n① $m\\ge n$\n② $m\\le n$\n③ $m=n$만 가능\n④ $n>m$","scenario_6":"$$\\mathrm{rank}(A)=r$이면 $\\dim(\\mathrm{Col}(A))$는?\n\n① $r$\n② $mn$\n③ $n-r$\n④ $m$","scenario_7":"두 행이 서로 비례(한 행이 다른 행의 상수배)이면 그 두 행만 놓고 본 행랭크 기여는?\n\n① 최대 1\n② 항상 2\n③ 항상 0\n④ 행 개수와 같다","scenario_8":"선형변환 $T(\\mathbf{x})=A\\mathbf{x}$ ($A\\in\\mathbb{R}^{m\\times n}$)의 상(image)의 차원은?\n\n① $\\mathrm{rank}(A)$\n② 항상 $n$\n③ 항상 $m$\n④ 항상 0","scenario_9":"$$n\\times n$ 행렬 $A$에서 $\\mathrm{rank}(A)0$에 대해, $S+\\mu I$의 고유값(중복 포함)은?\n\n① $S$의 고유값과 같다\n② **$S$의 각 고유값에 $\\mu$를 더한 것**과 같다\n③ 모두 $\\mu$ 하나뿐이다\n④ 모두 $0$이다","hscn_5":"실대칭 행렬 $A=Q\\Lambda Q^{\\mathsf T}$ ($Q$ 직교, $\\Lambda$ 대각)일 때 $A^5=Q\\Lambda_1 Q^{\\mathsf T}$로 쓸 수 있다. 이때 $\\Lambda_1$은?\n\n① **$\\Lambda$의 각 대각 성분을 5제곱한 대각행렬**\n② $5\\Lambda$\n③ $\\Lambda^{-1}$\n④ $I$"},"problemAnswers":{"edef_0":2,"edef_1":2,"edef_2":2,"edef_3":2,"edef_4":1,"edef_5":2,"etf_0":2,"etf_1":1,"etf_2":2,"etf_3":1,"etf_4":1,"etf_5":1,"ecalc_0":1,"ecalc_1":1,"ecalc_2":1,"ecalc_3":1,"ecalc_4":3,"ecalc_5":2,"eprop_0":1,"eprop_1":1,"eprop_2":1,"eprop_3":1,"eprop_4":2,"eprop_5":1,"mcon_0":1,"mcon_1":2,"mcon_2":2,"mcon_3":2,"mcon_4":1,"mcon_5":1,"mcmp_0":2,"mcmp_1":2,"mcmp_2":1,"mcmp_3":2,"mcmp_4":1,"mcmp_5":2,"mdiag_0":1,"mdiag_1":3,"mdiag_2":1,"mdiag_3":1,"mdiag_4":1,"mdiag_5":1,"hproj_0":1,"hproj_1":1,"hproj_2":3,"hproj_3":3,"hproj_4":1,"hproj_5":1,"hpca_0":1,"hpca_1":2,"hpca_2":2,"hpca_3":2,"hpca_4":1,"hpca_5":1,"hscn_0":2,"hscn_1":2,"hscn_2":2,"hscn_3":2,"hscn_4":2,"hscn_5":1},"problemSolutions":{"edef_0":"**1)** 고유값·고유벡터 정의와 $\\det(A-\\lambda I)$·대각합·행렬식 연결을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","edef_1":"**1)** 고유값·고유벡터 정의와 $\\det(A-\\lambda I)$·대각합·행렬식 연결을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","edef_2":"**1)** 고유값·고유벡터 정의와 $\\det(A-\\lambda I)$·대각합·행렬식 연결을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","edef_3":"**1)** 고유값·고유벡터 정의와 $\\det(A-\\lambda I)$·대각합·행렬식 연결을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","edef_4":"**1)** 고유값·고유벡터 정의와 $\\det(A-\\lambda I)$·대각합·행렬식 연결을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","edef_5":"**1)** 고유값·고유벡터 정의와 $\\det(A-\\lambda I)$·대각합·행렬식 연결을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","etf_0":"**1)** 닮음·대칭·행렬식·대각합·거듭제곱 등 성질을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","etf_1":"**1)** 닮음·대칭·행렬식·대각합·거듭제곱 등 성질을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","etf_2":"**1)** 닮음·대칭·행렬식·대각합·거듭제곱 등 성질을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","etf_3":"**1)** 닮음·대칭·행렬식·대각합·거듭제곱 등 성질을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","etf_4":"**1)** 닮음·대칭·행렬식·대각합·거듭제곱 등 성질을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","etf_5":"**1)** 닮음·대칭·행렬식·대각합·거듭제곱 등 성질을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","ecalc_0":"**1)** 삼각·대칭 $2\\times2$는 특성방정식 $\\lambda^2-\\mathrm{tr}\\lambda+\\det=0$ 또는 대각을 읽습니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","ecalc_1":"**1)** 삼각·대칭 $2\\times2$는 특성방정식 $\\lambda^2-\\mathrm{tr}\\lambda+\\det=0$ 또는 대각을 읽습니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","ecalc_2":"**1)** 삼각·대칭 $2\\times2$는 특성방정식 $\\lambda^2-\\mathrm{tr}\\lambda+\\det=0$ 또는 대각을 읽습니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","ecalc_3":"**1)** 삼각·대칭 $2\\times2$는 특성방정식 $\\lambda^2-\\mathrm{tr}\\lambda+\\det=0$ 또는 대각을 읽습니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","ecalc_4":"**1)** 삼각·대칭 $2\\times2$는 특성방정식 $\\lambda^2-\\mathrm{tr}\\lambda+\\det=0$ 또는 대각을 읽습니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ③","ecalc_5":"**1)** 삼각·대칭 $2\\times2$는 특성방정식 $\\lambda^2-\\mathrm{tr}\\lambda+\\det=0$ 또는 대각을 읽습니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","eprop_0":"**1)** 삼각·대칭 $2\\times2$는 특성방정식 $\\lambda^2-\\mathrm{tr}\\lambda+\\det=0$ 또는 대각을 읽습니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","eprop_1":"**1)** 삼각·대칭 $2\\times2$는 특성방정식 $\\lambda^2-\\mathrm{tr}\\lambda+\\det=0$ 또는 대각을 읽습니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","eprop_2":"**1)** 삼각·대칭 $2\\times2$는 특성방정식 $\\lambda^2-\\mathrm{tr}\\lambda+\\det=0$ 또는 대각을 읽습니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","eprop_3":"**1)** 삼각·대칭 $2\\times2$는 특성방정식 $\\lambda^2-\\mathrm{tr}\\lambda+\\det=0$ 또는 대각을 읽습니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","eprop_4":"**1)** 대각화 조건·고유공간·기하적/대수적 중복도를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","eprop_5":"**1)** 대각화 조건·고유공간·기하적/대수적 중복도를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","mcon_0":"**1)** 대각화 조건·고유공간·기하적/대수적 중복도를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","mcon_1":"**1)** 대각화 조건·고유공간·기하적/대수적 중복도를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcon_2":"**1)** 대각화 조건·고유공간·기하적/대수적 중복도를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcon_3":"**1)** 대각화 조건·고유공간·기하적/대수적 중복도를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcon_4":"**1)** 대각화 조건·고유공간·기하적/대수적 중복도를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","mcon_5":"**1)** 대각화 조건·고유공간·기하적/대수적 중복도를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","mcmp_0":"**1)** 대각화 조건·고유공간·기하적/대수적 중복도를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcmp_1":"**1)** 대각화 조건·고유공간·기하적/대수적 중복도를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcmp_2":"**1)** 고유값·고유벡터 정의와 $\\det(A-\\lambda I)$·대각합·행렬식 연결을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","mcmp_3":"**1)** 고유값·고유벡터 정의와 $\\det(A-\\lambda I)$·대각합·행렬식 연결을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcmp_4":"**1)** 고유값·고유벡터 정의와 $\\det(A-\\lambda I)$·대각합·행렬식 연결을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","mcmp_5":"**1)** 고유값·고유벡터 정의와 $\\det(A-\\lambda I)$·대각합·행렬식 연결을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mdiag_0":"**1)** 닮음·다항식·역·시프트 $A+cI$ 규칙을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","mdiag_1":"**1)** 닮음·다항식·역·시프트 $A+cI$ 규칙을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ③","mdiag_2":"**1)** 닮음·다항식·역·시프트 $A+cI$ 규칙을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","mdiag_3":"**1)** 닮음·다항식·역·시프트 $A+cI$ 규칙을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","mdiag_4":"**1)** 닮음·다항식·역·시프트 $A+cI$ 규칙을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","mdiag_5":"**1)** 닮음·다항식·역·시프트 $A+cI$ 규칙을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","hproj_0":"**1)** 닮음·다항식·역·시프트 $A+cI$ 규칙을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","hproj_1":"**1)** 닮음·다항식·역·시프트 $A+cI$ 규칙을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","hproj_2":"**1)** 닮음·다항식·역·시프트 $A+cI$ 규칙을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ③","hproj_3":"**1)** 닮음·다항식·역·시프트 $A+cI$ 규칙을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ③","hproj_4":"**1)** 닮음·대칭·행렬식·대각합·거듭제곱 등 성질을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","hproj_5":"**1)** 닮음·대칭·행렬식·대각합·거듭제곱 등 성질을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","hpca_0":"**1)** 닮음·대칭·행렬식·대각합·거듭제곱 등 성질을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","hpca_1":"**1)** 닮음·대칭·행렬식·대각합·거듭제곱 등 성질을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hpca_2":"**1)** 고유값·고유벡터·특성방정식·실대칭 행렬의 스펙트럼 성질을 응용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hpca_3":"**1)** 고유값·고유벡터·특성방정식·실대칭 행렬의 스펙트럼 성질을 응용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hpca_4":"**1)** 고유값·고유벡터·특성방정식·실대칭 행렬의 스펙트럼 성질을 응용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","hpca_5":"**1)** 고유값·고유벡터·특성방정식·실대칭 행렬의 스펙트럼 성질을 응용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","hscn_0":"**1)** 고유값·고유벡터·특성방정식·실대칭 행렬의 스펙트럼 성질을 응용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hscn_1":"**1)** 고유값·고유벡터·특성방정식·실대칭 행렬의 스펙트럼 성질을 응용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hscn_2":"**1)** 고유값·고유벡터·특성방정식·실대칭 행렬의 스펙트럼 성질을 응용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hscn_3":"**1)** 고유값·고유벡터·특성방정식·실대칭 행렬의 스펙트럼 성질을 응용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hscn_4":"**1)** 고유값·고유벡터·특성방정식·실대칭 행렬의 스펙트럼 성질을 응용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hscn_5":"**1)** 고유값·고유벡터·특성방정식·실대칭 행렬의 스펙트럼 성질을 응용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①"},"problemTestCodes":{"edef_0":"answer = 2\nassert answer == 2","edef_1":"answer = 2\nassert answer == 2","edef_2":"answer = 2\nassert answer == 2","edef_3":"answer = 2\nassert answer == 2","edef_4":"answer = 1\nassert answer == 1","edef_5":"answer = 2\nassert answer == 2","etf_0":"answer = 2\nassert answer == 2","etf_1":"answer = 1\nassert answer == 1","etf_2":"answer = 2\nassert answer == 2","etf_3":"answer = 1\nassert answer == 1","etf_4":"answer = 1\nassert answer == 1","etf_5":"answer = 1\nassert answer == 1","ecalc_0":"answer = 1\nassert answer == 1","ecalc_1":"answer = 1\nassert answer == 1","ecalc_2":"answer = 1\nassert answer == 1","ecalc_3":"answer = 1\nassert answer == 1","ecalc_4":"answer = 3\nassert answer == 3","ecalc_5":"answer = 2\nassert answer == 2","eprop_0":"answer = 1\nassert answer == 1","eprop_1":"answer = 1\nassert answer == 1","eprop_2":"answer = 1\nassert answer == 1","eprop_3":"answer = 1\nassert answer == 1","eprop_4":"answer = 2\nassert answer == 2","eprop_5":"answer = 1\nassert answer == 1","mcon_0":"answer = 1\nassert answer == 1","mcon_1":"answer = 2\nassert answer == 2","mcon_2":"answer = 2\nassert answer == 2","mcon_3":"answer = 2\nassert answer == 2","mcon_4":"answer = 1\nassert answer == 1","mcon_5":"answer = 1\nassert answer == 1","mcmp_0":"answer = 2\nassert answer == 2","mcmp_1":"answer = 2\nassert answer == 2","mcmp_2":"answer = 1\nassert answer == 1","mcmp_3":"answer = 2\nassert answer == 2","mcmp_4":"answer = 1\nassert answer == 1","mcmp_5":"answer = 2\nassert answer == 2","mdiag_0":"answer = 1\nassert answer == 1","mdiag_1":"answer = 3\nassert answer == 3","mdiag_2":"answer = 1\nassert answer == 1","mdiag_3":"answer = 1\nassert answer == 1","mdiag_4":"answer = 1\nassert answer == 1","mdiag_5":"answer = 1\nassert answer == 1","hproj_0":"answer = 1\nassert answer == 1","hproj_1":"answer = 1\nassert answer == 1","hproj_2":"answer = 3\nassert answer == 3","hproj_3":"answer = 3\nassert answer == 3","hproj_4":"answer = 1\nassert answer == 1","hproj_5":"answer = 1\nassert answer == 1","hpca_0":"answer = 1\nassert answer == 1","hpca_1":"answer = 2\nassert answer == 2","hpca_2":"answer = 2\nassert answer == 2","hpca_3":"answer = 2\nassert answer == 2","hpca_4":"answer = 1\nassert answer == 1","hpca_5":"answer = 1\nassert answer == 1","hscn_0":"answer = 2\nassert answer == 2","hscn_1":"answer = 2\nassert answer == 2","hscn_2":"answer = 2\nassert answer == 2","hscn_3":"answer = 2\nassert answer == 2","hscn_4":"answer = 2\nassert answer == 2","hscn_5":"answer = 1\nassert answer == 1"}},"midMathCh08":{"chapter":"Chapter 08","title":"방향 도함수와 그라디언트: 올라가야 할 길 찾기","description":"한 치 앞도 보이지 않는 짙은 안개 속에서, 험준한 산맥의 가장 깊은 골짜기(오차가 가장 작은 최적의 장소)를 찾아가야 하는 탐험가를 상상해 봅시다. 눈으로 지형을 볼 수 없으니 오직 발바닥으로 느껴지는 '경사도'에만 의지해서 하산해야 합니다. 인공지능이 수많은 데이터를 받아들이며 똑똑해지는 학습 과정은 이 탐험가의 아슬아슬한 산 타기와 완벽하게 똑같습니다. 인공지능이 예측을 틀릴 때마다 발생하는 오차(손실)는 거대한 3차원 산맥을 이룹니다.\n\n이때 눈이 먼 탐험가에게 '지금 당신이 서 있는 자리에서 동쪽으로 가면 얼마나 가파른가요?'를 알려주는 지표가 **방향 도함수**입니다. 그리고 내 주변 360도 모든 방향을 통틀어 '어느 쪽이 가장 가파른 오르막길인가요?'를 한 치의 오차도 없이 콕 집어 가리키는 기적의 나침반이 바로 **그라디언트(Gradient)** $\\nabla f$입니다. 이 장에서는 미적분학의 꽃이라 불리는 그라디언트가 어떻게 인공지능의 길잡이가 되어 복잡한 오차의 산을 무사히 내려가게 만드는지, 수학 수식의 장벽을 허물고 생생한 지형도의 비유를 통해 아주 깊고 풍성하게 안내합니다.","sectionTitle":"방향 도함수와 그라디언트: 올라가야 할 길 찾기","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","problemSolving":"문제 풀이를 위한 설명"},"visualShort":"3D 손실 곡면 + 등고선 + 경사하강 경로","visualIntro":"색이 진할수록 오차가 큰 봉우리, 옅을수록 작은 골짜기입니다. 검은 선은 오차를 줄이려 내려가는 길입니다.","visualStep1":"곡면: 매개변수마다 손실(오차) 높이가 달라짐","visualStep2":"등고선: 같은 높이; $\\nabla f$는 등고선과 직각","visualStep3":"보는 방향 $\\mathbf{u}$로 걸을 때의 경사","visualStep4":"보라 화살표=오름($\\nabla f$), 검은 길=내림(경사하강)","visualStepsLabel":"보는 순서","visualFlowTitle":"학습 흐름","visualFlowStep0":"개념: 편미분 → 방향 도함수 → 그라디언트","visualFlowStep1":"직관: 등고선 지도·손실 곡면","visualFlowStep2":"대수: $D_{\\mathbf{u}} f = \\nabla f \\cdot \\mathbf{u}$","visualFlowStep3":"연결: Ch.02 내적, 기초수학 편미분","visualFlowStep4":"적용: 경사하강 → Ch.09 야코비안, Ch.10 헤시안","gradVisualAriaLabel":"3차원 손실 곡면, 바닥 등고선, 경사하강 경로, 한 점에서의 그라디언트 화살표가 단계적으로 나타납니다.","gradVisualMainTitle":"방향 도함수와 그라디언트: 올라가야 할 길 찾기","gradVisualSubtitle":"산 지도를 볼 때 **그라디언트** $\\nabla f$는 등고선과 **직각**이고, **제일 가파른 오름길**을 가리킵니다. **방향 도함수** $D_{\\mathbf{u}} f$는 “$\\mathbf{u}$ 방향으로 한 걸음 걸으면 얼마나 오르내리나”이고, $\\nabla f$와 $\\mathbf{u}$의 **내적** $\\nabla f \\cdot \\mathbf{u}$ 한 줄로 구합니다.","gradVisualCaption":"그림 읽기: **빨강·노랑**은 오차가 큰 **봉우리**, **파랑·보라**는 오차가 작은 **골짜기**입니다. **검은 선**은 오차를 줄이려 **내려가는** 길(경사하강), **보라 화살표**는 그 자리에서 **가장 가파르게 오르는** 방향($\\nabla f$)입니다.","gradDiagramLabelSurface":"손실 곡면 / Loss surface","gradDiagramLabelContour":"등고선 / Contour","gradDiagramLabelPath":"경사하강 경로 / Descent path","gradDiagramLabelGradient":"그라디언트 / Gradient","whatIs":{"0":"**1. 다변수 함수와 등고선: 3차원 지형을 2차원으로 읽기**\n\n우리가 흔히 보는 2차원 지도는 평면이지만, 그 위에 그려진 구불구불한 선(등고선)을 보면 어디가 산봉우리이고 어디가 푹 패인 계곡인지 알 수 있습니다. 등고선이 빽빽하게 뭉쳐 있으면 땀을 뻘뻘 흘려야 하는 가파른 절벽을 의미하고, 널찍하게 퍼져 있으면 걷기 편안한 완만한 평지입니다. 인공지능이 데이터를 학습할 때 계산하는 오차(손실) 역시 변수가 워낙 많아서 이렇게 거대하고 험준한 다차원 산맥을 형성합니다. 우리는 수학이라는 강력한 렌즈를 통해 이 보이지 않는 거대한 산맥의 등고선을 읽어내고, 현재 오차가 얼마나 가파르게 솟아오르고 있는지, 혹은 안정적으로 낮아지고 있는지를 직관적으로 파악할 수 있습니다.","1":"**2. 편미분: 동서남북 중 오직 한 우물만 파는 경사 측정**\n\n여러분이 험난한 산 중턱에 멈춰 섰다고 가정해 봅시다. 이때 '만약 다른 방향은 전부 무시하고, 오직 정동쪽($x$축 방향)으로만 한 걸음 내디디면 경사가 어떨까?' 혹은 '오직 정북쪽($y$축 방향)으로만 걸어가면 오르막일까 내리막일까?'를 측정해 볼 수 있습니다. 이처럼 여러 방향 중에서 딱 하나의 축 방향만 선택해서 그쪽의 기울기만 쏙 뽑아 재는 것을 **편미분**이라고 부릅니다. 수식으로는 $\\frac{\\partial f}{\\partial x}$ 처럼 둥근 기호를 사용하여 나타내며, 이는 오직 한 방향만의 경사를 측정하는 아주 제한적이지만 모든 계산의 기초가 되는 핵심 도구입니다.","2":"**3. 방향 도함수: 내가 고개를 돌려 바라보는 바로 그 길의 경사도**\n\n하지만 탐험가가 꼭 반듯하게 동서남북 4방향으로만 걸어야 할 의무는 없습니다. 목적지에 따라 북동쪽 30도 방향, 혹은 남서쪽으로 비스듬한 방향 등 내가 가고자 하는 임의의 방향을 360도 자유롭게 정할 수 있습니다. 그렇게 내가 선택한 특정 방향으로 아주 살짝 발을 내디뎠을 때, 지형이 얼마나 급격하게 높아지거나 낮아지는지를 측정한 순간적인 변화율이 바로 **방향 도함수** $D_{\\mathbf{u}} f$입니다. 쉽게 말해, 지금 서 있는 자리에서 내가 자유롭게 고개를 돌려 바라보고 있는 바로 그 오솔길의 체감 경사도라고 이해하시면 됩니다.","3":"**4. 그라디언트(Gradient): 가장 무시무시한 오르막길을 가리키는 기적의 나침반**\n\n내 주변 360도 모든 방향 중에서, 산 정상으로 향하는 가장 끔찍하게 가파른 오르막길 방향은 단 하나 존재할 것입니다. 앞서 구했던 $x$축 방향의 기울기와 $y$축 방향의 기울기를 따로 구한 뒤, 이것을 묶어 하나의 화살표(벡터)로 만든 것이 바로 **그라디언트(Gradient, $\\nabla f$)**입니다. 이 마법의 화살표는 항상 지형의 등고선을 가장 단기간에 가로지르는 수직 방향으로 뻗어나갑니다. 화살표가 향하는 '방향'은 내 주변에서 가장 가파른 오르막길을 가리키고, 화살표의 '길이'는 그 오르막길이 도대체 얼마나 가파른지(최대 경사도)를 수치로 알려줍니다.","4":"**5. 내적과 그라디언트의 마법 같은 관계**\n\n내가 바라보는 임의의 방향 경사도(방향 도함수)를 구할 때마다 매번 험난하고 복잡한 계산을 새로 할 필요가 없습니다. 우리가 가진 최고의 나침반인 '그라디언트'와 내가 가고자 하는 '방향 벡터'를 서로 **내적(Dot Product)**하기만 하면 놀랍게도 그 방향의 경사가 바로 계산되어 튀어나옵니다. 핵심은 **$D_{\\mathbf{u}} f = \\nabla f \\cdot \\mathbf{u}$**입니다. 만약 내가 그라디언트가 가리키는 곳과 정확히 똑같은 곳을 바라보고 걷는다면, 나는 세상에서 가장 가파른 오르막길을 정면으로 마주하며 걷고 있는 셈이 됩니다."},"whyImportant":{"bridge":"인공지능 모델을 똑똑하게 만드는 훈련 과정(최적화)은 사실상 오차가 가장 적은 상태, 즉 '거대한 산맥의 가장 깊고 평온한 골짜기 밑바닥'을 찾아가는 험난한 여정입니다. 입력된 데이터와 가중치가 수십만 개로 늘어나면 이 산맥은 수백만 차원의 상상조차 할 수 없는 복잡한 지형이 됩니다. 이런 짙은 안개 속에서 눈을 가린 채 무작정 걷다가는 평생을 헤매도 골짜기를 찾을 수 없습니다.","similarity":"이때 **그라디언트(Gradient)** $\\nabla L$은 한 줄기 빛과 같은 기적의 내비게이션 역할을 수행합니다. 탐험가가 현재 서 있는 위치에서 오차가 가장 폭발적으로 증가하는 끔찍한 오르막길을 정확히 손가락으로 가리켜 주기 때문입니다. 인공지능은 그저 그 손가락이 가리키는 방향의 **정반대**로 몸을 돌려 한 걸음씩 묵묵히 걸어 내려가기만 하면 됩니다. 이 수학적 나침반이 없다면 딥러닝 모델의 학습 자체가 아예 불가능하며, 수많은 가중치들이 어디로 변해야 할지 길을 잃고 영원히 방황하게 될 것입니다."},"howUsed":{"ml":"**1. 딥러닝의 멈추지 않는 심장, 경사하강법(Gradient Descent)**\n\n이 모든 방향과 경사에 대한 개념은 결국 인공지능을 완성하는 단 하나의 위대한 알고리즘, 경사하강법으로 귀결됩니다. $\\mathbf{w}_{k+1} = \\mathbf{w}_k - \\eta \\nabla L(\\mathbf{w}_k)$ 이라는 핵심 수식은 인공지능이 발걸음을 옮기는 생생한 원리를 보여줍니다. 여기서 $\\nabla L$은 앞서 말한 '가장 가파른 오르막길'을 뜻하고, 그 앞에 붙은 마이너스 기호($-$)는 '오르막의 정반대인 내리막길로 조심스럽게 내려가겠다'는 강력한 의지를 의미합니다.\n\n또한, 에타($\\eta$)라고 불리는 **학습률(Learning Rate)**은 탐험가의 '보폭'을 뜻합니다. 보폭이 너무 크면 껑충껑충 뛰다가 목표한 골짜기를 훌쩍 건너뛰어 반대편 산봉우리로 추락해버리는 대참사가 발생하고, 보폭이 개미처럼 너무 작으면 바닥에 닿기도 전에 학습 시간이 끝나버립니다. 따라서 실전에서는 이 보폭을 환경에 맞게 세밀하게 조절하는 것이 모델의 성공을 좌우합니다.","geometry":"**2. 모델의 건강 상태를 눈으로 확인하는 손실 곡면 시각화**\n\n최신 데이터 과학 연구나 논문들을 살보면 알록달록한 3D 산맥 그림이나 색깔이 짙어졌다 옅어지는 등고선 히트맵을 아주 자주 볼 수 있습니다. 이는 모델이 얼마나 부드럽고 쾌적하게 학습을 진행하고 있는지 확인하기 위해, 억 단위가 넘는 미지의 가중치 변수들을 우리가 눈으로 볼 수 있는 2~3개의 차원으로 꾹꾹 압축하여 오차의 곡면을 그려본 것입니다. 연구자들은 그라디언트 나침반을 따라 내려가는 하산 경로가 이 히트맵 위에서 지그재그로 불안하게 요동치는지, 아니면 썰매를 타듯 쾌속으로 부드럽게 미끄러져 내려가는지를 눈으로 직접 보고 모델의 건강 상태와 학습 구조를 진단합니다."},"summary":"**한 줄 요약:** 등고선 지도처럼 손실 산맥을 읽고, 임의 방향 경사는 **$D_{\\mathbf{u}} f = \\nabla f \\cdot \\mathbf{u}$**, 최대 오름은 **$\\nabla f$**, 한 걸음 내림은 **$\\mathbf{w}_{k+1}=\\mathbf{w}_k-\\eta\\nabla L$**로 정리됩니다.","problemSolving":{"focus":"먼저 **핵심 세 줄**만 잡으세요. ① 방향 경사: **$D_{\\mathbf{u}} f = \\nabla f \\cdot \\mathbf{u}$** ($\\mathbf{u}$는 단위벡터). ② **$\\nabla f$**는 등고선에 직각, 제일 가파른 오름. ③ 경사하강: **$\\mathbf{w}_{k+1}=\\mathbf{w}_k-\\eta\\nabla L$** (마이너스·$\\eta$ 확인). 풀이 순서는 **$\\nabla f$(또는 $\\nabla L$) → $\\mathbf{u}$ 정규화 → 내적**.","examplesHeading":"풀이 예시","examplesTable":"**예시 1 — 정의**\n\n문제: $f(x,y)=x^2+y^2$에서 점 $(1,1)$의 **그라디언트**와 그 **크기**는?\n\n풀이: $\\nabla f=(2,2)$, $\\|\\nabla f\\|=2\\sqrt{2}$입니다.\n\n---\n\n**예시 2 — 방향 도함수**\n\n문제: 같은 점에서 단위 방향 $\\mathbf{u}=(1/\\sqrt{2},0)$일 때 $D_{\\mathbf{u}} f$는?\n\n풀이: $D_{\\mathbf{u}} f=(2,2)\\cdot(1/\\sqrt{2},0)=\\sqrt{2}$입니다(내적 공식).\n\n---\n\n**예시 3 — 최대 상승**\n\n문제: $\\|\\mathbf{u}\\|=1$일 때 $D_{\\mathbf{u}} f$가 **최대**가 되는 방향과 최댓값은?\n\n풀이: 방향은 **$\\nabla f$와 같음**, 최댓값은 **$\\|\\nabla f\\|$**입니다.\n\n---\n\n**예시 4 — 등고선**\n\n문제: 등고선 위에서 **접선 방향**으로 걸으면 $D_{\\mathbf{u}} f$는? $\\nabla f$는 등고선과 어떤 관계?\n\n풀이: 접선 방향에서는 **$D_{\\mathbf{u}} f=0$**; $\\nabla f$는 등고선에 **수직**입니다.\n\n---\n\n**예시 5 — 경사하강**\n\n문제: $L=w_1^2+w_2^2$, $\\mathbf{w}=(2,1)$, $\\eta=0.25$일 때 한 걸음 뒤 $\\mathbf{w}$는?\n\n풀이: $\\nabla L=(4,2)$이므로 $\\mathbf{w}_{\\text{new}}=(2,1)-0.25(4,2)=(1,0.5)$입니다.\n\n---\n\n**예시 6 — 학습 정체**\n\n문제: 손실이 더 이상 줄지 않을 때, 그라디언트가 힌트를 주는 상황은?\n\n풀이: **$\\nabla L\\approx\\mathbf{0}$**인 평평한 곳(극값·안장 **후보**)에 갇혔을 수 있습니다."},"problemSolvingLabel":"문제 풀이를 위한 설명","problemSolvingTable":"| 말로 정리 | 의미 |\n| :--- | :--- |\n| **방향 도함수** | $\\mathbf{u}$ 방향으로 걸을 때의 경사 |\n| **그라디언트** | 제일 가파른 **오름** 방향 $\\nabla f$ |\n| **핵심식** | $D_{\\mathbf{u}} f = \\nabla f \\cdot \\mathbf{u}$ |\n| **등고선** | $\\nabla f$는 등고선에 **직각**; 접선으로 걸으면 경사 0 |\n| **경사하강** | $\\mathbf{w}_{k+1}=\\mathbf{w}_k-\\eta\\nabla L$ |\n| **평평한 곳** | $\\nabla f\\approx\\mathbf{0}$ → 극값·안장 **후보** |\n\n**①** $\\nabla f$ 먼저. **②** $\\mathbf{u}$ 단위벡터인지. **③** $D_{\\mathbf{u}} f>0$이면 그 방향 **오름**. **④** $\\eta$ 너무 크면 튐, 너무 작으면 느림.","practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"","practiceProblemsInstruction":"문제를 읽고 가장 알맞은 선택지를 고르세요.","problems":{"gdef_0":"단위 벡터 $\\mathbf{u}$ 방향으로 아주 조금 움직일 때 $f$의 변화율을 무엇이라 부르는가?\n\n① 편미분\n② 방향 도함수 $D_{\\mathbf{u}} f$\n③ 야코비안\n④ 헤시안","gdef_1":"$$\\nabla f$(그라디언트)의 의미로 가장 가까운 것은?\n\n① 항상 최솟값 방향\n② 편미분을 모은 벡터, 가장 가파른 **오름** 방향\n③ 등고선 접선 방향\n④ 항상 영벡터","gdef_2":"$$\\|\\mathbf{u}\\|=1$일 때 $D_{\\mathbf{u}} f$와 $\\nabla f$의 관계로 맞는 것은?\n\n① 항상 $0$\n② $D_{\\mathbf{u}} f=\\nabla f\\cdot\\mathbf{u}$\n③ $D_{\\mathbf{u}} f=\\|\\nabla f\\|^2$\n④ 관계 없음","gdef_3":"단위 벡터 $\\mathbf{u}$에서 $D_{\\mathbf{u}} f$가 **최대**가 되려면 보통?\n\n① $\\mathbf{u}$가 $\\nabla f$에 수직\n② $\\mathbf{u}$가 $\\nabla f$와 **같은 방향**\n③ $\\nabla f=\\mathbf{0}$일 때만\n④ 항상 동쪽","gdef_4":"$$\\nabla f(\\mathbf{x})=\\mathbf{0}$인 점에서 맞는 설명은?\n\n① 반드시 안장점\n② 모든 방향에서 변화율 $0$ (극값 후보·정상점)\n③ 반드시 최대\n④ 그라디언트가 무한","gdef_5":"$$\\partial f/\\partial x$는 어떤 방향 도함수의 특수한 경우인가?\n\n① $\\mathbf{u}=(0,1)$\n② $\\mathbf{u}=(1,0)$ ($x$축 방향)\n③ 대각선\n④ 해당 없음","gtf_0":"그라디언트 $\\nabla f$는 등고선에 **수직**이다.\n\n① 참\n② 거짓","gtf_1":"$$\\|\\mathbf{u}\\|=1$이면 항상 $D_{\\mathbf{u}} f\\le \\|\\nabla f\\|$이다.\n\n① 참\n② 거짓","gtf_2":"그라디언트는 항상 함수의 **최솟값** 방향을 가리킨다.\n\n① 참\n② 거짓","gtf_3":"$$\\nabla f=\\mathbf{0}$이면 임의의 단위 $\\mathbf{u}$에 대해 $D_{\\mathbf{u}} f=0$이다.\n\n① 참\n② 거짓","gtf_4":"$$\\|\\mathbf{u}\\|=1$일 때 $D_{\\mathbf{u}} f>\\|\\nabla f\\|$가 될 수 있다.\n\n① 참\n② 거짓","gtf_5":"편미분은 특정 좌표 방향의 방향 도함수이다.\n\n① 참\n② 거짓","gcalc_0":"$$f(x,y)=x^2+y^2$에서 $(1,1)$의 $\\nabla f$는?\n\n① $(0,0)$\n② $(2,2)$\n③ $(1,1)$\n④ $(-2,-2)$","gcalc_1":"$$f(x,y)=x^2+xy+y^2$에서 원점의 $\\nabla f$는?\n\n① $(0,0)$\n② $(1,1)$\n③ $(2,2)$\n④ 존재하지 않음","gcalc_2":"$$f(x,y)=3x+2y$의 $\\nabla f$는?\n\n① $(2,3)$\n② $(3,2)$\n③ $(0,0)$\n④ $(5,5)$","gcalc_3":"$$f=x^2+y^2$, $(1,1)$, $\\mathbf{u}=\\frac{1}{\\sqrt{2}}(1,0)$일 때 $D_{\\mathbf{u}} f$는?\n\n① $2$\n② $\\sqrt{2}$\n③ $2\\sqrt{2}$\n④ $0$","gcalc_4":"$$f(x,y)=xy$에서 $(2,3)$의 $\\nabla f$는?\n\n① $(2,3)$\n② $(3,2)$\n③ $(0,0)$\n④ $(6,6)$","gcalc_5":"$$f(x,y)=x^2-y^2$에서 $(1,0)$의 $\\nabla f$는?\n\n① $(2,0)$\n② $(0,2)$\n③ $(2,2)$\n④ $(0,0)$","gprop_0":"$$\\|\\mathbf{u}\\|=1$일 때 $D_{\\mathbf{u}} f$의 **최댓값**은?\n\n① $0$\n② $\\|\\nabla f\\|$\n③ $\\|\\nabla f\\|^2$\n④ 항상 $1$","gprop_1":"$$\\nabla f\\neq\\mathbf{0}$, $\\|\\mathbf{u}\\|=1$, $D_{\\mathbf{u}} f=0$이면 $\\mathbf{u}$는?\n\n① $\\nabla f$와 평행\n② $\\nabla f$에 **수직** (등고선 접선)\n③ 영벡터\n④ 임의","gprop_2":"가장 가파른 **오름** 방향은?\n\n① 임의 $\\mathbf{u}$\n② $\\nabla f$ 방향\n③ $-\\nabla f$\n④ 등고선 접선","gprop_3":"경사하강 $\\mathbf{w}_{k+1}=\\mathbf{w}_k-\\eta\\nabla L$, $\\eta>0$일 때 이동 방향은?\n\n① $\\nabla L$과 같음\n② $-\\nabla L$ (하강)\n③ 무작위\n④ 영","gprop_4":"한 점에서 $\\nabla f$가 상수이면 $f$는 그 근처에서?\n\n① 이차함수만\n② 1차(평면)에 가깝다\n③ 항상 $0$\n④ 주기함수","gprop_5":"등고선 $f=c$ 위에서 $\\nabla f$는 등고선에 대해?\n\n① 접선\n② **수직**(법선)\n③ 평행할 수 없음\n④ 항상 영","mcon_0":"편미분과 방향 도함수 관계로 맞는 것은?\n\n① 무관\n② 편미분은 **특정 방향**의 방향 도함수\n③ 방향 도함수는 항상 $0$\n④ 그라디언트는 스칼라","mcon_1":"$$\\nabla f=\\mathbf{0}$인 점을 흔히 무엇이라 부르는가?\n\n① 고유값\n② **임계점**(정상점)\n③ 랭크 결손\n④ 특이점만","mcon_2":"$$f(x,y)=x^2+y^2$의 원점에서 $\\nabla f$는?\n\n① $(2,2)$\n② $(0,0)$\n③ 정의 안 됨\n④ $(1,1)$","mcon_3":"이변수에서 $\\nabla f=\\mathbf{0}$이면 반드시?\n\n① 최대\n② **극값 후보** (최대·최소·안장 가능)\n③ 최소만\n④ 선형","mcon_4":"$$D_{\\mathbf{u}} f=\\nabla f\\cdot\\mathbf{u}$ ($\\|\\mathbf{u}\\|=1$)인 이유는?\n\n① 내적 정의\n② 방향 도함수는 그라디언트의 **방향 성분**\n③ 테일러\n④ 행렬식","mcon_5":"손실 $L(\\mathbf{w})$ 학습에서 그라디언트 부호는?\n\n① 데이터 개수\n② $L$을 **키우는** 방향 (하강은 $-\\nabla L$)\n③ 학습률\n④ 배치 크기","mgeo_0":"등고선을 따라 걸으면 $f$는 보통?\n\n① 최대로 증가\n② (그 선 위에서는) **높이가 일정**\n③ 항상 $0$\n④ 그라디언트와 같음","mgeo_1":"그라디언트가 등고선에 수직인 기하 이유는?\n\n① 우연\n② **수직 방향**이 높이 변화가 가장 크기 때문\n③ 그라디언트가 접선\n④ 항상 수평","mgeo_2":"평평한 곳 ($\\nabla f\\approx\\mathbf{0}$)에서는?\n\n① 가파른 오름만\n② **어느 방향으로도** 거의 변하지 않음\n③ 반드시 골짜기\n④ 그라디언트 무한","mgeo_3":"$$f(x,y)=x^2+y^2$의 등고선 모양은?\n\n① 직선\n② **동심원**\n③ 쌍곡선\n④ 점만","mgeo_4":"손실 **히트맵**에서 붉은 영역은 보통?\n\n① 낮은 값\n② **높은 값** (봉우리)\n③ 그라디언트 영만\n④ 무작위","mgeo_5":"안장점 근처의 $\\nabla f$는?\n\n① 항상 영\n② 방향에 따라 오르막·내리막 **혼재** (영이지만 곡률은 섞임)\n③ 항상 최대\n④ 정의 불가","mcmp_0":"$$(1,1)$에서 $\\mathbf{u}_1=(1,0)$, 단위 $\\mathbf{u}_2=(1/\\sqrt{2},1/\\sqrt{2})$, $f=x^2+y^2$. 더 가파른 오름은?\n\n① $\\mathbf{u}_1$\n② $\\mathbf{u}_2$ ($\\nabla f$ 방향)\n③ 같음\n④ 비교 불가","mcmp_1":"$$\\nabla f=(4,0)$, 단위 $\\mathbf{u}=(0,1)$의 $D_{\\mathbf{u}} f$는?\n\n① $4$\n② $0$\n③ $-4$\n④ $16$","mcmp_2":"$$\\nabla f=(3,4)$의 크기 $\\|\\nabla f\\|$는?\n\n① $7$\n② $5$\n③ $12$\n④ $1$","mcmp_3":"한 점에서 $D_{\\mathbf{u}_1} f=2$, $D_{\\mathbf{u}_2} f=5$ (둘 다 단위)이면?\n\n① $\\mathbf{u}_1$이 $\\nabla f$ 방향\n② $\\mathbf{u}_2$가 $\\nabla f$에 **더 가깝다**\n③ 둘 다 수직\n④ 그라디언트 영","mcmp_4":"$$f=x+y$의 $\\nabla f$는?\n\n① $(0,0)$\n② $(1,1)$ (어디서나 같음)\n③ $(1,-1)$\n④ 점마다 다름","mcmp_5":"$$\\nabla f=(2,-1)$, 단위 $\\mathbf{u}=(1,0)$의 $D_{\\mathbf{u}} f$는?\n\n① $-1$\n② $2$\n③ $0$\n④ $\\sqrt{5}$","hopt_0":"$$\\mathbf{w}=(2,1)$, $L=w_1^2+w_2^2$, $\\eta=0.25$일 때 경사하강 1스텝 후 $\\mathbf{w}$는?\n\n① $(0,0)$\n② $(1,0.5)$\n③ $(3,1.5)$\n④ $(2,1)$","hopt_1":"$$\\eta<0$로 $-\\eta\\nabla L$을 밟으면?\n\n① 반드시 최소\n② **상승**(악화) 방향\n③ 변화 없음\n④ 영 그라디언트만","hopt_2":"$$\\nabla L=\\mathbf{0}$이면 1스텝 업데이트는?\n\n① 반드시 발산\n② **위치 그대로**\n③ 무작위\n④ 반드시 최소","hopt_3":"$$L(w)=(w-3)^2$, $w=1$, $\\eta=0.125$일 때 다음 $w$는?\n\n① $1$\n② $1.5$\n③ $3$\n④ $0$","hopt_4":"학습률 $\\eta$가 **너무 크면** 전형적으로?\n\n① 반드시 수렴\n② **진동·발산**할 수 있음\n③ 기울기 소실만\n④ 손실 $0$","hopt_5":"미니배치 그라디언트는 전체 그라디언트에 비해?\n\n① 항상 같음\n② **노이즈** 있음 (기댓값은 그라디언트)\n③ 항상 영\n④ 사용 불가","hloss_0":"1변수 $L(w)=w^2$의 $\\frac{dL}{dw}$는?\n\n① $w$\n② $2w$\n③ $w^2$\n④ $0$","hloss_1":"MSE $L=\\frac{1}{n}\\sum(y_i-\\hat{y}_i)^2$, $\\hat{y}_i=wx_i$일 때 $\\partial L/\\partial w$는 오차와?\n\n① 무관\n② $x_i$를 곱한 형태 (**연쇄법칙**)\n③ 항상 $0$\n④ 행렬식만","hloss_2":"손실 곡면의 **골짜기**로 가는 업데이트 방향은?\n\n① $\\nabla L$\n② $-\\nabla L$\n③ 무작위\n④ 등고선 접선","hloss_3":"$$L(\\mathbf{w})=\\|\\mathbf{w}\\|^2$의 $\\nabla L$는?\n\n① $\\mathbf{0}$\n② $2\\mathbf{w}$\n③ $-\\mathbf{w}$\n④ 단위벡터만","hloss_4":"손실 $L(w_1,w_2)=w_1^2+4w_2^2$에서 $(1,1)$의 $\\nabla L$는?\n\n① $(1,4)$\n② $(2,8)$\n③ $(0,0)$\n④ $(8,2)$","hloss_5":"평평한 골짜기(얽힌 등고선)에서는 그라디언트가?\n\n① 항상 큼\n② **작아서** 잘 안 움직임\n③ 무한\n④ 항상 영","hscn_0":"신경망 학습에서 가중치를 바꾸는 **주된 단서**는?\n\n① 행렬식\n② **손실의 그라디언트**\n③ 고유값만\n④ 무작위만","hscn_1":"분류 손실이 안 줄면 (그라디언트 거의 영) 한 원인은?\n\n① 학습률 큼\n② 이미 **평평·포화** 근처\n③ 기울기 폭발만\n④ 데이터 없음","hscn_2":"3D **손실 곡면**에서 등고선이 **촘촘**한 영역은 보통?\n\n① $\\|\\nabla L\\|$가 **크다** (가파름)\n② $\\|\\nabla L\\|$가 항상 $0$\n③ 학습률 $\\eta=0$\n④ 그라디언트와 무관","hscn_3":"다변수 함수 $f(x_1,\\ldots,x_n)$에서 **한 좌표** $x_i$만 조금 바꿀 때의 변화율을 나타내는 것은?\n\n① 행렬식\n② **편미분** $\\frac{\\partial f}{\\partial x_i}$ (그 축 방향의 방향 도함수)\n③ 모든 고유값\n④ 헤시안만","hscn_4":"경사하강이 **국소 최소**에 멈추는 이유는?\n\n① 그라디언트 증가\n② $\\nabla L\\approx\\mathbf{0}$\n③ 학습률 무한\n④ 손실만 증가","hscn_5":"정규화 $L+\\lambda\\|\\mathbf{w}\\|^2$ 효과 중 하나는?\n\n① 그라디언트를 영으로\n② 파라미터를 **작게** 유지하는 항 추가\n③ 등고선 제거\n④ 학습 금지"},"problemAnswers":{"gdef_0":2,"gdef_1":2,"gdef_2":2,"gdef_3":2,"gdef_4":2,"gdef_5":2,"gtf_0":1,"gtf_1":1,"gtf_2":2,"gtf_3":1,"gtf_4":2,"gtf_5":1,"gcalc_0":2,"gcalc_1":1,"gcalc_2":2,"gcalc_3":2,"gcalc_4":2,"gcalc_5":1,"gprop_0":2,"gprop_1":2,"gprop_2":2,"gprop_3":2,"gprop_4":2,"gprop_5":2,"mcon_0":2,"mcon_1":2,"mcon_2":2,"mcon_3":2,"mcon_4":2,"mcon_5":2,"mgeo_0":2,"mgeo_1":2,"mgeo_2":2,"mgeo_3":2,"mgeo_4":2,"mgeo_5":2,"mcmp_0":2,"mcmp_1":2,"mcmp_2":2,"mcmp_3":2,"mcmp_4":2,"mcmp_5":2,"hopt_0":2,"hopt_1":2,"hopt_2":2,"hopt_3":2,"hopt_4":2,"hopt_5":2,"hloss_0":2,"hloss_1":2,"hloss_2":2,"hloss_3":2,"hloss_4":2,"hloss_5":2,"hscn_0":2,"hscn_1":2,"hscn_2":1,"hscn_3":2,"hscn_4":2,"hscn_5":2},"problemSolutions":{"gdef_0":"**1)** 방향 도함수·그라디언트 정의와 $D_{\\mathbf{u}} f=\\nabla f\\cdot\\mathbf{u}$를 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gdef_1":"**1)** 방향 도함수·그라디언트 정의와 $D_{\\mathbf{u}} f=\\nabla f\\cdot\\mathbf{u}$를 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gdef_2":"**1)** 방향 도함수·그라디언트 정의와 $D_{\\mathbf{u}} f=\\nabla f\\cdot\\mathbf{u}$를 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gdef_3":"**1)** 방향 도함수·그라디언트 정의와 $D_{\\mathbf{u}} f=\\nabla f\\cdot\\mathbf{u}$를 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gdef_4":"**1)** 방향 도함수·그라디언트 정의와 $D_{\\mathbf{u}} f=\\nabla f\\cdot\\mathbf{u}$를 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gdef_5":"**1)** 방향 도함수·그라디언트 정의와 $D_{\\mathbf{u}} f=\\nabla f\\cdot\\mathbf{u}$를 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gtf_0":"**1)** 등고선 수직, 최대 상승, 부호·크기 관계를 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","gtf_1":"**1)** 등고선 수직, 최대 상승, 부호·크기 관계를 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","gtf_2":"**1)** 등고선 수직, 최대 상승, 부호·크기 관계를 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gtf_3":"**1)** 등고선 수직, 최대 상승, 부호·크기 관계를 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","gtf_4":"**1)** 등고선 수직, 최대 상승, 부호·크기 관계를 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gtf_5":"**1)** 등고선 수직, 최대 상승, 부호·크기 관계를 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","gcalc_0":"**1)** 편미분을 구한 뒤 내적·크기를 계산합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gcalc_1":"**1)** 편미분을 구한 뒤 내적·크기를 계산합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","gcalc_2":"**1)** 편미분을 구한 뒤 내적·크기를 계산합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gcalc_3":"**1)** 편미분을 구한 뒤 내적·크기를 계산합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gcalc_4":"**1)** 편미분을 구한 뒤 내적·크기를 계산합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gcalc_5":"**1)** 편미분을 구한 뒤 내적·크기를 계산합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","gprop_0":"**1)** 단위벡터, 최대 $D_{\\mathbf{u}} f$, 경사하강 부호를 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gprop_1":"**1)** 단위벡터, 최대 $D_{\\mathbf{u}} f$, 경사하강 부호를 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gprop_2":"**1)** 단위벡터, 최대 $D_{\\mathbf{u}} f$, 경사하강 부호를 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gprop_3":"**1)** 단위벡터, 최대 $D_{\\mathbf{u}} f$, 경사하강 부호를 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gprop_4":"**1)** 단위벡터, 최대 $D_{\\mathbf{u}} f$, 경사하강 부호를 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","gprop_5":"**1)** 단위벡터, 최대 $D_{\\mathbf{u}} f$, 경사하강 부호를 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcon_0":"**1)** 편미분 vs 방향, 임계점, 내적 의미를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcon_1":"**1)** 편미분 vs 방향, 임계점, 내적 의미를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcon_2":"**1)** 편미분 vs 방향, 임계점, 내적 의미를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcon_3":"**1)** 편미분 vs 방향, 임계점, 내적 의미를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcon_4":"**1)** 편미분 vs 방향, 임계점, 내적 의미를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcon_5":"**1)** 편미분 vs 방향, 임계점, 내적 의미를 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mgeo_0":"**1)** 등고선·수직·평지·히트맵 직관을 씁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mgeo_1":"**1)** 등고선·수직·평지·히트맵 직관을 씁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mgeo_2":"**1)** 등고선·수직·평지·히트맵 직관을 씁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mgeo_3":"**1)** 등고선·수직·평지·히트맵 직관을 씁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mgeo_4":"**1)** 등고선·수직·평지·히트맵 직관을 씁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mgeo_5":"**1)** 등고선·수직·평지·히트맵 직관을 씁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcmp_0":"**1)** 두 방향·벡터 크기·내적 값을 비교합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcmp_1":"**1)** 두 방향·벡터 크기·내적 값을 비교합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcmp_2":"**1)** 두 방향·벡터 크기·내적 값을 비교합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcmp_3":"**1)** 두 방향·벡터 크기·내적 값을 비교합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcmp_4":"**1)** 두 방향·벡터 크기·내적 값을 비교합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","mcmp_5":"**1)** 두 방향·벡터 크기·내적 값을 비교합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hopt_0":"**1)** 경사하강 한 스텝, 학습률 부호를 계산합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hopt_1":"**1)** 경사하강 한 스텝, 학습률 부호를 계산합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hopt_2":"**1)** 경사하강 한 스텝, 학습률 부호를 계산합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hopt_3":"**1)** 경사하강 한 스텝, 학습률 부호를 계산합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hopt_4":"**1)** 경사하강 한 스텝, 학습률 부호를 계산합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hopt_5":"**1)** 경사하강 한 스텝, 학습률 부호를 계산합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hloss_0":"**1)** 손실 미분·$-\\nabla L$ 방향을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hloss_1":"**1)** 손실 미분·$-\\nabla L$ 방향을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hloss_2":"**1)** 손실 미분·$-\\nabla L$ 방향을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hloss_3":"**1)** 손실 미분·$-\\nabla L$ 방향을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hloss_4":"**1)** 손실 미분·$-\\nabla L$ 방향을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hloss_5":"**1)** 손실 미분·$-\\nabla L$ 방향을 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hscn_0":"**1)** ML 학습·평평한 손실·다음 장 연결을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hscn_1":"**1)** ML 학습·평평한 손실·다음 장 연결을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hscn_2":"**1)** ML 학습·평평한 손실·다음 장 연결을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","hscn_3":"**1)** ML 학습·평평한 손실·다음 장 연결을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hscn_4":"**1)** ML 학습·평평한 손실·다음 장 연결을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","hscn_5":"**1)** ML 학습·평평한 손실·다음 장 연결을 떠올립니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②"},"problemTestCodes":{"gdef_0":"answer = 2\nassert answer == 2","gdef_1":"answer = 2\nassert answer == 2","gdef_2":"answer = 2\nassert answer == 2","gdef_3":"answer = 2\nassert answer == 2","gdef_4":"answer = 2\nassert answer == 2","gdef_5":"answer = 2\nassert answer == 2","gtf_0":"answer = 1\nassert answer == 1","gtf_1":"answer = 1\nassert answer == 1","gtf_2":"answer = 2\nassert answer == 2","gtf_3":"answer = 1\nassert answer == 1","gtf_4":"answer = 2\nassert answer == 2","gtf_5":"answer = 1\nassert answer == 1","gcalc_0":"answer = 2\nassert answer == 2","gcalc_1":"answer = 1\nassert answer == 1","gcalc_2":"answer = 2\nassert answer == 2","gcalc_3":"answer = 2\nassert answer == 2","gcalc_4":"answer = 2\nassert answer == 2","gcalc_5":"answer = 1\nassert answer == 1","gprop_0":"answer = 2\nassert answer == 2","gprop_1":"answer = 2\nassert answer == 2","gprop_2":"answer = 2\nassert answer == 2","gprop_3":"answer = 2\nassert answer == 2","gprop_4":"answer = 2\nassert answer == 2","gprop_5":"answer = 2\nassert answer == 2","mcon_0":"answer = 2\nassert answer == 2","mcon_1":"answer = 2\nassert answer == 2","mcon_2":"answer = 2\nassert answer == 2","mcon_3":"answer = 2\nassert answer == 2","mcon_4":"answer = 2\nassert answer == 2","mcon_5":"answer = 2\nassert answer == 2","mgeo_0":"answer = 2\nassert answer == 2","mgeo_1":"answer = 2\nassert answer == 2","mgeo_2":"answer = 2\nassert answer == 2","mgeo_3":"answer = 2\nassert answer == 2","mgeo_4":"answer = 2\nassert answer == 2","mgeo_5":"answer = 2\nassert answer == 2","mcmp_0":"answer = 2\nassert answer == 2","mcmp_1":"answer = 2\nassert answer == 2","mcmp_2":"answer = 2\nassert answer == 2","mcmp_3":"answer = 2\nassert answer == 2","mcmp_4":"answer = 2\nassert answer == 2","mcmp_5":"answer = 2\nassert answer == 2","hopt_0":"answer = 2\nassert answer == 2","hopt_1":"answer = 2\nassert answer == 2","hopt_2":"answer = 2\nassert answer == 2","hopt_3":"answer = 2\nassert answer == 2","hopt_4":"answer = 2\nassert answer == 2","hopt_5":"answer = 2\nassert answer == 2","hloss_0":"answer = 2\nassert answer == 2","hloss_1":"answer = 2\nassert answer == 2","hloss_2":"answer = 2\nassert answer == 2","hloss_3":"answer = 2\nassert answer == 2","hloss_4":"answer = 2\nassert answer == 2","hloss_5":"answer = 2\nassert answer == 2","hscn_0":"answer = 2\nassert answer == 2","hscn_1":"answer = 2\nassert answer == 2","hscn_2":"answer = 1\nassert answer == 1","hscn_3":"answer = 2\nassert answer == 2","hscn_4":"answer = 2\nassert answer == 2","hscn_5":"answer = 2\nassert answer == 2"}},"midMathCh09":{"chapter":"Chapter 09","title":"야코비안 행렬: 여러 입력이 움직일 때 출력은?","description":"복잡한 공장에서 거대한 기계를 조종한다고 상상해 보세요. 다이얼(입력)이 여러 개 있고, 기계의 상태를 보여주는 계기판(출력)도 여러 개가 있습니다. 1번 다이얼과 2번 다이얼을 동시에 아주 살짝 돌렸을 때, 3번 계기판과 4번 계기판의 바늘은 각각 얼마나 움직일까요?\n\n이전 장에서 배운 **그라디언트(Gradient)**가 결과값(오차)이 오직 1개일 때 가장 가파른 오르막길을 알려주는 '단일 나침반'이었다면, 이번 장에서 만날 **야코비안 행렬(Jacobian Matrix, $J$)**은 결과값이 여러 개일 때 모든 입력과 모든 출력 사이의 미세한 상호작용을 하나의 거대한 표로 완벽하게 정리해 둔 **'궁극의 민감도 종합 상황판'**입니다.\n\n우리가 다루는 세상이나 딥러닝 모델은 멀리서 보면 꼬불꼬불하고 예측하기 힘든 비선형 곡면($\\mathbf{f}$)입니다. 하지만 아무리 복잡한 곡면이라도 돋보기로 아주 크게 확대해서 특정 지점 근처만 살펴보면, 마치 반듯한 직선이나 평면처럼 보입니다. 야코비안 행렬은 이 찰나의 순간을 반듯한 평행사변형 격자로 흉내 내어(국소 선형 근사), 거대하고 복잡한 신경망이 오차를 추적하고 스스로를 튜닝할 수 있게 만드는 기적의 수학적 도구입니다.","sectionTitle":"야코비안 행렬: 여러 입력이 움직일 때 출력은?","sectionLabels":{"easyExplain":"쉬운 말로 다시 보기","whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","problemSolving":"문제 풀이를 위한 설명"},"visualShort":"입력 → 출력: f(휘어짐) vs J(직선 근사)","visualIntro":"왼쪽 **입력** 격자가 오른쪽 **출력**으로 바뀝니다. 멀리서 보면 **휘어짐**($f$), 가까이 보면 **직선처럼 기울어짐**($J$). 주황·보라 **▱** 모양이 비슷하면 근사가 맞습니다.","visualStep1":"입력 격자","visualStep2":"f: 휘어짐","visualStep3":"작은 ▱","visualStep4":"J: 직선 근사","visualStepsLabel":"보는 순서","visualFlowTitle":"학습 흐름","visualFlowStep0":"개념: 벡터값 함수 $\\mathbf{f}(\\mathbf{x})$","visualFlowStep1":"직관: 입력 격자 → 출력 왜곡 (상단 f)","visualFlowStep2":"수학: $J_{ij}=\\partial f_i/\\partial x_j$, $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$","visualFlowStep3":"연결: Ch.08 $\\nabla f$, Ch.05 $\\det J$","visualFlowStep4":"적용: 역전파, Ch.10 헤시안","jacVisualAriaLabel":"입력 격자가 출력으로 바뀌며, 비선형 f의 휘어짐과 선형 J의 기울어짐이 순서대로 나타납니다.","jacVisualMainTitle":"야코비안: 여러 입력이 움직일 때 출력은?","jacVisualSubtitle":"Ch.08 **그라디언트**는 결과 **1개**일 때, Ch.09 **야코비안 $J$**는 결과 **여러 개**일 때 씁니다. 애니메이션: 왼쪽 입력 → 오른쪽 출력. 먼저 **휘어짐**($f$), 이어 **직선 근사**($J$).","jacVisualCaption":"**빨간 격자**=좌표, **초록 화살표**=변환, **주황 ▱**=$f$의 작은 영역, **보라 ▱**=$J$의 근사. ▱ 모양이 비슷하면 $f\\approx J\\Delta\\mathbf{x}$.","jacVisualHintFar":"→ 멀리: 격자가 휘어짐 (비선형 f)","jacVisualHintNear":"→ 가까이: 직선처럼 기울어짐 (선형 J)","jacDiagramLabelInput":"입력 / Input","jacDiagramLabelOutput":"출력 / Output","jacDiagramLabelNonlinear":"비선형 f","jacDiagramLabelLinear":"국소 선형 J","whatIs":{"0":"**1. 벡터값 함수: 여러 개의 입력 스틱과 여러 개의 출력 스크린**\n\n지금까지 우리가 다룬 함수는 다이얼을 여러 개 돌려도 결과(오차)가 딱 하나만 나오는 기계였습니다(스칼라 함수). 하지만 카메라 화면의 픽셀 위치 좌표나, 딥러닝 중간 층의 수백 개 뉴런 값들처럼 결과물 자체가 여러 개의 묶음(벡터)으로 튀어나오는 경우가 훨씬 많습니다. 이렇게 $n$개의 입력이 들어가서 $m$개의 출력이 한꺼번에 쏟아져 나오는 기계를 **벡터값 함수**라고 부릅니다. 입력 스틱 하나를 툭 건드리면 수십 개의 출력 스크린이 동시에 출렁이게 됩니다.","1":"**2. 국소 선형화: 돋보기로 보면 둥근 지구도 평평하다**\n\n위 비주얼의 상단 그림처럼, 실제 세상의 변화는 격자가 휘어지고 구부러지는 아주 복잡한 곡선(비선형)입니다. 하지만 우리가 어떤 특정 지점 근처를 현미경으로 수만 배 줌인(Zoom-in)해서 본다면 어떨까요? 곡선은 마치 아주 짧고 반듯한 직선처럼 보이고, 둥근 곡면은 평평한 평면처럼 다룰 수 있게 됩니다. 이처럼 아주 찰나의 좁은 영역(국소 영역)에서만큼은 복잡한 변화를 반듯한 일차방정식(선형)처럼 취급하겠다는 아이디어가 미적분학의 핵심이며, 야코비안 행렬은 바로 그 반듯하게 펴진 평면의 **'기울기 종합 표'**입니다.","2":"**3. 야코비안 행렬의 정의: 궁극의 변화량 요약본**\n\n수식 $J_{ij} = \\frac{\\partial f_i}{\\partial x_j}$는 복잡해 보이지만 아주 단순한 뜻입니다. **\"$j$번째 다이얼을 한 칸 돌렸을 때, $i$번째 계기판 바늘은 몇 칸 움직이는가?\"**를 표의 $i$행 $j$열 자리에 꼼꼼히 적어둔 것입니다. 덕분에 수많은 다이얼을 동시에 무작위로 살짝살짝 돌렸을 때($\\Delta \\mathbf{x}$), 전체 계기판들이 최종적으로 어떻게 변할지($\\Delta \\mathbf{y}$)를 $\\Delta \\mathbf{y} \\approx J \\Delta \\mathbf{x}$ 라는 단 한 줄의 깔끔한 행렬 곱셈으로 즉시 예측할 수 있습니다.","3":"**4. 그라디언트(Ch.08)와의 관계: 나침반을 쌓아 올린 탑**\n\n만약 출력이 딱 1개라면, 이 표는 1줄짜리 가로줄이 되며 우리가 익히 아는 **그라디언트** 나침반이 됩니다. 만약 출력이 3개라면? 각각의 출력에 대한 그라디언트 나침반 3개를 차곡차곡 가로로 쌓아 올린 3줄짜리 표가 됩니다. 즉, 야코비안은 **'각 출력값들이 가진 그라디언트들을 층층이 쌓아 올려 만든 거대한 나침반들의 모음집'**이라고 이해하면 완벽합니다.","4":"**5. 기하학적 마법: 찌그러진 면적의 비율 ($\\det J$)**\n\n작고 반듯했던 정사각형 격자 모양의 입력 데이터가 야코비안 변환을 거치면, 기울어진 평행사변형 모양으로 찌그러집니다. 이때, 그 평행사변형의 면적이 원래의 정사각형 면적보다 도대체 몇 배나 커졌는지(혹은 작아졌는지)를 직관적으로 알려주는 숫자가 바로 행렬식 **$\\det J$**입니다. 만약 $|\\det J| = 6$ 이라면, 공간이 찰흙처럼 늘어나면서 단위 면적이 6배로 팽창했다는 뜻이 됩니다."},"easyExplain":{"0":"**① 그라디언트 vs 야코비안 — 답이 1개일 때와 여러 개일 때**\n\nCh.08 **그라디언트**는 답이 **하나**일 때 씁니다. 예: \"공부 시간을 10분 늘리면 시험 점수가 몇 점 오를까?\" **야코비안**은 답이 **여러 개**일 때 씁니다. 예: 로봇 팔에서 어깨·팔꿈치를 조금 움직이면, 손의 **X 위치**와 **Y 위치**가 **각각** 얼마나 변하는지 한 **표**에 모아 둔 것입니다. Ch.08 = 나침반 하나, Ch.09 = 다이얼 여러 개와 계기판 여러 개를 연결한 **큰 표**.","1":"**② 표 한 칸 $J_{ij}$ 읽는 법 — \"다이얼 j → 바늘 i\"**\n\n$J_{ij}$는 어렵게 보여도 이렇게만 읽으면 됩니다. **\"$j$번째 입력(다이얼)을 살짝 돌리면, $i$번째 출력(바늘)이 얼마나 움직이나?\"** 표의 **행 = 출력 번호**, **열 = 입력 번호**입니다. 2×2 예: 첫 번째 행은 \"첫 번째 결과가 x, y 입력에 각각 얼마나 반응하는가\"를 담습니다.","2":"**③ $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$ — \"조금 움직이면 대략 이만큼\"**\n\n입력을 **아주 조금** 움직이면($\\Delta\\mathbf{x}$), 출력도 **아주 조금** 변합니다($\\Delta\\mathbf{y}$). 이때 **출력 변화 ≈ 야코비안 × 입력 변화**로 대략 맞출 수 있습니다. 멀리서 보면 휘어진 길(비선형)도, **한 점 근처**에서는 짧은 **직선**처럼 보인다는 뜻과 같습니다. 위쪽 그림의 곡선 vs 아래쪽 직선 격자가 바로 이 차이입니다.","3":"**④ 역전파 — 오차를 거꾸로 전달할 때 표를 곱한다**\n\n신경망은 층이 여러 겹입니다. 마지막에 \"틀렸다\"는 신호가 나오면, **앞 층으로 거꾸로** 전달해야 어디를 고칠지 알 수 있습니다. 각 층마다 작은 **야코비안 표**가 있고, 이 표들을 **곱해 가며** 연결합니다($J_{\\text{total}}=J_L\\cdots J_1$). LEGO를 거꾸로 이어 붙이듯 **표 × 표 × 표**라고만 기억해도 충분합니다.","4":"**⑤ $\\det J$ — 넓이가 몇 배로 늘었나 · 로봇 팔 경고등**\n\n작은 **정사각형** 그림이 변환 후 **평행사변형**으로 찌그러지면, **넓이가 몇 배**가 됐는지 알려 주는 숫자가 $\\det J$입니다(Ch.05 행렬식). $|\\det J|=6$이면 넓이 **6배**. 로봇 팔이 **완전히 펴지면** $\\det J=0$ — 어떤 방향으로는 **1mm도 못 움직이는** **마비(특이점)** 상태라는 **경고등**입니다."},"whyImportant":{"bridge":"**딥러닝은 수많은 야코비안 행렬들이 거미줄처럼 얽힌 거대한 공장**입니다. 어떤 신경망 층을 통과할 때 활성화 함수(ReLU, Sigmoid 등)를 거치며 데이터의 형태가 복잡하게 굽이치더라도, '역전파(Backpropagation)'라는 오차 추적 시스템은 찰나의 국소 선형화 마법을 부려 각 층의 **야코비안 행렬**을 구해냅니다. 이전 장의 그라디언트가 오직 마지막 '최종 오차'에 대한 나침반이었다면, 신경망 내부의 깊은 층과 층 사이에서는 수천 개의 뉴런들이 서로 미치는 영향을 담아낼 수 있는 거대한 야코비안 행렬이 반드시 필요합니다.","similarity":"결국 신경망이 학습한다는 것은, 꼬리에 꼬리를 무는 연쇄 법칙(Chain Rule)에 따라 이 야코비안 행렬들을 계속해서 곱해나가는 수학적 과정에 불과합니다. 진짜 사람 같은 얼굴을 만들어내는 GAN 생성기나, 데이터를 압축하는 오토인코더 모델들 모두 \"내가 입력한 잠재된 노이즈를 아주 살짝 비틀었을 때, 눈앞의 이미지가 어떻게 찌그러지고 변할까?\"를 이 야코비안 행렬을 통해 꿰뚫어 보고 학습의 방향을 결정합니다."},"howUsed":{"ml":"**1. 역전파(Backpropagation): 오차가 거꾸로 굽이쳐 흐르는 강**\n\n인공지능 모델에서 오차를 줄이려면, 마지막 층에서 발생한 오차를 첫 번째 입력층까지 거꾸로 전달하며 책임 소재를 따져야 합니다. 수십 개의 층(Layer)이 쌓여 있을 때, 각 층을 지날 때마다 해당 층이 만들어낸 **국소 야코비안 행렬들을 징검다리처럼 척척 곱해 나가기만 하면** ($J_{\\text{total}} = J_L \\cdots J_2 J_1$), 아무리 복잡한 딥러닝 모델이라도 한 번에 전체 민감도를 계산해내고 가중치를 업데이트할 수 있습니다.\n\n**2. 확률 밀도의 팽창과 수축 (Normalizing Flows)**\n\n최신 생성형 AI 중에는 단순한 찰흙(정규분포)을 마구 주무르고 늘려서 정교한 조각상(복잡한 데이터 분포)으로 만드는 기법이 있습니다. 찰흙을 양옆으로 2배 넓게 늘리면 그 밀도는 절반으로 옅어지겠죠? 이처럼 공간의 부피가 변화함에 따라 확률 밀도가 어떻게 왜곡되는지 정밀하게 보정할 때, 부피의 변화율을 알려주는 야코비안 행렬식 $\\log|\\det J|$ 가 필수적인 마법의 열쇠로 사용됩니다.","geometry":"**3. 로봇 팔의 미세 제어와 마비 상태(Singularity)**\n\n어깨와 팔꿈치 관절을 가진 로봇 팔을 생각해 봅시다. 목표물에 닿기 위해 '관절 모터를 1도 돌리면 손끝의 X, Y 좌표가 각각 얼마나 이동할까?'를 정확히 계산해 주는 것이 야코비안입니다. 만약 로봇 팔이 일직선으로 완전히 펴져 버린다면 어떻게 될까요? 이때는 야코비안의 행렬식 $\\det J$가 $0$이 되어버립니다. 이는 로봇 팔이 더 이상 특정 방향(앞쪽)으로는 단 1밀리미터도 움직일 수 없는 수학적 **특이점(마비 상태)**에 빠졌음을 경고하는 아주 중요한 실전 신호입니다."},"summary":"**한 줄 요약:** 야코비안 행렬 $J$는 여러 개의 다이얼을 돌렸을 때 여러 개의 계기판이 어떻게 변할지를 완벽하게 담아낸 **'궁극의 민감도 종합 표'**입니다. 좁은 구역에서는 복잡한 변화를 반듯한 일차방정식($\\Delta\\mathbf{y} \\approx J\\Delta\\mathbf{x}$)처럼 다룰 수 있게 해주며, 딥러닝 모델이 거대한 층들을 넘어 오차를 거꾸로 추적(역전파)할 수 있게 만드는 가장 중요한 수학적 심장입니다.","problemSolving":{"focus":"**문제 풀 때 이렇게만 따라가세요**\n\n**① 표 크기 — 출력 몇 개? 입력 몇 개?**\n출력(결과) $m$개, 입력 $n$개면 $J$는 **$m$행 × $n$열** 표입니다. **행 = 출력**, **열 = 입력** (계기판 번호 / 다이얼 번호).\n\n**② 표 칸 채우기 — \"다이얼 j → 바늘 i\"**\n$(i,j)$ 칸에는 **\"$j$번 입력을 살짝 움직이면 $i$번 출력이 얼마나 변하나?\"** 값을 넣습니다. 수식 이름은 편미분($J_{ij}$)이지만, **반응 정도 하나**라고만 생각해도 됩니다.\n\n**③ 작은 움직임 — 입력 조금 → 출력 조금**\n입력을 **아주 조금** 바꿀 때 ($\\Delta\\mathbf{x}$), 출력 변화($\\Delta\\mathbf{y}$)는 대략 **$J$ × 입력 변화**로 맞춥니다: $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$.\n\n**④ 출력 1개면 Ch.08 그라디언트**\n결과가 1개($m=1$)뿐이면 $J$는 Ch.08 **그라디언트** $\\nabla f$를 가로로 눕힌 것과 같습니다 ($\\nabla f^\\mathsf{T}$).\n\n**풀이 순서 3단계:** ① 크기 확인 → ② 칸별 편미분 채우기 → ③ 함수가 겹쳐 있으면 $J_g J_f$ 곱하기","examplesHeading":"풀이 예시","examplesTable":"**예시 1 — 2×2 J**\n\n문제: $\\mathbf{f}(x,y)=(x+y,\\;x-y)$의 $J$는?\n\n풀이: $f_1=x+y\\Rightarrow(1,1)$, $f_2=x-y\\Rightarrow(1,-1)$. $J=\\begin{pmatrix}1&1\\\\1&-1\\end{pmatrix}$.\n\n---\n\n**예시 2 — 한 점에서**\n\n문제: $\\mathbf{f}(x,y)=(x^2,\\;y)$, $(1,0)$의 $J$?\n\n풀이: $\\partial f_1/\\partial x=2x=2$, 나머지 0; $\\partial f_2/\\partial y=1$. $J=\\begin{pmatrix}2&0\\\\0&1\\end{pmatrix}$.\n\n---\n\n**예시 3 — 선형**\n\n문제: $\\mathbf{f}(\\mathbf{x})=A\\mathbf{x}$의 $J$?\n\n풀이: **$A$** (어디서나 같음).\n\n---\n\n**예시 4 — 연쇄**\n\n문제: $f(x)=x$, $g(u)=2u$일 때 $J_{g\\circ f}$ (1×1)?\n\n풀이: $J_f=1$, $J_g=2$, $J_{g\\circ f}=J_g J_f=2$.\n\n---\n\n**예시 5 — det J**\n\n문제: $J=\\begin{pmatrix}2&0\\\\0&3\\end{pmatrix}$일 때 단위 정사각형 면적?\n\n풀이: $|\\det J|=|6|=6$ → **6배**.\n\n---\n\n**예시 6 — 선형 층**\n\n문제: $\\mathbf{z}=W\\mathbf{x}+\\mathbf{b}$에서 $J$는?\n\n풀이: 선형 변환이므로 **$W$**."},"problemSolvingLabel":"문제 풀이를 위한 설명","problemSolvingTable":"| 말로 정리 | 의미 |\n| :--- | :--- |\n| **야코비안** | $J_{ij}=\\partial f_i/\\partial x_j$, $m\\times n$ |\n| **국소 근사** | $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$ |\n| **그라디언트** | $m=1$일 때 $J=\\nabla f^\\mathsf{T}$ |\n| **연쇄** | $J_{g\\circ f}=J_g J_f$ |\n| **det J** | 면적·부피 배율 (Ch.05) |\n| **역전파** | $\\partial L/\\partial\\mathbf{x}=J^\\mathsf{T}(\\partial L/\\partial\\mathbf{f})$ |\n\n**①** 행=출력, 열=입력. **②** 선형 $f=Ax$면 $J=A$. **③** 작은 $\\Delta\\mathbf{x}$. **④** 특이(det$=0$)면 한 방향으로 찌그러짐.","practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"","practiceProblemsInstruction":"문제를 읽고 가장 알맞은 선택지를 고르세요.","problems":{"jdef_0":"입력 $\\mathbf{x}$를 조금 움직였을 때 벡터 출력 $\\mathbf{f}(\\mathbf{x})$의 변화를 한 표(행렬)로 모은 것은?\n\n① 그라디언트\n② **야코비안 행렬** $J$\n③ 헤시안\n④ 행렬식","jdef_1":"$$J_{ij}=\\dfrac{\\partial f_i}{\\partial x_j}$에서 $J_{ij}$의 의미로 맞는 것은?\n\n① $j$번째 출력 / $i$번째 입력\n② **$i$번째 출력** / **$j$번째 입력** 편미분\n③ $i=j$일 때만 정의\n④ 항상 $0$","jdef_2":"$$f:\\mathbb{R}^2\\to\\mathbb{R}^3$일 때 야코비안 $J$의 크기(행×열)는?\n\n① $2\\times 2$\n② $2\\times 3$\n③ **$3\\times 2$**\n④ $3\\times 3$","jdef_3":"스칼라 함수 $f:\\mathbb{R}^n\\to\\mathbb{R}$의 야코비안은 보통?\n\n① $n\\times n$ 행렬\n② **$1\\times n$** (그라디언트를 행으로)\n③ $n\\times 1$만\n④ 정의 불가","jdef_4":"국소 선형 근사 $\\Delta\\mathbf{y}\\approx J\\,\\Delta\\mathbf{x}$에서 $J$는?\n\n① 항상 대칭\n② **해당 점**에서의 야코비안\n③ 헤시안\n④ 단위행렬만","jdef_5":"선형 변환 $\\mathbf{f}(\\mathbf{x})=A\\mathbf{x}$의 야코비안 $J$는?\n\n① $A^{-1}$\n② **$A$** (어디서나 같음)\n③ $A^\\mathsf{T}A$\n④ 영행렬","jtf_0":"입력 변화가 작을 때 $\\Delta\\mathbf{y}\\approx J\\,\\Delta\\mathbf{x}$는 **1차 근사**로 쓸 수 있다.\n\n① 참\n② 거짓","jtf_1":"야코비안은 항상 **정사각**($n\\times n$) 행렬이다.\n\n① 참\n② 거짓","jtf_2":"$$m=1$이면 야코비안 $J$는 그라디언트 $\\nabla f$를 **행 벡터**로 둔 것과 같다.\n\n① 참\n② 거짓","jtf_3":"$$\\det J$는 (2D에서) 작은 면적이 변환 후 **몇 배**가 되는지와 관련된다.\n\n① 참\n② 거짓","jtf_4":"야코비안의 **행**은 출력 하나에 대한 모든 입력 편미분이다.\n\n① 참\n② 거짓","jtf_5":"합성 $h=g\\circ f$의 야코비안은 $J_h=J_g\\,J_f$ (**연쇄법칙**)이다.\n\n① 참\n② 거짓","jcalc_0":"$$\\mathbf{f}(x,y)=(x+y,\\; x-y)$의 $J$는?\n\n① $\\begin{pmatrix}1&-1\\\\1&1\\end{pmatrix}$\n② $\\begin{pmatrix}1&1\\\\1&-1\\end{pmatrix}$\n③ $\\begin{pmatrix}0&1\\\\1&0\\end{pmatrix}$\n④ $\\begin{pmatrix}2&0\\\\0&2\\end{pmatrix}$","jcalc_1":"$$\\mathbf{f}(x,y)=(2x,\\; 3y)$의 $J$는?\n\n① $\\begin{pmatrix}2&3\\\\0&0\\end{pmatrix}$\n② $\\begin{pmatrix}2&0\\\\0&3\\end{pmatrix}$\n③ $\\begin{pmatrix}3&2\\\\0&0\\end{pmatrix}$\n④ $\\begin{pmatrix}1&1\\\\1&1\\end{pmatrix}$","jcalc_2":"$$\\mathbf{f}(x,y)=(x,\\; y)$의 $J$는?\n\n① 영행렬\n② **단위행렬** $I$\n③ $\\begin{pmatrix}0&1\\\\1&0\\end{pmatrix}$\n④ $\\begin{pmatrix}2&0\\\\0&2\\end{pmatrix}$","jcalc_3":"$$\\mathbf{f}(x,y)=(3x,\\; y)$의 $J$는?\n\n① $\\begin{pmatrix}1&0\\\\0&3\\end{pmatrix}$\n② $\\begin{pmatrix}3&0\\\\0&1\\end{pmatrix}$\n③ $\\begin{pmatrix}3&1\\\\0&0\\end{pmatrix}$\n④ $\\begin{pmatrix}0&3\\\\1&0\\end{pmatrix}$","jcalc_4":"$$\\mathbf{f}(x,y)=(x,\\; 2y)$의 $J$는?\n\n① $\\begin{pmatrix}2&0\\\\0&1\\end{pmatrix}$\n② $\\begin{pmatrix}1&0\\\\0&2\\end{pmatrix}$\n③ $\\begin{pmatrix}1&2\\\\0&1\\end{pmatrix}$\n④ $\\begin{pmatrix}0&1\\\\2&0\\end{pmatrix}$","jcalc_5":"$$\\mathbf{f}(x,y)=(x^2,\\; y)$에서 $(1,0)$의 $J$는?\n\n① $\\begin{pmatrix}1&0\\\\0&1\\end{pmatrix}$\n② $\\begin{pmatrix}2&0\\\\0&1\\end{pmatrix}$\n③ $\\begin{pmatrix}2&0\\\\0&0\\end{pmatrix}$\n④ $\\begin{pmatrix}0&2\\\\1&0\\end{pmatrix}$","jprop_0":"$$f:\\mathbb{R}^n\\to\\mathbb{R}^m$일 때 $J$의 **행 개수**는?\n\n① $n$\n② **$m$** (출력 개수)\n③ $m+n$\n④ 항상 $1$","jprop_1":"$$f:\\mathbb{R}^n\\to\\mathbb{R}^m$일 때 $J$의 **열 개수**는?\n\n① $m$\n② **$n$** (입력 개수)\n③ $m-n$\n④ $1$","jprop_2":"모든 $J$ 성분이 $0$이면 그 점 **근처**에서 $\\mathbf{f}$는?\n\n① 반드시 비선형\n② **거의 상수**(변화 없음)\n③ 반드시 발산\n④ 정의 불가","jprop_3":"$$\\mathbf{f}(\\mathbf{x})=A\\mathbf{x}+\\mathbf{b}$일 때 $J$는?\n\n① $\\mathbf{b}$\n② **$A$**\n③ $A\\mathbf{b}$\n④ $A^{-1}$","jprop_4":"$$\\Delta\\mathbf{x}$가 **작을수록** $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$ 근사는?\n\n① 항상 나빠짐\n② **더 정확**해짐\n③ 변하지 않음\n④ 항상 틀림","jprop_5":"2입력 2출력에서 $J$의 **총 성분 개수**는?\n\n① $2$\n② **$4$**\n③ $8$\n④ $1$","jcon_0":"Ch.08 **그라디언트**와 Ch.09 **야코비안**의 관계로 맞는 것은?\n\n① 완전히 무관\n② 스칼라 $f$의 $J$는 $\\nabla f^\\mathsf{T}$; 벡터 $f$는 **행마다 출력 하나**\n③ 야코비안은 항상 스칼라\n④ 그라디언트가 더 큰 행렬","jcon_1":"벡터값 함수 $\\mathbf{f}:\\mathbb{R}^2\\to\\mathbb{R}^2$에서 $J$의 **한 행**은?\n\n① 입력 하나의 편미분\n② **출력 하나**에 대한 $(\\partial/\\partial x,\\;\\partial/\\partial y)$\n③ 헤시안 한 줄\n④ 행렬식","jcon_2":"$$\\mathbf{f}(x,y)=(x^2,\\; y^2)$는?\n\n① 선형\n② **비선형** (곱·제곱)\n③ 상수\n④ $1\\to 1$만","jcon_3":"국소 선형화 $\\mathbf{f}(\\mathbf{x}_0+\\Delta\\mathbf{x})\\approx\\mathbf{f}(\\mathbf{x}_0)+J\\Delta\\mathbf{x}$에서 $J$는?\n\n① $\\mathbf{x}_0$에서만 정의 안 됨\n② **$\\mathbf{x}_0$**에서 계산한 야코비안\n③ 헤시안\n④ 임의 행렬","jcon_4":"신경망 층 $\\mathbf{z}=W\\mathbf{x}+\\mathbf{b}$에서 $J$는?\n\n① $W\\mathbf{b}$\n② **$W$**\n③ $W^\\mathsf{T}W$\n④ $\\mathbf{b}$만","jcon_5":"출력이 **1개**($m=1$)일 때 야코비안 크기는?\n\n① $n\\times n$\n② **$1\\times n$**\n③ $n\\times 1$만\n④ $1\\times 1$만","jgeo_0":"2D에서 작은 **정사각형**이 $J$로 변환되면 보통?\n\n① 항상 원\n② **평행사변형**\n③ 점\n④ 직선","jgeo_1":"$$\\det J>0$이면 (작은 영역) 보통?\n\n① 면적 **확대**·방향 유지\n② **면적 배율** $|\\det J|$ (Ch.05 행렬식)\n③ 항상 축소만\n④ det와 무관","jgeo_2":"$$J=\\begin{pmatrix}2&0\\\\0&3\\end{pmatrix}$일 때 단위 정사각형 면적은?\n\n① $1$\n② **$6$** ($2\\times 3$)\n③ $5$\n④ $0$","jgeo_3":"비선형 $f$를 **멀리서** 보면 복잡해도, 한 점 **근처**에서는?\n\n① 항상 상수\n② **$J$로 직선·평면처럼** 근사\n③ 헤시안만 필요\n④ 야코비안 불필요","jgeo_4":"$$J$가 **특이**(det$=0$)이면 작은 영역은?\n\n① 면적 그대로\n② **한 줄로 찌그러짐** (면적 0)\n③ 반드시 확대\n④ 회전만","jgeo_5":"로봇 관절 $(\\theta_1,\\theta_2)$→ 손 $(x,y)$에서 $J$는?\n\n① 손 위치만\n② **관절을 조금 움직일 때 손이 어떻게 움직이는지**\n③ 질량\n④ 배터리","jcmp_0":"$$f:\\mathbb{R}^2\\to\\mathbb{R}$의 $\\nabla f$와 $J$ 크기는?\n\n① $\\nabla f$가 $2\\times 2$\n② $\\nabla f$는 $2$성분 벡터, $J$는 **$1\\times 2$**\n③ 같음\n④ $J$가 $2\\times 2$","jcmp_1":"$$f:\\mathbb{R}^2\\to\\mathbb{R}^2$의 $J$ vs Ch.10 **헤시안** $H$?\n\n① $H$가 1계\n② $J$는 **1계** 편미분, $H$는 **2계**\n③ 같음\n④ $J$가 대칭만","jcmp_2":"$$\\mathbf{f}(x,y)=(x,y)$의 $J$는?\n\n① 영행렬\n② **$I$** (단위)\n③ $\\begin{pmatrix}0&1\\\\1&0\\end{pmatrix}$\n④ $\\begin{pmatrix}2&0\\\\0&2\\end{pmatrix}$","jcmp_3":"$$\\mathbf{f}(x,y)=(x+y,\\;0)$의 $J$는?\n\n① $\\begin{pmatrix}1&1\\\\1&1\\end{pmatrix}$\n② $\\begin{pmatrix}1&1\\\\0&0\\end{pmatrix}$\n③ $\\begin{pmatrix}0&0\\\\1&1\\end{pmatrix}$\n④ $\\begin{pmatrix}1&0\\\\1&0\\end{pmatrix}$","jcmp_4":"Ch.08 **방향 도함수**와 $J$의 한 **행**은?\n\n① 무관\n② 그 **출력**을 스칼라처럼 보면 그 출력의 그라디언트(행)\n③ 항상 0\n④ 헤시안","jcmp_5":"$$f:\\mathbb{R}^2\\to\\mathbb{R}^2$, $g:\\mathbb{R}^2\\to\\mathbb{R}^2$일 때 $J_{g\\circ f}$ 크기는?\n\n① $1\\times 2$\n② **$2\\times 2$**\n③ $4\\times 4$\n④ $1\\times 1$","jchain_0":"$$f(x)=3x$의 $J$ (1×1)는?\n\n① $1$\n② **$3$**\n③ $0$\n④ $9$","jchain_1":"$$f(x)=x$, $g(u)=2u$일 때 $J_{g\\circ f}$ (1×1)는?\n\n① $3$\n② **$2$** ($J_g=2$, $J_f=1$)\n③ $1$\n④ $0$","jchain_2":"합성 $h=g\\circ f$의 야코비안은?\n\n① $J_f+J_g$\n② **$J_g\\,J_f$** (행렬 곱)\n③ $J_f-J_g$\n④ 항상 단위행렬","jchain_3":"선형 $\\mathbf{f}(\\mathbf{x})=A\\mathbf{x}$, $\\mathbf{g}(\\mathbf{u})=B\\mathbf{u}$. $J_{g\\circ f}$는?\n\n① $A+B$\n② **$BA$**\n③ $AB$\n④ $A^{-1}$","jchain_4":"2층 $\\mathbf{z}=W_1\\mathbf{x}$, $\\mathbf{y}=W_2\\mathbf{z}$. $\\partial\\mathbf{y}/\\partial\\mathbf{x}$는?\n\n① $W_1+W_2$\n② **$W_2 W_1$**\n③ $W_1 W_2$\n④ $W_2^\\mathsf{T}$","jchain_5":"역전파는 각 층의 야코비안을 ___ 한다.\n\n① 더하기만\n② **연쇄(곱)**\n③ 나누기\n④ 무시","jloss_0":"층 $\\mathbf{z}=W\\mathbf{x}+\\mathbf{b}$에서 $J$는?\n\n① $\\mathbf{b}$\n② **$W$**\n③ $W\\mathbf{x}$\n④ $W^\\mathsf{T}W$","jloss_1":"스칼라 $L=f(\\mathbf{x})$, $\\mathbf{x}\\in\\mathbb{R}^n$. $J_L$ 크기는?\n\n① $n\\times n$\n② **$1\\times n$**\n③ $1\\times 1$만\n④ $n\\times 1$만","jloss_2":"선형 $\\mathbf{f}(\\mathbf{x})=A\\mathbf{x}$의 $J$는?\n\n① 점마다 달라짐\n② **어디서나 $A$**\n③ 항상 $I$\n④ $\\mathbf{0}$","jloss_3":"$$f:\\mathbb{R}^2\\to\\mathbb{R}$ (출력 1개)의 $J$ 크기는?\n\n① $2\\times 2$\n② **$1\\times 2$**\n③ $2\\times 1$만\n④ $1\\times 1$","jloss_4":"$$\\Delta\\mathbf{y}\\approx J\\,\\Delta\\mathbf{x}$에서 $J$의 역할은?\n\n① 출력을 고정\n② **입력 변화→출력 변화** 비율 표\n③ 헤시안\n④ 학습률","jloss_5":"신경망에서 여러 층 $J$를 곱하면?\n\n① 한 층만 남음\n② **입력→최종 출력** 변화율\n③ 항상 $I$\n④ det만 구함","jscn_0":"로봇 관절을 **조금** 움직일 때 손 위치 변화는?\n\n① 무작위\n② **$J\\,\\Delta\\boldsymbol{\\theta}$**로 근사\n③ 헤시안만\n④ 상수","jscn_1":"입력 $\\mathbf{x}$를 **조금** 바꿀 때 출력 변화는?\n\n① 항상 0\n② **$J\\,\\Delta\\mathbf{x}$**로 근사\n③ det만\n④ 2계 미분만","jscn_2":"Ch.08 **그라디언트** vs 벡터 $\\mathbf{f}$의 $J$?\n\n① $f$에는 미분 없음\n② Ch.08은 **한 출력**; $J$는 **출력마다 한 행**\n③ 완전히 같음\n④ $J$가 2계","jscn_3":"작은 정사각형이 $J$로 변하면 보통?\n\n① 원\n② **평행사변형**\n③ 점\n④ 직선","jscn_4":"신경망 층 $\\mathbf{z}=W\\mathbf{x}$에서 $J$는?\n\n① $\\mathbf{x}$\n② **$W$**\n③ $W\\mathbf{x}$\n④ det $W$","jscn_5":"선형 $\\mathbf{f}(\\mathbf{x})=A\\mathbf{x}$의 $J$는?\n\n① $A^{-1}$\n② **$A$**\n③ $A^\\mathsf{T}A$\n④ 영행렬"},"problemAnswers":{"jdef_0":2,"jdef_1":2,"jdef_2":3,"jdef_3":2,"jdef_4":2,"jdef_5":2,"jtf_0":1,"jtf_1":2,"jtf_2":1,"jtf_3":1,"jtf_4":1,"jtf_5":1,"jcalc_0":2,"jcalc_1":2,"jcalc_2":2,"jcalc_3":2,"jcalc_4":2,"jcalc_5":2,"jprop_0":2,"jprop_1":2,"jprop_2":2,"jprop_3":2,"jprop_4":2,"jprop_5":2,"jcon_0":2,"jcon_1":2,"jcon_2":2,"jcon_3":2,"jcon_4":2,"jcon_5":2,"jgeo_0":2,"jgeo_1":2,"jgeo_2":2,"jgeo_3":2,"jgeo_4":2,"jgeo_5":2,"jcmp_0":2,"jcmp_1":2,"jcmp_2":2,"jcmp_3":2,"jcmp_4":2,"jcmp_5":2,"jchain_0":2,"jchain_1":2,"jchain_2":2,"jchain_3":2,"jchain_4":2,"jchain_5":2,"jloss_0":2,"jloss_1":2,"jloss_2":2,"jloss_3":2,"jloss_4":2,"jloss_5":2,"jscn_0":2,"jscn_1":2,"jscn_2":2,"jscn_3":2,"jscn_4":2,"jscn_5":2},"problemSolutions":{"jdef_0":"**1)** 야코비안 정의, $J_{ij}$ 의미, $m\\times n$ 크기를 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jdef_1":"**1)** 야코비안 정의, $J_{ij}$ 의미, $m\\times n$ 크기를 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jdef_2":"**1)** 야코비안 정의, $J_{ij}$ 의미, $m\\times n$ 크기를 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ③","jdef_3":"**1)** 야코비안 정의, $J_{ij}$ 의미, $m\\times n$ 크기를 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jdef_4":"**1)** 야코비안 정의, $J_{ij}$ 의미, $m\\times n$ 크기를 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jdef_5":"**1)** 야코비안 정의, $J_{ij}$ 의미, $m\\times n$ 크기를 적용합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jtf_0":"**1)** 국소 근사, det J, $m=1$↔그라디언트, 연쇄법칙 참·거짓을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","jtf_1":"**1)** 국소 근사, det J, $m=1$↔그라디언트, 연쇄법칙 참·거짓을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jtf_2":"**1)** 국소 근사, det J, $m=1$↔그라디언트, 연쇄법칙 참·거짓을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","jtf_3":"**1)** 국소 근사, det J, $m=1$↔그라디언트, 연쇄법칙 참·거짓을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","jtf_4":"**1)** 국소 근사, det J, $m=1$↔그라디언트, 연쇄법칙 참·거짓을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","jtf_5":"**1)** 국소 근사, det J, $m=1$↔그라디언트, 연쇄법칙 참·거짓을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ①","jcalc_0":"**1)** 각 성분 편미분을 구해 $J$ 행렬을 채웁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcalc_1":"**1)** 각 성분 편미분을 구해 $J$ 행렬을 채웁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcalc_2":"**1)** 각 성분 편미분을 구해 $J$ 행렬을 채웁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcalc_3":"**1)** 각 성분 편미분을 구해 $J$ 행렬을 채웁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcalc_4":"**1)** 각 성분 편미분을 구해 $J$ 행렬을 채웁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcalc_5":"**1)** 각 성분 편미분을 구해 $J$ 행렬을 채웁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jprop_0":"**1)** 행·열 수, 선형 $f=Ax$, 작은 $\\Delta\\mathbf{x}$ 근사를 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jprop_1":"**1)** 행·열 수, 선형 $f=Ax$, 작은 $\\Delta\\mathbf{x}$ 근사를 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jprop_2":"**1)** 행·열 수, 선형 $f=Ax$, 작은 $\\Delta\\mathbf{x}$ 근사를 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jprop_3":"**1)** 행·열 수, 선형 $f=Ax$, 작은 $\\Delta\\mathbf{x}$ 근사를 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jprop_4":"**1)** 행·열 수, 선형 $f=Ax$, 작은 $\\Delta\\mathbf{x}$ 근사를 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jprop_5":"**1)** 행·열 수, 선형 $f=Ax$, 작은 $\\Delta\\mathbf{x}$ 근사를 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcon_0":"**1)** 벡터값 vs 스칼라, 층 $W$, 국소 선형화 개념을 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcon_1":"**1)** 벡터값 vs 스칼라, 층 $W$, 국소 선형화 개념을 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcon_2":"**1)** 벡터값 vs 스칼라, 층 $W$, 국소 선형화 개념을 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcon_3":"**1)** 벡터값 vs 스칼라, 층 $W$, 국소 선형화 개념을 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcon_4":"**1)** 벡터값 vs 스칼라, 층 $W$, 국소 선형화 개념을 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcon_5":"**1)** 벡터값 vs 스칼라, 층 $W$, 국소 선형화 개념을 구분합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jgeo_0":"**1)** □→▱, $\\det J$ 면적 배율, 특이점 직관을 씁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jgeo_1":"**1)** □→▱, $\\det J$ 면적 배율, 특이점 직관을 씁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jgeo_2":"**1)** □→▱, $\\det J$ 면적 배율, 특이점 직관을 씁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jgeo_3":"**1)** □→▱, $\\det J$ 면적 배율, 특이점 직관을 씁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jgeo_4":"**1)** □→▱, $\\det J$ 면적 배율, 특이점 직관을 씁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jgeo_5":"**1)** □→▱, $\\det J$ 면적 배율, 특이점 직관을 씁니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcmp_0":"**1)** J vs $\\nabla f$ vs H, 합성 크기 $2\\times 2$를 비교합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcmp_1":"**1)** J vs $\\nabla f$ vs H, 합성 크기 $2\\times 2$를 비교합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcmp_2":"**1)** J vs $\\nabla f$ vs H, 합성 크기 $2\\times 2$를 비교합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcmp_3":"**1)** J vs $\\nabla f$ vs H, 합성 크기 $2\\times 2$를 비교합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcmp_4":"**1)** J vs $\\nabla f$ vs H, 합성 크기 $2\\times 2$를 비교합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jcmp_5":"**1)** J vs $\\nabla f$ vs H, 합성 크기 $2\\times 2$를 비교합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jchain_0":"**1)** 스칼라·선형 연쇄, $J_g J_f$, 2층 $W_2W_1$ 개념을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jchain_1":"**1)** 스칼라·선형 연쇄, $J_g J_f$, 2층 $W_2W_1$ 개념을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jchain_2":"**1)** 스칼라·선형 연쇄, $J_g J_f$, 2층 $W_2W_1$ 개념을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jchain_3":"**1)** 스칼라·선형 연쇄, $J_g J_f$, 2층 $W_2W_1$ 개념을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jchain_4":"**1)** 스칼라·선형 연쇄, $J_g J_f$, 2층 $W_2W_1$ 개념을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jchain_5":"**1)** 스칼라·선형 연쇄, $J_g J_f$, 2층 $W_2W_1$ 개념을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jloss_0":"**1)** 층 $J=W$, 크기, $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$ 역할을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jloss_1":"**1)** 층 $J=W$, 크기, $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$ 역할을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jloss_2":"**1)** 층 $J=W$, 크기, $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$ 역할을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jloss_3":"**1)** 층 $J=W$, 크기, $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$ 역할을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jloss_4":"**1)** 층 $J=W$, 크기, $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$ 역할을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jloss_5":"**1)** 층 $J=W$, 크기, $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$ 역할을 확인합니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jscn_0":"**1)** 로봇·입력 미소변화, Ch.08 비교, 평행사변형 등 직관 시나리오입니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jscn_1":"**1)** 로봇·입력 미소변화, Ch.08 비교, 평행사변형 등 직관 시나리오입니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jscn_2":"**1)** 로봇·입력 미소변화, Ch.08 비교, 평행사변형 등 직관 시나리오입니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jscn_3":"**1)** 로봇·입력 미소변화, Ch.08 비교, 평행사변형 등 직관 시나리오입니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jscn_4":"**1)** 로봇·입력 미소변화, Ch.08 비교, 평행사변형 등 직관 시나리오입니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②","jscn_5":"**1)** 로봇·입력 미소변화, Ch.08 비교, 평행사변형 등 직관 시나리오입니다. **2)** 예시·단계로 확인합니다. **3)** 정답 ②"},"problemTestCodes":{"jdef_0":"answer = 2\nassert answer == 2","jdef_1":"answer = 2\nassert answer == 2","jdef_2":"answer = 3\nassert answer == 3","jdef_3":"answer = 2\nassert answer == 2","jdef_4":"answer = 2\nassert answer == 2","jdef_5":"answer = 2\nassert answer == 2","jtf_0":"answer = 1\nassert answer == 1","jtf_1":"answer = 2\nassert answer == 2","jtf_2":"answer = 1\nassert answer == 1","jtf_3":"answer = 1\nassert answer == 1","jtf_4":"answer = 1\nassert answer == 1","jtf_5":"answer = 1\nassert answer == 1","jcalc_0":"answer = 2\nassert answer == 2","jcalc_1":"answer = 2\nassert answer == 2","jcalc_2":"answer = 2\nassert answer == 2","jcalc_3":"answer = 2\nassert answer == 2","jcalc_4":"answer = 2\nassert answer == 2","jcalc_5":"answer = 2\nassert answer == 2","jprop_0":"answer = 2\nassert answer == 2","jprop_1":"answer = 2\nassert answer == 2","jprop_2":"answer = 2\nassert answer == 2","jprop_3":"answer = 2\nassert answer == 2","jprop_4":"answer = 2\nassert answer == 2","jprop_5":"answer = 2\nassert answer == 2","jcon_0":"answer = 2\nassert answer == 2","jcon_1":"answer = 2\nassert answer == 2","jcon_2":"answer = 2\nassert answer == 2","jcon_3":"answer = 2\nassert answer == 2","jcon_4":"answer = 2\nassert answer == 2","jcon_5":"answer = 2\nassert answer == 2","jgeo_0":"answer = 2\nassert answer == 2","jgeo_1":"answer = 2\nassert answer == 2","jgeo_2":"answer = 2\nassert answer == 2","jgeo_3":"answer = 2\nassert answer == 2","jgeo_4":"answer = 2\nassert answer == 2","jgeo_5":"answer = 2\nassert answer == 2","jcmp_0":"answer = 2\nassert answer == 2","jcmp_1":"answer = 2\nassert answer == 2","jcmp_2":"answer = 2\nassert answer == 2","jcmp_3":"answer = 2\nassert answer == 2","jcmp_4":"answer = 2\nassert answer == 2","jcmp_5":"answer = 2\nassert answer == 2","jchain_0":"answer = 2\nassert answer == 2","jchain_1":"answer = 2\nassert answer == 2","jchain_2":"answer = 2\nassert answer == 2","jchain_3":"answer = 2\nassert answer == 2","jchain_4":"answer = 2\nassert answer == 2","jchain_5":"answer = 2\nassert answer == 2","jloss_0":"answer = 2\nassert answer == 2","jloss_1":"answer = 2\nassert answer == 2","jloss_2":"answer = 2\nassert answer == 2","jloss_3":"answer = 2\nassert answer == 2","jloss_4":"answer = 2\nassert answer == 2","jloss_5":"answer = 2\nassert answer == 2","jscn_0":"answer = 2\nassert answer == 2","jscn_1":"answer = 2\nassert answer == 2","jscn_2":"answer = 2\nassert answer == 2","jscn_3":"answer = 2\nassert answer == 2","jscn_4":"answer = 2\nassert answer == 2","jscn_5":"answer = 2\nassert answer == 2"}},"midMathCh10":{"chapter":"Chapter 10","title":"헤시안 행렬: 곡면이 휘어진 정도 읽기","description":"헤시안 행렬은 ‘지금 서 있는 땅이 앞으로 어떻게 휘어질지’를 숫자로 담은 표라고 생각하면 됩니다. 1번 미분은 ‘지금 어느 쪽이 내리막인지’ 알려주고, 2번 미분으로 만든 헤시안은 ‘앞으로 땅이 푹 꺼질지, 한쪽은 올라가고 한쪽은 내려가는(안장점)지’를 알려줍니다. 그래서 인공지능이 산을 내려가듯 정답을 찾을 때, 헤시안이 중요한 지도 역할을 합니다.","sectionTitle":"헤시안 행렬: 곡면이 휘어진 정도 읽기","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","problemSolving":"문제 풀이를 위한 설명"},"visualShort":"헤시안: 2계 편미분 → 곡률·극값 판별","visualIntroShort":"1번 미분은 ‘지금 어느 쪽이 내리막인지’ 알려주고, 2번 미분인 헤시안은 ‘앞으로 땅이 푹 꺼질지, 한쪽은 올라가고 한쪽은 내려갈지(안장점)’ 알려줍니다. 아래 애니메이션으로 흐름만 따라가 보세요.","visualWhyHessian":"헤시안은 함수를 두 번 미분해 만든 행렬이라서, 아래 그림에서 보이는 ‘휘어짐’이 바로 헤시안이 알려주는 내용입니다.","visualIntro":"입력은 함수 $f(\\mathbf{x})$와 점 $\\mathbf{x}$이고, 이 점에서 2계 편미분 $\\frac{\\partial^2 f}{\\partial x_i \\partial x_j}$들을 계산해 표에 채우면 그 표가 헤시안 $\\mathbf{H}$(대칭)입니다. 고유값이 모두 양수면 극소, 모두 음수면 극대, 양수와 음수가 섞이면 안장점입니다.","visualCaption":"왼쪽은 밥그릇처럼 아래로만 휘어져서 그곳이 최소이고, 오른쪽은 한 방향은 값이 올라가고 다른 방향은 내려가서 최소도 최대도 아닌 점(안장점)입니다.","visualStep1":"입력: 스칼라 함수 $f(\\mathbf{x})$, 점 $\\mathbf{x}$","visualStep2":"2계 편미분 $\\frac{\\partial^2 f}{\\partial x_i \\partial x_j}$ 계산","visualStep3":"헤시안 행렬 $\\mathbf{H}$ (대칭) 구성","visualStepsLabel":"보는 순서","whatIs":{"intro":"**헤시안 행렬이란?** 지금 서 있는 점에서, 모든 방향으로 땅이 얼마나 휘어져 있는지를 숫자로 적어 둔 표라고 보면 됩니다. 함수를 두 번 미분한 값들을 모아서 만든 정사각형 표(행렬)이고, 대각선을 기준으로 좌우가 같은 대칭 행렬이 됩니다.","plain":"눈을 감고 산을 내려간다고 생각해 보세요. 발로 느끼는 ‘이쪽이 더 내리막이다’가 1번 미분(기울기)입니다. 반대로 ‘한 발 더 내딛으면 땅이 푹 꺼질지, 평평할지’를 미리 아는 감각이 2번 미분, 즉 헤시안입니다. 이걸 알면 낭떠러지를 피하고, 밥그릇처럼 파인 진짜 바닥을 찾을 수 있습니다.","definition":"조금 더 정확히 말하면, 함수 $f$를 두 변수 방향으로 두 번 미분한 값 $\\frac{\\partial^2 f}{\\partial x_i \\partial x_j}$들을 표에 채운 것이 헤시안 $\\mathbf{H}$입니다. 이 표에서 나오는 **고유값**이 핵심입니다. 고유값이 모두 양수면 그 점은 밥그릇 바닥처럼 **극소점**이고, 모두 음수면 산꼭대기처럼 **극대점**입니다. 양수와 음수가 섞여 있으면 한 방향으로는 올라가고 다른 방향으로는 내려가는 **안장점**이 됩니다.","inAI":"인공지능 학습은 ‘에러가 가장 작은 골짜기’를 찾는 일입니다. 기울기만 보고 조금씩 내려가는 방법은 돌아가느라 느립니다. 헤시안으로 휘어짐을 알면, 바닥 쪽으로 크게 점프하는 **뉴턴법**을 쓸 수 있어서 훨씬 빨리 학습할 수 있습니다."},"whyImportant":{"fakeBottom":"내려가다 보면 기울기가 0인 평평한 곳을 만날 수 있습니다. 그렇다고 그곳이 반드시 진짜 바닥은 아닙니다. 잠깐 평평했다가 한쪽은 올라가고 한쪽은 내려가는 안장점 같은 곳일 수 있어요. 이때 헤시안의 고유값을 보면, 진짜 최소점인지 안장점(한 방향은 올라가고 다른 방향은 내려가는 점)인지 구별할 수 있습니다. 인공지능처럼 변수가 많을 때는 이런 가짜 바닥에 걸리지 않는 게 매우 중요합니다.","smartStep":"좁은 길은 보폭을 작게, 넓은 들판은 보폭을 크게 해야 빠르고 안전합니다. 헤시안은 ‘어느 방향이 얼마나 가파른지’를 알려주기 때문에, 학습할 때 보폭(학습률)을 스스로 잘 맞추어서 헛걸음 없이 효율적으로 내려갈 수 있게 해 줍니다."},"howUsed":{"newton":"뉴턴법은 다음 공식으로 한 번에 많이 움직이는 방법입니다: $\\mathbf{x}_{k+1} = \\mathbf{x}_k - \\mathbf{H}^{-1} \\nabla f(\\mathbf{x}_k)$. 여기서 $\\mathbf{x}_k$는 지금 위치(현재 점), $\\nabla f(\\mathbf{x}_k)$는 그 점에서의 기울기(그라디언트), $\\mathbf{H}$는 그 점에서의 헤시안 행렬이고 $\\mathbf{H}^{-1}$는 그 역행렬입니다. 즉 ‘지금 기울기와 땅이 휘어진 모양(헤시안)을 같이 보고, 바닥 쪽으로 크게 점프해서 $\\mathbf{x}_{k+1}$로 간다’는 뜻이에요. 조금씩만 내려가는 것보다 훨씬 빨리 정답 근처에 도달할 수 있습니다.","quasiNewton":"다만 변수가 많아지면 헤시안을 정확히 구하는 비용이 너무 커집니다. 그래서 실무에서는 헤시안을 완전히 계산하지 않고, 지금까지의 기울기 정보만으로 ‘대략 이런 모양이겠지’ 하고 추측해서 쓰는 **준뉴턴법**(BFGS 등)을 더 많이 사용합니다."},"summary":"정리하면, 헤시안은 함수를 두 번 미분해 만든 ‘휘어짐 지도’라고 보면 됩니다. 기울기가 0인 곳이 진짜 최소(밥그릇 바닥)인지, 최대(엎어놓은 그릇)인지, 안장점(한쪽은 올라가고 한쪽은 내려가는 점)인지 구별하게 해 주고, 인공지능이 가짜 정답에 걸리지 않으면서 보폭을 잘 맞춰 빠르게 정답을 찾도록 돕는 역할을 합니다.","problemSolving":{"focus":"아래 표에는 문제 풀이에 필요한 **수식과 기호 의미**만 정리했습니다. 표 밑 **풀이 예시**에서 실제 풀이 과정을 참고하세요.","examplesHeading":"풀이 예시","examplesTable":"$23"},"problemSolvingLabel":"문제 풀이를 위한 설명","problemSolvingTable":"$24","problemSolvingExample1":"**예시 (성분 개수)**\n\n$f(x_1,x_2)$의 헤시안은 $2\\times2$이므로 성분은 4개, 대칭이면 독립 성분은 3개입니다. → **정답 4**(총개수) 또는 **3**(독립, 문맥에 따라)","problemSolvingExample2":"**예시 (극값 판별)**\n\n고유값이 2와 5(둘 다 양수)이면 그 점은 극소점입니다. → **정답 1**(극소) 또는 문제에서 요구한 수","problemSolvingExample3":"**예시 (뉴턴법 한 스텝)**\n\n$f(x)=x^2$이면 $f'(x)=2x$, $f''(x)=2$. $x_0=4$에서 $x_1 = x_0 - f'(x_0)/f''(x_0) = 4 - 8/2 = 0$. → **정답 0**","visualConceptTitle":"개념 구조","visualConceptStep0":"입력: 스칼라 함수 $f(\\mathbf{x})$, 점 $\\mathbf{x}$","visualConceptStep1":"2계 편미분 $\\frac{\\partial^2 f}{\\partial x_i \\partial x_j}$ 계산","visualConceptStep2":"헤시안 행렬 $\\mathbf{H}$ (대칭) 구성","visualConceptStep3":"고유값·극값 해석: 모두 양수 → 극소, 모두 음수 → 극대, 혼합 → 안장","visualFlowTitle":"학습 흐름","visualFlowStep0":"개념: 2계 편미분 행렬","visualFlowStep1":"직관: 곡면의 휘어진 정도(곡률)","visualFlowStep2":"수학: $H_{ij}$, 대칭성, 고유값","visualFlowStep3":"적용: 뉴턴법, 극값 판별, 신뢰 영역","visualBowlTitle":"밥그릇: 아래로만 휘어짐 → 최소점","visualSaddleTitle":"안장점: 이쪽은 값↑ 올라가고, 저쪽은 값↓ 내려감","visualCurveDown":"↓ 휘어짐","visualFppMin":"f″=2 > 0 → 최소","visualMinPoint":"최소점","visualValueUp":"값↑","visualValueDown":"값↓","visualSaddleOrangeGreen":"주황 이쪽으로 가면 값 올라감 · 초록 이쪽으로 가면 값 내려감","visualSaddleNeither":"안장점: 최소도 최대도 아님","visualSummary1":"밥그릇 아래로만 휘어짐 → 여기가 최소","visualSummary2":"엎어놓은 그릇 위로만 휘어짐 → 여기가 최대 (밥그릇을 뒤집은 모양)","visualSummary3":"안장점 한 방향은 값이 올라가고 다른 방향은 값이 내려감 → 최소·최대 아님","problemPromptIntro":"문제를 읽고 헤시안/극값 관련 값을 입력하세요.","promptDefinition":"다음 설명이 **참**이면 보기 **1**, **거짓**이면 보기 **0**을 고르세요.","promptDefinitionChoice":"아래 (가)·(나)·(다) 중 옳은 것을 고르세요.","promptElementCount":"입력 변수가 {n}개인 스칼라 함수 $f$에 대해, 헤시안 행렬의 성분 개수(총 칸 수)는?","promptIndependentCount":"$$n={n}$변수 대칭 헤시안의 독립 성분 개수는?","promptMatrixSize":"$$n={n}$변수 함수의 헤시안 행렬의 행(또는 열)의 개수는?","promptEigenvalueType":"헤시안의 고유값이 $\\lambda_1={ev1}$, $\\lambda_2={ev2}$일 때, 정류점의 종류는?","promptNewton1D":"$$f(x)={a}x^2{bVal}x+{c}$에서 $x_0={x0}$일 때 뉴턴법 한 스텝 후 $x_1$의 값은?","promptScalarSecondDeriv":"$$f(x)={a}x^2+bx+c$에서 2계 도함수 $f''(x)$의 값은?","promptDefault":"아래 보기 중 정답을 고르세요.","mcDefChoice1":"(가)","mcDefChoice2":"(나)","mcDefChoice3":"(다)","mcDefChoice4":"(라) (가)~(다) 중 어느 것도 옳지 않다","mcEigenChoice1":"극소","mcEigenChoice2":"극대","mcEigenChoice3":"안장","mcEigenChoice4":"위 세 가지에 모두 해당하지 않는다","definitionStatements":{"0":"$$C^2$급 스칼라 함수의 헤시안 행렬은 대칭 행렬이다.","1":"정류점에서 헤시안의 고유값이 모두 양수이면 그 점은 국소 극소점이다.","2":"정류점에서 헤시안의 고유값이 모두 음수이면 그 점은 국소 극대점이다.","3":"헤시안의 $(i,j)$ 성분은 $\\partial^2 f/\\partial x_i\\partial x_j$로 정의된다.","4":"$$f$가 $C^2$이면 $\\partial^2 f/\\partial x_i\\partial x_j = \\partial^2 f/\\partial x_j\\partial x_i$이다.","5":"$$n$변수 스칼라 함수의 헤시안은 $n\\times n$ 크기의 정사각 행렬이다.","6":"헤시안이 양의 정부호이면 모든 고유값은 양수이다.","7":"헤시안이 음의 정부호이면 모든 고유값은 음수이다.","10":"헤시안의 고유값이 서로 다르면 정류점은 반드시 안장점이다.","11":"모든 스칼라 함수의 헤시안은 항상 단위행렬이다.","12":"1변수 함수 $f(x)$의 헤시안은 항상 $2\\times 2$ 행렬이다.","13":"고유값이 하나라도 0이면 정류점은 반드시 국소 극소점이다.","14":"헤시안이 영행렬이면 정류점은 반드시 국소 극값이다."},"definitionChoiceQuestions":{"0":"(가) $2$변수 함수의 헤시안 성분의 총 개수는 $4$이다.\n(나) $9$이다.\n(다) $6$이다.","1":"(가) $3$변수 대칭 헤시안의 독립 성분 개수는 $9$이다.\n(나) $6$이다.\n(다) $3$이다.","2":"(가) 국소 극소점\n(나) 국소 극대점\n(다) 안장점\n\n(참고) 고유값은 $\\lambda_1=2$, $\\lambda_2=-1$이다.","3":"(가) 국소 극소점\n(나) 국소 극대점\n(다) 안장점\n\n(참고) 고유값은 $\\lambda_1=3$, $\\lambda_2=5$이다.","4":"(가) 국소 극소점\n(나) 국소 극대점\n(다) 안장점\n\n(참고) 고유값은 $\\lambda_1=-2$, $\\lambda_2=-4$이다.","5":"(가) $f''(x)=2$\n(나) $f''(x)=0$\n(다) $f''(x)=1$\n\n(참고) $f(x)=x^2+1$이다.","6":"(가) 행(열)의 개수 $4$\n(나) $3$\n(다) $2$\n\n(참고) 헤시안이 $2\\times 2$일 때이다.","7":"(가) $9$\n(나) $3$\n(다) $6$\n\n(참고) 변수가 $3$개일 때 헤시안의 행 개수는?"}},"advMathChapters":{"advMath00":{"chapter":"Chapter 00","title":"고급 수학과 인공지능: 생성 모델이 쓰는 수학의 세계","description":"고급 수학과 AI: 생성형 모델·강화학습을 위한 다차원 공간 분석, 복잡 확률 분포, 딥러닝 심화 수학 커리큘럼 소개."},"advMath01":{"chapter":"Chapter 01","title":"특이값 분해와 유사역행렬: 데이터 속 숨은 축 찾기","description":"SVD·유사역행렬로 데이터 잠재 패턴 추출. 비정방 행렬 역행렬, PCA·추천 시스템 기초. 고급 수학 Ch.01."},"advMath02":{"chapter":"Chapter 02","title":"텐서 대수와 아인슈타인 표기법: 신경망 수식을 짧게 쓰기","description":"텐서 대수, Einsum·축약 연산. 신경망 가중치·어텐션 메커니즘 수식 표현. 고급 수학 Ch.02."},"advMath03":{"chapter":"Chapter 03","title":"라그랑주 승수법과 KKT: 제약이 있을 때 최적점 찾기","description":"라그랑주 승수법·KKT 조건으로 제약 최적화. SVM·제한적 강화학습 수학적 기초. 고급 수학 Ch.03."},"advMath04":{"chapter":"Chapter 04","title":"마르코프 체인: 다음 상태는 지금 상태만 보면 된다","description":"마르코프 체인, 상태 전이 행렬, 정상 분포·수렴성. MCMC·강화학습 기초. 고급 수학 Ch.04."},"advMath05":{"chapter":"Chapter 05","title":"몬테카를로 적분: 무작위로 뽑아서 값 맞추기","description":"몬테카를로 적분으로 고차원 기댓값·확률 근사. 강화학습·베이지안 추론에 활용. 고급 수학 Ch.05."},"advMath06":{"chapter":"Chapter 06","title":"MCMC: 복잡한 분포에서 표본 뽑기","description":"MCMC, 깁스·메트로폴리스-헤이스팅스. 복잡 사후분포 샘플링. 고급 수학 Ch.06."},"advMath07":{"chapter":"Chapter 07","title":"EM 알고리즘: 숨은 변수와 번갈아 추정하기","description":"EM 알고리즘: E-step·M-step, 잠재 변수 모델 최대가능도 추정. GMM·HMM 기초. 고급 수학 Ch.07."},"advMath08":{"chapter":"Chapter 08","title":"MAP 추정: 사전 믿음과 데이터의 절충","description":"MAP 추정, 사전확률·L1·L2 정규화 수학적 근거. 베이지안 딥러닝 기초. 고급 수학 Ch.08."},"advMath09":{"chapter":"Chapter 09","title":"켤레 사전 확률: 손으로 풀 수 있는 베이즈","description":"켤레 사전확률로 사후분포 해석적 계산. 베이즈 정리·베타·디리클레 분포. 고급 수학 Ch.09."},"advMath10":{"chapter":"Chapter 10","title":"JS 발산과 상호 정보량: 분포 거리와 정보 공유","description":"JS 발산·상호정보량. 분포 거리·정보 공유 정량화. GAN·정보 이론. 고급 수학 Ch.10."},"advMath11":{"chapter":"Chapter 11","title":"변분 추론: 다루기 힘든 확률을 쉽게 근사하기","description":"변분 추론, KL 발산 최소화·근사 사후. VAE·생성 모델 핵심. 고급 수학 Ch.11."},"advMath12":{"chapter":"Chapter 12","title":"재매개변수화 트릭: 샘플링에도 미분을 붙이기","description":"재매개변수화 트릭으로 샘플링 연산 미분 가능하게. VAE 학습·경사 추정. 고급 수학 Ch.12."},"advMath13":{"chapter":"Chapter 13","title":"바서슈타인 거리: 분포를 옮기는 비용으로 재기","description":"바서슈타인 거리·Earth Mover. 분포 겹침 없을 때도 유한 거리·WGAN. 고급 수학 Ch.13."},"advMath14":{"chapter":"Chapter 14","title":"MDP와 벨만 방정식: 강화학습의 수학적 뼈대","description":"MDP·벨만 방정식. 상태·행동·보상·가치 함수. 강화학습 수학 기초. 고급 수학 Ch.14."},"advMath15":{"chapter":"Chapter 15","title":"푸리에 변환: 신호를 주파수로 쪼개 보기","description":"푸리에 변환·주파수 영역 분석. 시계열·이미지 신호 처리, CNN·Attention. 고급 수학 Ch.15."},"advMath16":{"chapter":"Chapter 16","title":"그래프 라플라시안: 네트워크를 행렬로 쓰기","description":"그래프 라플라시안·인접·차수 행렬. GNN·정보 확산·스무스니스. 고급 수학 Ch.16."},"advMath17":{"chapter":"Chapter 17","title":"확률미분방정식(SDE): 노이즈를 계속 섞어 넣기","description":"SDE·브라운 운동. 확산 모델 전진 과정·노이즈 스케줄 수식화. 고급 수학 Ch.17."},"advMath18":{"chapter":"Chapter 18","title":"랑주뱅 동역학과 스코어 매칭: 노이즈에서 데이터 복원하기","description":"랑주뱅 동역학·스코어 매칭. 확산 모델 역과정·데이터 복원. 고급 수학 Ch.18."},"advMath19":{"chapter":"Chapter 19","title":"정보 기하학과 자연 기울기: 거리 개념을 바꾼 최적화","description":"정보 기하학·피셔 정보 행렬·자연 기울기. 리만 다양체 위 최적화. 고급 수학 Ch.19."},"advMath20":{"chapter":"Chapter 20","title":"고급 수학 총정리: 생성·최적화 수학 한눈에","description":"VAE·GAN·Diffusion·LLM에서 SDE·변분추론·최적운송·정보기하학이 쓰이는 방식 총정리. 고급 수학 Ch.20."}},"midDlChapters":{"midDl00":{"chapter":"Chapter 00","title":"중급 딥러닝: 학습을 안정시키고, 이미지·텍스트를 다루기"},"midDl01":{"chapter":"Chapter 01","title":"가중치 초기화: 좋은 출발이 반이다"},"midDl02":{"chapter":"Chapter 02","title":"최적화 알고리즘: 속도와 방향을 똑똑하게 조절하기"},"midDl03":{"chapter":"Chapter 03","title":"학습률 스케줄링: 때에 따라 속도 줄이기"},"midDl04":{"chapter":"Chapter 04","title":"손실 함수 심화: 불균형 데이터와 거리로 배우기"},"midDl05":{"chapter":"Chapter 05","title":"과적합 방지와 정규화: 외우지 않고 이해하게 하기"},"midDl06":{"chapter":"Chapter 06","title":"정규화 층: 층마다 스케일을 맞추는 법"},"midDl07":{"chapter":"Chapter 07","title":"데이터 증강과 노이즈 강건성: 적은 데이터로 더 잘 배우기"},"midDl08":{"chapter":"Chapter 08","title":"합성곱 신경망 기초: 이미지에서 패턴 찾기"},"midDl09":{"chapter":"Chapter 09","title":"풀링과 다중 채널: 요약하고 색을 나누기"},"midDl10":{"chapter":"Chapter 10","title":"잔차 연결과 ResNet: 깊게 쌓아도 잊지 않기"},"midDl11":{"chapter":"Chapter 11","title":"경량화 합성곱: 가볍고 빠르게"},"midDl12":{"chapter":"Chapter 12","title":"비전 전이 학습: 남이 배운 걸 가져오기"},"midDl13":{"chapter":"Chapter 13","title":"비전 태스크 1: 사진 속에서 무엇이 어디 있는지 찾기"},"midDl14":{"chapter":"Chapter 14","title":"비전 태스크 2: 픽셀마다 경계 그리기"},"midDl15":{"chapter":"Chapter 15","title":"자연어 전처리와 토큰화: 문장을 모델이 먹을 수 있게"},"midDl16":{"chapter":"Chapter 16","title":"단어 임베딩: 단어를 벡터로 표현하기"},"midDl17":{"chapter":"Chapter 17","title":"1D 합성곱: 시퀀스 데이터에서 패턴 잡기"},"midDl18":{"chapter":"Chapter 18","title":"순환 신경망: 이전을 기억하는 층"},"midDl19":{"chapter":"Chapter 19","title":"LSTM과 GRU: 먼 과거까지 기억하기"},"midDl20":{"chapter":"Chapter 20","title":"인코더-디코더와 어텐션: 중요한 부분에 집중하기"},"midDl21":{"chapter":"Chapter 21","title":"중급 딥러닝 총정리: 지금까지의 딥러닝 한눈에"}},"midDlCh00":{"description":"중급 딥러닝에서 무엇을 배우는지, Ch01~Ch21에서 다룰 학습 안정화와 이미지·텍스트 다루기를 한눈에 알아봅니다.","roadmapTitle":"챕터별 중급 딥러닝 도식화","roadmapDescription":"챕터를 하나씩 진행할 때마다 아래 도식이 조금씩 채워져요. 지금까지의 구조예요.","roadmapListHeading":"Ch01~Ch21에서 배우는 것","sectionTitle":"중급 딥러닝이란?","paragraphs":{"0":"**기초 딥러닝**에서는 뉴런, 층, 기울기까지 배웠다면, **중급 딥러닝**에서는 **학습을 안정시키는 방법**과 **이미지·텍스트**처럼 구조가 있는 데이터를 다루는 방법을 배웁니다. **가중치 초기화**, **옵티마이저**(모멘텀, Adam), **학습률 스케줄**, **정규화·과적합 방지**, **배치 정규화** 등을 통해 학습이 잘 수렴하도록 만들고, **합성곱 신경망(CNN)**, **ResNet**, **전이 학습**, **객체 검출·세그멘테이션**, **자연어 전처리·임베딩**, **RNN·LSTM·GRU**, **인코더-디코더·어텐션**까지 이어집니다.","1":"**이미지**는 픽셀 격자이기 때문에 **합성곱**으로 공간 패턴을 잡고, **풀링**으로 요약하며, **잔차 연결**로 깊은 네트워크도 안정적으로 학습합니다. **텍스트**는 시퀀스이기 때문에 **토큰화·임베딩** 후 **1D 합성곱**이나 **RNN·LSTM**으로 문맥을 반영하고, **어텐션**으로 중요한 부분에 집중하는 구조를 배우게 됩니다.","2":"**학습이 안정적이어야 하는 이유**는 간단합니다. 가중치를 나쁘게 고르면 학습이 거의 진행되지 않거나, 학습률이 너무 크면 발산하고, 너무 작으면 너무 느립니다. **옵티마이저**는 기울기만 보지 않고 '지금까지의 움직임(모멘텀)'이나 '변수마다 다른 보폭(Adam)'을 써서 더 빠르고 안정적으로 최적점에 가까워지게 합니다. **학습률 스케줄**은 처음에는 크게 움직이다가 나중에 작게 조정해 정확히 수렴하게 하고, **정규화**와 **배치 정규화**는 층마다 값의 스케일을 맞춰 기울기 소실·폭발을 줄입니다.","3":"**비전(이미지)**에서는 픽셀 주변의 **국소 패턴**(모서리, 텍스처)이 중요하므로 **합성곱**이 적합합니다. **풀링**으로 위치를 조금 흐리게 하면서 정보를 압축하고, **ResNet**의 잔차 연결은 층을 아무리 깊게 쌓아도 이전 정보를 그대로 더해 줘서 학습이 깨지지 않게 합니다. **전이 학습**은 이미 대량의 데이터로 학습된 모델을 가져와 우리 태스크에 맞게 살짝만 다시 학습시키는 방식이라, 데이터가 적어도 실용적인 성능을 내는 데 유리합니다.","4":"**자연어·시퀀스**에서는 단어나 문자를 **토큰**으로 나누고 **임베딩**으로 벡터로 바른 뒤, **RNN**이나 **LSTM·GRU**로 '이전까지의 문맥'을 담은 상태를 넘기며 다음 단어를 예측합니다. **어텐션**은 '지금 예측할 때 문장의 어떤 부분이 중요한지'를 학습해, 번역·요약·질의응답 같은 태스크에서 핵심만 골라 쓰게 해 줍니다. 이 코스를 마치면 이미지 분류·검출·세그멘테이션, 그리고 텍스트 생성·번역·요약의 기본 구조를 이해할 수 있습니다.","5":"이 코스에서는 Ch01~Ch07까지 **학습 안정화**(초기화, 최적화, 스케줄, 손실, 정규화, 정규화 층, 데이터 증강), Ch08~Ch14까지 **비전**(CNN, 풀링, ResNet, 경량 합성곱, 전이 학습, 검출·세그멘테이션), Ch15~Ch21까지 **자연어·시퀀스**(전처리, 임베딩, 1D CNN, RNN, LSTM·GRU, 인코더-디코더·어텐션, 총정리) 순으로 한 걸음씩 다룹니다."}},"midDlCh01":{"chapter":"Chapter 01","title":"가중치 초기화: 좋은 출발이 반이다","description":"**가중치 초기화(Weight Initialization)**는 딥러닝 모델이 학습이라는 마라톤을 시작하기 전에, 출발선을 어디에 둘지 정하는 첫 단추입니다. 출발선을 잘못 잡으면 학습이 제대로 되지 않습니다. 가중치가 너무 작게 설정되면 역전파 과정에서 기울기가 점점 0에 가까워져 앞쪽 층이 거의 갱신되지 않는 **기울기 소실**이 생기고, 반대로 너무 크게 두면 기울기가 폭발하듯 커지는 **기울기 폭발**이 일어납니다. 이 챕터에서는 이런 문제를 줄이기 위해 널리 쓰이는 **Xavier 초기화**와 **He 초기화**를 쉽고 자세히 알아봅니다.","sectionTitle":"가중치 초기화: 좋은 출발이 반이다","whatIs":{"0":"**가중치 초기화란?**\n\n딥러닝에서 각 층의 뉴런들은 **가중치($W$)**와 **편향($b$)**이라는 숫자들로 서로 연결되어 있습니다. 학습이 시작되기 전에는 이 값들이 비어 있는 상태이므로, 맨 처음에 어떤 숫자로 채울지 정해 주어야 합니다. 이렇게 학습 0일 차에 가중치와 편향을 처음부터 정해 두는 과정을 **가중치 초기화**라고 부릅니다. 비유하자면, 오케스트라에 악보를 나눠 준 뒤 \"어느 크기로 연주할지\" 볼륨을 정하는 것과 같습니다. 볼륨이 너무 작으면 소리가 잘 안 들리고, 너무 크면 음이 깨져서 엉망이 됩니다. 가중치 초기화도 마찬가지로, 적당한 크기로 출발하는 것이 중요합니다.","1":"**수학적으로 보면**\n\n한 층에서 이루어지는 계산은 $z=W\\mathbf{x}+b$라는 식으로 나타낼 수 있습니다. 여기서 **$z$**는 활성화 함수를 거치기 전의 \"원시 출력\", **$W$**는 입력이 출력에 얼마나 반영될지 정하는 가중치 행렬(초기화할 때 이 크기를 조절합니다), **$\\mathbf{x}$**는 이 층에 들어오는 입력, **$b$**는 편향(보통 0으로 둡니다)입니다. 만약 가중치 $W$를 모두 0으로 두면 어떻게 될까요? 그러면 같은 층 안의 모든 뉴런이 똑같은 출력을 내게 됩니다. 이 상태를 \"대칭성이 깨지지 않았다\"고 말합니다. 이렇게 되면 역전파 때 기울기가 골고루 나뉘지 않아서, 결국 학습이 제대로 이루어지지 않습니다. 그래서 우리는 가중치를 **작은 무작위 숫자(난수)**로 채우고, 그 난수들이 퍼져 나가는 크기(분산)를 층의 구조에 맞게 조절합니다.","2":"**실전에서의 의미**\n\n초기화를 대충 하면 실무에서 곧바로 문제가 나타납니다. 스팸 메일 분류기나 의료 영상 판독 모델처럼 실제로 쓰이는 시스템에서도, 초기화가 나쁘면 정답률이 잘 오르지 않거나 학습 중에 **NaN**(Not a Number)이 발생해 프로그램이 멈추는 일이 생깁니다. 특히 층이 많을수록 가중치가 여러 번 곱해지기 때문에, 나쁜 초기화의 영향이 더 크게 드러납니다. 그래서 실무에서는 **Xavier 초기화**, **He 초기화**처럼 층의 크기(입력·출력 뉴런 수)에 맞춰 분산을 정한 규칙을 사용합니다. PyTorch나 TensorFlow 같은 프레임워크에는 이런 방식들이 기본으로 잘 세팅되어 있어서, 원리만 알아 두면 학습이 잘 안 될 때 원인을 파악하는 데 큰 도움이 됩니다."},"whyImportant":{"0":"**기울기 소실과 폭발 방지**\n\n딥러닝에서는 손실 함수의 오차를 **역전파**라는 과정으로 뒤쪽 층에서 앞쪽 층까지 전달하면서 가중치를 조금씩 수정합니다. 이때 연쇄 법칙에 따라 기울기가 층을 지날 때마다 가중치와 곱해지기 때문에, 가중치의 크기가 조금만 어긋나도 결과가 크게 달라집니다. 가중치가 **너무 작게** 설정되어 있으면, 기울기가 층을 지날수록 계속 작은 수와 곱해져 0에 가까워집니다. 그러면 앞쪽에 있는 층들은 기울기를 거의 받지 못해 학습이 멈춘 것처럼 보입니다. 이를 **기울기 소실(Vanishing Gradient)**이라고 합니다. 반대로 가중치가 **너무 크면** 기울기가 층을 지날 때마다 커져서 숫자가 폭발하는 **기울기 폭발(Exploding Gradient)**이 일어납니다. 좋은 초기화는 층을 지나갈 때 활성화나 기울기의 **분산**이 지나치게 커지거나 작아지지 않도록 맞춰 주는 역할을 합니다.","1":"**빠르고 안정적인 학습(수렴)**\n\n학습을 산에서 계곡(최적점)을 찾아 내려가는 과정에 비유할 수 있습니다. 이때 초기화는 \"헬기로 어디에 내려앉을지\" 정하는 것과 같습니다. 나쁜 위치에 내려앉으면 골짜기를 오래 헤매야 하고, 좋은 위치에서 출발하면 빠르고 안전하게 목표 지점에 도달할 수 있습니다. 올바른 초기화를 하면 기울기 소실과 폭발이 줄어들 뿐 아니라, **학습 속도** 자체가 빨라지고 수렴이 안정적으로 이루어지는 효과를 얻을 수 있습니다."},"howUsed":{"0":"**① Xavier (Glorot) 초기화**\n\nXavier 초기화는 이전 층의 노드 수(**$n_{in}$**, 입력 쪽 연결 개수)와 다음 층의 노드 수(**$n_{out}$**, 출력 쪽 연결 개수)를 **둘 다** 고려해서 가중치를 뽑을 때의 분산(스케일)을 정하는 방법입니다. 수식으로는 분산을 $\\sigma^2=\\frac{2}{n_{in}+n_{out}}$으로 두는데, $n_{in}+n_{out}$이 커질수록 분모가 커져 분산이 작아지므로 노드가 많은 층일수록 가중치를 더 작게 뽑아 값이 넘치지 않게 됩니다. 직관적으로 말하면, 노드가 많은 층일수록 더 많은 수가 더해지기 때문에 값이 넘치지 않도록 분산을 작게 잡아 주는 것입니다. Xavier 초기화는 **tanh**나 **시그모이드(Sigmoid)**처럼 출력이 대략 -1에서 1 근처로 모이는 대칭적인 활성화 함수와 잘 맞습니다. 이런 활성화들은 층을 지날 때 분산이 유지되도록 수학적으로 맞춰져 있어서, Xavier와 짝을 이루어 널리 쓰입니다.","1":"**② He 초기화**\n\nHe 초기화는 **ReLU** 활성화 함수에 맞춘 초기화 방식입니다. ReLU는 입력이 양수면 그대로 두고, 음수면 0으로 만들어 버리기 때문에, 평균적으로 보면 출력이 입력보다 약 절반 정도로 줄어드는 효과가 있습니다. He 초기화는 이 \"줄어든 절반\"을 보상하기 위해 분산을 $\\sigma^2=\\frac{2}{n_{in}}$으로 둡니다. 여기서는 $n_{in}$만 쓰고 $n_{out}$은 쓰지 않습니다. 직관적으로는 Xavier에서 쓰는 분산보다 2배 느낌으로 키워서, ReLU가 잘라 버린 절반만큼을 다시 채워 주는 것이라고 생각하면 됩니다.","2":"**③ 실무에서 어떻게 선택할까?**\n\n실무에서는 사용하는 활성화 함수에 따라 초기화를 골라 쓰면 됩니다. **ReLU**나 Leaky ReLU 같은 **ReLU 계열**을 쓰는 층이라면 **He 초기화**를 쓰는 것이 일반적입니다. 반대로 **tanh**나 **시그모이드**를 쓰는 층이라면 **Xavier 초기화**가 잘 맞습니다. PyTorch나 TensorFlow에서는 Linear(완전연결) 층을 만들 때 활성화에 맞춰 위 두 방식 중 하나가 기본으로 적용되어 있는 경우가 많습니다. 원리를 알아 두면 학습이 잘 되지 않을 때 초기화부터 점검하는 데 도움이 됩니다."},"problemSolving":{"0":"가중치 초기화는 학습이 시작되기 전에 각 층의 가중치($W$)와 편향($b$)을 어떤 값으로 설정할지 정하는 단계입니다. 0으로 두면 대칭성 때문에 학습이 제대로 되지 않으므로, 보통 **작은 무작위 숫자(난수)**로 채우되, 그 난수들이 퍼지는 크기인 **분산(스케일)**을 층에 맞게 조절합니다. **Xavier 초기화**는 분산을 $\\sigma^2 = 2/(n_{in}+n_{out})$으로 두어 tanh·시그모이드 같은 활성화와 잘 맞추고, **He 초기화**는 $\\sigma^2 = 2/n_{in}$으로 두어 ReLU 계열에 맞춥니다. 좋은 초기화를 하면 기울기 소실과 기울기 폭발이 줄어들고 수렴 속도와 안정성이 좋아집니다. Xavier 식의 $n_{in}$, $n_{out}$은 각각 입력·출력 쪽 연결 개수이고, He 식 $2/n_{in}$은 ReLU가 출력을 약 절반으로 줄이므로 그만큼 분산을 키워 보정한 것입니다.","2":"**예시 (정의)**\n\n\"가중치 초기화의 주된 목적은? ① 학습 전 층의 스케일을 적절히 맞추기 ② 학습률을 키우기 ③ 데이터 증강\"\n\n가중치 초기화는 층을 지날 때 활성화·기울기의 스케일이 유지되도록 하는 것이 목적이다. → **정답 1**\n\n---\n\n**예시 (Xavier vs He)**\n\n\"ReLU를 쓰는 층에서 흔히 쓰는 초기화는? ① Xavier ② He ③ 0\"\n\nReLU 계열에서는 He 초기화를 쓴다. → **정답 2**\n\n---\n\n**예시 (계산)**\n\n$n_{in}+n_{out}=6$일 때 균일 Xavier 비 $6/(n_{in}+n_{out})$의 값(정수)은?\n\n$6/6=1$. → **정답 1**","3":"**정의 예시** — \"가중치 초기화의 주된 목적은? ① 학습 전 층의 스케일 맞추기 ② 학습률 키우기 ③ 데이터 증강\" → 목적은 층을 지날 때 스케일이 유지되게 하는 것. **정답 1**\n\n**참/거짓 예시** — \"가중치 초기화는 학습 전에 $W$, $b$를 정하는 과정이다.\" → 맞음. **정답 1**\n\n**응용 예시** — \"스팸 분류 모델에서 손실이 거의 줄지 않을 때 먼저 의심하는 것은? ① 초기화·학습률 ② 데이터 개수만 ③ 배치 크기만\" → 초기화·학습률 점검이 우선. **정답 1**\n\n**선택 예시** — \"He 초기화에서 $\\sigma^2$는? ① $2/n_{in}$ ② $2/(n_{in}+n_{out})$ ③ $1/n_{in}$\" → He는 $\\sigma^2=2/n_{in}$. **정답 1**\n\n**개념 예시** — \"Xavier에서 $n_{in}+n_{out}=6$이면 $6/(n_{in}+n_{out})$의 값(정수)은? ① 1 ② 2 ③ 3\" → $6/6=1$. **정답 1**\n\n**계산 예시** — \"$n_{in}+n_{out}=6$일 때 $6/(n_{in}+n_{out})$의 값(정수)은?\" → $6/6=1$. **정답 1**"},"summary":"가중치 초기화는 학습을 시작하기 전에 각 층의 가중치($W$)와 편향($b$)을 어떤 값으로 둘지 정하는 과정입니다. 가중치를 모두 0으로 두면 같은 층의 뉴런들이 같은 출력을 내어 대칭성이 깨지지 않고, 역전파 시 기울기가 골고루 나뉘지 않아 학습이 제대로 이루어지지 않습니다. 반대로 무작위로 뽑되 크기를 너무 크게 또는 너무 작게 두면 기울기 폭발이나 기울기 소실이 생깁니다. 그래서 **Xavier 초기화**와 **He 초기화**처럼 층의 크기(입력·출력 노드 수)에 맞춰 분산을 조절한 방법이 널리 쓰입니다. Xavier는 tanh·시그모이드 같은 활성화에, He는 ReLU 계열에 적합합니다. 이렇게 적절한 초기화를 하면 기울기 소실과 폭발을 줄이고, 수렴을 더 빠르고 안정적으로 만들 수 있습니다.","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","summary":"요약"},"formulaGuide":{"title":"수식 쉽게 이해하기","linear":"**수식 $z = W\\mathbf{x}+b$ (한 층의 선형 합)**\n\n이 수식은 한 층에서 들어온 입력을 가중치와 편향으로 처리한 뒤, 활성화 함수를 거치기 전의 값을 나타냅니다. **$z$**는 그 \"원시 출력\"으로, 뉴런이 여러 개면 각각 하나씩 있어 벡터가 됩니다. **$W$ (가중치)**는 입력 $\\mathbf{x}$의 각 성분이 출력에 얼마나 반영될지 정하는 행렬입니다. $W$가 크면 입력이 그대로 크게 전달되고, 작으면 작게 전달되기 때문에, 초기화할 때 $W$의 **분산**을 적당히 잡는 것이 중요합니다. **$\\mathbf{x}$**는 이 층에 들어오는 입력으로, 아래 층의 출력이거나 데이터의 특징입니다. **$b$ (편향)**는 기준선을 어디에 둘지 정하는 상수이며, 보통 0으로 초기화합니다. 쉬운 비유로는, 입력 $\\mathbf{x}$에 요금표 $W$를 곱해 합산하고 기본료 $b$를 더한 값이라고 보면 됩니다. $W$가 너무 크면 금액이 폭발하고, 너무 작으면 0에 가까워집니다.","xavierVariance":"**Xavier 분산 $\\sigma^2 = \\frac{2}{n_{in}+n_{out}}$**\n\nXavier 초기화에서는 가중치를 뽑을 **정규 분포의 분산**을 위 식으로 정합니다. **$\\sigma^2$**가 크면 가중치 값들이 평균 0 주변에서 더 넓게 퍼져 \"크기가 큰\" 가중치가 나올 가능성이 높아집니다. **$n_{in}$**은 이 층 **입력 쪽**의 연결 개수(입력 차원), **$n_{out}$**은 **출력 쪽**의 연결 개수(뉴런 수)입니다. 들어오는 문과 나가는 문의 개수라고 생각하면 됩니다. **$n_{in}+n_{out}$**이 커질수록 분모가 커지므로 $\\sigma^2$는 **작아집니다**. 즉, 노드가 많은 층일수록 가중치를 더 작게 뽑아서 여러 개가 더해져도 값이 넘치지 않게 합니다. 분자 **2**는 수학적으로 입력과 출력에서 분산이 유지되도록 유도했을 때 나오는 상수로, tanh·시그모이드 같은 대칭 활성화에 맞춘 값입니다. 연주자가 많을수록 각자 볼륨을 낮춰야 소리가 넘치지 않듯, 층이 넓을수록 가중치 크기를 줄이는 것과 같습니다.","heVariance":"**He 분산 $\\sigma^2 = \\frac{2}{n_{in}}$**\n\nHe 초기화에서는 가중치를 뽑을 **정규 분포의 분산**을 $\\sigma^2 = 2/n_{in}$으로 둡니다. Xavier와 달리 **$n_{in}$**(입력 연결 개수)만 쓰고 $n_{out}$은 넣지 않습니다. ReLU는 음수를 0으로 만들어 버리기 때문에, 평균적으로 출력이 약 절반으로 줄어듭니다. 그래서 분산이 반으로 줄어드는 것을 **2배로 키워서 보상**하려고 분자에 2를 둡니다. \"사라진 절반을 만회하기 위해 2를 곱한다\"고 이해하면 됩니다. Xavier는 $n_{in}$과 $n_{out}$ 둘 다 쓰고, He는 입력 쪽만 씁니다. ReLU는 출력이 잘려 나가므로 나가는 쪽을 별도로 맞출 필요가 있고, 그 결과 수식이 $2/n_{in}$ 형태로 단순해집니다. ReLU가 신호를 절반으로 줄이므로, 가중치를 조금 더 크게 뽑아서 층을 지난 뒤에도 크기가 유지되게 하는 것입니다.","xavierUniform":"**Xavier 균일 분포 $[-a,\\ a]$, $a = \\sqrt{\\frac{6}{n_{in}+n_{out}}}$**\n\nXavier 초기화는 가중치를 **정규 분포**로 뽑을 수도 있고 **균일 분포**로 뽑을 수도 있습니다. 균일 분포를 쓸 때는 \"$-a$부터 $a$까지 구간에서 동일한 확률로 숫자를 하나 뽑는다\"고 합니다. **$a$**는 이 구간의 \"반폭\"으로, $a$가 크면 가중치가 $-a$에서 $a$ 사이에서 더 넓게 퍼질 수 있습니다. **$a = \\sqrt{6/(n_{in}+n_{out})}$**는 정규 분포에서 쓰는 분산 $\\sigma^2 = 2/(n_{in}+n_{out})$과 \"분산이 맞도록\" 균일 분포를 잡으면 유도됩니다. 6은 균일 분포의 분산 공식에서 나오는 상수입니다. 문제에서 $n_{in}+n_{out}$이 주어지면 $6/(n_{in}+n_{out})$을 먼저 계산할 수 있고, 가능한 경우 정수로 떨어지게 (예: $n_{in}+n_{out}=6$이면 $6/6=1$) 두는 것이 좋습니다. -a에서 +a까지 공평하게 번호를 뽑는다고 할 때, $a$를 층 크기에 맞춰 정해 두면 층을 지나도 값이 너무 커지거나 작아지지 않게 됩니다."},"visual":"가중치 초기화가 기울기 흐름에 미치는 영향을 보여주는 시각화입니다.","problemSolvingLabel":"문제 풀이를 위한 설명","practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"아래는 **60문제 은행**에서 무작위로 뽑은 **10문제**입니다(기초 수학 챕터와 같이 쉬움 4·중간 3·어려움 3, 제시 순서는 쉬움→중간→어려움). 보기 버튼으로 답을 고르세요.","practiceProblemsInstruction":"문제를 읽고 보기에서 정답을 고르세요.","midDlCh01VisualIntro":"가중치 초기화는 학습의 첫 단계로, 층마다 $W$와 $b$를 적절한 스케일로 두어 순전파·역전파 시 분산이 유지되게 합니다.","midDlCh01VisualStep0":"① 초기화: 각 층의 $W$, $b$를 (Xavier/He 등) 규칙에 따라 설정","midDlCh01VisualStep1":"② 순전파: 입력 → 선형 합 $z$ → 활성화 $a$ → 다음 층","midDlCh01VisualStep2":"③ 손실 계산 후 역전파: 기울기가 층을 따라 전달","midDlCh01VisualStep3":"④ 갱신: 기울기에 따라 $W$, $b$ 업데이트. 좋은 초기화면 기울기 크기가 적당히 유지됨","midDlCh01VisualConceptTitle":"개념 구조: 초기화 → 순전파 → 손실 → 역전파 → 갱신","midDlCh01VisualFlowTitle":"학습 흐름: 층별로 입력·가중치·출력 스케일이 맞도록 초기화","midDlCh01VisualModelTitle":"모델 작동: 한 층에서 $z=Wx+b$의 분산이 입력 분산과 비슷하게 유지되도록 $W$의 분산을 정함","midDlCh01VisualScaleTitle":"초기화 스케일의 영향","midDlCh01VisualScaleSmall":"W 너무 작음 → 기울기 소실","midDlCh01VisualScaleLarge":"W 너무 큼 → 기울기 폭발","midDlCh01VisualScaleGood":"적당한 W → 분산 유지","midDlCh01VisualSegInput":"입력","midDlCh01VisualSegLayer1":"층1","midDlCh01VisualSegLayer2":"층2","midDlCh01VisualSegLayer3":"층3","midDlCh01VisualSegOutput":"출력","midDlCh01VisualRowLabelVanishing":"소실","midDlCh01VisualRowLabelStable":"유지","midDlCh01VisualRowLabelExploding":"폭발","midDlCh01VisualScaleCaption":"층을 지날 때 **분산이 유지**되도록 W, b 스케일을 정하는 것이 좋은 초기화입니다.","midDlCh01VisualBannerShort":"좋은 출발이 반이다","midDlCh01VisualBannerSub":"적당한 초기화 → 빠른 수렴 · 안정 학습","problems":{"definition_0":"가중치 초기화의 주된 목적은? ① 학습 전 층의 스케일 맞추기 ② 학습률 키우기 ③ 데이터 증강","definition_1":"학습 시작 전에 각 층의 $W$, $b$를 정하는 과정은? ① 가중치 초기화 ② 경사 하강 ③ 정규화","definition_2":"ReLU 계열 활성화에서 흔히 쓰는 초기화는? ① Xavier ② He ③ 0 초기화","definition_3":"tanh·시그모이드에서 흔히 쓰는 초기화는? ① Xavier ② He ③ 0 초기화","definition_4":"기울기가 0에 가까워져 앞쪽 층이 거의 갱신되지 않는 현상은? ① 기울기 소실 ② 기울기 폭발 ③ 과적합","definition_5":"가중치가 너무 클 때 기울기가 폭발하는 현상은? ① 기울기 소실 ② 기울기 폭발 ③ 언더피팅","definition_6":"Xavier 초기화에서 분산은 $n_{in}$, $n_{out}$으로 어떻게 정하는가? ① $2/(n_{in}+n_{out})$ ② $2/n_{in}$ ③ $1/n_{in}$","definition_7":"He 초기화에서 분산은? ① $2/(n_{in}+n_{out})$ ② $2/n_{in}$ ③ $1/(n_{in}+n_{out})$","definition_8":"가중치를 모두 0으로 두면 안 되는 주된 이유는? ① 대칭성 때문에 뉴런들이 같은 출력을 내어 학습이 제대로 안 됨 ② 계산이 느림 ③ 메모리 부족","definition_9":"한 층의 선형 합 $z = W\\mathbf{x}+b$에서 $W$가 너무 작으면? ① 기울기 소실에 가깝게 됨 ② 기울기 폭발 ③ 영향 없음","trueFalse_0":"가중치 초기화는 학습 전에 $W$, $b$를 정하는 과정이다. 맞으면 1, 틀리면 0.","trueFalse_1":"Xavier 초기화는 ReLU에만 쓰인다. 맞으면 1, 틀리면 0.","trueFalse_2":"He 초기화는 ReLU 계열 활성화에 적합하다. 맞으면 1, 틀리면 0.","trueFalse_3":"좋은 초기화는 층을 지날 때 분산이 유지되게 한다. 맞으면 1, 틀리면 0.","trueFalse_4":"가중치를 모두 0으로 두는 것이 권장된다. 맞으면 1, 틀리면 0.","trueFalse_5":"기울기 소실은 가중치가 너무 클 때 생긴다. 맞으면 1, 틀리면 0.","trueFalse_6":"기울기 폭발은 가중치가 너무 클 때 생길 수 있다. 맞으면 1, 틀리면 0.","trueFalse_7":"초기화는 수렴 속도에 영향을 준다. 맞으면 1, 틀리면 0.","trueFalse_8":"Xavier에서 $\\sigma^2 = 2/(n_{in}+n_{out})$이다. 맞으면 1, 틀리면 0.","trueFalse_9":"He에서 $\\sigma^2 = 2/n_{in}$이다. 맞으면 1, 틀리면 0.","scenario_0":"스팸 분류 모델에서 손실이 거의 줄지 않을 때 먼저 의심하는 것은? ① 초기화·학습률 ② 데이터 개수만 ③ 배치 크기만","scenario_1":"깊은 CNN에서 앞쪽 층이 거의 갱신되지 않을 때 원인으로 가장 흔한 것은? ① 기울기 소실 ② 과적합 ③ 데이터 부족","scenario_2":"ReLU를 쓰는 MLP를 처음 구현할 때 기본으로 쓰기 좋은 초기화는? ① Xavier ② He ③ 0","scenario_3":"tanh를 쓰는 층에서 분산을 $2/(n_{in}+n_{out})$으로 두는 초기화는? ① Xavier ② He ③ 없음","scenario_4":"학습 중 NaN이 나왔을 때 초기화 측면에서 의심할 것은? ① 기울기 폭발(스케일 과대) ② 데이터만 ③ 배치 크기만","scenario_5":"의료 영상 분류 모델이 수렴이 매우 느릴 때 초기화를 바꿔 보는 이유는? ① 출발점이 나쁘면 수렴이 느려질 수 있음 ② 데이터가 부족해서만 ③ 학습률만 조절하면 됨","scenario_6":"PyTorch 기본 Linear 층의 초기화는 대부분 어떤 방식에 가깝나? ① Xavier/He 계열 ② 항상 0 ③ 무작위만","scenario_7":"층을 지날 때 활성화 분산이 유지되게 하는 초기화의 목표를 무엇이라 부르나? ① 분산 유지(스케일 맞추기) ② 정규화 ③ 드롭아웃","scenario_8":"사기 거래 탐지 모델이 깊을 때 초기화를 신경 쓰는 이유는? ① 기울기 소실·폭발 방지 ② 데이터만 중요 ③ 배치 크기만 중요","scenario_9":"$$n_{in}=8$, $n_{out}=8$인 층에서 Xavier를 쓸 때 $n_{in}+n_{out}$은? ① 16 ② 8 ③ 64","choice_0":"가중치를 0으로 두면 안 되는 이유는? ① 대칭성으로 학습이 제대로 안 됨 ② 메모리 절약 ③ 속도가 느려서","choice_1":"He 초기화에서 $\\sigma^2$는? ① $2/n_{in}$ ② $2/(n_{in}+n_{out})$ ③ $1/n_{in}$","choice_2":"기울기 소실을 완화하는 방법으로 적절한 것은? ① 적절한 초기화(예: Xavier/He) ② 학습률만 키우기 ③ 배치 크기만 키우기","choice_3":"Xavier 초기화가 맞는 활성화는? ① tanh·시그모이드 ② ReLU만 ③ 없음","choice_4":"한 층에서 $z=W\\mathbf{x}+b$일 때 $W$의 스케일이 너무 크면? ① 기울기 폭발 가능 ② 기울기 소실만 ③ 영향 없음","choice_5":"초기화가 학습에 미치는 영향은? ① 수렴 속도·안정성 ② 데이터 양만 ③ 손실 함수 형태만","choice_6":"ReLU를 쓰는 층의 He 초기화에서 분산은 입력 차원 $n_{in}$에? ① 반비례($2/n_{in}$) ② 비례 ③ 무관","choice_7":"역전파 시 기울기가 0에 가까워지는 현상은? ① 기울기 소실 ② 기울기 폭발 ③ 정규화","choice_8":"Xavier에서 $n_{in}=4$, $n_{out}=6$이면 $n_{in}+n_{out}$은? ① 10 ② 24 ③ 2","choice_9":"좋은 초기화의 목표에 가까운 것은? ① 층을 지날 때 분산 유지 ② 가중치를 0으로 ③ 학습률만 키우기","concept_0":"$$z=W\\mathbf{x}+b$에서 $W$의 분산이 너무 크면 역전파 시 기울기는? ① 폭발할 수 있음 ② 항상 0 ③ 변하지 않음","concept_1":"Xavier에서 균일 분포의 범위는 $[-a,a]$일 때 $a=\\sqrt{6/(n_{in}+n_{out})}$이다. $n_{in}+n_{out}=6$이면 $6/(n_{in}+n_{out})$의 값(정수)은? ① 1 ② 2 ③ 3","concept_2":"He 초기화를 쓰는 주된 이유는? ① ReLU가 0 이하를 0으로 만들어 분산이 줄기 때문 ② Xavier보다 빠름 ③ 항상 더 좋음","concept_3":"깊은 네트워크에서 초기화가 더 중요한 이유는? ① 기울기가 여러 층을 거치며 곱해지기 때문 ② 데이터만 중요 ③ 1층만 중요","concept_4":"편향 $b$는 보통 어떻게 초기화하는가? ① 0으로 ② 1로 ③ 무작위로","concept_5":"Leaky ReLU를 쓸 때도 He에 가까운 초기화를 쓰는 경우가 많은 이유는? ① ReLU 계열이라 분산 특성이 비슷 ② Xavier만 씀 ③ 0 초기화","concept_6":"학습률이 적당한데도 손실이 거의 안 줄면? ① 초기화나 구조(기울기 소실) 의심 ② 데이터만 ③ 배치만","concept_7":"Xavier와 He의 공통점은? ① 층의 크기에 맞춰 분산을 정함 ② 모두 0 초기화 ③ ReLU 전용","concept_8":"역전파에서 연쇄 법칙으로 기울기를 곱할 때, 0.5를 10번 곱하면 약 0.001이다. 이와 비슷한 현상은? ① 기울기 소실 ② 기울기 폭발 ③ 정규화","concept_9":"실무에서 ReLU CNN의 기본 초기화는? ① He 계열 ② 0 ③ Xavier만","calc_0":"$$n_{in}+n_{out}=6$일 때 균일 Xavier 비 $6/(n_{in}+n_{out})$의 값(정수)은?","calc_1":"$$n_{in}=8$인 층에서 He 초기화 $\\sigma^2=2/n_{in}$의 분모 $n_{in}$(정수)은?","calc_2":"$$n_{in}=2$, $n_{out}=8$일 때 Xavier 분산 $\\sigma^2=2/(n_{in}+n_{out})$의 분모(정수)는?","calc_3":"$$n_{in}=32$일 때 He에서 $2/n_{in}$에 쓰이는 분모 $n_{in}$(정수)은?","calc_4":"$$n_{in}=5$, $n_{out}=5$일 때 Xavier 분산의 분모 $n_{in}+n_{out}$(정수)는?","calc_5":"$$n_{in}+n_{out}=3$일 때 $6/(n_{in}+n_{out})$의 값(정수)은?","calc_6":"$$n_{in}=1$, $n_{out}=7$일 때 Xavier 분산의 분모 $n_{in}+n_{out}$(정수)는?","calc_7":"$$n_{in}=20$일 때 He 초기화 $\\sigma^2=2/n_{in}$의 분모(정수)는?","calc_8":"$$n_{in}=4$, $n_{out}=12$일 때 Xavier 분산의 분모 $n_{in}+n_{out}$(정수)는?","calc_9":"$$n_{in}+n_{out}=2$일 때 $6/(n_{in}+n_{out})$의 값(정수)은?"},"problemAnswers":{"definition_0":1,"definition_1":1,"definition_2":2,"definition_3":1,"definition_4":1,"definition_5":2,"definition_6":1,"definition_7":2,"definition_8":1,"definition_9":1,"trueFalse_0":1,"trueFalse_1":0,"trueFalse_2":1,"trueFalse_3":1,"trueFalse_4":0,"trueFalse_5":0,"trueFalse_6":1,"trueFalse_7":1,"trueFalse_8":1,"trueFalse_9":1,"scenario_0":1,"scenario_1":1,"scenario_2":2,"scenario_3":1,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1,"choice_0":1,"choice_1":1,"choice_2":1,"choice_3":1,"choice_4":1,"choice_5":1,"choice_6":1,"choice_7":1,"choice_8":1,"choice_9":1,"concept_0":1,"concept_1":1,"concept_2":1,"concept_3":1,"concept_4":1,"concept_5":1,"concept_6":1,"concept_7":1,"concept_8":1,"concept_9":1,"calc_0":1,"calc_1":8,"calc_2":10,"calc_3":32,"calc_4":10,"calc_5":2,"calc_6":8,"calc_7":20,"calc_8":16,"calc_9":3},"problemSolutions":{"definition_0":"**1) 개념**: 가중치 초기화의 주된 목적은 학습을 시작하기 전에 각 층의 $W$, $b$를 **적절한 스케일**로 두는 것이다. 그래야 순전파 시 활성화 값이 층을 지날 때마다 폭발하거나 소실되지 않고, 역전파 시 기울기도 안정적으로 전달된다. **2) 오답 이유**: ② 학습률 키우기·③ 데이터 증강은 초기화와 별개 주제이므로 해당하지 않는다. **3) 실전 예시**: 스팸 메일 분류 모델을 학습시킬 때 초기화를 대충 하면 손실이 수백 스텝이 지나도 거의 줄지 않거나 NaN이 뜨는 경우가 있다. He나 Xavier로 바꾸면 손실이 정상적으로 감소한다. **4) 단계 정리**: (1) 초기화 목적 = 층별 스케일 맞추기 → (2) 따라서 정답은 ①이다.","definition_1":"**1) 정의**: 학습이 시작되기 **전**에, 각 층의 가중치 $W$와 편향 $b$를 **어떤 값으로 둘지** 정하는 과정이 바로 **가중치 초기화**이다. **2) 오답 이유**: ② 경사 하강은 학습이 시작된 뒤 가중치를 업데이트하는 방법이고, ③ 정규화는 과적합을 줄이기 위한 기법으로 초기화와 다르다. **3) 실전 예시**: 의료 영상 진단 모델(CNN)을 만들 때, 첫 에폭부터 손실이 안 줄면 '학습률만 조절했는데도 안 된다'고 느낄 수 있다. 이때 초기화(He/Xavier)를 점검하면 해결되는 경우가 많다. **4) 단계**: 질문이 묻는 것은 '학습 시작 전 $W$, $b$를 정하는 과정'이므로 → **정답 ① 가중치 초기화**이다.","definition_2":"ReLU 계열 활성화 함수를 쓸 때는 **He 초기화**가 널리 쓰인다. He는 $\\sigma^2 = 2/n_{in}$으로 ReLU의 특성(0 이하를 0으로 만듦)을 보정한다. 따라서 정답은 ②이다.","definition_3":"tanh·시그모이드처럼 대칭인 활성화에서는 **Xavier(Glorot) 초기화**가 적합하다. Xavier는 $\\sigma^2 = 2/(n_{in}+n_{out})$으로 분산을 맞춘다. 정답은 ①이다.","definition_4":"**1) 현상 정의**: 역전파 시 기울기는 연쇄 법칙으로 층을 지날 때마다 (가중치 등) 곱해진다. 가중치가 **너무 작으면** 이 곱이 0에 가까워져, **앞쪽 층**으로 갈수록 기울기가 거의 0이 되어 해당 층이 거의 갱신되지 않는다. 이를 **기울기 소실(Vanishing Gradient)**이라 한다. **2) 오답**: ② 기울기 폭발은 가중치가 너무 클 때, ③ 과적합은 다른 주제이다. **3) 실전 예시**: 의료 영상 CNN이 10층 이상일 때, 초기화를 너무 작게 하면 처음 몇 에폭만에 손실이 거의 움직이지 않고 앞쪽 Conv 층의 가중치가 갱신되지 않는 것처럼 보인다. He 초기화로 스케일을 맞추면 완화된다. **4) 결론**: 질문이 묻는 것은 '기울기가 0에 가까워져 앞쪽 층이 거의 갱신되지 않는 현상'이므로 → **정답 ① 기울기 소실**.","definition_5":"가중치가 **너무 크면** 역전파 시 기울기가 층을 지날 때마다 커져 폭발한다. 이를 **기울기 폭발**이라 한다. 정답은 ②이다.","definition_6":"Xavier 초기화에서는 분산을 $\\sigma^2 = 2/(n_{in}+n_{out})$으로 둔다. 따라서 정답은 ①이다.","definition_7":"He 초기화에서는 $\\sigma^2 = 2/n_{in}$을 쓴다. 정답은 ②이다.","definition_8":"가중치를 모두 0으로 두면 같은 층의 모든 뉴런이 같은 출력을 내어 **대칭성**이 깨지지 않고, 역전파 시 기울기가 골고루 나뉘지 않아 학습이 제대로 되지 않는다. 정답은 ①이다.","definition_9":"$$W$가 너무 작으면 선형 합 $z$와 그 기울기가 작아져, 역전파 시 **기울기 소실**에 가깝게 된다. 정답은 ①이다.","trueFalse_0":"가중치 초기화는 학습이 시작되기 전에 각 층의 $W$, $b$를 정하는 과정이 맞다. 정답 1.","trueFalse_1":"Xavier 초기화는 tanh·시그모이드에 쓰이고, ReLU에는 He를 쓴다. 따라서 \"ReLU에만 쓰인다\"는 틀렸다. 정답 0.","trueFalse_2":"He 초기화는 ReLU·Leaky ReLU 등 ReLU 계열에 적합하다. 정답 1.","trueFalse_3":"좋은 초기화는 층을 통과할 때 활성화·기울기의 분산이 지나치게 커지거나 줄지 않게 유지하는 것이 목표다. 정답 1.","trueFalse_4":"가중치를 모두 0으로 두는 것은 대칭성 때문에 권장되지 않는다. 정답 0.","trueFalse_5":"기울기 소실은 가중치가 **너무 작을** 때 생긴다. 너무 클 때는 기울기 폭발. 정답 0.","trueFalse_6":"기울기 폭발은 가중치가 너무 커서 역전파 시 기울기가 폭발하는 현상이다. 정답 1.","trueFalse_7":"적절한 초기화는 출발점을 좋게 해 수렴 속도에 영향을 준다. 정답 1.","trueFalse_8":"Xavier에서 분산은 $\\sigma^2 = 2/(n_{in}+n_{out})$이 맞다. 정답 1.","trueFalse_9":"He에서 $\\sigma^2 = 2/n_{in}$이 맞다. 정답 1.","scenario_0":"**1) 상황 해석**: 스팸 분류 모델에서 손실이 거의 줄지 않는다는 것은 학습이 제대로 진행되지 않는다는 신호다. **2) 원인 후보**: (가) 초기화가 나빠서 기울기 소실·폭발이 발생했거나, (나) 학습률이 너무 크거나 작거나, (다) 데이터/배치만의 문제일 수 있다. **3) 실전 예시**: 스팸 메일 분류기에서 가중치를 0에 가깝게 초기화했을 때 역전파 기울기가 앞쪽 층까지 거의 전달되지 않아 손실이 정체된다. He 또는 Xavier로 바꾼 뒤 같은 학습률로 다시 학습하면 손실이 정상적으로 감소하는 경우가 많다. **4) 결론**: '먼저 의심하는 것'으로는 **초기화·학습률**이 적절하다. 데이터 개수만·배치 크기만은 첫 점검 단계보다 나중에 보는 것이 일반적이다. → **정답 ①(1)**.","scenario_1":"깊은 CNN에서 앞쪽 층이 거의 갱신되지 않으면 **기울기 소실**을 의심한다. 초기화(He/Xavier)와 배치 정규화 등으로 완화할 수 있다. 정답 1.","scenario_2":"ReLU를 쓰는 MLP에서는 **He 초기화**를 기본으로 쓴다. 정답 2.","scenario_3":"tanh에서 분산을 $2/(n_{in}+n_{out})$으로 두는 것은 **Xavier** 초기화이다. 정답 1.","scenario_4":"**1) 상황**: 학습 중 NaN이 나온다는 것은 수치가 overflow/underflow 되었다는 뜻으로, 초기화 측면에서는 **기울기 폭발** 가능성이 크다. **2) 원인**: 초기 가중치 스케일이 너무 크면 역전파 시 기울기가 층을 지날 때마다 불어나 결국 표현 범위를 넘어선다. **3) 실전 예시**: 사기 거래 탐지용 깊은 MLP에서 가중치를 무작위로 크게 두면 몇 스텝 만에 손실이 NaN이 되는 경우가 있다. He/Xavier로 바꾸고 학습률을 낮추면 해결되는 경우가 많다. **4) 결론**: 초기화 측면에서 의심할 것은 **기울기 폭발(스케일 과대)**이다. → **정답 ①(1)**.","scenario_5":"수렴이 매우 느리면 **출발점(초기화)**이 나쁠 수 있다. 적절한 Xavier/He로 바꾸면 개선되는 경우가 있다. 정답 1.","scenario_6":"PyTorch의 Linear 등은 대부분 **Xavier/He** 계열로 초기화한다. 정답 1.","scenario_7":"층을 지날 때 활성화 분산이 유지되게 하는 것이 초기화의 목표이며, 이를 **분산 유지(스케일 맞추기)**라고 말할 수 있다. 정답 1.","scenario_8":"깊은 모델에서는 **기울기 소실·폭발 방지**를 위해 초기화를 신경 쓴다. 정답 1.","scenario_9":"$$n_{in}+n_{out} = 8+8 = 16$이다. 정답 16이지만 선택지가 ① 16 ② 8 ③ 64이므로 ① = 1을 입력. 정답 1.","choice_0":"가중치를 0으로 두면 같은 층 뉴런들이 같은 출력을 내어 **대칭성** 때문에 학습이 제대로 되지 않는다. 정답 1.","choice_1":"He 초기화에서 $\\sigma^2 = 2/n_{in}$이다. 정답 1.","choice_2":"기울기 소실 완화에는 **적절한 초기화**(Xavier/He)가 도움이 된다. 정답 1.","choice_3":"Xavier는 **tanh·시그모이드**에 적합하다. 정답 1.","choice_4":"$$W$의 스케일이 너무 크면 역전파 시 **기울기 폭발** 가능성이 있다. 정답 1.","choice_5":"초기화는 **수렴 속도·안정성**에 영향을 준다. 정답 1.","choice_6":"He에서 분산은 $2/n_{in}$으로 $n_{in}$에 **반비례**한다. 정답 1.","choice_7":"역전파 시 기울기가 0에 가까워지는 현상은 **기울기 소실**이다. 정답 1.","choice_8":"$$n_{in}+n_{out} = 4+6 = 10$이다. 정답 1(① 10).","choice_9":"좋은 초기화의 목표는 **층을 지날 때 분산 유지**이다. 정답 1.","concept_0":"$$W$의 분산이 너무 크면 $z$와 역전파되는 기울기도 커져 **기울기 폭발**이 날 수 있다. 정답 1.","concept_1":"Xavier 균일 분포에서 $a=\\sqrt{6/(n_{in}+n_{out})}$이므로 $6/(n_{in}+n_{out})$을 계산한다. $n_{in}+n_{out}=6$이면 $6/6=1$이다. 정수이므로 정답은 ① 1이다. 실전 예: 의료 영상 CNN에서 층별 $n_{in}$, $n_{out}$을 넣어 Xavier 범위를 계산할 때 같은 식을 쓴다.","concept_2":"ReLU는 0 이하를 0으로 만들어 출력 분산이 입력의 약 절반이 된다. He는 이를 보정하기 위해 $\\sigma^2=2/n_{in}$을 쓴다. 정답 1.","concept_3":"깊은 네트워크에서는 기울기가 **여러 층을 거치며 연쇄 법칙으로 곱해지기** 때문에, 초기화가 나쁘면 소실·폭발이 심해진다. 정답 1.","concept_4":"편향 $b$는 보통 **0**으로 초기화한다. 정답 1.","concept_5":"Leaky ReLU도 ReLU 계열이라 **분산 특성이 비슷**하여 He에 가까운 초기화를 많이 쓴다. 정답 1.","concept_6":"학습률이 적당한데 손실이 안 줄면 **초기화**가 나쁘거나 **기울기 소실** 등 구조적 문제를 의심한다. 정답 1.","concept_7":"Xavier와 He의 공통점은 **층의 크기($n_{in}$, $n_{out}$ 등)에 맞춰 분산을 정한다**는 것이다. 정답 1.","concept_8":"작은 수(0.5)를 여러 번 곱하면 0에 가까워지는 것과 같은 현상이 **기울기 소실**이다. 정답 1.","concept_9":"ReLU CNN에서는 **He 계열** 초기화가 기본이다. 정답 1.","calc_0":"균일 Xavier에서 반폭 $a=\\sqrt{6/(n_{in}+n_{out})}$와 맞물리는 비 $6/(n_{in}+n_{out})$이다. $n_{in}+n_{out}=6$이면 $6/6=1$. 정답 **1**.","calc_1":"He 초기화는 $\\sigma^2=2/n_{in}$이므로 분모는 $n_{in}$이다. $n_{in}=8$이면 분모 **8**.","calc_2":"Xavier 분산 $\\sigma^2=2/(n_{in}+n_{out})$의 분모는 $n_{in}+n_{out}=2+8=10$. 정답 **10**.","calc_3":"He에서 $2/n_{in}$의 분모는 $n_{in}$이므로 $n_{in}=32$ → **32**.","calc_4":"$$n_{in}+n_{out}=5+5=10$. 정답 **10**.","calc_5":"$$n_{in}+n_{out}=3$이면 $6/3=2$. 정답 **2**.","calc_6":"$$n_{in}+n_{out}=1+7=8$. 정답 **8**.","calc_7":"He에서 분모는 $n_{in}=20$. 정답 **20**.","calc_8":"$$n_{in}+n_{out}=4+12=16$. 정답 **16**.","calc_9":"$$n_{in}+n_{out}=2$이면 $6/2=3$. 정답 **3**."},"problemTestCodes":{"definition_0":"answer = 1\nassert answer == 1","definition_1":"answer = 1\nassert answer == 1","definition_2":"answer = 2\nassert answer == 2","definition_3":"answer = 1\nassert answer == 1","definition_4":"answer = 1\nassert answer == 1","definition_5":"answer = 2\nassert answer == 2","definition_6":"answer = 1\nassert answer == 1","definition_7":"answer = 2\nassert answer == 2","definition_8":"answer = 1\nassert answer == 1","definition_9":"answer = 1\nassert answer == 1","trueFalse_0":"answer = 1\nassert answer == 1","trueFalse_1":"answer = 0\nassert answer == 0","trueFalse_2":"answer = 1\nassert answer == 1","trueFalse_3":"answer = 1\nassert answer == 1","trueFalse_4":"answer = 0\nassert answer == 0","trueFalse_5":"answer = 0\nassert answer == 0","trueFalse_6":"answer = 1\nassert answer == 1","trueFalse_7":"answer = 1\nassert answer == 1","trueFalse_8":"answer = 1\nassert answer == 1","trueFalse_9":"answer = 1\nassert answer == 1","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 2\nassert answer == 2","scenario_3":"answer = 1\nassert answer == 1","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1","choice_0":"answer = 1\nassert answer == 1","choice_1":"answer = 1\nassert answer == 1","choice_2":"answer = 1\nassert answer == 1","choice_3":"answer = 1\nassert answer == 1","choice_4":"answer = 1\nassert answer == 1","choice_5":"answer = 1\nassert answer == 1","choice_6":"answer = 1\nassert answer == 1","choice_7":"answer = 1\nassert answer == 1","choice_8":"answer = 1\nassert answer == 1","choice_9":"answer = 1\nassert answer == 1","concept_0":"answer = 1\nassert answer == 1","concept_1":"n_in_plus_n_out = 6\nvalue = 6 // n_in_plus_n_out\nassert value == 1\nanswer = 1\nassert answer == 1","concept_2":"answer = 1\nassert answer == 1","concept_3":"answer = 1\nassert answer == 1","concept_4":"answer = 1\nassert answer == 1","concept_5":"answer = 1\nassert answer == 1","concept_6":"answer = 1\nassert answer == 1","concept_7":"answer = 1\nassert answer == 1","concept_8":"answer = 1\nassert answer == 1","concept_9":"answer = 1\nassert answer == 1","calc_0":"s = 6\nanswer = 6 // s\nassert answer == 1","calc_1":"n_in = 8\nanswer = n_in\nassert answer == 8","calc_2":"n_in, n_out = 2, 8\nanswer = n_in + n_out\nassert answer == 10","calc_3":"n_in = 32\nanswer = n_in\nassert answer == 32","calc_4":"n_in, n_out = 5, 5\nanswer = n_in + n_out\nassert answer == 10","calc_5":"s = 3\nanswer = 6 // s\nassert answer == 2","calc_6":"n_in, n_out = 1, 7\nanswer = n_in + n_out\nassert answer == 8","calc_7":"n_in = 20\nanswer = n_in\nassert answer == 20","calc_8":"n_in, n_out = 4, 12\nanswer = n_in + n_out\nassert answer == 16","calc_9":"s = 2\nanswer = 6 // s\nassert answer == 3"},"problemDifficulty":{"definition_0":"easy","definition_1":"easy","definition_2":"easy","definition_3":"easy","definition_4":"easy","definition_5":"easy","definition_6":"easy","definition_7":"easy","definition_8":"easy","definition_9":"easy","trueFalse_0":"easy","trueFalse_1":"easy","trueFalse_2":"easy","trueFalse_3":"easy","trueFalse_4":"easy","trueFalse_5":"easy","trueFalse_6":"easy","trueFalse_7":"easy","trueFalse_8":"easy","trueFalse_9":"easy","scenario_0":"medium","scenario_1":"medium","scenario_2":"medium","scenario_3":"medium","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","choice_0":"medium","choice_1":"medium","choice_2":"medium","choice_3":"medium","choice_4":"medium","choice_5":"medium","choice_6":"medium","choice_7":"medium","choice_8":"medium","choice_9":"medium","concept_0":"hard","concept_1":"hard","concept_2":"hard","concept_3":"hard","concept_4":"hard","concept_5":"hard","concept_6":"hard","concept_7":"hard","concept_8":"hard","concept_9":"hard","calc_0":"hard","calc_1":"hard","calc_2":"hard","calc_3":"hard","calc_4":"hard","calc_5":"hard","calc_6":"hard","calc_7":"hard","calc_8":"hard","calc_9":"hard"},"problemOrder":["definition_0","definition_1","definition_2","definition_3","definition_4","definition_5","definition_6","definition_7","definition_8","definition_9","trueFalse_0","trueFalse_1","trueFalse_2","trueFalse_3","trueFalse_4","trueFalse_5","trueFalse_6","trueFalse_7","trueFalse_8","trueFalse_9","scenario_0","scenario_1","scenario_2","scenario_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","choice_0","choice_1","choice_2","choice_3","choice_4","choice_5","choice_6","choice_7","choice_8","choice_9","concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","concept_6","concept_7","concept_8","concept_9","calc_0","calc_1","calc_2","calc_3","calc_4","calc_5","calc_6","calc_7","calc_8","calc_9"]},"midDlCh02":{"chapter":"Chapter 02","title":"최적화 알고리즘: 속도와 방향을 똑똑하게 조절하기","description":"AI 모델을 학습시키는 과정은 **'안대가 씌워진 채로 거대한 산맥에서 가장 깊은 골짜기(오차가 가장 적은 최솟값)를 찾아 내려가는 등산'**과 완벽하게 같습니다. 여기서 **최적화(Optimization)**란, 우리가 현재 서 있는 위치에서 어느 방향으로, 얼만큼의 보폭으로 걸어 내려갈지 결정하는 내비게이션 역할을 합니다.\n\nCh.01에서 출발선을 정했다면, 이번 장에서는 경사(Gradient)를 느끼며 안전하고 빠르게 산을 내려가는 다양한 스킬들을 배웁니다. 뚜벅뚜벅 걸어가는 **SGD**부터, 관성을 이용해 썰매를 타는 **모멘텀(Momentum)**, 그리고 지형에 맞춰 보폭을 스스로 조절하는 똑똑한 자율주행차 **Adam**까지! 실무에서 매일 마주하게 될 핵심 최적화 알고리즘들의 원리를 아주 쉽고 직관적으로 파헤쳐 봅니다.","sectionTitle":"최적화 알고리즘: 속도와 방향을 똑똑하게 조절하기","whatIs":{"0":"**1. 경사 하강법(Gradient Descent)과 SGD: 오르막의 반대로 걷기**\n\n**개념:** 산을 내려갈 때 가장 확실한 방법은 발끝으로 땅을 짚어보고 **'가장 가파른 내리막길'**로 한 걸음씩 내디디는 것입니다. 이것이 경사 하강법의 핵심입니다.\n\n**직관적 비유:** 짙은 안개가 낀 한라산에서 하산한다고 상상해 보세요. 한 번에 너무 크게 뛰면(보폭이 넓으면) 낭떠러지로 떨어지거나 반대편 봉우리로 튕겨 올라갈 수 있습니다. 반대로 너무 좁은 보폭으로 걸으면 해가 져도 하산하지 못하겠죠. 여기서 '보폭'이 바로 **학습률(Learning Rate)**입니다.\n\n**핵심 수식:**\n$\\theta \\leftarrow \\theta - \\eta \\nabla L(\\theta)$\n- **$\\theta$**(세타): 현재 위치(모델의 가중치 파라미터)\n- **$\\eta$**(에타): 보폭, 즉 **학습률** (보통 0.01, 0.001 등)\n- **$\\nabla L$**: 현재 위치에서의 기울기(경사)\n\n**실전 팁:** 전체 지도를 다 보려면 시간이 너무 오래 걸리기 때문에, 실무에서는 지도의 일부(미니배치)만 보고 빠르게 방향을 정하는 **확률적 경사 하강법(SGD, Stochastic Gradient Descent)**을 기본으로 사용합니다.","1":"**2. 모멘텀(Momentum): 빙판 위를 미끄러지는 볼링공**\n\n**개념:** SGD는 눈앞의 경사만 보고 걷기 때문에, 울퉁불퉁한 좁은 골짜기를 만나면 좌우로 심하게 지그재그로 움직이며 시간을 낭비합니다. 이를 해결하기 위해 **'과거에 이동했던 방향의 관성'**을 추가한 것이 모멘텀입니다.\n\n**직관적 비유:** 가벼운 종이컵은 작은 돌멩이(노이즈)에도 쉽게 방향을 바꾸지만, 무거운 볼링공은 웬만한 장애물은 뚫고 원래 굴러가던 방향으로 묵묵히 밀고 나갑니다. 모멘텀은 모델에 이 볼링공 같은 '무게감'을 부여합니다.\n\n**핵심 수식:**\n$v \\leftarrow \\beta v + (1-\\beta)g$\n$\\theta \\leftarrow \\theta - \\eta v$\n- **$v$**: 현재 굴러가고 있는 속도(관성 벡터)\n- **$\\beta$**(베타): 과거의 관성을 얼마나 유지할지 정하는 계수 (보통 0.9로 이전 속도의 90%를 유지)\n- **$g$**: 현재 위치에서 측정한 기울기\n\n**보충:** **Nesterov** 변형은 관성으로 한 번 이동한 **앞 지점**에서 기울기를 보아 예측 성격을 줍니다.","2":"**3. 적응형 옵티마이저 (AdaGrad, RMSProp, Adam): 바퀴마다 브레이크 따로 잡기**\n\n**개념:** 데이터의 특징에 따라 어떤 파라미터는 이미 목표치에 도달했고, 어떤 파라미터는 아직 한참 더 가야 할 수 있습니다. 모든 파라미터에 똑같은 보폭($\\eta$)을 적용하는 대신, **각 파라미터의 상황에 맞춰 보폭을 스스로 조절(Adaptive)**하는 똑똑한 방법들입니다.\n\n**발전 과정:**\n- **AdaGrad:** \"많이 걸어온 길은 보폭을 줄이자!\" 과거에 경사가 컸던(많이 움직인) 파라미터의 보폭을 확 줄여줍니다.\n- **RMSProp:** AdaGrad의 단점(나중에는 보폭이 0이 되어 멈춰버림)을 완화하기 위해, 아주 옛날의 궤적은 서서히 잊어버리도록 고안되었습니다.\n- **Adam (실무 제왕):** **모멘텀(방향 유지)**과 **RMSProp(보폭 조절)**의 장점을 합친 방식입니다. 현재 딥러닝에서 가장 기본적으로 선택하는 옵티마이저 중 하나입니다.\n\n**실전 팁:** 최신 논문들에서는 가중치 감소(Weight Decay)를 분리하여 성능을 끌어올린 **AdamW**를 매우 즐겨 사용합니다.","3":"**4. 최적화의 3대 목표: 안정성, 속도, 일반화**\n\n**개념:** 옵티마이저를 고르는 것은 단순히 '빨리 내려가는 것'만이 목적이 아닙니다. 목적지(최솟값)에 도달하는 궤적에 따라 모델이 처음 보는 데이터에 얼마나 잘 대응하는지(일반화 성능)가 달라집니다.\n\n**직관적 비유:** KTX(Adam)를 타면 부산에 빨리 도착하지만, 완행열차(SGD+Momentum)를 타면 시간이 걸려도 구석구석 숨겨진 명소(더 좋은 일반화 지점)를 발견할 확률이 높습니다.\n\n**실전 팁:** 시야가 좁은 초반에는 보폭을 천천히 늘리는 **워밍업(Warm-up)**을 하고, 목적지에 다다를수록 보폭을 줄이는 **학습률 스케줄링(Scheduler)**을 옵티마이저와 반드시 짝꿍으로 함께 사용해야 합니다."},"whyImportant":{"0":"**AI 프로젝트의 시간과 비용을 결정짓는 핵심**\n\n학습률이 너무 크면 모델이 엉뚱한 곳으로 튕겨 나가 영원히 학습되지 않고(발산), 너무 작으면 1시간이면 끝날 학습이 1주일이 걸릴 수도 있습니다. 올바른 옵티마이저와 학습률 설정은 곧 값비싼 GPU 대여 비용과 여러분의 야근 시간을 줄여주는 마법입니다.","1":"**'시험 점수(일반화 성능)'를 바꾼다**\n\n재미있게도, 같은 데이터로 학습해도 옵티마이저에 따라 최종 결과물의 질이 달라집니다. 어떤 골짜기(최솟값)에 정착하느냐에 따라 새로운 데이터(테스트 세트)에 대한 예측력이 크게 달라지기 때문입니다. 실력 있는 AI 엔지니어는 데이터의 성격에 맞춰 이 도구들을 자유자재로 바꿔 낍니다.","2":"**모델이 아플 때 가장 먼저 확인하는 '체온계'**\n\n학습 로스(Loss)가 뚝 떨어지지 않고 제자리걸음을 하거나, 갑자기 NaN(계산 불가) 에러가 뜬다면? 가장 먼저 의심해야 할 용의자 1순위가 바로 '학습률'과 '옵티마이저'입니다. 이 원리를 알면 막막한 에러 앞에서도 침착하게 디버깅을 시작할 수 있습니다."},"howUsed":{"0":"**① 실험을 기록하고, 한 번에 하나씩만 바꾸기**\n\n라이브러리마다 함수 이름은 다르지만 실무 습관은 비슷합니다. **학습률·배치 크기·옵티마이저·난수 시드**를 메모해 두고, 이상이 생기면 **한 번에 변수 하나만** 바꿔 원인을 좁힙니다. 손실이 들쭉날쭉하면 배치·학습률·모멘텀을 먼저 보고, 오래 돌릴수록 갱신이 거의 멎는 느낌이면 AdaGrad 계열 대신 **RMSProp·Adam** 같은 선택을 검토합니다. **증상과 조절할 손잡이**를 짝지어 생각하는 연습이 중요합니다.","1":"**② 실무자를 위한 옵티마이저 선택 치트시트**\n\n| 상황 | 추천 옵티마이저 | 이유 |\n| :--- | :--- | :--- |\n| **일단 빠르게 결과(Baseline)를 보고 싶을 때** | `Adam` 또는 `AdamW` | 알아서 보폭을 조절해 주어 초기 학습률 설정에 덜 민감함 |\n| **자연어 처리(NLP), 트랜스포머 모델 학습** | `AdamW` | 희소한 데이터와 복잡한 구조에서 압도적인 안정성을 기대할 때가 많음 |\n| **이미지 분류(CNN) 성능을 극한(SOTA)으로 쥐어짤 때** | `SGD + Momentum` | 세팅은 까다롭지만, 최적의 하이퍼파라미터를 찾으면 일반화 성능이 더 뛰어날 수 있음 |","2":"**③ 모니터링: 눈을 떼지 마세요!**\n\n비행기를 이륙시켰다고 끝이 아닙니다. TensorBoard나 Weights & Biases(W&B) 같은 대시보드를 띄워놓고 손실 곡선(Loss Curve)이 아름답게 미끄럼틀을 타며 내려가고 있는지 반드시 실시간으로 지켜보아야 합니다. 그래프가 심하게 톱니바퀴처럼 요동친다면 학습률을 낮춰 줄 타이밍입니다."},"problemSolving":{"0":"최적화는 손실 $L(\\theta)$을 줄이기 위해 역전파로 얻은 기울기로 파라미터 $\\theta$를 어떻게 갱신할지 정하는 과정입니다. 기본 **SGD**는 미니배치에서 본 기울기 $\\hat{g}$로 $\\theta \\leftarrow \\theta - \\eta \\hat{g}$ 한 스텝을 밟으며, **학습률 $\\eta$**가 한 걸음의 크기(보폭)를 직접 결정합니다. **모멘텀**은 속도 $v$를 누적해 좁은 골짜기에서 생기는 지그재그를 줄이고, **Adam/AdamW**는 1차·2차 모멘트로 좌표마다 보폭을 다르게 두는 적응형 옵티마이저입니다. 손실이 들쭉날쭉하거나 발산할 때는 옵티마이저 이름만 바꾸기보다 **학습률·배치 크기·학습률 스케줄러**를 함께 점검하는 것이 실무에서 가장 먼저 필요합니다.","2":"**예시 (정의)**\n\n\"모멘텀(Momentum)의 핵심 역할은? ① 학습률을 0으로 만듦 ② 과거 방향을 누적해 진동을 줄임 ③ 역전파를 생략\"\n\n모멘텀은 속도 $v$를 누적해 업데이트 방향의 관성을 유지한다. → **정답 2**\n\n---\n\n**예시 (응용)**\n\n\"학습 손실이 크게 진동할 때 가장 먼저 점검할 조합은? ① 학습률·모멘텀·배치 크기 ② 데이터 0개 ③ 레이어 전부 삭제\"\n\n진동은 스텝 크기와 기울기 노이즈 문제와 연결되므로 ①을 먼저 본다. → **정답 1**\n\n---\n\n**예시 (계산)**\n\n$\\eta=0.001$, $g=20$일 때 SGD에서 업데이트 크기 $\\eta g$는?\n\n$0.001 \\times 20 = 0.02$. → **정답 0.02**","3":"**정의 예시** — \"Adam이 함께 사용하는 정보로 맞는 것은? ① 1차·2차 모멘트 ② 배치 인덱스만 ③ 드롭아웃 마스크만\" → Adam은 1차·2차 모멘트를 사용. **정답 1**\n\n---\n\n**참/거짓 예시** — \"RMSProp은 제곱 기울기의 지수이동평균(EMA)을 사용한다.\" → 맞음. **정답 1**\n\n---\n\n**응용 예시** — \"초반 학습이 불안정할 때 먼저 고려할 것은? ① warmup·학습률 스케줄 ② 역전파 끄기 ③ 데이터 삭제\" → warmup·스케줄 우선 점검. **정답 1**\n\n---\n\n**선택 예시** — \"Nesterov의 특징은? ① lookahead 지점의 기울기 ② 현재점만 ③ 기울기 미사용\" → lookahead 사용. **정답 1**\n\n---\n\n**개념 예시** — \"AdaGrad에서 자주 갱신된 좌표의 유효 보폭은? ① 작아지는 경향 ② 항상 동일 ③ 커지는 경향\" → 누적으로 인해 보폭 감소 경향. **정답 1**\n\n---\n\n**계산 예시** — \"샘플 수 64, 배치 크기 16일 때 한 에폭 스텝 수는?\" → $64/16=4$. **정답 4**"},"summary":"**최적화**는 손실 $L(\\theta)$을 줄이기 위해, 역전파로 얻은 기울기 $g$를 학습률 $\\eta$과 함께 **스텝(step)**으로 가공한 뒤 $\\theta \\leftarrow \\theta - \\eta\\cdot(\\text{스텝})$ 형태로 파라미터를 갱신하는 과정입니다.\n\n**SGD**는 미니배치 기울기 $\\hat{g}$로 갱신하고, **모멘텀**은 속도 $v$를 누적해 진동을 줄이며, **Adam/AdamW**는 1차·2차 모멘트로 좌표별 보폭을 적응적으로 조절합니다.\n\n**실무 디버깅 요약(증상 → 우선 점검)**\n- 손실 진동: `lr`, 모멘텀, 배치 크기\n- 초반 발산/NaN: 초기화, `lr`, `grad_norm`, clipping\n- 학습 정체: 스케줄러(warmup 포함), 옵티마이저 재선택(SGD↔AdamW)\n- 검증 정체: weight decay, 증강, early stopping\n\n**실전 튜닝 순서 요약**\n1) 로그 정상성 확인 → 2) `lr` 먼저 조정 → 3) 옵티마이저 선택 → 4) 스케줄 결합 → 5) 안정화 장치 적용 → 6) 평균 성능·분산·재현성으로 최종 선택\n\n**운영 원칙**: 한 번에 한 변수만 변경하고, `optimizer/lr/batch_size/weight_decay/seed/scheduler`를 기록해 비교합니다.","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","summary":"요약"},"formulaGuide":{"title":"수식 쉽게 이해하기","sgd":"**SGD 한 스텝** $\\theta \\leftarrow \\theta - \\eta \\hat{g}$ — $\\hat{g}$는 미니배치로 추정한 기울기, $\\eta$는 스텝 크기(학습률)입니다.","momentum":"**모멘텀** $v \\leftarrow \\beta v + (1-\\beta)g$, $\\theta \\leftarrow \\theta - \\eta v$ — 과거 방향이 $v$에 쌓여 좁은 골짜기에서 좌우로만 튕기는 현상을 줄이는 데 도움이 됩니다.","adam":"**Adam(개념)** — 1차 모멘트(기울기의 EMA)와 2차 모멘트(기울기 제곱의 EMA)로 각 좌표의 보폭을 조절하고, 초기 몇 스텝의 편향을 **bias correction**으로 나눕니다.","adaptive":"**적응형의 공통 직관** — 자주 크게 갱신되는 좌표는 보폭을 줄이고, 드문 좌표는 상대적으로 덜 줄이는 식으로 **좌표별 학습률 효과**를 냅니다."},"visual":"손실 곡면(산맥) 위에서 SGD·모멘텀·Adam 궤적을 비교하는 애니메이션으로, 같은 기울기라도 **어디로 걸어가느냐**가 어떻게 달라지는지 직관적으로 보여 줍니다.","problemSolvingLabel":"문제 풀이를 위한 설명","practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"아래는 **60문제 은행**에서 무작위로 뽑은 **10문제**입니다(쉬움 4·중간 3·어려움 3, 순서는 쉬움→중간→어려움). 모든 문항은 **객관식**이며, 정답 번호를 선택하세요.","practiceProblemsInstruction":"문제를 읽고 가장 알맞은 선택지를 고르세요.","midDlCh02VisualIntro":"안대를 쓴 채 **같은 산맥(손실 곡면)**을 내려가도, SGD·모멘텀·Adam은 **서로 다른 길**을 택합니다. 아래는 단순화한 골짜기에서의 궤적 비교입니다.","midDlCh02VisualStep0":"① **SGD**: 기울기 반대 방향으로 매 스텝 이동(노이즈 있으면 지그재그)","midDlCh02VisualStep1":"② **Momentum**: 속도 $v$를 누적해 관성으로 꺾임이 완만해짐","midDlCh02VisualStep2":"③ **Adam**: 좌표별 적응적 보폭으로 골짜기 형태에 맞게 스텝","midDlCh02VisualStep3":"④ **실무**: 로그·스케줄·초기화(Ch.01)와 함께 튜닝","midDlCh02VisualConceptTitle":"개념 구조: 기울기 →(가공)→ 파라미터 갱신","midDlCh02VisualFlowTitle":"학습 흐름: 순전파 → 손실 → 역전파 → 옵티마이저 step","midDlCh02VisualModelTitle":"모델 작동: $\\theta \\leftarrow \\theta - \\eta \\cdot(\\text{Adam 등으로 만든 스텝})$","midDlCh02VisualLegendSgd":"SGD","midDlCh02VisualLegendMom":"Momentum","midDlCh02VisualLegendAdam":"Adam","midDlCh02VisualCaption":"**빨강(SGD)**은 초기부터 좌우로 더 크게 흔들리며 내려오고, 하강 중 지그재그가 가장 뚜렷하게 남습니다. **초록(모멘텀)**은 진동을 줄이면서도 끝에서 중심에서 살짝 비켜 있고, **파랑(Adam)**은 가장 빨리 골짜기 한가운데로 붙습니다.","problems":{"definition_0":"손실을 줄이는 경사 하강 한 스텝에서 $\\theta$를 움직이는 일반적인 방향은?\n1) $\\nabla L$와 같은 방향\n2) $\\nabla L$의 **반대** 방향\n3) $\\nabla L$에 수직","definition_1":"PyTorch에서 `loss.backward()` 직후 미니배치 기울기로 파라미터를 갱신하는 전형적 옵티마이저 동작에 가장 가까운 설명은? ① 매번 전체 훈련셋 기울기 ② **일부 샘플로 추정한** $\\hat{g}$로 갱신 ③ 역전파를 생략","definition_2":"좁은 골짜기에서 좌우로 튕기는 움직임을 완화하려고 과거 기울기를 속도 $v$에 쌓는 방법은?\n1) 드롭아웃만 증가\n2) **모멘텀**으로 관성 부여\n3) 배치 크기를 항상 1로 고정","definition_3":"Nesterov 모멘텀이 일반 모멘텀과 달리 보는 것은?\n1) 현재 $\\theta$에서의 $g$만\n2) 관성으로 **한 번 이동한 지점**에서의 $g$\n3) 검증 손실만","definition_4":"AdaGrad가 좌표마다 스텝을 줄이기 위해 누적하는 양은? ① 가중치 절댓값 ② 기울기 **제곱** ③ 에폭 인덱스","definition_5":"RMSProp이 AdaGrad의 무한 누적을 완화하는 대표 장치는? ① 기울기 부호만 저장 ② 제곱 기울기의 **지수이동평균(EMA)** ③ 항상 고정 $\\eta$만 사용","definition_6":"Adam이 동시에 다루는 두 추정에 가장 가까운 조합은?\n1) **1차·2차 모멘트**(모멘텀+적응형 스케일)\n2) 드롭아웃 마스크만\n3) 풀링 크기만","definition_7":"학습률 $\\eta$가 지나치게 클 때 자주 동반되는 현상이 **아닌** 것은? ① 손실 진동 ② **항상 더 빠른 수렴만 보장** ③ NaN","definition_8":"Adam의 1차 모멘트 $m$이 추정하는 것에 가장 가까운 것은? ① 최근 기울기의 **EMA** ② 항상 0 벡터 ③ 검증 정확도","definition_9":"데이터·모델·로그 제약을 함께 보고 옵티마이저를 고를 때 우선시하는 관점은?\n1) 모니터 해상도\n2) **안정성·속도·일반화** 등 학습 관점\n3) 파일 확장자","trueFalse_0":"[참/거짓] `optimizer.step()`이 기울기 **반대** 방향으로 $\\theta$를 옮기는 전형적 경사 하강과 맞다면 1, 아니면 0.","trueFalse_1":"[참/거짓] 모멘텀은 학습률 하이퍼파라미터를 항상 0으로 만든다. 맞으면 1, 틀리면 0.","trueFalse_2":"[참/거짓] Adam은 적응형 분모와 모멘텀적 1차 모멘트를 함께 쓰는 경우가 많다. 맞으면 1, 틀리면 0.","trueFalse_3":"[참/거짓] AdaGrad는 오래 학습할수록 일부 좌표의 유효 스텝이 지나치게 작아질 수 있다. 맞으면 1, 틀리면 0.","trueFalse_4":"[참/거짓] RMSProp의 핵심은 제곱 기울기의 EMA로 누적 스케일을 안정화하는 것이다. 맞으면 1, 틀리면 0.","trueFalse_5":"[참/거짓] 미니배치가 클수록 기울기 추정 분산이 **항상** 커진다. 맞으면 1, 틀리면 0.","trueFalse_6":"[참/거짓] Cosine 스케줄처럼 시간에 따라 $\\eta$를 바꾸는 것은 학습률 스케줄링의 한 예이다. 맞으면 1, 틀리면 0.","trueFalse_7":"[참/거짓] Nesterov는 관성 방향으로 미리 이동한 지점에서 기울기를 보는 아이디어를 담는다. 맞으면 1, 틀리면 0.","trueFalse_8":"[참/거짓] Adam에서 $\\varepsilon$은 $\\sqrt{\\hat{v}}$ 분모가 0에 가까울 때를 완화하려는 작은 상수이다. 맞으면 1, 틀리면 0.","trueFalse_9":"[참/거짓] 모든 데이터셋·모델에서 Adam이 항상 SGD+momentum보다 낫다. 맞으면 1, 틀리면 0.","scenario_0":"[응용] ResNet 학습 중 손실이 크게 진동하며 내리지 않는다. **가장 먼저** 점검하기 좋은 조합은? ① **lr·모멘텀·배치** 재조정 ② 훈련 이미지 0장 ③ 모든 BN 제거","scenario_1":"희소 BoW 텍스트 분류를 빠르게 돌려보고 싶다. 흔히 첫 시도로 고려하는 옵티마이저 계열은?\n1) **Adam/AdamW** 등 적응형\n2) 순수 배치 GD만 고정\n3) k-means","scenario_2":"이미지 CNN에서 검증 성능까지 고려할 때 자주 보는 학습 조합은? ① **SGD+모멘텀(+스케줄)** 또는 Adam ② 역전파 끄기 ③ 옵티마이저 없이 순전파만","scenario_3":"AdaGrad로 오래 돌린 뒤 업데이트가 거의 멎은 것 같다. 다음으로 자연스러운 시도는?\n1) **RMSProp/Adam** 등으로 전환·lr 재설정\n2) 배치 1만 영원히 유지\n3) 입력 특징 전부 삭제","scenario_4":"초기에는 크게, 후반에는 작게 $\\eta$를 주고 싶다. 이를 코드로 구현할 때 핵심은? ① **스케줄러/워밍업** 설계 ② lr 무한 증가 ③ `step()` 생략","scenario_5":"학습 중 `grad_norm`이 비정상적으로 크다. Ch.01 초기화와 함께 볼 항목은? ① **lr·클리핑·스케일** ② 로그 파일 이름 ③ 테마 색","scenario_6":"모멘텀 $\\beta=0.99$로 올리면 관성이 어떻게 되는가?\n1) **과거 방향을 더 오래 유지**\n2) 즉시 전역최적 보장\n3) 학습 불가","scenario_7":"L2 감쇠를 Adam과 함께 쓸 때 가중치 감쇠를 손실항과 분리해 다루는 대표 변형은? ① **AdamW** ② SGD만 ③ Adagrad만","scenario_8":"소량 데이터 과적합이 의심될 때 **옵티마이저만** 바꿔서 해결하기는?\n1) **어렵고** 정규화·데이터가 우선\n2) Adam이면 무조건 해결\n3) lr만 무한대","scenario_9":"멀티 GPU에서 에폭마다 셔플 시드가 고정되어 편향이 생긴 것 같다. 살펴볼 것은? ① **셔플·동기화** ② 아이콘 ③ GPU 제거","choice_0":"순수 배치 GD 대비 미니배치 SGD의 전형적 특징은?\n1) 차이 없음\n2) $\\hat{g}$에 **샘플링 노이즈**가 있어 지역에서 탈출에 유리할 수 있음\n3) 역전파가 없음","choice_1":"모멘텀에서 $\\beta \\to 0$이면 속도 누적이 거의 사라져 어떤 업데이트에 가까워지는가? ① **SGD와 유사** ② 항상 발산 ③ lr=0","choice_2":"튜토리얼에서 자주 보는 Adam의 $(\\beta_1,\\beta_2)$ 조합에 가장 가까운 것은?\n1) **$(0.9,\\,0.999)$**\n2) $(0,0)$\n3) $(1,1)$","choice_3":"트랜스포머 파인튜닝 초반 불안정을 줄이려고 lr을 천천히 키우는 기법은? ① **워밍업** ② 항상 lr=0 유지 ③ 데이터 삭제","choice_4":"Adam에서 2차 모멘트가 다루는 대상에 가장 가까운 것은? ① 기울기 **제곱**의 EMA ② 가중치 절댓값 ③ 배치 인덱스","choice_5":"L2와 Adam을 함께 쓸 때 자주 쓰는 \"감쇠 분리\" 변형은?\n1) **AdamW**\n2) softmax 제거\n3) 배치 0","choice_6":"좁은 골짜기의 지그재그를 줄이는 데 도움이 되기 쉬운 항목은? ① **모멘텀** ② lr=0 고정 ③ 추론 전용 모드","choice_7":"구현체에서 Adam의 $\\varepsilon$ 기본값이 흔히 놓이는 규모는?\n1) **$10^{-8}$ 부근**\n2) $10^{2}$\n3) 정확히 0","choice_8":"동일한 모델에서 배치만 키울 때 일반적으로 기울기 추정 분산은? ① **작아지는 경향** ② 항상 동일 ③ 항상 커짐","choice_9":"RNN 언어모델에서 폭주하는 `grad`를 자르는 데 쓰는 기법은? ① **그래디언트 클리핑** ② 항상 해로움 ③ 추론만","concept_0":"손실 지형이 가파른 협곡일 때 좌우 진동을 줄이는 데 **가장 직접** 연결되는 조합은? ① 데이터 증강만 ② **모멘텀·lr·조건수/스케줄** ③ 배치=1 고정","concept_1":"Adam bias correction이 주로 완화하려는 것은?\n1) 초기에 $m,\\hat{v}$가 **0 근처에서 생기는 편향**\n2) 항상 lr=0\n3) 풀링 크기","concept_2":"희소 특징에서 자주 갱신되는 좌표의 AdaGrad 스텝이 어떻게 되는 경향인가? ① **더 작아짐** ② 항상 동일 ③ 무한대","concept_3":"같은 훈련 손실이라도 옵티마이저에 따라 검증 오차가 달라질 수 있는 설명으로 타당한 것은?\n1) **최적화 궤적·암묵적 정규화**가 달라질 수 있음\n2) 옵티마이저가 손실식을 바꿈\n3) 항상 동일","concept_4":"Nesterov가 일반 모멘텀과 달리 **기울기를 계산하는 위치**에서 차이를 둔다. 맞는 설명은? ① 동일 ② **다름** ③ 역전파 없음","concept_5":"RMSProp이 AdaGrad의 어떤 문제를 완화하려고 했는가? ① 제곱 누적이 **발산적으로 커지는** 경향 ② 항상 lr 증가 ③ softmax","concept_6":"대배치(예: 4096)로 분산을 줄인 뒤 수렴을 맞추려면 흔히 검토하는 것은?\n1) **lr 스케일링(선형 규칙 등)**\n2) lr=0 고정\n3) 데이터 삭제","concept_7":"매 스텝 새로운 `backward()` 전에 이전 기울기를 비우는 관례는? ① **`optimizer.zero_grad()`** ② 가중치 삭제 ③ 손실 고정","concept_8":"Adam에서 $\\sqrt{\\hat{v}}+\\epsilon$으로 나누면 기울기가 큰 좌표의 유효 스텝은? ① **상대적으로 작아짐** ② 항상 동일 ③ 항상 커짐","concept_9":"ImageNet 스타일 CNN에서 검증까지 신경 쓸 때 자주 보는 조합은?\n1) **SGD+momentum + lr 스케줄**\n2) Adam만 고정\n3) 옵티마이저 없음","calc_0":"[계산] 훈련 샘플 **48**개, 배치 **16**일 때 한 에폭 미니배치 스텝 수를 가장 알맞은 선택지를 고르세요.","calc_1":"[계산] 에폭 **4**, 에폭당 스텝 **25**이면 총 파라미터 갱신 횟수(정수)는?","calc_2":"[계산] $\\eta=3$, $g=2$일 때 $\\eta g$의 값(정수)은?","calc_3":"[계산] $\\beta=0.9$, $v=10$, $g=10$일 때 $v \\leftarrow \\beta v + (1-\\beta)g$의 결과(정수)는?","calc_4":"[계산] $m=0$, $\\beta_1=0.9$, $g=20$일 때 $m \\leftarrow \\beta_1 m + (1-\\beta_1)g$의 결과(정수)는?","calc_5":"[계산] $\\beta=0.5$, $v=6$, $g=2$일 때 $v \\leftarrow \\beta v + (1-\\beta)g$의 결과(정수)는?","calc_6":"[계산] $\\beta_1=0.9$, $m=10$, $g=0$일 때 $m \\leftarrow \\beta_1 m + (1-\\beta_1)g$의 결과(정수)는?","calc_7":"[계산] $t=1$, $\\beta_1=0.9$일 때 $1/(1-\\beta_1^t)$의 값(정수)은?","calc_8":"[계산] 샘플 **2048**, 배치 **256**일 때 한 에폭 스텝 수(정수)는?","calc_9":"[계산] 학습률 **0.002**에 스케일 **500**을 곱한 값(정수)은?"},"problemAnswers":{"definition_0":2,"definition_1":2,"definition_2":2,"definition_3":2,"definition_4":2,"definition_5":2,"definition_6":1,"definition_7":2,"definition_8":1,"definition_9":2,"trueFalse_0":1,"trueFalse_1":0,"trueFalse_2":1,"trueFalse_3":1,"trueFalse_4":1,"trueFalse_5":0,"trueFalse_6":1,"trueFalse_7":1,"trueFalse_8":1,"trueFalse_9":0,"scenario_0":1,"scenario_1":1,"scenario_2":1,"scenario_3":1,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1,"choice_0":2,"choice_1":1,"choice_2":1,"choice_3":1,"choice_4":1,"choice_5":1,"choice_6":1,"choice_7":1,"choice_8":1,"choice_9":1,"concept_0":2,"concept_1":1,"concept_2":2,"concept_3":1,"concept_4":2,"concept_5":1,"concept_6":2,"concept_7":1,"concept_8":2,"concept_9":1,"calc_0":3,"calc_1":100,"calc_2":6,"calc_3":10,"calc_4":2,"calc_5":4,"calc_6":9,"calc_7":10,"calc_8":8,"calc_9":1},"problemSolutions":{"definition_0":"**1) 개념:** 경사 하강은 손실이 내려가는 방향으로 가려면 기울기 **반대**로 움직입니다. **2) 예시:** 로지스틱 회귀에서 한 스텝은 $\\theta\\leftarrow\\theta-\\eta\\nabla L$입니다. **3) 단계:** 보기 ②가 맞습니다. **정답 2**","definition_1":"**1) 개념:** 미니배치 SGD는 **부분 집합**으로 $\\hat{g}$를 추정합니다. **2) 예시:** 배치 64면 64개 샘플로 기울기를 만듭니다. **3) 정답 2**","definition_2":"**1) 개념:** 모멘텀은 속도 $v$에 기울기를 섞어 **관성**을 만듭니다. **2) 예시:** 좁은 골짜기에서 진동이 줄어듭니다. **3) 정답 2**","definition_3":"**1) 개념:** 네스테로프는 **lookahead** 형태로 기울기를 봅니다. **2) 실무:** `torch.optim.SGD(..., nesterov=True)` 등으로 씁니다. **3) 정답 2**","definition_4":"**1) 개념:** AdaGrad는 기울기 **제곱**을 누적해 나눕니다. **2) 정답 2**","definition_5":"**1) 개념:** RMSProp은 제곱 기울기의 **EMA**를 씁니다. **2) 정답 2**","definition_6":"**1) 개념:** Adam은 1차·2차 모멘트를 함께 씁니다. **2) 정답 1**","definition_7":"**1) 개념:** $\\eta$가 크면 진동·NaN 등이 생길 수 있지만, \"항상 더 빠르게 수렴한다\"는 보장은 아닙니다. **2) 보기 ②**는 그런 **오해**에 해당합니다. **3) 정답 2**","definition_8":"**1) 개념:** 1차 모멘트는 기울기의 **EMA**입니다. **2) 정답 1**","definition_9":"**1) 개념:** 데이터·모델·안정성·속도를 봅니다. **2) 정답 2**","trueFalse_0":"경사 하강은 기울기 반대 방향이 맞습니다. **정답 1**","trueFalse_1":"모멘텀은 학습률을 0으로 만들지 않습니다. **정답 0**","trueFalse_2":"Adam은 적응형+모멘텀적 요소를 함께 씁니다. **정답 1**","trueFalse_3":"AdaGrad는 누적으로 스텝이 작아질 수 있습니다. **정답 1**","trueFalse_4":"RMSProp은 제곱 기울기 EMA가 핵심입니다. **정답 1**","trueFalse_5":"배치가 크면 분산이 **작아지는** 경향이 일반적이므로 문장은 틀렸습니다. **정답 0**","trueFalse_6":"학습률 스케줄링은 시간에 따라 $\\eta$를 바꿉니다. **정답 1**","trueFalse_7":"네스테로프는 lookahead 아이디어를 담습니다. **정답 1**","trueFalse_8":"$$\\varepsilon$은 수치 안정용입니다. **정답 1**","trueFalse_9":"항상 Adam이 더 낫지는 않습니다. **정답 0**","scenario_0":"**1) 상황:** 진동은 $\\eta$ 과대·모멘텀 부족 등이 흔합니다. **2) 예시:** CNN에서 loss가 요동치면 lr을 10배 줄여봅니다. **3) 정답 1**","scenario_1":"**1) 적응형 Adam이 빠른 실험에 자주 쓰입니다. **2) 정답 1**","scenario_2":"**1) 비전에서 SGD+momentum 또는 Adam이 흔합니다. **2) 정답 1**","scenario_3":"**1) AdaGrad 한계를 피하려면 RMSProp/Adam 등을 검토합니다. **2) 정답 1**","scenario_4":"**1) 스케줄러로 $\\eta$를 줄입니다. **2) 정답 1**","scenario_5":"**1) 클리핑·lr·초기화를 봅니다. **2) 정답 1**","scenario_6":"**1) $\\beta$↑이면 관성↑입니다. **2) 정답 1**","scenario_7":"**1) AdamW가 대표적입니다. **2) 정답 1**","scenario_8":"**1) 과적합은 정규화·데이터가 우선입니다. **2) 정답 1**","scenario_9":"**1) 셔플·동기화를 점검합니다. **2) 정답 1**","choice_0":"**1) 미니배치는 노이즈가 있어 탈출에 유리할 수 있습니다. **2) 정답 2**","choice_1":"**1) $\\beta\\approx0$이면 관성이 거의 없습니다. **2) 정답 1**","choice_2":"**1) 0.9, 0.999가 전형적입니다. **2) 정답 1**","choice_3":"**1) 워밍업은 초기 불안정 완화에 쓰입니다. **2) 정답 1**","choice_4":"**1) 2차 모멘트는 제곱 기울기 EMA입니다. **2) 정답 1**","choice_5":"**1) AdamW는 감쇠 분리를 다룹니다. **2) 정답 1**","choice_6":"**1) 모멘텀이 지그재그 완화에 도움이 됩니다. **2) 정답 1**","choice_7":"**1) $\\varepsilon\\sim10^{-8}$이 일반적입니다. **2) 정답 1**","choice_8":"**1) 배치↑ 분산↓ 경향입니다. **2) 정답 1**","choice_9":"**1) 클리핑은 폭주 완화에 쓰입니다. **2) 정답 1**","concept_0":"**1) 좁은 골짜기 지그재그는 모멘텀·lr이 핵심입니다. **2) 예시:** NLP 트랜스포머 튜닝에서 Adam+warmup을 씁니다. **3) 정답 2**","concept_1":"**1) 초기 모멘트는 0에서 시작해 편향이 있습니다. **2) 정답 1**","concept_2":"**1) 자주 갱신되는 좌표는 AdaGrad에서 스텝이 줄습니다. **2) 정답 2**","concept_3":"**1) 궤적이 달라 일반화가 달라질 수 있습니다. **2) 정답 1**","concept_4":"**1) 네스테로프는 기울기 평가 위치가 다릅니다. **2) 정답 1**","concept_5":"**1) RMSProp은 무한 누적을 완화합니다. **2) 정답 1**","concept_6":"**1) 큰 배치는 lr 스케일링이 필요할 수 있습니다. **2) 정답 2**","concept_7":"**1) `zero_grad()`가 관례입니다. **2) 정답 1**","concept_8":"**1) 분모가 커져 스텝이 줄어듭니다. **2) 정답 2**","concept_9":"**1) 비전 대회는 SGD+momentum+스케줄이 흔합니다. **2) 정답 1**","calc_0":"**1) 계산:** $48/16=3$. **2) 예시:** 배치 16이면 48개를 3번에 나눕니다. **3) 정답 3**","calc_1":"**1) 계산:** $5\\times20=100$. **2) 정답 100**","calc_2":"**1) 계산:** $2\\times3=6$. **2) 정답 6**","calc_3":"**1) 계산:** $0.9\\times10+0.1\\times10=10$. **2) 정답 10**","calc_4":"**1) 계산:** $0.1\\times20=2$. **2) 정답 2**","calc_5":"**1) 계산:** $0.5\\times6+0.5\\times2=4$. **2) 정답 4**","calc_6":"**1) 계산:** $0.9\\times10+0.1\\times0=9$. **2) 정답 9**","calc_7":"**1) 계산:** $1/(1-0.9)=10$. **2) 정답 10**","calc_8":"**1) 계산:** $4096/512=8$. **2) 정답 8**","calc_9":"**1) 계산:** $0.001\\times1000=1$. **2) 정답 1**"},"problemTestCodes":{"definition_0":"answer = 2\nassert answer == 2","definition_1":"answer = 2\nassert answer == 2","definition_2":"answer = 2\nassert answer == 2","definition_3":"answer = 2\nassert answer == 2","definition_4":"answer = 2\nassert answer == 2","definition_5":"answer = 2\nassert answer == 2","definition_6":"answer = 1\nassert answer == 1","definition_7":"answer = 2\nassert answer == 2","definition_8":"answer = 1\nassert answer == 1","definition_9":"answer = 2\nassert answer == 2","trueFalse_0":"answer = 1\nassert answer == 1","trueFalse_1":"answer = 0\nassert answer == 0","trueFalse_2":"answer = 1\nassert answer == 1","trueFalse_3":"answer = 1\nassert answer == 1","trueFalse_4":"answer = 1\nassert answer == 1","trueFalse_5":"answer = 0\nassert answer == 0","trueFalse_6":"answer = 1\nassert answer == 1","trueFalse_7":"answer = 1\nassert answer == 1","trueFalse_8":"answer = 1\nassert answer == 1","trueFalse_9":"answer = 0\nassert answer == 0","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 1\nassert answer == 1","scenario_3":"answer = 1\nassert answer == 1","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1","choice_0":"answer = 2\nassert answer == 2","choice_1":"answer = 1\nassert answer == 1","choice_2":"answer = 1\nassert answer == 1","choice_3":"answer = 1\nassert answer == 1","choice_4":"answer = 1\nassert answer == 1","choice_5":"answer = 1\nassert answer == 1","choice_6":"answer = 1\nassert answer == 1","choice_7":"answer = 1\nassert answer == 1","choice_8":"answer = 1\nassert answer == 1","choice_9":"answer = 1\nassert answer == 1","concept_0":"answer = 2\nassert answer == 2","concept_1":"answer = 1\nassert answer == 1","concept_2":"answer = 2\nassert answer == 2","concept_3":"answer = 1\nassert answer == 1","concept_4":"answer = 2\nassert answer == 2","concept_5":"answer = 1\nassert answer == 1","concept_6":"answer = 2\nassert answer == 2","concept_7":"answer = 1\nassert answer == 1","concept_8":"answer = 2\nassert answer == 2","concept_9":"answer = 1\nassert answer == 1","calc_0":"n, b = 48, 16\nanswer = n // b\nassert answer == 3","calc_1":"answer = 5 * 20\nassert answer == 100","calc_2":"eta, g = 2, 3\nanswer = eta * g\nassert answer == 6","calc_3":"beta, v, g = 0.9, 10, 10\nanswer = int(beta * v + (1 - beta) * g)\nassert answer == 10","calc_4":"beta1, m, g = 0.9, 0, 20\nanswer = int((1 - beta1) * g)\nassert answer == 2","calc_5":"beta, v, g = 0.5, 6, 2\nanswer = int(beta * v + (1 - beta) * g)\nassert answer == 4","calc_6":"beta1, m, g = 0.9, 10, 0\nanswer = int(beta1 * m + (1 - beta1) * g)\nassert answer == 9","calc_7":"beta1, t = 0.9, 1\nanswer = int(1 / (1 - beta1 ** t))\nassert answer == 10","calc_8":"n, b = 2048, 256\nanswer = n // b\nassert answer == 8","calc_9":"lr, k = 0.001, 1000\nanswer = int(round(lr * k))\nassert answer == 1"},"problemDifficulty":{"definition_0":"easy","definition_1":"easy","definition_2":"easy","definition_3":"easy","definition_4":"easy","definition_5":"easy","definition_6":"easy","definition_7":"easy","definition_8":"easy","definition_9":"easy","trueFalse_0":"easy","trueFalse_1":"easy","trueFalse_2":"easy","trueFalse_3":"easy","trueFalse_4":"easy","trueFalse_5":"easy","trueFalse_6":"easy","trueFalse_7":"easy","trueFalse_8":"easy","trueFalse_9":"easy","scenario_0":"medium","scenario_1":"medium","scenario_2":"medium","scenario_3":"medium","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","choice_0":"medium","choice_1":"medium","choice_2":"medium","choice_3":"medium","choice_4":"medium","choice_5":"medium","choice_6":"medium","choice_7":"medium","choice_8":"medium","choice_9":"medium","concept_0":"hard","concept_1":"hard","concept_2":"hard","concept_3":"hard","concept_4":"hard","concept_5":"hard","concept_6":"hard","concept_7":"hard","concept_8":"hard","concept_9":"hard","calc_0":"hard","calc_1":"hard","calc_2":"hard","calc_3":"hard","calc_4":"hard","calc_5":"hard","calc_6":"hard","calc_7":"hard","calc_8":"hard","calc_9":"hard"},"problemOrder":["definition_0","definition_1","definition_2","definition_3","definition_4","definition_5","definition_6","definition_7","definition_8","definition_9","trueFalse_0","trueFalse_1","trueFalse_2","trueFalse_3","trueFalse_4","trueFalse_5","trueFalse_6","trueFalse_7","trueFalse_8","trueFalse_9","scenario_0","scenario_1","scenario_2","scenario_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","choice_0","choice_1","choice_2","choice_3","choice_4","choice_5","choice_6","choice_7","choice_8","choice_9","concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","concept_6","concept_7","concept_8","concept_9","calc_0","calc_1","calc_2","calc_3","calc_4","calc_5","calc_6","calc_7","calc_8","calc_9"]},"midMlChapters":{"midMl00":{"chapter":"Chapter 00","title":"중급 머신러닝: 현실 데이터와 맞서는 전처리·튜닝","description":"깨끗하게 정제된 데이터를 넘어서, 결측치, 이상치, 비선형적 관계를 가진 현실 데이터를 다루기 위한 전처리 기법과 모델 성능 최적화의 필요성을 소개합니다."},"midMl01":{"chapter":"Chapter 01","title":"데이터 스케일링: 단위를 맞추고 분포를 다루기","description":"단위가 다른 특성(Feature)들이 모델에 미치는 영향을 균일하게 맞추기 위한 표준화(Standardization), 정규화(Min-Max Scaling), 그리고 이상치에 강건한 Robust Scaling을 배웁니다."},"midMl02":{"chapter":"Chapter 02","title":"범주형 인코딩: 문자를 숫자로, 의미를 살리기","description":"텍스트 형태의 범주형 데이터를 컴퓨터가 연산할 수 있도록 숫자로 변환하는 원-핫 인코딩(One-Hot Encoding)과 순서형 인코딩, 타깃 인코딩의 차이점을 설명합니다."},"midMl03":{"chapter":"Chapter 03","title":"결측치 처리와 보간: 빈칸을 똑똑하게 채우기","description":"데이터에 빈값이 존재할 때 단순히 삭제하는 것을 넘어, 평균/중앙값 대체부터 KNN 기반 보간, 회귀 예측 기반 보간까지 결측치를 통계적으로 채워 넣는 방법을 다룹니다."},"midMl04":{"chapter":"Chapter 04","title":"불균형 데이터: 소수 클래스도 제대로 배우기","description":"정상 데이터가 압도적으로 많은 사기 탐지, 질병 진단 등의 상황에서, 모델이 다수 클래스에 편향되지 않도록 소수 데이터를 합성하는 SMOTE 기법과 클래스별 가중치 조절을 배웁니다."},"midMl05":{"chapter":"Chapter 05","title":"고급 교차 검증: 층화·시계열까지 나누기","description":"단순한 K-폴드를 넘어, 클래스 비율을 균일하게 유지하는 층화추출(Stratified) 교차 검증과 시간의 흐름을 보존해야 하는 시계열 분할(Time Series Split) 기법의 차이를 알아봅니다."},"midMl06":{"chapter":"Chapter 06","title":"다중 분류 평가와 ROC-AUC: 임계값에 따른 성능 보기","description":"이진 분류의 평가 지표(정밀도, 재현율)를 다중 클래스로 확장하는 방법론(Micro, Macro 평균)과, 임계값 변화에 따른 모델의 전반적인 분류 성능을 평가하는 ROC 곡선을 분석합니다."},"midMl07":{"chapter":"Chapter 07","title":"서포트 벡터 머신: 마진을 최대로 넓히는 경계","description":"두 클래스 사이를 나누는 여러 선 중, 가장 가까운 데이터 포인트(서포트 벡터)와의 여백(Margin)을 최대로 넓히는 최적의 결정 경계(Hyperplane)를 찾는 분류 기법입니다."},"midMl08":{"chapter":"Chapter 08","title":"커널 트릭: 차원만 올려도 비선형 분리","description":"원래의 차원에서는 선형으로 분류할 수 없는 데이터를, 데이터의 직접적인 이동 없이 내적 연산만으로 고차원 공간으로 매핑하여 분리하는 수학적 기법을 다룹니다."},"midMl09":{"chapter":"Chapter 09","title":"PCA: 분산을 최대한 담는 축으로 압축하기","description":"수많은 특성 간의 상관관계를 분석하여, 데이터가 가진 전체 분산을 최대한 보존하는 소수의 직교하는 축(Principal Component)으로 고차원 데이터를 선형 압축하는 원리입니다."},"midMl10":{"chapter":"Chapter 10","title":"배깅과 페이스팅: 여러 모델을 투표로 묶기","description":"복원 추출(Bootstrap)을 통해 여러 개의 훈련 세트를 만들어 각각 모델을 학습시킨 후 투표로 결과를 합치는 배깅과, 비복원 추출을 사용하는 페이스팅의 편향-분산 제어 원리를 설명합니다."},"midMl11":{"chapter":"Chapter 11","title":"에이다부스트: 틀린 것에 집중해서 순서대로 보강하기","description":"독립적으로 모델을 생성하는 배깅과 달리, 이전 모델이 틀린 데이터에 더 큰 가중치를 부여하여 순차적으로 약한 학습기(Weak Learner)를 결합해 오차를 줄이는 알고리즘입니다."},"midMl12":{"chapter":"Chapter 12","title":"GBM: 잔차를 다음 트리가 맞추기","description":"틀린 데이터의 가중치를 직접 조정하는 대신, 이전 트리가 남긴 잔차(Residual Error)를 다음 트리가 예측하도록 하여 경사하강법과 앙상블을 결합한 수학적 접근 방식입니다."},"midMl13":{"chapter":"Chapter 13","title":"DBSCAN: 모여 있는 곳만 군집으로 묶기","description":"구형으로만 묶이는 K-평균 군집화의 한계를 넘어, 데이터가 촘촘하게 모여 있는 밀도(Density)를 기준으로 군집을 형성하고 외곽의 노이즈 데이터를 걸러내는 알고리즘입니다."},"midMl14":{"chapter":"Chapter 14","title":"계층적 군집화: 비슷한 것부터 나무처럼 합치기","description":"사전에 군집의 개수를 지정하지 않고, 가장 비슷한 데이터끼리 순차적으로 병합하거나 분할하여 계층적 트리 구조(Dendrogram)로 데이터의 관계를 시각화하는 비지도 학습입니다."},"midMl15":{"chapter":"Chapter 15","title":"가우시안 혼합 모델: 여러 종 모양의 합으로 군집하기","description":"데이터가 여러 개의 서로 다른 정규 분포(Gaussian) 조합에서 생성되었다고 가정하고, EM 알고리즘을 통해 각 데이터가 특정 분포에 속할 확률을 계산하는 연성(Soft) 군집화입니다."},"midMl16":{"chapter":"Chapter 16","title":"이상치 탐지: 정상에서 멀어지면 표시하기","description":"정답 라벨이 부족한 상황에서 통계적 분포나 데이터 간의 거리를 활용하여, 정상 패턴에서 크게 벗어난 비정상 데이터를 찾아내는 비지도/반지도 기반의 탐색론을 다룹니다."},"midMl17":{"chapter":"Chapter 17","title":"파이프라인: 전처리부터 학습까지 한 번에","description":"스케일링, 인코딩, 차원 축소, 모델 학습 등 일련의 데이터 전처리 및 학습 과정을 하나의 연속적인 워크플로우로 묶어 코드의 재사용성을 높이고 데이터 누수(Data Leakage)를 방지합니다."},"midMl18":{"chapter":"Chapter 18","title":"하이퍼파라미터 튜닝 1: 그리드·랜덤으로 최적값 찾기","description":"사용자가 직접 지정해야 하는 트리의 깊이, 학습률 등의 최적값을 찾기 위해, 가능한 모든 조합을 시도하는 그리드 서치(Grid Search)와 무작위 조합을 시도하는 랜덤 서치의 차이를 비교합니다."},"midMl19":{"chapter":"Chapter 19","title":"하이퍼파라미터 튜닝 2: 베이지안으로 더 빨리 찾기","description":"이전 탐색 결과를 사후 확률 모델에 반영하여, 다음으로 탐색할 하이퍼파라미터 조합을 통계적으로 추천함으로써 최적점을 빠르고 효율적으로 찾는 고급 탐색 기법입니다."},"midMl20":{"chapter":"Chapter 20","title":"중급 머신러닝 총정리: 전처리·튜닝 한눈에","description":"결측치 처리부터 스케일링, PCA 차원 축소를 거쳐 SVM과 부스팅 모델을 하이퍼파라미터 튜닝으로 최적화하는 실무형 머신러닝 파이프라인 프로세스를 요약합니다."}},"advMlChapters":{"advMl00":{"chapter":"Chapter 00","title":"고급 머신러닝: 최고 성능과 블랙박스 열기","description":"캐글(Kaggle) 등 실제 데이터 분석 대회에서 주력으로 사용되는 최적화된 부스팅 앙상블의 원리와, 블랙박스 모델의 예측 근거를 투명하게 해석하기 위한 XAI의 중요성을 소개합니다."},"advMl01":{"chapter":"Chapter 01","title":"XGBoost: 빠르고 정규화된 부스팅","description":"기존 GBM의 느린 학습 속도를 개선하고, 트리 구조의 복잡성을 제어하는 정규화(Regularization) 항을 목적 함수에 추가하여 과적합 방지 성능을 극대화한 알고리즘입니다."},"advMl02":{"chapter":"Chapter 02","title":"LightGBM: 리프부터 깊게 쌓아 속도 내기","description":"트리의 균형을 맞추는 기존 방식(Level-wise)과 달리, 손실을 가장 많이 줄일 수 있는 노드부터 깊게 분할하는 리프 중심 분할(Leaf-wise)을 채택하여 속도와 정확도를 높인 모델입니다."},"advMl03":{"chapter":"Chapter 03","title":"CatBoost: 범주형 변수 그대로 먹이기","description":"명목형 변수를 처리할 때 타깃 누수를 방지하기 위해 정렬된 부스팅(Ordered Boosting) 기법을 사용하며, 범주형 데이터가 많은 표 형식(Tabular) 데이터에서 탁월한 성능을 냅니다."},"advMl04":{"chapter":"Chapter 04","title":"t-SNE: 고차원을 2D 지도로 펼치기","description":"고차원 데이터 간의 유사도를 확률 분포로 변환하여, PCA로는 파악하기 힘든 비선형적 군집 구조를 유지한 채 2차원 또는 3차원 공간에 시각화하는 비지도 알고리즘입니다."},"advMl05":{"chapter":"Chapter 05","title":"UMAP: 빠르게, 전역 구조까지 보존하기","description":"t-SNE의 느린 속도와 전역적 구조 상실 문제를 보완하기 위해, 리만 기하학과 위상수학을 바탕으로 데이터의 지역적 구조와 전역적 구조를 모두 빠르게 보존하는 차원 축소 기법입니다."},"advMl06":{"chapter":"Chapter 06","title":"Isolation Forest: 빨리 고립되면 이상치","description":"정상 데이터는 밀집되어 있고 이상치는 드물다는 점을 이용해, 의사결정나무를 무작위로 분할할 때 평균적으로 더 적은 횟수의 분할만으로 고립되는 데이터를 이상치로 판별합니다."},"advMl07":{"chapter":"Chapter 07","title":"One-Class SVM: 정상만으로 경계 그리기","description":"정상 데이터만으로 모델을 학습시켜 정상 데이터가 존재하는 영역의 경계선(Boundary)을 설정하고, 이후 새로운 데이터가 이 경계선을 벗어나면 이상치로 분류하는 커널 기반 기법입니다."},"advMl08":{"chapter":"Chapter 08","title":"특성 선택과 중요도: 어떤 변수가 진짜 중요한가","description":"단순한 정보 이득(Information Gain)을 넘어, 각 특성을 무작위로 섞었을 때 성능이 얼마나 하락하는지 측정하는 순열 중요도(Permutation Importance)를 통한 핵심 변수 추출법입니다."},"advMl09":{"chapter":"Chapter 09","title":"XAI 1: 부분 의존성 플롯으로 한 변수 영향 보기","description":"복잡한 비선형 앙상블 모델에서, 특정 특성(Feature)의 수치 변화가 모델의 평균적인 예측 결과에 어떤 한계적 영향(Marginal Effect)을 미치는지 선그래프로 시각화합니다."},"advMl10":{"chapter":"Chapter 10","title":"XAI 2: LIME으로 이 예측만 국소 해석하기","description":"전역적인 모델 해석이 아닌 개별 데이터 예측 결과에 초점을 맞춰, 해당 데이터 포인트 주변의 국소적(Local) 영역을 선형 모델로 근사하여 어떤 변수가 예측에 영향을 주었는지 설명합니다."},"advMl11":{"chapter":"Chapter 11","title":"XAI 3: SHAP으로 기여도 공정하게 나누기","description":"게임 이론의 섀플리 값(Shapley Value)을 기반으로, 특정 특성이 전체 모델의 예측값을 기준(Base Value)으로부터 얼마나 높이거나 낮추었는지 모든 상호작용을 고려하여 정량적으로 분배합니다."},"advMl12":{"chapter":"Chapter 12","title":"시계열 전처리와 정상성: 예측 가능한 상태로 만들기","description":"주가, 매출액 등 시계열 데이터가 통계적 모델링을 할 수 있는 일정한 평균과 분산을 갖춘 상태(정상성)인지 판단하는 ADF 검정과 차분(Differencing) 전처리를 다룹니다."},"advMl13":{"chapter":"Chapter 13","title":"ARIMA와 SARIMA: 과거와 오차로 미래 예측하기","description":"데이터 자신의 과거 관측값(AR)과 오차(MA), 그리고 차분(I)을 결합한 통계적 예측 모델로, 데이터에 주기적인 패턴이 있는 경우 계절성(Seasonality)을 추가한 SARIMA의 구조를 설명합니다."},"advMl14":{"chapter":"Chapter 14","title":"Prophet: 트렌드·계절·휴일을 분해해서 예측하기","description":"페이스북(Meta)에서 개발한 시계열 모델로, 전체적인 추세(Trend), 주간/연간 계절성, 그리고 휴일(Holiday) 효과 등 구조적 구성 요소를 분해하여 비선형적인 패턴을 예측합니다."},"advMl15":{"chapter":"Chapter 15","title":"추천 1: 콘텐츠 기반—비슷한 걸 골라 주기","description":"사용자의 과거 행동 이력이 아닌 아이템 자체의 속성(텍스트, 메타데이터)을 벡터화하고 코사인 유사도를 계산하여, 사용자가 좋아했던 아이템과 가장 비슷한 항목을 추천합니다."},"advMl16":{"chapter":"Chapter 16","title":"추천 2: 행렬 분해로 빈칸 점수 채우기","description":"희소한 사용자-아이템 평가 행렬을 소수의 잠재 요인(Latent Factor)을 가진 두 개의 하위 행렬로 분해한 뒤, 이를 다시 내적하여 사용자가 평가하지 않은 아이템의 점수를 예측합니다."},"advMl17":{"chapter":"Chapter 17","title":"추천 3: 인수분해 머신으로 맥락까지 반영하기","description":"사용자 및 아이템 ID뿐만 아니라 시간, 기기 정보 등 다양한 맥락적(Contextual) 특성 변수들 간의 상호작용을 선형 시간 내에 효과적으로 계산하는 고차원 희소 데이터 특화 알고리즘입니다."},"advMl18":{"chapter":"Chapter 18","title":"연관 규칙과 Apriori: 함께 사는 패턴 찾기","description":"기계학습 이전의 전통적 추천 방식으로, 대규모 장바구니 데이터에서 항목들 간의 조건부 확률(지지도, 신뢰도, 향상도) 패턴을 찾아냅니다."},"advMl19":{"chapter":"Chapter 19","title":"AutoML: 전처리·모델·튜닝을 자동으로","description":"데이터 사이언티스트가 반복적으로 수행하는 전처리, 모델 선택, 하이퍼파라미터 튜닝 과정을 자동화 알고리즘으로 대체하여, 최소한의 코드로 최적의 기준 모델(Baseline)을 확보하는 기법입니다."},"advMl20":{"chapter":"Chapter 20","title":"고급 머신러닝 총정리: SOTA·XAI·시계열·추천 한눈에","description":"XGBoost/LightGBM 기반의 예측 파이프라인 구축부터 SHAP을 활용한 실무 비즈니스 인사이트 도출, 그리고 시계열 및 추천 시스템으로의 문제 해결 영역 확장을 요약합니다."}},"advDlChapters":{"advDl00":{"chapter":"Chapter 00","title":"고급 딥러닝: 거대 모델과 생성형 AI의 세계"},"advDl01":{"chapter":"Chapter 01","title":"트랜스포머 1: 셀프 어텐션으로 한 번에 보기"},"advDl02":{"chapter":"Chapter 02","title":"트랜스포머: 위치 인코딩과 피드포워드"},"advDl03":{"chapter":"Chapter 03","title":"트랜스포머 계보: BERT는 이해, GPT는 생성"},"advDl04":{"chapter":"Chapter 04","title":"어텐션 최적화: FlashAttention과 희소 어텐션"},"advDl05":{"chapter":"Chapter 05","title":"비전 트랜스포머: 이미지를 패치로 잘라 넣기"},"advDl30":{"chapter":"Chapter 06","title":"Swin 트랜스포머: 전역 어텐션에서 계층적 윈도 구조로"},"advDl31":{"chapter":"Chapter 07","title":"비전 모델의 진화: CNN은 지역, ViT는 전역을 본다"},"advDl08":{"chapter":"Chapter 08","title":"PEFT와 LoRA: 적은 파라미터만 고쳐서 미세조정"},"advDl09":{"chapter":"Chapter 09","title":"QLoRA와 양자화: 더 작게 줄여서 튜닝하기"},"advDl10":{"chapter":"Chapter 10","title":"가치 정렬과 RLHF: 사람 취향에 맞추기"},"advDl11":{"chapter":"Chapter 11","title":"DPO: 강화학습 없이 선호도로 정렬하기"},"advDl12":{"chapter":"Chapter 12","title":"RAG: 검색으로 환각 줄이기"},"advDl13":{"chapter":"Chapter 13","title":"LLM 에이전트: 도구를 쓰는 모델"},"advDl27":{"chapter":"Chapter 14","title":"CNN 완전 정복: 커널, 스트라이드, 패딩부터 뼈대의 진화까지"},"advDl28":{"chapter":"Chapter 15","title":"객체 탐지 (Object Detection): R-CNN 패밀리와 YOLO의 대결 (바운딩 박스 찾기)"},"advDl29":{"chapter":"Chapter 16","title":"이미지 분할 (Segmentation): U-Net과 DeepLab (픽셀 단위로 이미지 이해하기)"},"advDl15":{"chapter":"Chapter 17","title":"Grad-CAM과 XAI: CNN이 어디를 봤는지 보기"},"advDl14":{"chapter":"Chapter 18","title":"그래프 신경망 (GNN): 이웃에게 메시지 보내기"},"advDl16":{"chapter":"Chapter 19","title":"오토인코더: 압축했다가 복원하기"},"advDl17":{"chapter":"Chapter 20","title":"VAE: 확률로 쓰는 생성 공간"},"advDl18":{"chapter":"Chapter 21","title":"GAN 기초: 만들고 구분하기 대결"},"advDl19":{"chapter":"Chapter 22","title":"조건부 GAN: 조건을 주고 원하는 걸 만들기"},"advDl20":{"chapter":"Chapter 23","title":"확산 모델 (Diffusion) 1: 노이즈 넣었다가 빼기"},"advDl21":{"chapter":"Chapter 24","title":"확산 모델 (Diffusion) 2: 잠재 공간에서 확산하기"},"advDl22":{"chapter":"Chapter 25","title":"시각-언어 모델과 CLIP: 이미지와 문장 한 공간에 (앞선 CNN과 LLM 지식의 결합)"},"advDl23":{"chapter":"Chapter 26","title":"음성 인식과 오디오: 소리를 텍스트로"},"advDl24":{"chapter":"Chapter 27","title":"모델 압축과 지식 증류: 큰 걸 작게 옮기기"},"advDl25":{"chapter":"Chapter 28","title":"추론 최적화와 배포: 서버부터 웹 브라우저 런타임까지 서비스할 수 있게 만들기"},"advDl26":{"chapter":"Chapter 29","title":"고급 딥러닝 총정리: 아키텍처와 미래 한눈에"}},"advDlCh00":{"chapter":"Chapter 00","title":"고급 딥러닝: 거대 모델과 생성형 AI의 세계","description":"고급 딥러닝(Ch.00)은 생성형 AI가 “왜 거대해졌는지”와 “어떤 파이프라인으로 작동하는지”를 한 번에 잡아주는 입문 챕터입니다. 이 코스에서는 데이터에서 **표현(Representation)**을 뽑아내는 학습을 넘어, **대규모 트랜스포머**가 문맥을 이해하고 다음 토큰을 예측하는 방식, 그리고 그 결과를 사용자 의도에 맞게 정렬(Alignment)하고 배포(Inference/Deployment)하는 흐름을 배웁니다.","roadmapTitle":"거대 모델로 이어지는 고급 딥러닝 로드맵","roadmapDescription":"아래 로드맵은 Ch01부터 차근차근 채워지며, 각 챕터가 전체 시스템에서 어떤 역할을 하는지 연결해 보여줍니다.","roadmapListHeading":"Ch01~Ch24에서 배우는 것","sectionTitle":"고급 딥러닝이란? (생성형 AI 시스템 관점)","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","problemSolving":"문제 풀이를 위한 설명"},"whatIs":{"0":"**거대 모델(Foundation / LLM)**은 다음 토큰을 예측하는 목표로 학습한 거대한 신경망입니다. 즉, $p(x_t\\mid x_{ 토큰화 -> 컨텍스트 윈도우 -> Transformer -> 디코딩(예: greedy/beam/sample)`의 파이프라인으로 응답을 생성합니다. 이때 디코딩 전략과 프롬프트 설계가 결과 품질을 크게 좌우합니다.","1":"정렬과 제어는 여러 방식으로 이루어집니다. 예를 들어 **RLHF/DPO**처럼 선호도를 이용해 모델을 업데이트하거나, **RAG**로 외부 지식을 검색해 근거 기반 답변을 만들 수 있어요.","2":"서비스 관점에서는 **도구 사용(Tool use)**, 캐싱/배치 처리, 양자화/지식 증류 같은 최적화가 함께 들어갑니다. 같은 모델이라도 “어떻게 돌리느냐”에 따라 체감 품질과 비용이 달라집니다."},"problemSolving":{"0":"이 섹션은 고급 딥러닝 전체를 문제 풀이 관점에서 한 번에 짚기 위한 설명입니다. **다음 토큰 예측**으로 이루어지는 사전학습은 일반적인 언어 능력의 바탕이 되며, 확률적 생성과 표현 학습과 이어집니다. 사용자 지시에 맞춰 응답하게 만드는 **Instruction·SFT**는 데이터 포맷과 미세조정이 함께 등장합니다.\n\n**정렬(Alignment)**은 선호·안전·사실성을 다루며 선호 학습과 보상 모델 개념으로 연결됩니다. **RAG·근거 있는 생성**은 검색·임베딩·컨텍스트 결합으로 환각을 줄이는 방향과 맞닿아 있고, **추론 최적화**는 지연과 비용을 줄이기 위해 양자화·캐싱·증류 같은 실행 층면을 다룹니다."}},"advDlCh01":{"chapter":"Chapter 01","title":"트랜스포머 1: 셀프 어텐션으로 한 번에 보기","description":"트랜스포머 모델은 단어 간의 관계를 파악하는 **셀프 어텐션(Self-Attention)**, 학습의 안정성을 책임지는 **Add & Norm(잔차 연결과 층 정규화)**, 그리고 파악된 정보를 깊이 있게 가공하는 **피드포워드(Feed Forward) 신경망**이라는 세 가지 톱니바퀴로 맞물려 돌아갑니다. 과거의 모델들이 단어를 하나씩 순서대로 읽으며 앞내용을 까먹곤 했다면, 트랜스포머는 문장 전체를 조감도처럼 내려다보며 처리합니다. 이 챕터에서는 초보자도 쉽게 이해할 수 있도록 Query, Key, Value를 통한 어텐션 메커니즘부터, 모델이 지치지 않고 깊게 학습하도록 돕는 Add & Norm과 피드포워드의 직관적인 원리까지 친절하게 알아봅니다.","sectionTitle":"트랜스포머 1: 셀프 어텐션으로 한 번에 보기","whatIs":{"0":"**1. 셀프 어텐션(Self-Attention): 문맥을 파악하는 눈**\n\n셀프 어텐션은 문장 안의 각 단어가 다른 모든 단어를 동시에 바라보고, 지금 단어를 이해하기 위해 **'어떤 단어를 얼마나 참고할지' 가중치**를 정하는 과정입니다. 비유하자면 도서관에서 책을 찾는 것과 같습니다. 내가 궁금한 검색어(Query)를 들고, 책들의 키워드(Key)를 확인한 뒤, 가장 관련성 높은 책의 실제 내용(Value)을 골라내는 것이죠. 이를 통해 \"배를 타고 강을 건너다 배가 아파서 배를 먹었다\"라는 문장에서 각각의 '배'가 주변 단어들과 어떻게 연결되는지 한 번에 파악합니다. ","1":"**2. Add (잔차 연결, Residual Connection): 정보의 고속도로**\n\n어텐션을 통과한 정보는 **Add** 단계를 거칩니다. 수학적으로는 입력값 $x$를 어텐션 결과에 그대로 더해주는 $x + \\mathrm{Attention}(x)$ 형태입니다. 비유하자면 **'우회도로(지름길)'**를 뚫어주는 것과 같습니다. 딥러닝은 층이 깊어질수록 원본 데이터의 정보가 희미해지거나 왜곡되기 쉬운데, 원본 데이터를 징검다리처럼 안전하게 다음 층으로 곧바로 넘겨주어 학습의 방향을 잃지 않게(기울기 소실 방지) 도와주는 든든한 안전망 역할을 합니다.","2":"**3. Norm (층 정규화, Layer Normalization): 멘탈 관리와 영점 조절**\n\nAdd를 거친 데이터는 값이 들쭉날쭉해질 수 있습니다. 그래서 **Norm** 단계를 통해 데이터의 평균을 0, 분산을 1로 맞추어 줍니다. 수식으로는 $\\frac{x - \\mu}{\\sigma}$의 형태를 띱니다. 학교 시험 점수를 과목별로 '표준 편차'를 내어 공평하게 평가하듯, 신경망 안의 숫자 값들이 폭주하거나 죽어버리지 않도록 **'영점 조절'**을 해주는 과정입니다. 덕분에 모델은 훈련 내내 안정적인 컨디션을 유지합니다. ","3":"**4. 피드포워드 신경망 (Feed Forward): 개별 심층 면접**\n\n어텐션이 '단어와 단어 사이의 관계'를 모아서 섞는 단체 토론이라면, **피드포워드(FFNN)**는 각 단어를 따로따로 불러내어 **'개별 심층 면접'**을 보는 과정입니다. 여기서 각 단어의 벡터는 다른 단어의 눈치를 보지 않고 오직 자기 자신의 의미를 더 깊고 복잡하게 변환($\\mathrm{ReLU}(xW_1 + b_1)W_2 + b_2$)합니다. 이처럼 [어텐션 $\\rightarrow$ Add & Norm $\\rightarrow$ 피드포워드 $\\rightarrow$ Add & Norm]의 흐름이 바로 트랜스포머를 구성하는 하나의 핵심 블록(Encoder Block)입니다. "},"whyImportant":{"0":"**셀프 어텐션의 중요성: 장거리 의존성 완벽 해결**\n\n기존의 RNN은 한 줄로 서서 앞사람의 말을 뒷사람에게 전하는 귓속말 게임과 같아 문장이 길어지면 정보를 잊어버렸습니다. 하지만 셀프 어텐션은 모두가 참여하는 단체 채팅방과 같아서, 100번째 단어를 읽을 때도 1번째 단어를 즉시 참고할 수 있습니다. 수십 장의 법률 문서나 긴 고객 상담 로그를 분석할 때 핵심 문맥을 절대 놓치지 않는 이유가 바로 이 때문입니다.","1":"**Add & Norm이 중요한 이유: 깊고 거대한 모델의 탄생 비결**\n\nChatGPT처럼 똑똑한 AI를 만들려면 이 블록을 수십~수백 층으로 아주 깊게 쌓아야 합니다. 하지만 층이 깊어질수록 뒤에서 앞으로 오차를 전달하는 '역전파' 과정에서 신호가 끊기는(기울기 소실) 문제가 발생합니다. **Add(잔차 연결)**가 고속도로를 뚫어주고, **Norm(정규화)**이 신호의 크기를 안정적으로 유지해주기 때문에, 우리는 100층이 넘는 초거대 AI 모델도 붕괴 없이 안정적으로 학습시킬 수 있게 되었습니다.","2":"**피드포워드가 중요한 이유: 차원을 넘나드는 의미의 확장**\n\n단어의 관계를 아는 것만으로는 부족합니다. 피드포워드 신경망은 데이터를 더 높은 차원으로 뻥 튀겼다가(확장) 다시 원래 차원으로 줄이는(압축) **'모래시계형 구조'**를 가집니다. 이 과정을 거치며 데이터 속에 숨겨진 매우 복잡하고 추상적인 규칙(비선형적 특징)들을 추출해 냅니다. 마치 밀가루와 물(관계성)을 반죽기(피드포워드)에 넣고 강하게 치대어 쫄깃한 면발(깊은 의미)을 뽑아내는 것과 같습니다.","3":"**실제 머신러닝 적용 사례의 시너지**\n\n구글 번역기나 의료 진단 AI는 이 콤보를 활용합니다. 어텐션으로 \"발열은 없음\"에서 '없음'이 '발열'을 꾸며준다는 관계를 파악하고, 피드포워드로 이 조합이 '건강함' 또는 '음성 판정'이라는 깊은 의학적 의미를 갖도록 가공합니다. 그리고 Add & Norm 덕분에 수천만 건의 의료 문서를 지치지 않고 안정적으로 학습할 수 있는 것입니다."},"howUsed":{"0":"**실무에서의 전체 조립 과정: 밑작업과 컨베이어 벨트**\n\n실무에서는 텍스트를 모델에 넣기 전 '전처리'를 반드시 거칩니다. 문장을 단어 조각(토큰)으로 쪼개고 숫자 벡터(임베딩)로 바꾼 뒤, 단어의 순서를 알려주는 **위치 인코딩(Positional Encoding)**을 더해줍니다. 어텐션 연산 자체는 단어의 순서를 모르는 '집합'처럼 동작하기 때문에, \"내가 문장의 몇 번째 단어다\"라는 위치 꼬리표를 강제로 달아주는 것입니다. 이렇게 준비된 데이터는 **[멀티헤드 어텐션 $\\rightarrow$ Add & Norm $\\rightarrow$ 피드포워드 $\\rightarrow$ Add & Norm]**이라는 하나의 거대한 컨베이어 벨트(인코더 블록)를 통과합니다. 이 똑같은 블록을 12번 쌓으면 BERT-Base 모델이 되고, 96번씩 쌓아 올리면 GPT-3 같은 거대 언어 모델이 완성됩니다. ","1":"**멀티헤드 어텐션의 활약: 전문가 위원회의 분업**\n\n한 명의 천재보다 8명의 전문가 위원회가 낫다는 아이디어입니다. 예를 들어 512차원의 데이터가 들어오면, 8개의 헤드(Head)가 이를 64차원씩 쪼개어 각자의 관점으로 분석합니다. 1번 헤드는 '누가 무엇을 했는지' 문법적 구조를, 2번 헤드는 '긍정인지 부정인지' 감정의 뉘앙스를, 3번 헤드는 '사람 이름이나 지명'을 전담하여 추적하는 식입니다. 각 헤드는 $\\mathrm{head}_h=\\mathrm{softmax}(Q_hK_h^T/\\sqrt{d_k})V_h$ 공식으로 자신이 맡은 분야의 가중치를 계산합니다. 분석이 끝나면, 8개의 64차원 조각들을 다시 옆으로 길게 이어 붙여($\\mathrm{Concat}$) 본래의 512차원으로 복구합니다. 이를 통해 한 번의 연산으로 문장의 다채롭고 입체적인 의미를 파악하게 됩니다. ","2":"**피드포워드와 활성화 함수의 결합: 현미경 관찰과 핵심 추출**\n\n어텐션이 단어와 단어 '사이'의 관계를 파악했다면, 피드포워드(FFNN)는 단어 '하나하나'의 의미를 독립적으로 깊게 파고듭니다. 실무에서는 보통 입력 차원(예: 512)을 4배(예: 2048)로 크게 부풀리는 **확장-압축(모래시계) 구조**를 사용합니다. 차원을 넓혀 단어의 아주 미세한 특징까지 현미경으로 관찰한 뒤, $\\mathrm{ReLU}$나 $\\mathrm{GELU}$ 같은 비선형 활성화 함수를 통과시킵니다. 이때 불필요한 노이즈나 무의미한 정보는 0으로 걸러내고, 정말 중요한 핵심 특징만 남겨 다시 원래의 512차원으로 압축합니다. 수식으로는 $\\mathrm{FFN}(x) = \\max(0, xW_1 + b_1)W_2 + b_2$ 로 표현되며, 이 과정을 통해 모델은 단순한 패턴을 넘어 복잡한 개념을 암기하고 이해하게 됩니다.","3":"**코드와 프레임워크에서의 활용: 하이퍼파라미터 튜닝**\n\n이 모든 복잡한 수학과 행렬 연산은 PyTorch나 TensorFlow 같은 프레임워크에 `nn.TransformerEncoderLayer`라는 단 한 줄의 코드로 예쁘게 포장되어 있습니다. 실무 개발자들은 밑바닥부터 수식을 짜기보다, 레고 블록을 조립하듯 핵심 **하이퍼파라미터**를 조절하는 데 집중합니다. 단어의 의미를 얼마나 풍성하게 담을지 결정하는 임베딩 차원 크기($d_{model}$), 전문가 위원회를 몇 명으로 구성할지 정하는 헤드 개수($n_{head}$), 현미경으로 얼마나 확대해서 볼지 결정하는 피드포워드 확장 크기($dim_{feedforward}$)를 조절하며 자신이 개발 중인 AI 서비스와 사용 가능한 GPU 자원에 맞춰 최적의 성능을 끌어냅니다."},"problemSolving":{"0":"셀프 어텐션 문제는 “모든 토큰이 서로를 참고해 주의 가중치 $A=\\mathrm{softmax}(QK^T/\\sqrt{d_k})$를 만든다”는 그림으로 접근하면 쉽습니다. Q·K·V는 입력 $X$에 $W_Q,W_K,W_V$를 곱해 만들고, $\\sqrt{d_k}$로 스케일링한 뒤 소프트맥스로 행마다 합이 1인 분포를 얻습니다. 멀티헤드는 문법·의미 등 여러 관점을 병렬로 보는 장치이며, $d_{model}=n_{head}\\times d_{head}$ 같은 구성 계산도 자주 나옵니다.","2":"**예시 (개념 이해 문제)**\n\n\"셀프 어텐션에서 Query(Q)와 Key(K)의 닷프로덕트($QK^T$)가 의미하는 것은 무엇인가? ① 단어의 길이 ② 단어 간의 연관성(유사도) ③ 문장의 위치 정보\"\n\nQuery와 Key의 내적은 두 단어가 문맥적으로 얼마나 관련이 있는지를 나타내는 점수입니다. → **정답 2**\n\n---\n\n**예시 (O/X 문제)**\n\n\"소프트맥스 이후 한 토큰의 어텐션 가중치 합은 보통 1이다. 맞으면 1, 틀리면 0.\"\n\nsoftmax는 확률을 만들기 때문에 합이 1이 됩니다. → **정답 1**\n\n---\n\n**예시 (응용 문제)**\n\n\"긴 고객 상담 로그에서 앞부분 부정 표현이 뒤 문장을 뒤집을 때 유리한 모델 요소는? ① 셀프 어텐션 ② 평균풀링만 ③ 단순 규칙기반\"\n\n앞의 부정 표현과 뒤 문장의 관계를 멀리까지 직접 참고해야 하므로 셀프 어텐션이 적절합니다. → **정답 1**\n\n---\n\n**예시 (투표 결과 계산 문제)**\n\n\"헤드 투표가 [1,1,0,1,0]일 때 1의 개수는?\"\n\n$1+1+0+1+0=3$입니다. → **정답 3**\n\n---\n\n**예시 (모델 예측 집계 문제)**\n\n\"세 헤드의 클래스1 예측 개수가 [2,1,2]일 때 총합은?\"\n\n$2+1+2=5$입니다. → **정답 5**\n\n---\n\n**예시 (모델 구성 계산 문제)**\n\n\"헤드 수 8, 헤드 차원 8일 때 모델 차원 $d_{model}$은?\"\n\n$d_{model}=8\\times8=64$입니다. → **정답 64**\n\n---\n\n**예시 (앙상블 원리 이해 문제)**\n\n\"멀티헤드 결합의 핵심 이점은? ① 서로 다른 관계를 여러 관점에서 나눠 학습해 일반화가 좋아진다 ② 파라미터가 0이 된다 ③ 계산량이 항상 0이다\"\n\n여러 관점을 결합해 오류를 줄이고 일반화 성능을 높인다는 점이 핵심입니다. → **정답 1**","3":"**정의 예시** — \"$\\mathrm{Attention}(Q,K,V)$에서 소프트맥스는 어느 축에 대해 적용되는가? ① 행(쿼리별 키 분포) ② 열만 ③ 배치\" → 쿼리별로 키에 대한 분포. **정답 1**\n\n---\n\n**참/거짓 예시** — \"$\\sqrt{d_k}$ 스케일링은 내적 값이 커질 때 소프트맥스가 극단으로 쏠리는 것을 줄이기 위함이다.\" → 맞음. **정답 1**\n\n---\n\n**응용 예시** — \"번역에서 주어-동사 호응을 멀리까지 보려면? ① 셀프 어텐션으로 토큰 간 직접 가중 ② 단어 빈도만\" → ①. **정답 1**\n\n---\n\n**선택 예시** — \"헤드 수 4, 헤드 차원 32일 때 $d_{model}$은? ① 128 ② 36 ③ 8\" → $4\\times32=128$. **정답 1**\n\n---\n\n**계산 예시** — \"토큰 수 20일 때 셀프 어텐션 점수 행렬(대략) 원소 수는?\" → $20\\times20=400$. **정답 400**"},"summary":"트랜스포머와 셀프 어텐션은 “순서대로 한 번 읽고 끝”이 아니라, 문장 안의 모든 단어가 동시에 서로를 바라보며 전체 문맥을 한 번에 파악하도록 설계된 메커니즘입니다. 기존 모델이 릴레이처럼 토큰을 이어가며 정보를 전달한다면, 셀프 어텐션은 단체 채팅방처럼 문장 전체 토큰이 동시에 참고하는 방식으로, 현재 토큰이 무엇을 얼마나 중요하게 봐야 하는지(어느 단어와의 관계가 강한지)를 조감도처럼 계산합니다. \n\n그 핵심 원리는 $Q, K, V$입니다. 내가 알고 싶은 질문에 해당하는 $Q$와, 각 단어가 지닌 특징을 담은 $K$를 비교해 단어 간 궁합을 점수로 만들고(내적 $QK^T$), 그 점수가 폭주하지 않도록 $\\sqrt{d_k}$로 스케일링한 뒤 소프트맥스를 거쳐 중요도 가중치 $A=\\mathrm{softmax}(QK^T/\\sqrt{d_k})$를 얻습니다. 그리고 $A$가 정한 비율로 실제 정보인 $V$를 섞어 최종 문맥 표현(컨텍스트)을 만들어, 문장의 앞과 뒤 사이에 긴 거리가 있어도 $O(1)$에 가까운 짧은 경로로 관계를 직접 이어 줍니다. \n\n이렇게 얻은 관계 정보는 멀티헤드 어텐션에서 더 입체적으로 확장됩니다. 문법, 감정, 고유명사처럼 서로 다른 관점의 “전문가”를 여러 헤드로 나눠 병렬로 분석한 다음, 결과를 $\\mathrm{Concat}$으로 합쳐 의미를 풍부하게 만들고, 이후 **Add & Norm(잔차 연결과 정규화)**으로 정보가 사라지지 않게 안정적으로 다음 단계로 넘기며, **피드포워드(FFNN)**가 각 토큰의 표현을 더 깊고 복잡한 형태로 변환해 BERT·GPT 같은 거대한 모델의 기반을 완성합니다.","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","summary":"요약"},"formulaGuideDiagramCaption":"아래 다이어그램은 Q/K/V 생성부터 스케일링, 소프트맥스, 가중합까지 셀프 어텐션 계산 흐름을 한눈에 보여줍니다.","formulaGuide":{"title":"수식 쉽게 이해하기","formulaGuideDiagramCaption":"아래 다이어그램은 Q/K/V 생성부터 스케일링, 소프트맥스, 가중합까지 셀프 어텐션 계산 흐름을 한눈에 보여줍니다.","linear":"$$Q=XW_Q$, $K=XW_K$, $V=XW_V$에서 $X$는 입력 임베딩, $W_Q/W_K/W_V$는 학습되는 변환 행렬입니다. 이 단계는 같은 문장을 '질문용 표상', '매칭용 표상', '내용용 표상'으로 나누는 작업입니다.","xavierVariance":"$$S=QK^T$는 토큰 간 관련도 점수 행렬입니다. 점수가 클수록 두 토큰 관계가 강합니다. 하지만 차원이 커질수록 값이 과도하게 커질 수 있어 $\\sqrt{d_k}$로 나눠 안정화합니다.","heVariance":"$$A=\\mathrm{softmax}(S/\\sqrt{d_k})$는 각 행 합이 1인 확률형 가중치 행렬입니다. 즉 한 토큰이 다른 토큰들을 얼마만큼 참고할지 비율로 표현합니다.","xavierUniform":"$$O=AV$는 가중치 $A$로 Value를 섞어 만든 최종 컨텍스트 표현입니다. 핵심은 단순 평균이 아니라 중요도 기반 가중 평균이라는 점입니다."},"visual":"개념 구조도는 `입력 토큰 → 임베딩 → Q/K/V 분기 → 유사도 행렬(QK^T) → 스케일링(√d_k) → softmax → 가중합(AV) → 멀티헤드 결합` 순서로 그립니다. 학습 흐름도는 `토큰화 → 위치 정보 주입 → 셀프 어텐션 → 피드포워드 → 예측`을 세로 단계로 나타냅니다. 모델 동작 다이어그램은 한 토큰이 다른 모든 토큰으로 화살표를 보내는 형태로 그리며, 화살표 두께는 어텐션 가중치 크기를 나타냅니다. 프론트엔드에서는 컨테이너에 `min-w-0`, `max-w-full`, `overflow-visible`, `minHeight: \"320px\"`를 적용하고, SVG는 `viewBox`로 모바일에서도 잘리지 않게 합니다.","problemSolvingLabel":"문제 풀이를 위한 설명","practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"아래는 60문제 문제풀에서 무작위로 뽑은 10문제입니다. 난이도는 쉬움 4, 보통 3, 어려움 3 비율이며, 개념 판단과 계산이 함께 나옵니다.","practiceProblemsInstruction":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionConcept":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionOx":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionScenario":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionVote":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionAggregate":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionConfig":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionEnsemble":"문제를 읽고 가장 알맞은 선택지를 고르세요.","advDlCh01VisualIntro":"셀프 어텐션은 각 토큰이 전체 토큰을 참고해 문맥을 재구성하는 연산입니다.","advDlCh01VisualStep0":"① 토큰 임베딩 생성 후 Q, K, V로 선형 변환","advDlCh01VisualStep1":"② QK^T로 관련도 점수 계산","advDlCh01VisualStep2":"③ √d_k로 스케일링 후 소프트맥스로 가중치 정규화","advDlCh01VisualStep3":"④ 가중치와 V를 곱해 컨텍스트 벡터 생성, 멀티헤드 결합","advDlCh01VisualConceptTitle":"개념 구조: Q/K/V → 점수 → 정규화 → 가중합","advDlCh01VisualFlowTitle":"학습 흐름: 토큰화 → 어텐션 → 표현 업데이트 → 예측","advDlCh01VisualModelTitle":"모델 작동: 각 토큰이 모든 토큰을 동시에 참고","advDlCh01VisualInputTokenLabel":"입력 토큰","advDlCh01VisualTokenRelationLabel":"토큰 연관 (self-attention)","advDlCh01VisualContextVectorOutputLabel":"문맥 벡터 출력","advDlCh01VisualContextVectorExplainLine1":"문맥 벡터는","advDlCh01VisualContextVectorExplainLine2":"토큰이 본 정보의 요약본","advDlCh01VisualCoreFormulaLabel":"핵심 수식","advDlCh01VisualLegendWeak":"약한 참고","advDlCh01VisualLegendMedium":"중간 참고","advDlCh01VisualLegendStrong":"강한 참고","advDlCh01VisualCurrentSuffix":" (현재)","problems":{"concept_0":"각 토큰이 문장 전체를 동시에 참고해 중요도를 계산하는 메커니즘은? ① 셀프 어텐션 ② 맥스풀링 ③ 드롭아웃","concept_1":"Query에 가장 가까운 설명은? ① 어떤 정보를 찾고 싶은지 나타내는 벡터 ② 정답 라벨 ③ 손실값","concept_2":"$$A=softmax(QK^T/\\sqrt{d_k})$에서 $d_k$는? ① 배치 크기 ② Key 벡터 차원 ③ 클래스 개수","concept_3":"멀티헤드를 쓰는 가장 알맞은 이유는? ① 서로 다른 관점의 관계를 동시에 본다 ② 파라미터를 0으로 만든다 ③ 토큰을 삭제한다","concept_4":"긴 문장에서 멀리 떨어진 단어 관계를 잘 잡는 이유는? ① 한 층에서 직접 참조 가능 ② 항상 문장이 짧아짐 ③ 손실 함수가 사라짐","concept_5":"스팸 메일 분류에서 셀프 어텐션이 특히 유용한 이유는? ① 단어 간 상호작용을 함께 본다 ② 학습 데이터를 자동 생성한다 ③ GPU를 없앤다","ox_0":"셀프 어텐션은 각 토큰이 다른 모든 토큰을 동시에 참고할 수 있다. 맞으면 1, 틀리면 0.","ox_1":"Query, Key, Value는 모두 동일한 의미라 구분이 필요 없다. 맞으면 1, 틀리면 0.","ox_2":"스케일드 닷프로덕트에서 $\\sqrt{d_k}$로 나누는 목적은 점수 폭주를 완화하는 것이다. 맞으면 1, 틀리면 0.","ox_3":"멀티헤드는 단일 헤드보다 항상 정보 표현이 단순해진다. 맞으면 1, 틀리면 0.","ox_4":"소프트맥스 이후 한 토큰의 어텐션 가중치 합은 보통 1이다. 맞으면 1, 틀리면 0.","ox_5":"셀프 어텐션은 번역, 요약, 분류 같은 NLP 작업에 활용된다. 맞으면 1, 틀리면 0.","scenario_0":"긴 고객 상담 로그에서 앞부분 부정 표현이 뒤 문장을 뒤집을 때 유리한 모델 요소는? ① 셀프 어텐션 ② 평균풀링만 ③ 단순 규칙기반","scenario_1":"의료 텍스트에서 \"암 아님\" 같은 표현을 안정적으로 해석하려면? ① 문맥 단어를 함께 보는 셀프 어텐션 ② 단어 빈도만 사용 ③ 마지막 단어만 사용","scenario_2":"번역 모델에서 주어-동사 일치를 더 잘 잡으려면 먼저 점검할 요소는? ① 어텐션 헤드 설정 ② 이미지 증강 ③ 픽셀 정규화","scenario_3":"사기 거래 설명 생성에서 거래 내역 간 연관을 반영하려면? ① 토큰 간 가중치 계산 ② 샘플 삭제 ③ 클래스 축소만","vote_0":"헤드 신뢰도 가중치가 [3,2,1,2,1], 이진 투표가 [1,1,0,1,0]일 때 양성(1)의 가중합은?","vote_1":"레이어 확률 [0.92,0.63,0.71,0.48,0.83,0.69]에서 임계값 0.7 이상을 양성으로 볼 때, 양성 개수는?","vote_2":"3클래스 예측 레이블이 [2,0,1,2,1,0,2,2]일 때 클래스 2를 선택한 횟수는?","vote_3":"앙상블 투표에서 클래스 A 득표가 7, 클래스 B 득표가 4일 때 득표 차(A-B)는?","scenario_4":"법률 요약에서 멀리 떨어진 조항 간 연결을 보려면 우선 적용할 구조는? ① 셀프 어텐션 ② 1-그램 빈도표 ③ 랜덤 선택","scenario_5":"뉴스 요약 모델이 핵심 문장을 놓친다면 우선 점검할 것은? ① 어텐션 가중치 분포 ② 파일 확장자 ③ 폴더 이름","scenario_6":"다국어 번역에서 단어 정렬 오류를 줄이려면 무엇을 튜닝하는 것이 자연스러운가? ① 헤드 수와 차원 ② 모니터 밝기 ③ 마우스 속도","scenario_7":"긴 문서 분류에서 앞문장 정보가 소실된다면 가장 관련 있는 해결 방향은? ① 문맥 전역 참조 강화 ② 토큰 전부 삭제 ③ 레이블 제거","scenario_8":"고객 불만 감지에서 \"아직 환불 안 됨\" 맥락을 살리려면? ① 부정어와 핵심 단어 관계를 어텐션으로 반영 ② 단어 길이만 사용 ③ 숫자만 사용","scenario_9":"실험에서 단일 헤드보다 멀티헤드가 안정적이었다. 가장 타당한 이유는? ① 여러 관점 결합 ② 데이터 자동 증식 ③ 손실 무시","vote_4":"신뢰도 [4,3,2,1,2,3,1,2], 투표 [1,1,1,0,1,0,1,1]일 때 양성(1)의 신뢰도 가중합은?","vote_5":"레이어 확률 [0.4,0.7,0.2,0.8,0.1,0.6,0.3,0.9,0.55,0.65]에서 0.6 이상을 양성으로 보면 양성 개수는?","vote_6":"레이어 A=[1,0,1,0,1,0,1,0,1,0,1,0], 레이어 B=[1,1,1,0,0,0,1,1,1,0,1,1]일 때 서로 다른 위치 개수는?","vote_7":"레이어 A=[1,1,0,0,1,1,0,0,1,1,0,0], 레이어 B=[1,0,0,1,1,0,0,1,1,0,0,1]일 때 둘 다 1인 위치 개수는?","vote_8":"투표 벡터 [0,0,0,1,1,1,1,1,0,1]에서 양성(1) 개수에서 음성(0) 개수를 뺀 값은?","vote_9":"초기 구간 투표 [1,1,1,1,1,0], 후반 구간 투표 [0,0,1,0,1,0]일 때 (초기 양성 수 - 후반 양성 수)는?","aggregate_0":"세 헤드의 클래스1 예측 개수가 [2,1,2]일 때 총합은?","aggregate_1":"네 헤드의 스팸 예측 수가 [3,2,1,2]일 때 총 스팸 예측 수는?","aggregate_2":"다섯 헤드가 클래스2에 준 점수가 [4,4,3,5,4]일 때 합계는?","aggregate_3":"헤드별 정상거래 표 수가 [6,5,7,6]일 때 총 표 수는?","ensemble_0":"멀티헤드 결합의 핵심 이점은? ① 다양한 표현 결합으로 일반화 향상 ② 파라미터 제거 ③ 학습 중지","ensemble_1":"서로 다른 헤드가 다른 관계를 보면 기대되는 효과는? ① 오류 상쇄 가능성 증가 ② 항상 동일 오류 ③ 정보 손실만 증가","ensemble_2":"단일 헤드 대비 멀티헤드가 강한 이유로 가장 타당한 것은? ① 특징 공간을 분할해 병렬 학습 ② 토큰 수를 강제로 1로 만듦 ③ softmax 제거","ensemble_3":"앙상블 관점에서 헤드 수를 늘릴 때 주의점으로 맞는 것은? ① 성능-연산량 균형 점검 ② 계산량은 항상 감소 ③ 검증 없이 무조건 증가","aggregate_4":"여섯 헤드 점수 [5,4,6,5,4,6]의 합은?","aggregate_5":"클래스0 표가 [7,8,6,9]일 때 총합은?","aggregate_6":"헤드별 키워드 매칭 수 [10,12,11,9,8]의 합은?","aggregate_7":"배치별 긍정 예측 수 [14,16,15]의 합은?","aggregate_8":"8개 헤드의 오류 수 [1,2,1,2,1,2,1,2] 합은?","aggregate_9":"헤드별 관심 토큰 수 [3,5,7,9,11]의 합은?","config_0":"헤드 수 4, 헤드 차원 16일 때 모델 차원 $d_{model}$은?","config_1":"헤드 수 8, 헤드 차원 8일 때 $d_{model}$은?","config_2":"토큰 수 10에서 어텐션 점수 행렬 크기(원소 수)는 $10\\times10$이다. 원소 수는?","config_3":"토큰 수 12에서 점수 행렬 원소 수는 $12\\times12$이다. 값은?","config_4":"헤드 수 6, 헤드 차원 12일 때 $d_{model}$은?","config_5":"헤드 수 3, 헤드 차원 24일 때 $d_{model}$은?","config_6":"시퀀스 길이 14에서 self-attention 점수 원소 수는 $14\\times14$이다. 값은?","config_7":"시퀀스 길이 16에서 점수 원소 수는 $16\\times16$이다. 값은?","config_8":"헤드 수 12, 헤드 차원 10일 때 $d_{model}$은?","config_9":"토큰 수 20에서 점수 행렬 원소 수는 $20\\times20$이다. 값은?","ensemble_4":"멀티헤드의 분산 감소 효과를 기대할 수 있는 이유는? ① 서로 다른 헤드의 오차가 일부 상쇄됨 ② 모든 헤드가 항상 완벽함 ③ 학습데이터가 불필요함","ensemble_5":"앙상블 관점에서 헤드 다양성을 높이는 목적은? ① 같은 입력에서 다른 특징을 보게 하기 ② 모든 헤드를 동일 복사 ③ 가중치 고정","ensemble_6":"실제 서비스에서 멀티헤드 수를 결정할 때 가장 중요한 것은? ① 정확도 개선과 지연시간의 균형 ② 무조건 최대 헤드 수 ③ 무조건 최소 헤드 수","ensemble_7":"여러 헤드를 결합해도 성능이 안 오를 때 우선 점검할 항목은? ① 헤드가 서로 유사한 패턴만 보는지 ② 토큰 이름 길이 ③ 파일 색상"},"problemAnswers":{"concept_0":1,"concept_1":1,"concept_2":2,"concept_3":1,"concept_4":1,"concept_5":1,"ox_0":1,"ox_1":0,"ox_2":1,"ox_3":0,"ox_4":1,"ox_5":1,"scenario_0":1,"scenario_1":1,"scenario_2":1,"scenario_3":1,"vote_0":7,"vote_1":3,"vote_2":4,"vote_3":3,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1,"vote_4":14,"vote_5":5,"vote_6":4,"vote_7":3,"vote_8":2,"vote_9":3,"aggregate_0":5,"aggregate_1":8,"aggregate_2":20,"aggregate_3":24,"ensemble_0":1,"ensemble_1":1,"ensemble_2":1,"ensemble_3":1,"aggregate_4":30,"aggregate_5":30,"aggregate_6":50,"aggregate_7":45,"aggregate_8":12,"aggregate_9":35,"config_0":64,"config_1":64,"config_2":100,"config_3":144,"config_4":72,"config_5":72,"config_6":196,"config_7":256,"config_8":120,"config_9":400,"ensemble_4":1,"ensemble_5":1,"ensemble_6":1,"ensemble_7":1},"problemSolutions":{"concept_0":"셀프 어텐션의 정의를 묻는 문제입니다. 핵심은 '각 토큰이 전체 토큰을 동시에 참고'하는지입니다. ①만 이 정의를 정확히 담고 있습니다. 실무 예시로 스팸 분류에서는 특정 단어 하나가 아니라 주변 단어와의 관계(예: 무료+클릭)를 함께 봐야 오탐이 줄어듭니다. 따라서 정답은 1입니다.","concept_1":"Query는 '무엇을 찾고 싶은가'를 표현하는 질문 벡터입니다. Key는 매칭 기준, Value는 실제로 가져올 내용입니다. 의료 진단 문서 분류에서 Query는 현재 토큰이 필요한 문맥 단서를 찾는 역할을 하고, Key와 비교해 중요한 Value를 가져옵니다. 따라서 정답은 1입니다.","concept_2":"$$d_k$는 Key 벡터의 차원입니다. 차원이 커지면 내적값 분산이 커져 softmax가 한쪽으로 쏠릴 수 있어 $\\sqrt{d_k}$로 나눕니다. 이 스케일링은 학습 안정화에 매우 중요하며 번역 모델 학습 폭주를 줄이는 데도 쓰입니다. 정답은 2입니다.","concept_3":"멀티헤드는 여러 관점의 관계를 동시에 보도록 해 표현력을 높입니다. 예를 들어 한 헤드는 문법, 다른 헤드는 개체명 연결을 볼 수 있습니다. 고객 리뷰 감성 분석에서 부정어 관계를 별도 헤드가 포착하면 정확도가 올라갑니다. 정답은 1입니다.","concept_4":"셀프 어텐션은 한 층에서 임의 거리 토큰을 직접 참조할 수 있어 장거리 의존성에 강합니다. 법률 문서처럼 앞 조항이 뒤 의미를 바꾸는 데이터에서 유리합니다. 따라서 정답은 1입니다.","concept_5":"스팸 메일 분류는 단어 간 상호작용이 핵심입니다. 셀프 어텐션은 문맥 관계를 가중치로 반영해 분류 성능을 높입니다. 단계: (1) 토큰화 (2) 관계 점수 계산 (3) 중요 문맥 반영 (4) 분류. 정답은 1입니다.","ox_0":"셀프 어텐션 정의 그대로이므로 참입니다. 실전에서도 각 토큰이 전체를 동시에 본다는 점이 번역·요약 성능의 핵심입니다. 정답 1.","ox_1":"Q, K, V는 역할이 다릅니다. 구분이 없으면 관계 계산이 성립하지 않습니다. 사기 거래 탐지 로그에서도 질문/매칭/내용 분리가 중요합니다. 정답 0.","ox_2":"맞습니다. $\\sqrt{d_k}$ 스케일링은 큰 내적값으로 인한 softmax 포화를 막아 안정적 학습을 돕습니다. 정답 1.","ox_3":"틀렸습니다. 멀티헤드는 오히려 다양한 패턴을 학습해 표현이 풍부해집니다. 정답 0.","ox_4":"softmax는 확률 정규화이므로 한 행의 합이 1이 됩니다. 따라서 참입니다. 정답 1.","ox_5":"맞습니다. 번역/요약/분류/질의응답에 모두 널리 사용됩니다. 정답 1.","scenario_0":"긴 로그에서 멀리 떨어진 단어 관계를 보려면 전역 참조가 가능한 셀프 어텐션이 적합합니다. 평균풀링만으로는 관계 방향을 잃기 쉽습니다. 고객센터 불만 탐지에서 앞부분 부정문이 뒤 의미를 바꾸는 경우 특히 유효합니다. 정답 1.","scenario_1":"\"암 아님\"은 부정어와 질병명 관계를 함께 봐야 합니다. 셀프 어텐션은 두 토큰의 상호작용을 직접 반영해 오진 위험을 줄입니다. 단계적으로 (1) 토큰 관계 점수 계산 (2) 부정어 가중치 반영 (3) 최종 분류를 수행합니다. 정답 1.","scenario_2":"주어-동사 일치는 토큰 간 장거리 관계 문제이므로 어텐션 헤드 설계가 핵심 점검 대상입니다. 이미지 증강/픽셀 정규화는 텍스트 번역 문제의 1순위가 아닙니다. 정답 1.","scenario_3":"거래 내역 간 연관을 반영하려면 토큰 간 가중치 계산이 필요합니다. 이는 셀프 어텐션의 본질입니다. 사기 거래 설명 생성에서도 근거 토큰을 묶어 해석력을 높일 수 있습니다. 정답 1.","vote_0":"가중치 [3,2,1,2,1]와 투표 [1,1,0,1,0]의 원소곱 합은 $3\\times1+2\\times1+1\\times0+2\\times1+1\\times0=7$입니다. 정답 7.","vote_1":"확률 [0.92,0.63,0.71,0.48,0.83,0.69]에서 0.7 이상은 0.92, 0.71, 0.83의 3개입니다. 정답 3.","vote_2":"레이블 [2,0,1,2,1,0,2,2]에서 클래스 2는 4회 등장합니다. 정답 4.","vote_3":"득표 차는 $7-4=3$입니다. 정답 3.","scenario_4":"법률 문서 조항 연결은 전형적인 장거리 의존성 문제입니다. 셀프 어텐션이 가장 적합합니다. 정답 1.","scenario_5":"핵심 문장 누락은 종종 어텐션 분포가 한쪽에 치우쳤을 때 발생합니다. 먼저 가중치 분포를 점검하는 것이 실전적인 접근입니다. 정답 1.","scenario_6":"다국어 정렬 오류는 헤드 수/헤드 차원 같은 어텐션 구성 요소와 직접 연관됩니다. 정답 1.","scenario_7":"앞문장 정보 소실은 전역 참조 강화(셀프 어텐션 활용, 층/헤드 조정)로 대응합니다. 정답 1.","scenario_8":"부정어-핵심단어 관계를 함께 보는 것이 정답입니다. 이는 감성분석/불만감지에서 실제로 가장 중요합니다. 정답 1.","scenario_9":"멀티헤드 안정성 향상의 핵심은 다관점 결합입니다. 서로 다른 패턴을 병렬 학습해 일반화 성능이 오릅니다. 정답 1.","vote_4":"양성인 위치의 신뢰도만 더하면 $4+3+2+2+1+2=14$입니다. 정답 14.","vote_5":"0.6 이상은 0.7, 0.8, 0.6, 0.9, 0.65로 5개입니다. 정답 5.","vote_6":"A와 B가 다른 위치를 세면 4개입니다. 정답 4.","vote_7":"둘 다 1인 위치는 (1,5,9)로 3개입니다. 정답 3.","vote_8":"양성 6개, 음성 4개이므로 차이는 $6-4=2$입니다. 정답 2.","vote_9":"초기 양성 5개, 후반 양성 2개이므로 $5-2=3$입니다. 정답 3.","aggregate_0":"집계 합: $2+1+2=5$. 모델 예측 집계는 헤드별 결과를 단순합 또는 가중합으로 모으는 첫 단계입니다. 정답 5.","aggregate_1":"총합 계산: $3+2+1+2=8$. 스팸 탐지 운영 환경에서도 배치별 헤드 출력을 합산해 임계값 비교를 수행합니다. 정답 8.","aggregate_2":"점수 합: $4+4+3+5+4=20$. 단계: (1) 헤드별 점수 확인 (2) 합산 (3) 최고점 클래스 선택. 정답 20.","aggregate_3":"합산: $6+5+7+6=24$. 금융 이상탐지 분류에서도 유사한 표 집계가 사용됩니다. 정답 24.","ensemble_0":"멀티헤드는 다양한 표현을 결합해 일반화를 높입니다. 단일 시점 편향을 줄이는 것이 핵심입니다. 정답 1.","ensemble_1":"헤드가 서로 다른 패턴을 보면 일부 오류가 상쇄될 수 있습니다. 이는 앙상블의 기본 원리입니다. 정답 1.","ensemble_2":"특징 공간 분할+병렬 관찰이 멀티헤드의 강점입니다. 토큰을 1개로 줄이거나 softmax 제거는 본질이 아닙니다. 정답 1.","ensemble_3":"헤드 수 증가는 성능 향상 가능성과 연산량 증가를 동시에 가져옵니다. 따라서 균형 점검이 중요합니다. 정답 1.","aggregate_4":"합계: $5+4+6+5+4+6=30$. 정답 30.","aggregate_5":"합계: $7+8+6+9=30$. 정답 30.","aggregate_6":"합계: $10+12+11+9+8=50$. 정답 50.","aggregate_7":"합계: $14+16+15=45$. 정답 45.","aggregate_8":"합계: $1+2+1+2+1+2+1+2=12$. 정답 12.","aggregate_9":"합계: $3+5+7+9+11=35$. 정답 35.","config_0":"모델 차원은 보통 $d_{model}=head\\_count \\times head\\_dim$입니다. 계산: $4\\times16=64$. 정답 64.","config_1":"계산: $8\\times8=64$. 번역 모델 경량 설정에서 자주 쓰는 정수 조합입니다. 정답 64.","config_2":"점수 행렬 원소 수는 토큰 수 제곱입니다. 계산: $10\\times10=100$. 정답 100.","config_3":"계산: $12\\times12=144$. 길이가 길수록 계산량이 제곱으로 늘어남을 보여줍니다. 정답 144.","config_4":"계산: $6\\times12=72$. 정답 72.","config_5":"계산: $3\\times24=72$. 동일한 $d_{model}$을 다른 헤드 조합으로 구성할 수 있습니다. 정답 72.","config_6":"계산: $14\\times14=196$. 긴 시퀀스에서 연산량 부담이 커지는 이유를 보여줍니다. 정답 196.","config_7":"계산: $16\\times16=256$. 정답 256.","config_8":"계산: $12\\times10=120$. 정답 120.","config_9":"계산: $20\\times20=400$. 검색/문서 요약에서 시퀀스 길이 증가 시 비용이 커지는 근거입니다. 정답 400.","ensemble_4":"서로 다른 헤드의 오차가 완전히 같지 않으면 결합 시 분산이 줄어드는 효과를 기대할 수 있습니다. 정답 1.","ensemble_5":"헤드 다양성의 목적은 서로 다른 특징을 보게 해 결합 이득을 만드는 것입니다. 정답 1.","ensemble_6":"실서비스는 정확도와 지연시간(SLA)을 함께 만족해야 하므로 균형이 핵심입니다. 정답 1.","ensemble_7":"성능이 안 오르면 헤드 다양성 부족을 먼저 점검해야 합니다. 유사 패턴만 보는 헤드는 앙상블 이득이 작습니다. 정답 1."},"problemTestCodes":{"concept_0":"answer = 1\nassert answer == 1","concept_1":"answer = 1\nassert answer == 1","concept_2":"answer = 2\nassert answer == 2","concept_3":"answer = 1\nassert answer == 1","concept_4":"answer = 1\nassert answer == 1","concept_5":"answer = 1\nassert answer == 1","ox_0":"answer = 1\nassert answer == 1","ox_1":"answer = 0\nassert answer == 0","ox_2":"answer = 1\nassert answer == 1","ox_3":"answer = 0\nassert answer == 0","ox_4":"answer = 1\nassert answer == 1","ox_5":"answer = 1\nassert answer == 1","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 1\nassert answer == 1","scenario_3":"answer = 1\nassert answer == 1","vote_0":"weights = [3,2,1,2,1]\nvotes = [1,1,0,1,0]\nassert sum(w*v for w, v in zip(weights, votes)) == 7","vote_1":"probs = [0.92,0.63,0.71,0.48,0.83,0.69]\nassert sum(1 for p in probs if p >= 0.7) == 3","vote_2":"labels = [2,0,1,2,1,0,2,2]\nassert sum(1 for y in labels if y == 2) == 4","vote_3":"a_votes = 7\nb_votes = 4\nassert a_votes - b_votes == 3","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1","vote_4":"weights = [4,3,2,1,2,3,1,2]\nvotes = [1,1,1,0,1,0,1,1]\nassert sum(w*v for w, v in zip(weights, votes)) == 14","vote_5":"probs = [0.4,0.7,0.2,0.8,0.1,0.6,0.3,0.9,0.55,0.65]\nassert sum(1 for p in probs if p >= 0.6) == 5","vote_6":"a = [1,0,1,0,1,0,1,0,1,0,1,0]\nb = [1,1,1,0,0,0,1,1,1,0,1,1]\nassert sum(1 for x, y in zip(a, b) if x != y) == 4","vote_7":"a = [1,1,0,0,1,1,0,0,1,1,0,0]\nb = [1,0,0,1,1,0,0,1,1,0,0,1]\nassert sum(1 for x, y in zip(a, b) if x == 1 and y == 1) == 3","vote_8":"votes = [0,0,0,1,1,1,1,1,0,1]\nones = sum(votes)\nzeros = len(votes) - ones\nassert ones - zeros == 2","vote_9":"early = [1,1,1,1,1,0]\nlate = [0,0,1,0,1,0]\nassert sum(early) - sum(late) == 3","aggregate_0":"values = [2,1,2]\ntotal = sum(values)\nassert total == 5","aggregate_1":"values = [3,2,1,2]\nassert sum(values) == 8","aggregate_2":"values = [4,4,3,5,4]\nassert sum(values) == 20","aggregate_3":"values = [6,5,7,6]\nassert sum(values) == 24","ensemble_0":"answer = 1\nassert answer == 1","ensemble_1":"answer = 1\nassert answer == 1","ensemble_2":"answer = 1\nassert answer == 1","ensemble_3":"answer = 1\nassert answer == 1","aggregate_4":"values = [5,4,6,5,4,6]\nassert sum(values) == 30","aggregate_5":"values = [7,8,6,9]\nassert sum(values) == 30","aggregate_6":"values = [10,12,11,9,8]\nassert sum(values) == 50","aggregate_7":"values = [14,16,15]\nassert sum(values) == 45","aggregate_8":"values = [1,2,1,2,1,2,1,2]\nassert sum(values) == 12","aggregate_9":"values = [3,5,7,9,11]\nassert sum(values) == 35","config_0":"head_count, head_dim = 4, 16\nd_model = head_count * head_dim\nassert d_model == 64","config_1":"head_count, head_dim = 8, 8\nd_model = head_count * head_dim\nassert d_model == 64","config_2":"tokens = 10\ncells = tokens * tokens\nassert cells == 100","config_3":"tokens = 12\ncells = tokens * tokens\nassert cells == 144","config_4":"head_count, head_dim = 6, 12\nassert head_count * head_dim == 72","config_5":"head_count, head_dim = 3, 24\nassert head_count * head_dim == 72","config_6":"tokens = 14\nassert tokens * tokens == 196","config_7":"tokens = 16\nassert tokens * tokens == 256","config_8":"head_count, head_dim = 12, 10\nassert head_count * head_dim == 120","config_9":"tokens = 20\nassert tokens * tokens == 400","ensemble_4":"answer = 1\nassert answer == 1","ensemble_5":"answer = 1\nassert answer == 1","ensemble_6":"answer = 1\nassert answer == 1","ensemble_7":"answer = 1\nassert answer == 1"},"problemDifficulty":{"concept_0":"easy","concept_1":"easy","concept_2":"easy","concept_3":"easy","concept_4":"easy","concept_5":"easy","ox_0":"easy","ox_1":"easy","ox_2":"easy","ox_3":"easy","ox_4":"easy","ox_5":"easy","scenario_0":"easy","scenario_1":"easy","scenario_2":"easy","scenario_3":"easy","vote_0":"easy","vote_1":"easy","vote_2":"easy","vote_3":"easy","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","vote_4":"medium","vote_5":"medium","vote_6":"medium","vote_7":"medium","vote_8":"medium","vote_9":"medium","aggregate_0":"medium","aggregate_1":"medium","aggregate_2":"medium","aggregate_3":"medium","ensemble_0":"medium","ensemble_1":"medium","ensemble_2":"medium","ensemble_3":"medium","aggregate_4":"hard","aggregate_5":"hard","aggregate_6":"hard","aggregate_7":"hard","aggregate_8":"hard","aggregate_9":"hard","config_0":"hard","config_1":"hard","config_2":"hard","config_3":"hard","config_4":"hard","config_5":"hard","config_6":"hard","config_7":"hard","config_8":"hard","config_9":"hard","ensemble_4":"hard","ensemble_5":"hard","ensemble_6":"hard","ensemble_7":"hard"},"problemOrder":["concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","ox_0","ox_1","ox_2","ox_3","ox_4","ox_5","scenario_0","scenario_1","scenario_2","scenario_3","vote_0","vote_1","vote_2","vote_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","vote_4","vote_5","vote_6","vote_7","vote_8","vote_9","aggregate_0","aggregate_1","aggregate_2","aggregate_3","ensemble_0","ensemble_1","ensemble_2","ensemble_3","aggregate_4","aggregate_5","aggregate_6","aggregate_7","aggregate_8","aggregate_9","config_0","config_1","config_2","config_3","config_4","config_5","config_6","config_7","config_8","config_9","ensemble_4","ensemble_5","ensemble_6","ensemble_7"]},"advDlCh02":{"chapter":"Chapter 02","title":"트랜스포머: 위치 인코딩과 피드포워드","description":"트랜스포머의 셀프 어텐션은 단어들 **끼리의 관계**를 파악하는 데는 탁월하지만, 단어가 문장 속 **어느 위치에 있는지** 스스로 알지 못하는 치명적인 단점이 있습니다. 이를 해결하기 위해 단어의 임베딩에 '몇 번째 단어인지' 알려주는 **위치 인코딩(Positional Encoding)** 이름표를 붙여줍니다. 또한, 어텐션으로 모인 정보를 각 단어별로 깊이 있게 재가공하는 **피드포워드(Feed Forward, FFN)** 층이 이어집니다. 이 챕터에서는 파동의 원리를 이용한 사인·코사인 위치 인코딩의 직관적인 이해와, 토큰들의 개별 심층 면접관 역할을 하는 FFN의 작동 원리를 초보자의 눈높이에서 쉽고 재미있게 알아봅니다.","sectionTitle":"트랜스포머: 위치 인코딩과 피드포워드","whatIs":{"0":"**1. 개념: 왜 위치 인코딩이 필요한가? (영화관 좌석표)**\n\n셀프 어텐션은 문장을 한 번에 뭉텅이로 처리하기 때문에 단어의 '순서'를 모릅니다. 즉, \"아빠가 방에 들어간다\"와 \"가방에 아빠가 들어간다\"를 똑같이 인식할 위험이 있습니다. **위치 인코딩(Positional Encoding)**은 각 단어 벡터에 위치 정보가 담긴 벡터 $PE(p)$를 **더해주는(Add)** 과정입니다.\n\n**직관적 이해:** 영화관표에 \"어벤져스(단어 의미)\"만 적혀 있고 \"좌석 번호(위치)\"가 없다면 대혼란이 오겠죠? PE는 각 단어의 목에 \"나는 1번 단어다\", \"나는 2번 단어다\"라는 고유한 **좌석 번호 띠**를 걸어주는 것과 같습니다.","1":"$25","2":"**3. 개념: 피드포워드(FFN) — 단어 하나씩 ‘깊은 상담’**\n\n**한 줄 요약:** **어텐션**은 단어들이 **서로 섞이며** 문맥을 나누는 단계이고, **FFN**은 그다음에 **각 단어 줄을 따로 유지한 채** 같은 계산을 **줄마다 한 번씩** 하는 단계입니다(위쪽 그림의 초록 **계산 블록**이 이 역할에 가깝습니다).\n\n**비유:** 회의에서 다 같이 이야기(어텐션)한 뒤, 참가자 **한 명씩** 상담실에 들어가 **개인 면담**(FFN)을 받는 것과 비슷합니다. 숫자 벡터의 길이($d_{model}$)를 잠깐 **넓혔다가**(중간을 크게) 다시 **원래 길이로 줄이는** 모래시계 모양이 흔합니다.\n\n**왜 필요할까요?** 어텐션만으로는 ‘곱·더하기’ 위주라 표현이 한계에 걸릴 수 있습니다. FFN 안에 **ReLU**($\\max(0,\\cdot)$)처럼 **0보다 작은 값을 잘라 내는** 비틀기를 넣어, 직선만으로는 못 그리는 **굴곡진 패턴**을 배우게 합니다.\n\n**수식(참고):** $\\mathrm{FFN}(x) = \\max(0, xW_1 + b_1)W_2 + b_2$. 보통 **모든 위치가 같은** $W_1,W_2$를 씁니다.","3":"**4. 개념: 한 블록 안 흐름 — 컨베이어 한 칸**\n\n**한 줄 요약:** 인코더 **블록 하나**는 공장 **작업 라인 한 칸**처럼, 항상 **같은 순서**로만 돌아갑니다.\n\n**쉬운 순서:**\n1. **출발 준비:** 단어 임베딩에 **위치(PE)**를 더해 ‘몇 번째 단어인지’가 붙은 상태로 만듭니다.\n2. **같이 섞기:** **어텐션**으로 단어들이 서로 문맥을 주고받습니다.\n3. **안 잊게 잇기:** **Add & Norm** — 아까 값을 조금 **더해 받침**(잔차)을 두고, 숫자 크기를 **가지런히**(층 정규화) 맞춥니다.\n4. **각자 손보기:** **FFN**으로 **각 단어 줄**을 비선형으로 다듬습니다.\n5. **다시 Add & Norm**으로 한 번 더 정리합니다.\n\n**수식(참고):** 먼저 $h' = \\mathrm{LayerNorm}(h + \\mathrm{Attn}(h))$, 이어서 $h'' = \\mathrm{LayerNorm}(h' + \\mathrm{FFN}(h'))$. 이 **한 덩어리**를 여러 겹 쌓으면 표현이 점점 풍부해집니다."},"whyImportant":{"0":"**순서가 곧 문법이고 의미다**\n\n자연어 처리에서 순서 정보는 생명입니다. \"내가 너를 이겼다\"와 \"너를 내가 이겼다\"는 같은 단어들로 이루어졌지만, 주어와 목적어의 위치가 결론을 완전히 바꿉니다. 위치 인코딩이 없다면 챗봇은 말의 앞뒤 문맥을 전혀 파악하지 못하는 바보가 됩니다. 금융 사기 탐지 모델에서도 \"비밀번호 변경 $\\rightarrow$ 큰 금액 이체\"라는 **사건의 순서**가 사기 여부를 결정짓는 핵심 키입니다.","1":"**FFN, 복잡성을 돌파하는 비선형의 마법**\n\n어텐션 연산은 사실 행렬들의 단순한 곱셈과 덧셈(선형 연산) 위주로 굴러갑니다. 선형 연산만으로는 복잡한 현실 세계의 데이터를 다 담을 수 없습니다. FFN은 중간에 $\\mathrm{ReLU}$나 $\\mathrm{GELU}$ 같은 비선형 활성화 함수를 개입시켜, 모델이 \"A면 B다\"라는 단순한 규칙을 넘어 \"A와 B가 동시에 등장하고 C가 없다면 D다\" 같은 **고차원적인 복잡한 규칙**을 학습할 수 있게 만듭니다.","2":"**성능과 비용의 저울질 (트레이드오프)**\n\nFFN의 중간 차원 크기($d_{ff}$)를 한없이 키우면 모델은 더 똑똑해지겠지만, 반대로 GPU 연산량과 메모리 소모가 극심해집니다. 실제 AI 서비스를 운영할 때 사용자에게 빠르게 답변을 주려면(지연 시간 단축), 이 FFN의 덩치를 얼마나 적절하게 조절하느냐가 머신러닝 엔지니어의 핵심 역량입니다.","3":"**최신 LLM으로 이어지는 불변의 진리**\n\n초기 트랜스포머의 사인·코사인 위치 인코딩은 이후 BERT의 '학습형 위치 임베딩', LLaMA 모델에서 쓰는 'RoPE(회전 위치 인코딩)' 등으로 발전해 왔습니다. 하지만 **\"순서 정보를 텐서(숫자)로 만들어서 주입한다\"**는 철학 자체는 변하지 않았으며, 어텐션과 FFN의 결합 구조 역시 현존하는 모든 최고 수준 AI 모델들의 뼈대 역할을 하고 있습니다."},"howUsed":{"0":"**실무 파이프라인: 밑작업의 정석 (토큰화 $\\rightarrow$ 임베딩 $\\rightarrow$ 위치 추가)**\n\n텍스트 데이터가 들어오면 개발자는 토크나이저로 문장을 잘게 쪼갭니다. 이를 임베딩 차원(예: 512차원)의 숫자로 바꾼 직후, **정확히 똑같은 512차원 크기의 위치 인코딩 벡터를 단순히 더해줍니다(+).** (이어 붙이는 Concat이 아니라 Add입니다!) 실무에서 허깅페이스(Hugging Face) 라이브러리를 쓸 때는 `max_position_embeddings`라는 파라미터로 모델이 한 번에 읽을 수 있는 최대 문장 길이를 설정합니다.","1":"**FFN 하이퍼파라미터 튜닝의 예술**\n\n실무 코드를 보면 `intermediate_size`라는 변수가 바로 FFN의 확장 차원($d_{ff}$)입니다. 대체로 입력 차원($d_{model}$)의 **4배** 크기를 주는 것이 국룰처럼 쓰입니다(예: $768 \\rightarrow 3072$). 만약 여러분이 복잡한 프로그래밍 코드를 생성하는 AI를 만든다면, 이 중간 차원을 더 넓히고 깊게 만들어서 코드의 깐깐한 문법과 스타일을 모델이 더 세밀하게 외우도록 유도할 수 있습니다.","2":"**디코더(생성형 AI)에서의 위치 정보 주의점**\n\nGPT 같은 디코더 전용 모델은 문장을 생성할 때 미래의 단어를 미리 커닝하지 못하도록 마스크(Masking)를 씌웁니다. 하지만 위치 인코딩은 여전히 **왼쪽에서 오른쪽으로 흐르는 절대적인 순서 번호**를 충실히 매겨줍니다. 이 컨텍스트 길이(문맥을 기억하는 길이)와 위치 처리 능력이 결국 챗봇이 과거 대화를 얼마나 잘 기억하는지(성능)를 결정합니다.","3":"**디버깅 꿀팁 (어디를 고쳐야 할까?)**\n\n내가 만든 모델이 긴 문서를 읽다가 앞부분 내용을 자꾸 까먹거나 순서를 헷갈린다면? 가장 먼저 위치 인코딩 방식(학습형인지, RoPE인지)과 설정된 최대 길이를 점검해야 합니다. 반대로 모델이 문맥은 아는데 말투가 너무 단조롭거나 미묘한 뉘앙스를 못 잡는다면? FFN의 층수나 폭($d_{ff}$), 혹은 활성화 함수를 변경해 모델의 '표현력(Capacity)' 자체를 끌어올려야 합니다."},"problemSolving":{"0":"위치 인코딩·FFN 문제는 “순서는 PE로, 단어 간 관계는 어텐션으로, 토큰별 비선형은 FFN으로” 나누어 생각하면 헷갈리지 않습니다. 전형적으로 $h=x+PE(pos)$로 임베딩과 위치를 더하고, FFN은 같은 층에서 위치마다 **같은** MLP 가중치를 쓰는 경우가 많습니다. $d_{ff}$, 깊이, 문맥 길이는 표현력과 비용을 함께 움직입니다.","2":"**예시**\n\n**문제**: \"토큰 임베딩 $x$와 위치 벡터 $PE$를 합칠 때 가장 흔한 방식은? ① 더하기 $x+PE(pos)$ ② 이어붙이기만 ③ 원소별 곱만\"\n\n가산형(add) PE가 일반적입니다. → 정답 **1**\n\n---\n\n**문제**: \"FFN(피드포워드) 블록의 역할에 가장 가까운 것은? ① 토큰 간 관계를 만드는 어텐션 ② 각 토큰 표현을 토큰별로 비선형 변환 ③ 드롭아웃만 적용\"\n\n토큰별 MLP에 가깝습니다. → 정답 **2**\n\n---\n\n**문제**: \"FFN은 토큰마다 다른 가중치를 반드시 써야 한다. 맞으면 1, 틀리면 0.\"\n\n보통은 공유 가중치입니다. → **정답 0**\n\n---\n\n**문제**: \"토큰 수 10일 때 self-attention 점수 행렬 원소 수는?\"\n\n$10\\times10=100$. → **정답 100**","3":"**정의 예시** — \"셀프 어텐션만으로 토큰의 절대 순서가 항상 완전히 드러난다. 맞으면 1, 틀리면 0.\" → 순서는 PE 등이 보완. **정답 0**\n\n---\n\n**참/거짓 예시** — \"사인·코사인 PE는 여러 주파수 성분을 쌓아 위치를 구분한다.\" → 맞음. **정답 1**\n\n---\n\n**선택 예시** — \"FFN이 주로 다루는 단위는? ① 토큰별 표현 ② 배치 인덱스만 ③ 이미지 픽셀만\" → ①. **정답 1**\n\n---\n\n**계산 예시** — \"토큰 수 $N=50$일 때 점수 행렬 원소 수는?\" → $50\\times50=2500$. **정답 2500**"},"summary":"트랜스포머가 문맥을 잘 보는 이유의 절반은 셀프 어텐션에 있지만, 문장이 가진 **순서**와 **어느 칸의 토큰인지**를 안정적으로 모델에 전달하려면 위치 정보를 별도로 실어 보내는 과정이 필요합니다. 전통적인 사인·코사인 위치 인코딩은 여러 주파수의 파동을 겹쳐 위치마다 서로 다른 패턴의 벡터를 만들고, 이를 토큰 임베딩에 더해 초기 표현을 완성합니다. 이후 블록에서는 어텐션이 토큰들 사이의 관계를 조정하고, 피드포워드 층은 그 결과를 토큰별로 동일한 비선형 변환을 반복 적용해 표현을 깊게 다듬습니다. 이때 중간 차원을 넓혔다가 다시 줄이는 구조는 연산 비용과 표현력 사이의 현실적인 타협점이 되며, 번역·요약·분류·생성 같은 응용 전반에서 공통으로 등장하는 설계입니다.","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","summary":"요약"},"formulaGuideDiagramCaption":"아래 다이어그램은 입력 결합(임베딩+위치), FFN의 비선형 변환, 그리고 토큰별 동일 가중치 적용 흐름을 시각적으로 보여줍니다.","formulaGuide":{"title":"수식 쉽게 이해하기","formulaGuideDiagramCaption":"아래 다이어그램은 입력 결합(임베딩+위치), FFN의 비선형 변환, 그리고 토큰별 동일 가중치 적용 흐름을 시각적으로 보여줍니다.","linear":"$$h_t^{(0)} = x_t + PE(t)$에서 $x_t$는 토큰 임베딩, $PE(t)$는 위치 $t$에 대응하는 벡터입니다. \"내용\"과 \"순서(몇 번째인지를 숫자로 만든 정보)\"를 더해 모델 입력을 만듭니다.","xavierVariance":"사인·코사인 PE에서 $PE(t,2i)=\\sin(t/10000^{2i/d})$, $PE(t,2i+1)=\\cos(t/10000^{2i/d})$ 꼴은 여러 주파수 $i$로 위치를 부호화합니다. $d$는 $d_{model}$, $t$는 토큰 인덱스입니다.","heVariance":"대표적으로 $\\mathrm{FFN}(x)=\\max(0,xW_1+b_1)W_2+b_2$ 꼴이며, $\\max(0,\\cdot)$는 ReLU입니다. 일반화하면 $\\mathrm{FFN}(h)=W_2\\,\\sigma(W_1 h+b_1)+b_2$에서 $\\sigma$는 GELU 등 비선형, $W_1$은 $d_{model}\\to d_{ff}$, $W_2$는 $d_{ff}\\to d_{model}$ 선형층입니다.","xavierUniform":"같은 FFN 가중치를 모든 위치에 적용하는 **파라미터 공유**는 데이터가 적은 위치에서도 일반화를 돕고, 구현을 단순화합니다."},"visual":"위치 인코딩과 FFN 흐름을 보여주는 인터랙티브 시각화입니다.","problemSolvingLabel":"문제 풀이를 위한 설명","practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"아래는 60문제 문제풀에서 무작위로 뽑은 10문제입니다. 난이도는 쉬움 4, 보통 3, 어려움 3 비율이며, 개념 판단과 계산이 함께 나옵니다.","practiceProblemsInstruction":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionConcept":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionOx":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionScenario":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionVote":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionAggregate":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionConfig":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionEnsemble":"문제를 읽고 가장 알맞은 선택지를 고르세요.","advDlCh02VisualZoneLabelTop":"위","advDlCh02VisualZoneLabelBottom":"아래","advDlCh02VisualIntroTop":"왼쪽부터 **읽는 방향**으로, 각 칸마다 **말의 뜻**과 **몇 번째인지를 숫자로 만든 정보(PE)** 를 **한데 더해요.**","advDlCh02VisualIntroBottom":"줄끼리는 **서로 섞지 않고**, **똑같은 계산 블록**(같은 가중치로 하는 같은 연산)을 네 줄이 **각각** 한 번씩 거쳐요.","advDlCh02VisualIntroNote":"논문에서는 이 계산 블록을 **FFN**이라고 부릅니다.","advDlCh02VisualStep0":"① 말의 **뜻** + **몇 번째인지** 정보를 더함 (이게 곧 PE를 더하는 것과 같아요)","advDlCh02VisualStep1":"② 그다음 (필요하면) 어텐션으로 주변 말과 섞음","advDlCh02VisualStep2":"③ FFN: 넓힌 층 → 비선형(한 번 꺾기) → 다시 원래 크기로 출력","advDlCh02VisualStep3":"④ 조금 더하고(+), 정리한 뒤 다음 층이나 출력","advDlCh02VisualConceptTitle":"① 입력 만들기 → (중간 단계 생략) → ② 줄마다 같은 FFN","advDlCh02VisualBridgeLead":"**①** 다음에 **②**가 같은 블록 안에서 차례로 진행돼요.","advDlCh02VisualBridgeBlock1":"**①** 먼저 **뜻 + 순서(PE)** 를 더해 **입력**을 만듭니다. (가운데 어텐션 등은 그림에서 생략)","advDlCh02VisualBridgeBlock2":"**②** 그다음 **같은 FFN**으로 줄마다 한 번씩 다듬어요. 줄끼리는 서로 안 섞어요.","advDlCh02VisualBridgeMicroCaption":"한 블록 안 순서","advDlCh02VisualAnimHint":"그림이 단계마다 천천히 강조됩니다(약 7초씩).","advDlCh02VisualAnimStepPe":"① 입력","advDlCh02VisualAnimStepBridge":"연결","advDlCh02VisualAnimStepFfn":"② FFN","advDlCh02VisualFlowTitle":"전체 흐름: 쪼개기 → 순서 정보 더하기 → 층 반복 → 예측","advDlCh02VisualModelTitle":"한 줄 요약: 뜻과 순서를 합친 벡터가 층을 통과함","advDlCh02VisualInputTokenLabel":"입력 토큰 + 위치","advDlCh02VisualTokenRelationLabel":"토큰 임베딩 + PE 합성","advDlCh02VisualContextVectorOutputLabel":"토큰별 업데이트된 표현","advDlCh02VisualContextVectorExplainLine1":"FFN은 각 칸에서","advDlCh02VisualContextVectorExplainLine2":"동일 MLP로 비선형 변환","advDlCh02VisualCoreFormulaLabel":"수식으로: **뜻+순서(PE)** 를 $h{+}PE$ 로 합치고, $\\mathrm{FFN}(h)$ 로 **칸마다** 다듬음","advDlCh02VisualLegendWeak":"낮은 중간 활성","advDlCh02VisualLegendMedium":"중간","advDlCh02VisualLegendStrong":"높은 중간 활성","advDlCh02VisualCurrentSuffix":" (현재)","advDlCh02VisualPanelPeTitle":"① 말의 뜻 + 순서 숫자(PE)를 한데 모으기","advDlCh02VisualPanelFfnTitle":"② 같은 계산 블록으로 줄마다 한 번씩 다듬기 (FFN)","advDlCh02VisualTrainCaption":"**문장 안에서 몇 번째 단어인지** 숫자로 적어 두는 것과 비슷해요.","advDlCh02VisualSameMachineHint":"네 줄은 서로 안 섞고, 똑같은 계산 블록만 통과","advDlCh02VisualMachineIn":"입력","advDlCh02VisualMachineMid":"넓힌 층","advDlCh02VisualMachineOut":"출력","advDlCh02VisualMachineAct":"비선형","advDlCh02VisualEmbShort":"뜻","advDlCh02VisualPosShort":"위치","advDlCh02VisualPosSlotShort":"번호","advDlCh02VisualPeShort":"순서값","advDlCh02VisualSumPrimary":"{slot} 합친","advDlCh02VisualSumSub":"뜻+순서값","advDlCh02VisualFfnSameNote":"네 칸 모두 **같은 계산 블록** (가중치 W₁, W₂ 공유)","advDlCh02VisualFfnPerToken":"줄","advDlCh02VisualFfnInLabel":"한 칸 크기","advDlCh02VisualLegendExpand":"넓힘","advDlCh02VisualLegendNonlin":"비선형","advDlCh02VisualLegendProject":"다시 좁힘","advDlCh02VisualLegendFfnLabel":"계산 블록(FFN)","problems":{"concept_0":"셀프 어텐션만으로는 토큰 순서 정보가 약해지므로, 순서를 벡터로 넣어 주는 장치는? ① 위치 인코딩(Positional Encoding) ② 드롭아웃만 ③ 배치 정규화만","concept_1":"원 논문형 사인·코사인 위치 인코딩에서 짝수 차원 인덱스 $2i$에는 보통 무엇이 들어가나? ① $\\sin$ ② $\\cos$ ③ ReLU","concept_2":"트랜스포머 블록의 FFN은 각 토큰 벡터에 대해 무엇을 하나? ① 토큰끼리의 관계를 섞는다 ② 토큰별로 동일한 MLP를 적용해 표현을 깊게 바꾼다 ③ 시퀀스 길이를 줄인다","concept_3":"BERT-base에서 흔히 $d_{ff}=4d_{model}$이다. $d_{model}=128$이면 $d_{ff}$로 자연스러운 값은? ① 256 ② 512 ③ 64","concept_4":"학습 가능한 임베딩으로 위치를 넣는 방식에 가까운 설명은? ① 토큰마다 학습된 위치 벡터를 더한다 ② 항상 $\\sin$만 쓴다 ③ 위치 정보를 쓰지 않는다","concept_5":"긴 문서에서 앞 문장과 뒤 문장의 순서가 라벨에 중요할 때, 어텐션과 함께 꼭 챙겨야 할 입력은? ① 토큰 임베딩 + 위치 정보 ② 픽셀만 ③ 파일 이름만","ox_0":"가산형 위치 인코딩은 보통 토큰 임베딩에 더해져서 모델 입력이 된다. 맞으면 1, 틀리면 0.","ox_1":"피드포워드 층은 시퀀스 길이 전체에 대해 한 번에 소프트맥스를 취한다. 맞으면 1, 틀리면 0.","ox_2":"동일한 FFN 가중치가 각 토큰 위치에 공유된다(위치마다 다른 파라미터가 필수는 아니다). 맞으면 1, 틀리면 0.","ox_3":"사인·코스 위치 인코딩은 토큰 간 상대 거리 정보를 일부 주기적 패턴으로 반영하도록 설계되었다. 맞으면 1, 틀리면 0.","ox_4":"$$d_{ff}$는 보통 $d_{model}$보다 작게만 잡는 것이 일반적이다. 맞으면 1, 틀리면 0.","ox_5":"인코더 블록에서 어텐션 다음에 오는 FFN은 번역·분류 등 NLP 파이프라인에서 널리 쓰인다. 맞으면 1, 틀리면 0.","scenario_0":"의료 기록 요약에서 \"투약 전\"과 \"투약 후\" 순서가 진단에 중요하다. 우선 보강할 입력은? ① 위치 인코딩을 포함한 순서 정보 ② 이미지 회전 각도 ③ 배치 크기만","scenario_1":"스팸 분류에서 \"무료\"와 \"지금 클릭\"이 멀리 떨어져도 함께 봐야 한다면, 어텐션과 함께 순서도 넣으려면? ① 임베딩+위치 ② 색공간 변환 ③ 음성 샘플링만","scenario_2":"사기 거래 설명 텍스트에서 금액과 시간 순서가 라벨과 연관될 때, 표현력을 넓히는 층은? ① 토큰별 FFN ② 항상 풀링만 ③ 정규식만","scenario_3":"긴 법률 문서에서 조항 번호의 상대적 거리가 중요할 때, 상대적 패턴을 다루기 쉬운 전통적 PE는? ① 사인·코사인 PE ② 무작위 삭제 ③ 파일 확장자","scenario_4":"모델이 \"오늘\"과 \"내일\"의 순서를 자주 혼동한다. 우선 점검할 것은? ① 위치 인코딩·임베딩 결합 ② 모니터 해상도 ③ 폰트 크기","scenario_5":"동일 $d_{model}$에서 FFN 중간 차원을 키우면 표현력은 늘지만 연산량도 늘어난다. 튜닝 시 균형을 보려면? ① $d_{ff}$와 지연 시간 ② 마우스 DPI ③ 테마 색","scenario_6":"다국어 번역에서 어순이 다른 언어 쌍을 다룰 때, 토큰 의미와 순서를 동시에 넣는 전처리 방향은? ① 서브워드 임베딩 + PE ② 픽셀 정규화만 ③ 파일 압축만","scenario_7":"긴 로그에서 앞부분 부정어가 뒤 문장을 바꾼다. 순서 신호를 유지하려면? ① PE가 포함된 입력 ② 단어 길이만 ③ UUID만","scenario_8":"리뷰 감성에서 \"않\"과 \"좋\"의 관계를 본 뒤, 토큰별 비선형 변환이 필요하면? ① FFN ② 항상 평균만 ③ 정지","scenario_9":"실험에서 FFN을 빼면 성능이 크게 떨어졌다. 가장 타당한 이유는? ① 토큰 표현의 깊은 비선형 변환이 사라짐 ② 배치 크기가 1이 됨 ③ GPU가 사라짐","vote_0":"헤드 신뢰도 가중치가 [3,2,1,2,1], 이진 투표가 [1,1,0,1,0]일 때 양성(1)의 가중합은?","vote_1":"레이어 확률 [0.92,0.63,0.71,0.48,0.83,0.69]에서 임계값 0.7 이상을 양성으로 볼 때, 양성 개수는?","vote_2":"3클래스 예측 레이블이 [2,0,1,2,1,0,2,2]일 때 클래스 2를 선택한 횟수는?","vote_3":"앙상블 투표에서 클래스 A 득표가 7, 클래스 B 득표가 4일 때 득표 차(A-B)는?","vote_4":"신뢰도 [4,3,2,1,2,3,1,2], 투표 [1,1,1,0,1,0,1,1]일 때 양성(1)의 신뢰도 가중합은?","vote_5":"레이어 확률 [0.4,0.7,0.2,0.8,0.1,0.6,0.3,0.9,0.55,0.65]에서 0.6 이상을 양성으로 보면 양성 개수는?","vote_6":"레이어 A=[1,0,1,0,1,0,1,0,1,0,1,0], 레이어 B=[1,1,1,0,0,0,1,1,1,0,1,1]일 때 서로 다른 위치 개수는?","vote_7":"레이어 A=[1,1,0,0,1,1,0,0,1,1,0,0], 레이어 B=[1,0,0,1,1,0,0,1,1,0,0,1]일 때 둘 다 1인 위치 개수는?","vote_8":"투표 벡터 [0,0,0,1,1,1,1,1,0,1]에서 양성(1) 개수에서 음성(0) 개수를 뺀 값은?","vote_9":"초기 구간 투표 [1,1,1,1,1,0], 후반 구간 투표 [0,0,1,0,1,0]일 때 (초기 양성 수 - 후반 양성 수)는?","aggregate_0":"세 헤드의 양성 예측 개수가 [2,1,2]일 때 총합은?","aggregate_1":"네 블록의 스팸 점수 합이 [3,2,1,2]일 때 총합은?","aggregate_2":"다섯 FFN 블록의 활성 뉴런 수가 [4,4,3,5,4]일 때 합계는?","aggregate_3":"네 위치의 PE 차원 매칭 수가 [6,5,7,6]일 때 총합은?","aggregate_4":"여섯 층 점수 [5,4,6,5,4,6]의 합은?","aggregate_5":"클래스0 표가 [7,8,6,9]일 때 총합은?","aggregate_6":"헤드별 키워드 매칭 수 [10,12,11,9,8]의 합은?","aggregate_7":"배치별 긍정 예측 수 [14,16,15]의 합은?","aggregate_8":"8개 헤드의 오류 수 [1,2,1,2,1,2,1,2] 합은?","aggregate_9":"위치별 관심 토큰 수 [3,5,7,9,11]의 합은?","ensemble_0":"여러 FFN/블록을 쌓으면 기대되는 효과로 가장 가까운 것은? ① 표현을 단계적으로 쌓아 복잡 패턴 학습 ② 파라미터가 항상 0 ③ 학습이 불가능","ensemble_1":"서로 다른 깊이의 스택에서 오차가 상쇄될 수 있는 이유는? ① 층마다 다른 변환을 거침 ② 항상 동일 출력 ③ 데이터 삭제","ensemble_2":"단일 FFN 층 대비 다층 FFN이 강한 이유로 타당한 것은? ① 비선형을 반복 적용해 표현력 증가 ② 시퀀스 길이 강제 1 ③ softmax 제거","ensemble_3":"블록 수를 늘릴 때 주의할 점은? ① 성능·연산·과적합 균형 ② 항상 무한 증가 ③ 검증 불필요","ensemble_4":"깊은 스택에서 일부 층이 유사한 기능만 하면? ① 중복으로 이득이 작을 수 있음 ② 항상 성능 향상 ③ 학습 불가","ensemble_5":"다양한 층을 쌓는 목적은? ① 단계적 추상화 ② 동일 복사 ③ 고정","ensemble_6":"실서비스에서 층 수를 정할 때 중요한 것은? ① 정확도와 지연 ② 모니터 주사율 ③ 아이콘 크기","ensemble_7":"성능이 정체되면 먼저 볼 항목은? ① 층이 서로 비슷한 표현만 만드는지 ② 파일 이름 ③ 테마","config_0":"헤드 수 4, 헤드 차원 16일 때 $d_{model}$은?","config_1":"헤드 수 8, 헤드 차원 8일 때 $d_{model}$은?","config_2":"토큰 수 10에서 어텐션 점수 행렬의 원소 수는 $10\\times10$이다. 값은?","config_3":"토큰 수 12에서 점수 행렬 원소 수는 $12\\times12$이다. 값은?","config_4":"헤드 수 6, 헤드 차원 12일 때 $d_{model}$은?","config_5":"헤드 수 3, 헤드 차원 24일 때 $d_{model}$은?","config_6":"시퀀스 길이 14에서 self-attention 점수 원소 수는 $14\\times14$이다. 값은?","config_7":"시퀀스 길이 16에서 점수 원소 수는 $16\\times16$이다. 값은?","config_8":"헤드 수 12, 헤드 차원 10일 때 $d_{model}$은?","config_9":"토큰 수 20에서 점수 행렬 원소 수는 $20\\times20$이다. 값은?"},"problemAnswers":{"concept_0":1,"concept_1":1,"concept_2":2,"concept_3":2,"concept_4":1,"concept_5":1,"ox_0":1,"ox_1":0,"ox_2":1,"ox_3":1,"ox_4":0,"ox_5":1,"scenario_0":1,"scenario_1":1,"scenario_2":1,"scenario_3":1,"vote_0":3,"vote_1":4,"vote_2":4,"vote_3":7,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1,"vote_4":6,"vote_5":6,"vote_6":6,"vote_7":6,"vote_8":6,"vote_9":7,"aggregate_0":5,"aggregate_1":8,"aggregate_2":20,"aggregate_3":24,"ensemble_0":1,"ensemble_1":1,"ensemble_2":1,"ensemble_3":1,"aggregate_4":30,"aggregate_5":30,"aggregate_6":50,"aggregate_7":45,"aggregate_8":12,"aggregate_9":35,"config_0":64,"config_1":64,"config_2":100,"config_3":144,"config_4":72,"config_5":72,"config_6":196,"config_7":256,"config_8":120,"config_9":400,"ensemble_4":1,"ensemble_5":1,"ensemble_6":1,"ensemble_7":1},"problemSolutions":{"concept_0":"위치 인코딩은 셀프 어텐션이 순서를 약하게 다루는 점을 보완해 \"몇 번째 토큰인지\"를 벡터로 넣어 줍니다. 스팸 메일에서도 단어 순서와 간격이 의미에 영향을 줍니다. 정답 1.","concept_1":"사인·코사인 PE에서 짝수 인덱스 $2i$에는 $\\sin$이, 홀수 $2i+1$에는 $\\cos$가 대응하는 전형적 구성입니다. 의료 텍스트에서 시간 순서 표현과 연결됩니다. 정답 1.","concept_2":"FFN은 토큰 간 관계를 섞는 어텐션과 달리, 각 위치의 벡터에 동일한 MLP를 적용해 비선형 변환을 합니다. 정답 2.","concept_3":"$$4\\times128=512$가 흔한 스케일입니다. 정답 2.","concept_4":"학습형 위치 임베딩은 절대 위치를 학습 벡터로 넣는 방식입니다. 정답 1.","concept_5":"임베딩과 위치 정보를 함께 넣어야 순서가 라벨에 반영되기 쉽습니다. 정답 1.","ox_0":"가산형 PE는 임베딩에 더해집니다. 정답 1.","ox_1":"FFN은 토큰별로 적용되며 시퀀스 전체 소프트맥스는 일반적이지 않습니다. 정답 0.","ox_2":"파라미터 공유가 일반적입니다. 정답 1.","ox_3":"주기 함수로 상대적 거리 정보를 간접 반영하려는 설계입니다. 정답 1.","ox_4":"보통 $d_{ff}$는 $d_{model}$보다 크게 잡습니다. 정답 0.","ox_5":"NLP 블록의 표준 구성입니다. 정답 1.","scenario_0":"임상에서 순서는 약물·시간축에 필수입니다. PE가 포함된 입력이 적절합니다. 정답 1.","scenario_1":"어텐션으로 관계를 보고, 순서는 PE로 보강합니다. 정답 1.","scenario_2":"토큰별 비선형 변환은 FFN의 역할입니다. 정답 1.","scenario_3":"사인·코사인 PE는 상대 거리에 대한 주기적 신호를 줍니다. 정답 1.","scenario_4":"순서 혼동은 위치 정보 주입을 점검해야 합니다. 정답 1.","scenario_5":"$$d_{ff}$ 확대는 연산량과 트레이드오프입니다. 정답 1.","scenario_6":"토큰화+임베딩+PE가 표준입니다. 정답 1.","scenario_7":"부정어와의 거리는 순서 신호로 다루기 쉽습니다. 정답 1.","scenario_8":"비선형 깊은 변환은 FFN이 담당합니다. 정답 1.","scenario_9":"FFN 제거는 표현력 큰 손실입니다. 정답 1.","vote_0":"가중치 [3,2,1,2,1]와 투표 [1,1,0,1,0]의 원소곱 합은 $3\\times1+2\\times1+1\\times0+2\\times1+1\\times0=7$입니다. 정답 7.","vote_1":"확률 [0.92,0.63,0.71,0.48,0.83,0.69]에서 0.7 이상은 0.92, 0.71, 0.83의 3개입니다. 정답 3.","vote_2":"레이블 [2,0,1,2,1,0,2,2]에서 클래스 2는 4회 등장합니다. 정답 4.","vote_3":"득표 차는 $7-4=3$입니다. 정답 3.","vote_4":"양성인 위치의 신뢰도만 더하면 $4+3+2+2+1+2=14$입니다. 정답 14.","vote_5":"0.6 이상은 0.7, 0.8, 0.6, 0.9, 0.65로 5개입니다. 정답 5.","vote_6":"A와 B가 다른 위치를 세면 4개입니다. 정답 4.","vote_7":"둘 다 1인 위치는 (1,5,9)로 3개입니다. 정답 3.","vote_8":"양성 6개, 음성 4개이므로 차이는 $6-4=2$입니다. 정답 2.","vote_9":"초기 양성 5개, 후반 양성 2개이므로 $5-2=3$입니다. 정답 3.","aggregate_0":"$$2+1+2=5$. 정답 5.","aggregate_1":"$$3+2+1+2=8$. 정답 8.","aggregate_2":"$$4+4+3+5+4=20$. 정답 20.","aggregate_3":"$$6+5+7+6=24$. 정답 24.","ensemble_0":"깊게 쌓아 단계적 표현을 얻습니다. 정답 1.","ensemble_1":"층마다 다른 변환으로 오차 상쇄 여지가 생깁니다. 정답 1.","ensemble_2":"비선형 반복이 표현력을 키웁니다. 정답 1.","ensemble_3":"과적합·연산을 함께 봐야 합니다. 정답 1.","aggregate_4":"합 30. 정답 30.","aggregate_5":"합 30. 정답 30.","aggregate_6":"합 50. 정답 50.","aggregate_7":"합 45. 정답 45.","aggregate_8":"합 12. 정답 12.","aggregate_9":"합 35. 정답 35.","config_0":"$$4\\times16=64$. 정답 64.","config_1":"$$8\\times8=64$. 정답 64.","config_2":"$$10\\times10=100$. 정답 100.","config_3":"$$12\\times12=144$. 정답 144.","config_4":"$$6\\times12=72$. 정답 72.","config_5":"$$3\\times24=72$. 정답 72.","config_6":"$$14\\times14=196$. 정답 196.","config_7":"$$16\\times16=256$. 정답 256.","config_8":"$$12\\times10=120$. 정답 120.","config_9":"$$20\\times20=400$. 정답 400.","ensemble_4":"중복 층은 이득이 작을 수 있습니다. 정답 1.","ensemble_5":"단계적 추상화 목적입니다. 정답 1.","ensemble_6":"정확도와 지연 균형입니다. 정답 1.","ensemble_7":"표현 다양성 점검이 우선입니다. 정답 1."},"problemTestCodes":{"concept_0":"answer = 1\nassert answer == 1","concept_1":"answer = 1\nassert answer == 1","concept_2":"answer = 2\nassert answer == 2","concept_3":"answer = 2\nassert answer == 2","concept_4":"answer = 1\nassert answer == 1","concept_5":"answer = 1\nassert answer == 1","ox_0":"answer = 1\nassert answer == 1","ox_1":"answer = 0\nassert answer == 0","ox_2":"answer = 1\nassert answer == 1","ox_3":"answer = 1\nassert answer == 1","ox_4":"answer = 0\nassert answer == 0","ox_5":"answer = 1\nassert answer == 1","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 1\nassert answer == 1","scenario_3":"answer = 1\nassert answer == 1","vote_0":"votes = [1,1,0,1,0]\nassert sum(votes) == 3","vote_1":"votes = [1,0,1,1,1,0]\nassert sum(votes) == 4","vote_2":"votes = [0,0,1,0,1,1,1,0]\nassert sum(votes) == 4","vote_3":"votes = [1,1,1,1,0,0,1,0,1,1]\nassert sum(votes) == 7","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1","vote_4":"votes = [1,1,1,0,1,0,1,1]\nassert sum(votes) == 6","vote_5":"votes = [0,1,0,1,0,1,0,1,1,1]\nassert sum(votes) == 6","vote_6":"votes = [1,0,1,0,1,0,1,0,1,0,1,0]\nassert sum(votes) == 6","vote_7":"votes = [1,1,0,0,1,1,0,0,1,1,0,0]\nassert sum(votes) == 6","vote_8":"votes = [0,0,0,1,1,1,1,1,0,1]\nassert sum(votes) == 6","vote_9":"votes = [1,1,1,1,1,0,0,0,1,0,1,0]\nassert sum(votes) == 7","aggregate_0":"values = [2,1,2]\nassert sum(values) == 5","aggregate_1":"values = [3,2,1,2]\nassert sum(values) == 8","aggregate_2":"values = [4,4,3,5,4]\nassert sum(values) == 20","aggregate_3":"values = [6,5,7,6]\nassert sum(values) == 24","ensemble_0":"answer = 1\nassert answer == 1","ensemble_1":"answer = 1\nassert answer == 1","ensemble_2":"answer = 1\nassert answer == 1","ensemble_3":"answer = 1\nassert answer == 1","aggregate_4":"values = [5,4,6,5,4,6]\nassert sum(values) == 30","aggregate_5":"values = [7,8,6,9]\nassert sum(values) == 30","aggregate_6":"values = [10,12,11,9,8]\nassert sum(values) == 50","aggregate_7":"values = [14,16,15]\nassert sum(values) == 45","aggregate_8":"values = [1,2,1,2,1,2,1,2]\nassert sum(values) == 12","aggregate_9":"values = [3,5,7,9,11]\nassert sum(values) == 35","config_0":"assert 4 * 16 == 64","config_1":"assert 8 * 8 == 64","config_2":"assert 10 * 10 == 100","config_3":"assert 12 * 12 == 144","config_4":"assert 6 * 12 == 72","config_5":"assert 3 * 24 == 72","config_6":"assert 14 * 14 == 196","config_7":"assert 16 * 16 == 256","config_8":"assert 12 * 10 == 120","config_9":"assert 20 * 20 == 400","ensemble_4":"answer = 1\nassert answer == 1","ensemble_5":"answer = 1\nassert answer == 1","ensemble_6":"answer = 1\nassert answer == 1","ensemble_7":"answer = 1\nassert answer == 1"},"problemDifficulty":{"concept_0":"easy","concept_1":"easy","concept_2":"easy","concept_3":"easy","concept_4":"easy","concept_5":"easy","ox_0":"easy","ox_1":"easy","ox_2":"easy","ox_3":"easy","ox_4":"easy","ox_5":"easy","scenario_0":"easy","scenario_1":"easy","scenario_2":"easy","scenario_3":"easy","vote_0":"easy","vote_1":"easy","vote_2":"easy","vote_3":"easy","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","vote_4":"medium","vote_5":"medium","vote_6":"medium","vote_7":"medium","vote_8":"medium","vote_9":"medium","aggregate_0":"medium","aggregate_1":"medium","aggregate_2":"medium","aggregate_3":"medium","ensemble_0":"medium","ensemble_1":"medium","ensemble_2":"medium","ensemble_3":"medium","aggregate_4":"hard","aggregate_5":"hard","aggregate_6":"hard","aggregate_7":"hard","aggregate_8":"hard","aggregate_9":"hard","config_0":"hard","config_1":"hard","config_2":"hard","config_3":"hard","config_4":"hard","config_5":"hard","config_6":"hard","config_7":"hard","config_8":"hard","config_9":"hard","ensemble_4":"hard","ensemble_5":"hard","ensemble_6":"hard","ensemble_7":"hard"},"problemOrder":["concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","ox_0","ox_1","ox_2","ox_3","ox_4","ox_5","scenario_0","scenario_1","scenario_2","scenario_3","vote_0","vote_1","vote_2","vote_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","vote_4","vote_5","vote_6","vote_7","vote_8","vote_9","aggregate_0","aggregate_1","aggregate_2","aggregate_3","ensemble_0","ensemble_1","ensemble_2","ensemble_3","aggregate_4","aggregate_5","aggregate_6","aggregate_7","aggregate_8","aggregate_9","config_0","config_1","config_2","config_3","config_4","config_5","config_6","config_7","config_8","config_9","ensemble_4","ensemble_5","ensemble_6","ensemble_7"]},"advDlCh03":{"chapter":"Chapter 03","title":"트랜스포머 계보: BERT는 이해, GPT는 생성","description":"트랜스포머라는 위대한 발명품은 크게 두 갈래의 가문으로 발전했습니다. 문장 전체를 한 번에 꿰뚫어 보는 **인코더 가문의 BERT(이해형 모델)**와, 앞선 단어들을 바탕으로 다음 단어를 끊임없이 지어내는 **디코더 가문의 GPT(생성형 모델)**입니다. BERT가 '수능 국어 영역 빈칸 추론'의 달인이라면, GPT는 '끝말잇기와 소설 쓰기'의 천재입니다. 이 챕터에서는 두 모델이 어떤 방식으로 학습을 하고, 왜 실무에서 쓰임새가 완전히 다른지 초보자도 쉽게 이해할 수 있는 비유와 함께 정리합니다.","sectionTitle":"트랜스포머 계보: BERT는 이해, GPT는 생성","whatIs":{"0":"**1. BERT: 문장을 양방향으로 읽고 '이해'하는 인코더형**\n\n**개념:** BERT(Bidirectional Encoder Representations from Transformers)는 트랜스포머의 **인코더(Encoder)** 부분만 떼어내어 발전시킨 모델입니다. 핵심은 **양방향(Bidirectional) 문맥 파악**입니다. 왼쪽 단어와 오른쪽 단어를 동시에 참고하여 현재 단어가 문장에서 어떤 의미로 쓰였는지 가장 정확한 '표현 벡터'를 만들어냅니다.\n\n**직관적 이해:** 환자를 진찰할 때 과거 병력(왼쪽)과 현재 검사 결과(오른쪽)를 **동시에** 펼쳐놓고 종합적으로 판단하는 명의와 같습니다. 전체적인 그림을 한 번에 보기 때문에 문맥을 파악하는 능력이 탁월합니다.\n\n**수학적 설명:** BERT의 대표적인 학습 방법은 **MLM(Masked Language Modeling)**입니다. 문장 중간의 단어에 구멍(`[MASK]`)을 뚫어놓고, 주변 문맥을 이용해 정답 토큰($w_t$)의 확률 분포 $p(w_t \\mid \\text{전체 문맥})$를 맞추도록 훈련합니다.\n\n**실제 적용:** \"이 리뷰는 긍정인가요 부정인가요?\", \"이 문서에서 사람 이름과 날짜를 찾아주세요\" 같은 텍스트 분류, 개체명 인식, 문서 검색 등에 압도적으로 많이 쓰입니다.","1":"**2. GPT: 다음 단어를 끊임없이 '생성'하는 디코더형**\n\n**개념:** GPT(Generative Pre-trained Transformer)는 트랜스포머의 **디코더(Decoder)** 부분을 발전시킨 모델입니다. 이 모델은 문장을 처음부터 끝까지 한 번에 보지 못하게 **마스크(Mask)**로 미래의 단어들을 가려놓고, 오직 **과거의 단어들($1\\ldots t-1$)만 보고 다음 단어($t$)를 예측**하는 자기회귀(Autoregressive) 방식으로 작동합니다.\n\n**직관적 이해:** 타자기로 소설을 쓰는 작가와 같습니다. 작가는 **아직 쓰지 않은 다음 문장을 미리 볼 수 없습니다.** 지금까지 써 내려간 글의 흐름을 바탕으로 가장 자연스러운 다음 단어를 상상해서 적어 나갑니다.\n\n**수학적 설명:** 현재 위치보다 뒤에 있는 미래 토큰 정보가 섞이지 않도록, 어텐션 행렬에서 대각선 위쪽 영역을 $-\\infty$로 덮어버리는 **Causal Masking**을 사용합니다. 학습은 이전 토큰들($x_{i$ 차단)와 같은 규칙으로 미래 정보 누설을 막습니다."},"visual":"애니메이션 기획: ① BERT 패널에서 토큰 사이에 양방향 화살표가 순차로 강조된다. ② GPT 패널에서는 왼쪽→현재 토큰 방향만 강조되고 오른쪽은 회색으로 막힌다. ③ 하단에 MLM(가림)과 Next-token(화살표) 아이콘이 번갈아 깜빡인다. 모바일에서는 좌우 2열 대신 세로 스택으로 배치한다.","problemSolvingLabel":"문제 풀이를 위한 설명","practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"아래는 60문제 문제풀에서 무작위로 뽑은 10문제입니다. 난이도는 쉬움→보통→어려움 순서이며 비율은 4·3·3입니다. 개념 판단과 계산이 함께 나옵니다.","practiceProblemsInstruction":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionConcept":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionOx":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionScenario":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionVote":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionAggregate":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionConfig":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionEnsemble":"문제를 읽고 가장 알맞은 선택지를 고르세요.","advDlCh03VisualIntro":"BERT는 **문장 전체를 동시에 참고**해 표현을 만들고, GPT는 **지금까지의 토큰만 보고** 다음 토큰을 이어 붙입니다.","advDlCh03VisualStep0":"① 인코더(BERT): 토큰들이 서로 **양방향**으로 참고","advDlCh03VisualStep1":"② 디코더(GPT): **왼쪽 문맥만** 보고 다음 칸 예측","advDlCh03VisualStep2":"③ 학습 목표: MLM(가려 맞추기) vs 다음 토큰 로그우도","advDlCh03VisualStep3":"④ 추론: 분류·임베딩 vs 프롬프트로 **토큰 생성**","advDlCh03VisualConceptTitle":"개념 구조: 인코더형(이해) vs 디코더형(생성)","advDlCh03VisualFlowTitle":"학습 흐름: 토큰화 → 마스크/목표 설정 → 층 반복 → 헤드","advDlCh03VisualModelTitle":"모델 작동: 양방향 표현 vs 자기회귀 생성","advDlCh03VisualBertTitle":"BERT 계열","advDlCh03VisualGptTitle":"GPT 계열","advDlCh03VisualTokenRowLabel":"토큰","advDlCh03VisualDemoToken0":"I","advDlCh03VisualDemoToken1":"love","advDlCh03VisualDemoToken2":"deep","advDlCh03VisualDemoToken3":"learning","advDlCh03VisualBidirectionalHint":"양방향 참고","advDlCh03VisualCausalHint":"미래 토큰 차단","advDlCh03VisualMlmLabel":"MLM","advDlCh03VisualNextTokenLabel":"Next token","advDlCh03VisualLegendBoth":"양방향","advDlCh03VisualLegendLeftOnly":"왼쪽만","advDlCh03VisualLegendBlocked":"차단","advDlCh03VisualCurrentSuffix":" (현재)","advDlCh03ArchEmbedLabel":"텍스트 + 위치 임베딩","advDlCh03ArchEmbedExample":"I · love · deep · learning","advDlCh03ArchMhaBert":"멀티헤드\n어텐션","advDlCh03ArchMhaGpt":"마스크 멀티헤드\n어텐션","advDlCh03ArchAddNorm":"Add & Norm","advDlCh03ArchFfn":"Feed Forward","advDlCh03ArchLx":"N층 반복","advDlCh03ArchOutBert":"분류 헤드","advDlCh03ArchOutGptGen":"다음 토큰\n예측","advDlCh03ArchOutGptCls":"태스크\n분류","advDlCh03ArchResidualHint":"잔차 연결","advDlCh03ArchEncoderSub":"양방향 인코더 스택","advDlCh03ArchDecoderSub":"인과적 디코더 스택","advDlCh03ArchRelationTitle":"I love deep learning 토큰 관계","advDlCh03ArchRelationBert":"양방향: 각 토큰이 모든 토큰을 함께 참고","advDlCh03ArchRelationGpt":"인과적: 현재 토큰은 왼쪽(과거) 토큰만 참고","advDlCh03ArchRelationBlocked":"미래 X","advDlCh03ArchRelationExplainBert":"왼쪽 미니 비주얼은 멀티헤드 어텐션의 핵심을 단순화해 보여줍니다. 여러 헤드가 서로 다른 관계를 병렬로 보고, 결과를 합쳐(Concat + Projection) 양방향 문맥 표현을 만듭니다.","advDlCh03ArchRelationExplainGpt":"오른쪽은 마스크 멀티헤드 어텐션입니다. 구조는 멀티헤드와 같지만, 인과 마스크를 씌워 현재 위치가 미래 토큰을 보지 못하게 제한하고 자기회귀(next-token) 학습을 가능하게 합니다.","problems":{"concept_0":"전형적인 BERT 계열에 가장 가까운 설명은? ① 인코더 블록만 쌓아 양방향 표현을 만든다 ② 디코더만 쌓는다 ③ 합성곱만 쌓는다","concept_1":"원 논문형 사인·코사인 위치 인코딩에서 짝수 차원 인덱스 $2i$에는 보통 무엇이 들어가나? ① $\\sin$ ② $\\cos$ ③ ReLU","concept_2":"GPT 계열의 핵심 학습 목표에 가장 가까운 것은? ① 토큰 간 관계를 섞는 어텐션만 ② 왼쪽 문맥만 보고 다음 토큰을 예측하는 자기회귀 언어모델링 ③ 시퀀스 길이를 줄이기","concept_3":"BERT-base에서 흔히 $d_{ff}=4d_{model}$이다. $d_{model}=128$이면 $d_{ff}$로 자연스러운 값은? ① 256 ② 512 ③ 64","concept_4":"학습 가능한 임베딩으로 위치를 넣는 방식에 가까운 설명은? ① 토큰마다 학습된 위치 벡터를 더한다 ② 항상 $\\sin$만 쓴다 ③ 위치 정보를 쓰지 않는다","concept_5":"긴 문서에서 앞 문장과 뒤 문장의 순서가 라벨에 중요할 때, 어텐션과 함께 꼭 챙겨야 할 입력은? ① 토큰 임베딩 + 위치 정보 ② 픽셀만 ③ 파일 이름만","ox_0":"가산형 위치 인코딩은 보통 토큰 임베딩에 더해져서 모델 입력이 된다. 맞으면 1, 틀리면 0.","ox_1":"피드포워드 층은 시퀀스 길이 전체에 대해 한 번에 소프트맥스를 취한다. 맞으면 1, 틀리면 0.","ox_2":"동일한 FFN 가중치가 각 토큰 위치에 공유된다(위치마다 다른 파라미터가 필수는 아니다). 맞으면 1, 틀리면 0.","ox_3":"사인·코스 위치 인코딩은 토큰 간 상대 거리 정보를 일부 주기적 패턴으로 반영하도록 설계되었다. 맞으면 1, 틀리면 0.","ox_4":"$$d_{ff}$는 보통 $d_{model}$보다 작게만 잡는 것이 일반적이다. 맞으면 1, 틀리면 0.","ox_5":"인코더 블록에서 어텐션 다음에 오는 FFN은 번역·분류 등 NLP 파이프라인에서 널리 쓰인다. 맞으면 1, 틀리면 0.","scenario_0":"의료 기록 요약에서 \"투약 전\"과 \"투약 후\" 순서가 진단에 중요하다. 우선 보강할 입력은? ① 위치 인코딩을 포함한 순서 정보 ② 이미지 회전 각도 ③ 배치 크기만","scenario_1":"스팸 분류에서 \"무료\"와 \"지금 클릭\"이 멀리 떨어져도 함께 봐야 한다면, 어텐션과 함께 순서도 넣으려면? ① 임베딩+위치 ② 색공간 변환 ③ 음성 샘플링만","scenario_2":"사기 거래 설명 텍스트에서 금액과 시간 순서가 라벨과 연관될 때, 표현력을 넓히는 층은? ① 토큰별 FFN ② 항상 풀링만 ③ 정규식만","scenario_3":"긴 법률 문서에서 조항 번호의 상대적 거리가 중요할 때, 상대적 패턴을 다루기 쉬운 전통적 PE는? ① 사인·코사인 PE ② 무작위 삭제 ③ 파일 확장자","scenario_4":"모델이 \"오늘\"과 \"내일\"의 순서를 자주 혼동한다. 우선 점검할 것은? ① 위치 인코딩·임베딩 결합 ② 모니터 해상도 ③ 폰트 크기","scenario_5":"동일 $d_{model}$에서 FFN 중간 차원을 키우면 표현력은 늘지만 연산량도 늘어난다. 튜닝 시 균형을 보려면? ① $d_{ff}$와 지연 시간 ② 마우스 DPI ③ 테마 색","scenario_6":"다국어 번역에서 어순이 다른 언어 쌍을 다룰 때, 토큰 의미와 순서를 동시에 넣는 전처리 방향은? ① 서브워드 임베딩 + PE ② 픽셀 정규화만 ③ 파일 압축만","scenario_7":"긴 로그에서 앞부분 부정어가 뒤 문장을 바꾼다. 순서 신호를 유지하려면? ① PE가 포함된 입력 ② 단어 길이만 ③ UUID만","scenario_8":"리뷰 감성에서 \"않\"과 \"좋\"의 관계를 본 뒤, 토큰별 비선형 변환이 필요하면? ① FFN ② 항상 평균만 ③ 정지","scenario_9":"실험에서 FFN을 빼면 성능이 크게 떨어졌다. 가장 타당한 이유는? ① 토큰 표현의 깊은 비선형 변환이 사라짐 ② 배치 크기가 1이 됨 ③ GPU가 사라짐","vote_0":"헤드 신뢰도 가중치가 [3,2,1,2,1], 이진 투표가 [1,1,0,1,0]일 때 양성(1)의 가중합은?","vote_1":"레이어 확률 [0.92,0.63,0.71,0.48,0.83,0.69]에서 임계값 0.7 이상을 양성으로 볼 때, 양성 개수는?","vote_2":"3클래스 예측 레이블이 [2,0,1,2,1,0,2,2]일 때 클래스 2를 선택한 횟수는?","vote_3":"앙상블 투표에서 클래스 A 득표가 7, 클래스 B 득표가 4일 때 득표 차(A-B)는?","vote_4":"신뢰도 [4,3,2,1,2,3,1,2], 투표 [1,1,1,0,1,0,1,1]일 때 양성(1)의 신뢰도 가중합은?","vote_5":"레이어 확률 [0.4,0.7,0.2,0.8,0.1,0.6,0.3,0.9,0.55,0.65]에서 0.6 이상을 양성으로 보면 양성 개수는?","vote_6":"레이어 A=[1,0,1,0,1,0,1,0,1,0,1,0], 레이어 B=[1,1,1,0,0,0,1,1,1,0,1,1]일 때 서로 다른 위치 개수는?","vote_7":"레이어 A=[1,1,0,0,1,1,0,0,1,1,0,0], 레이어 B=[1,0,0,1,1,0,0,1,1,0,0,1]일 때 둘 다 1인 위치 개수는?","vote_8":"투표 벡터 [0,0,0,1,1,1,1,1,0,1]에서 양성(1) 개수에서 음성(0) 개수를 뺀 값은?","vote_9":"초기 구간 투표 [1,1,1,1,1,0], 후반 구간 투표 [0,0,1,0,1,0]일 때 (초기 양성 수 - 후반 양성 수)는?","aggregate_0":"세 헤드의 양성 예측 개수가 [2,1,2]일 때 총합은?","aggregate_1":"네 블록의 스팸 점수 합이 [3,2,1,2]일 때 총합은?","aggregate_2":"다섯 FFN 블록의 활성 뉴런 수가 [4,4,3,5,4]일 때 합계는?","aggregate_3":"네 위치의 PE 차원 매칭 수가 [6,5,7,6]일 때 총합은?","aggregate_4":"여섯 층 점수 [5,4,6,5,4,6]의 합은?","aggregate_5":"클래스0 표가 [7,8,6,9]일 때 총합은?","aggregate_6":"헤드별 키워드 매칭 수 [10,12,11,9,8]의 합은?","aggregate_7":"배치별 긍정 예측 수 [14,16,15]의 합은?","aggregate_8":"8개 헤드의 오류 수 [1,2,1,2,1,2,1,2] 합은?","aggregate_9":"위치별 관심 토큰 수 [3,5,7,9,11]의 합은?","ensemble_0":"여러 FFN/블록을 쌓으면 기대되는 효과로 가장 가까운 것은? ① 표현을 단계적으로 쌓아 복잡 패턴 학습 ② 파라미터가 항상 0 ③ 학습이 불가능","ensemble_1":"서로 다른 깊이의 스택에서 오차가 상쇄될 수 있는 이유는? ① 층마다 다른 변환을 거침 ② 항상 동일 출력 ③ 데이터 삭제","ensemble_2":"단일 FFN 층 대비 다층 FFN이 강한 이유로 타당한 것은? ① 비선형을 반복 적용해 표현력 증가 ② 시퀀스 길이 강제 1 ③ softmax 제거","ensemble_3":"블록 수를 늘릴 때 주의할 점은? ① 성능·연산·과적합 균형 ② 항상 무한 증가 ③ 검증 불필요","ensemble_4":"깊은 스택에서 일부 층이 유사한 기능만 하면? ① 중복으로 이득이 작을 수 있음 ② 항상 성능 향상 ③ 학습 불가","ensemble_5":"다양한 층을 쌓는 목적은? ① 단계적 추상화 ② 동일 복사 ③ 고정","ensemble_6":"실서비스에서 층 수를 정할 때 중요한 것은? ① 정확도와 지연 ② 모니터 주사율 ③ 아이콘 크기","ensemble_7":"성능이 정체되면 먼저 볼 항목은? ① 층이 서로 비슷한 표현만 만드는지 ② 파일 이름 ③ 테마","config_0":"헤드 수 4, 헤드 차원 16일 때 $d_{model}$은?","config_1":"헤드 수 8, 헤드 차원 8일 때 $d_{model}$은?","config_2":"토큰 수 10에서 어텐션 점수 행렬의 원소 수는 $10\\times10$이다. 값은?","config_3":"토큰 수 12에서 점수 행렬 원소 수는 $12\\times12$이다. 값은?","config_4":"헤드 수 6, 헤드 차원 12일 때 $d_{model}$은?","config_5":"헤드 수 3, 헤드 차원 24일 때 $d_{model}$은?","config_6":"시퀀스 길이 14에서 self-attention 점수 원소 수는 $14\\times14$이다. 값은?","config_7":"시퀀스 길이 16에서 점수 원소 수는 $16\\times16$이다. 값은?","config_8":"헤드 수 12, 헤드 차원 10일 때 $d_{model}$은?","config_9":"토큰 수 20에서 점수 행렬 원소 수는 $20\\times20$이다. 값은?"},"problemAnswers":{"concept_0":1,"concept_1":1,"concept_2":2,"concept_3":2,"concept_4":1,"concept_5":1,"ox_0":1,"ox_1":0,"ox_2":1,"ox_3":1,"ox_4":0,"ox_5":1,"scenario_0":1,"scenario_1":1,"scenario_2":1,"scenario_3":1,"vote_0":3,"vote_1":4,"vote_2":4,"vote_3":7,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1,"vote_4":6,"vote_5":6,"vote_6":6,"vote_7":6,"vote_8":6,"vote_9":7,"aggregate_0":5,"aggregate_1":8,"aggregate_2":20,"aggregate_3":24,"ensemble_0":1,"ensemble_1":1,"ensemble_2":1,"ensemble_3":1,"aggregate_4":30,"aggregate_5":30,"aggregate_6":50,"aggregate_7":45,"aggregate_8":12,"aggregate_9":35,"config_0":64,"config_1":64,"config_2":100,"config_3":144,"config_4":72,"config_5":72,"config_6":196,"config_7":256,"config_8":120,"config_9":400,"ensemble_4":1,"ensemble_5":1,"ensemble_6":1,"ensemble_7":1},"problemSolutions":{"concept_0":"BERT 계열은 대표적으로 **트랜스포머 인코더 블록**을 쌓아, 토큰을 **양방향 문맥**과 함께 인코딩합니다. **실제 적용 예시(Example):** 의료 문서에서 증상과 부정어가 멀리 떨어져도 관계를 잡아야 할 때, 인코더형 표현이 임베딩 검색·분류에 자주 쓰입니다. **단계별 풀이:** (1) 선택지 ①이 인코더·양방향을 말하는지 확인 (2) ②는 GPT류의 디코더 중심 설명에 가깝고 (3) ③은 합성곱 중심으로 주제와 다릅니다. 따라서 정답은 1입니다.","concept_1":"사인·코사인 PE에서 짝수 인덱스 $2i$에는 $\\sin$이, 홀수 $2i+1$에는 $\\cos$가 대응하는 전형적 구성입니다. **실제 적용 예시(Example):** 다국어 번역 전처리에서 토큰 순서 정보를 안정적으로 넣을 때 PE가 함께 사용됩니다. **단계별 풀이:** 짝수 차원에 $\\sin$이 들어가는지 기억하고 선택지를 대응시키면 ①이 정답입니다. 정답 1.","concept_2":"GPT 계열은 **디코더**에서 **왼쪽 문맥만** 보고 $p(x_t\\mid x_{> 3\nassert answer == 32","ensemble_1":"answer = 96 // 4\nassert answer == 24","ensemble_2":"answer = 80 // 2\nassert answer == 40","ensemble_3":"answer = 512 // 4\nassert answer == 128","ensemble_4":"answer = 14 * 14\nassert answer == 196","ensemble_5":"answer = 10 * 10\nassert answer == 100","ensemble_6":"answer = 8 * 8\nassert answer == 64","ensemble_7":"answer = 32 // 2\nassert answer == 16","config_0":"assert 8 * 8 == 64","config_1":"assert 9 * 9 == 81","config_2":"assert 10 * 10 == 100","config_3":"assert 11 * 11 == 121","config_4":"assert 12 * 12 == 144","config_5":"assert 6 * 6 == 36","config_6":"assert 7 * 7 == 49","config_7":"assert 16 * 16 == 256","config_8":"assert 20 * 20 == 400","config_9":"assert 25 * 25 == 625"},"problemDifficulty":{"concept_0":"easy","concept_1":"easy","concept_2":"easy","concept_3":"easy","concept_4":"easy","concept_5":"easy","ox_0":"easy","ox_1":"easy","ox_2":"easy","ox_3":"easy","ox_4":"easy","ox_5":"easy","scenario_0":"easy","scenario_1":"easy","scenario_2":"easy","scenario_3":"easy","vote_0":"easy","vote_1":"easy","vote_2":"easy","vote_3":"easy","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","vote_4":"medium","vote_5":"medium","vote_6":"medium","vote_7":"medium","vote_8":"medium","vote_9":"medium","aggregate_0":"medium","aggregate_1":"medium","aggregate_2":"medium","aggregate_3":"medium","ensemble_0":"medium","ensemble_1":"medium","ensemble_2":"medium","ensemble_3":"medium","aggregate_4":"hard","aggregate_5":"hard","aggregate_6":"hard","aggregate_7":"hard","aggregate_8":"hard","aggregate_9":"hard","config_0":"hard","config_1":"hard","config_2":"hard","config_3":"hard","config_4":"hard","config_5":"hard","config_6":"hard","config_7":"hard","config_8":"hard","config_9":"hard","ensemble_4":"hard","ensemble_5":"medium","ensemble_6":"hard","ensemble_7":"hard"},"problemOrder":["concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","ox_0","ox_1","ox_2","ox_3","ox_4","ox_5","scenario_0","scenario_1","scenario_2","scenario_3","vote_0","vote_1","vote_2","vote_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","vote_4","vote_5","vote_6","vote_7","vote_8","vote_9","aggregate_0","aggregate_1","aggregate_2","aggregate_3","ensemble_0","ensemble_1","ensemble_2","ensemble_3","aggregate_4","aggregate_5","aggregate_6","aggregate_7","aggregate_8","aggregate_9","config_0","config_1","config_2","config_3","config_4","config_5","config_6","config_7","config_8","config_9","ensemble_4","ensemble_5","ensemble_6","ensemble_7"]},"advDlCh17":{"chapter":"Chapter 17","title":"오토인코더: 압축했다가 복원하기 (데이터의 핵심 요약본 만들기)","description":"복잡한 이미지나 고차원 데이터 $x$를 신경망에 넣으면, 모델이 먼저 데이터의 뼈대만 남긴 **중요한 요약 코드 $z$**(잠재 표현, Latent Representation)로 **압축(Encoding)**합니다. 그리고 이 짧은 요약본만 보고 다시 원본과 똑같은 모양의 $\\hat{x}$로 **복원(Decoding)**해내는 대칭 구조의 신경망, 이것이 바로 **오토인코더(Autoencoder)**입니다.\n\n오토인코더의 유일한 학습 목표는 입력값($x$)과 출력값($\\hat{x}$)의 차이를 줄이는 **재구성 손실(Reconstruction Loss)**을 최소화하는 것입니다. 정답 라벨(Label) 없이 데이터 그 자체를 정답으로 삼는 대표적인 **비지도 학습(Unsupervised Learning)**입니다. 이 장에서는 고차원 데이터를 좁은 '병목(Bottleneck)'으로 쥐어짜며 차원 축소와 이상 탐지를 수행하는 원리를 다지고, 다음 장(Chapter 18)에서 배울 생성 모델인 **VAE(변분 오토인코더)**의 튼튼한 기초를 세웁니다.","sectionTitle":"오토인코더: 압축했다가 복원하기","whatIs":{"0":"**1. 오토인코더의 대칭 구조: 인코더와 디코더**\n\n**개념:** 입력 $x$를 **인코더(Encoder)** $f_\\theta$가 잠재 벡터 $z=f_\\theta(x)$로 변환하고, 이를 **디코더(Decoder)** $g_\\phi$가 넘겨받아 $\\hat{x}=g_\\phi(z)$로 되돌려 놓습니다. 이때 $z$의 차원은 원본 입력보다 **훨씬 작은 병목(Bottleneck)** 공간에 갇히게 됩니다.\n\n**직관적 비유:** 목격자가 몽타주 화가에게 범인의 얼굴을 설명할 때, 수만 개의 픽셀을 다 묘사할 수는 없습니다. 대신 \"눈이 처짐, 코가 높음, 입술이 얇음\"이라는 3가지 핵심 특징(병목, $z$)만 압축해서 전달하고, 화가(디코더)는 이 요약본만 듣고 원본 얼굴을 똑같이 복원해 그리는 훈련과 완벽히 같습니다.","1":"**2. 손실 함수: 얼마나 똑같이 복원했나?**\n\n**개념:** 복원된 데이터가 원본과 얼마나 비슷한지 평가하기 위해, 실수 연속값 피처에는 픽셀 단위의 **평균제곱오차(MSE)**인 $\\frac{1}{d}\\sum_i (x_i-\\hat{x}_i)^2$ 를 주로 사용합니다. 데이터가 $[0, 1]$ 사이로 정규화된 흑백 이미지라면 **이진 교차 엔트로피(BCE)** 를 쓰기도 합니다.\n\n**직관:** 마치 원본 사진과 복사본 사진을 겹쳐 놓고, 불빛을 비춰보며 픽셀 하나하나가 얼마나 어긋났는지 오차 점수를 매기는 혹독한 채점관과 같습니다.","2":"**3. 왜 '병목(Bottleneck)'이 핵심인가?**\n\n**개념:** 만약 요약본 $z$의 크기가 원본과 똑같다면 어떨까요? 모델은 아무 특징도 학습하지 않고 단순히 입력값을 출력으로 '복사+붙여넣기(항등 함수)' 해버릴 것입니다. 병목을 좁게 쥐어짜야만, 신경망은 손실을 줄이기 위해 데이터에 숨겨진 **진짜 패턴과 구조적 규칙**만을 골라 $z$에 꾹꾹 눌러 담게 됩니다.\n\n**실전 (이상 탐지):** 공장의 불량품 탐지에 탁월합니다. '정상' 제품 사진으로만 복원 훈련을 시켜두면, 처음 보는 '비정상(스크래치 등)' 사진이 들어왔을 때 모델은 이를 복원하는 방법을 몰라 재구성 오차가 확 치솟게 됩니다. 이 오차 크기로 불량을 잡아냅니다.","3":"**4. 노이즈 제거 오토인코더 (Denoising AE)**\n\n**응용:** 단순히 똑같이 복원하는 것을 넘어, 원본 데이터에 일부러 지지직거리는 **가짜 노이즈(잡음)**나 마스킹을 추가한 뒤, 이를 '깨끗한 원본'으로 복원하도록 아주 가혹하게 학습시킵니다. 이 과정을 거치면 모델은 겉보기 노이즈에 흔들리지 않는 데이터의 **본질적인(Robust) 특징**을 훨씬 깊게 파악하게 됩니다.","4":"**5. 잠재 공간(Latent space)이란?**\n\n**개념:** **잠재 공간**은 픽셀·원시 특징이 아니라, 인코더가 만든 **코드 $z$가 놓이는 저차원 벡터 공간**을 말합니다. 각 데이터 샘플은 이 공간 안의 **한 점(좌표 벡터)**에 대응하고, 학습이 진행되면 비슷한 입력은 가까운 영역으로, 다른 패턴은 멀리 떨어지도록 **기하학적 구조**가 잡히는 경우가 많습니다.\n\n**오토인코더에서:** 병목 차원 $k$가 곧 잠재 공간의 **차원**입니다. 디코더 $g_\\phi$는 이 공간의 점을 다시 원래 차원의 $\\hat{x}$로 **펼치는** 역할을 합니다. (다음 장 **VAE**에서는 이 공간에 **확률분포**를 얹어 샘플링·생성으로 확장합니다.)","5":"**6. PCA(주성분 분석)는 무엇인가?**\n\n**개념:** **PCA(Principal Component Analysis, 주성분 분석)**는 여러 샘플이 모여 있는 고차원 데이터에서, **분산이 가장 크게 퍼지는 방향**을 순서대로 찾아 **서로 직교하는 주축(주성분, principal component)**을 만드는 **선형** 차원 축소입니다. 데이터를 그 축들 위로 **투영**하면 앞쪽 몇 개 축만 남겨도 원본 분포를 **가능한 한 많은 분산을 유지한 채** 요약한 저차원 표현이 됩니다(뒤로 버린 축에 실렸던 분산만큼 정보가 줄어듭니다).\n\n**오토인코더와 비교:** PCA는 **선형 변환**만 다루지만, 활성화를 넣은 오토인코더는 **비선형**으로 더 복잡한 구조를 학습할 수 있어, 복잡한 데이터에서는 AE가 더 유연할 때가 많습니다. (선형 AE에 MSE를 쓰면 특정 조건에서 PCA와 연결되는 직관이 있습니다.)"},"whyImportant":{"0":"**PCA를 뛰어넘는 강력한 차원 축소**\n\n위에서 **PCA**가 무엇인지 본 것처럼, PCA는 **선형** 압축에 가깝습니다. 반면 오토인코더는 비선형 활성화로 고차원 데이터를 2~3차원으로 **구불구불하고 유연하게** 압축·시각화할 수 있습니다.","1":"**레이블이 필요 없는(Unsupervised) 만능 특징 추출기**\n\n정답(Label)을 달아주는 작업은 비싸고 힘듭니다. 오토인코더는 정답 없이 데이터 자체만으로 특징($z$)을 뽑아낼 수 있습니다. 이렇게 미리 훈련된 인코더의 가중치를 가져와 다른 분류 모델의 초기값으로 쓰는 **전이 학습(Transfer Learning)**의 훌륭한 재료가 됩니다.","2":"**생성 AI(Generative AI)의 출발점**\n\n단순히 데이터를 압축하는 것을 넘어, '잠재 공간($z$)의 숫자들을 살짝 바꾸면 완전히 새로운 얼굴 이미지가 튀어나오지 않을까?'라는 상상력은 이후 **VAE(변분 오토인코더)**와 **GAN** 같은 위대한 생성 모델의 탄생으로 이어졌습니다."},"howUsed":{"0":"**1단계: 데이터 정규화 및 스케일링**\n\n이미지 픽셀은 보통 $0$~$255$이므로 $[0, 1]$로 **Min–Max 스케일**하거나 채널별로 **표준화**(평균·분산 맞추기)합니다. **RGB**는 채널 순서 $(R,G,B)$를 고정하고, 배치마다 동일한 전처리를 적용합니다. 스케일이 들쭉날쭉하면 MSE 기울기 스케일이 달라져 수렴이 느리거나 불안정해질 수 있습니다.","1":"**2단계: 아키텍처·병목 $k$·손실 선택**\n\n**이미지**는 **합성곱 오토인코더(CAE)** 로 국소 패턴을 살리는 것이 일반적이고, **벡터·시계열**이면 1D 합성곱이나 완전연결 스택을 씁니다. 병목 차원 $k$는 작을수록 압축이 강하지만 디테일이 사라지고, 클수록 복원은 쉬워지나 ‘요약’이 약해집니다—**검증 손실**로 $k$를 고릅니다. 출력이 실수면 **MSE**, $[0,1]$ 흑백에 가깝면 **BCE** 후보를 둡니다.","2":"**3단계: 학습 루프·출력 활성화·안정화**\n\n미니배치마다 $\\hat{x}$를 계산해 손실을 역전파합니다. 출력이 $[0,1]$이면 디코더 마지막 층에 **시그모이드**를 두어 $\\hat{x}$ 범위를 맞춥니다. **Adam** 등 적응적 옵티마이저, **학습률 스케줄**, 필요 시 **그래디언트 클리핑**으로 폭주를 막습니다. **학습/검증**을 나누어 과적합이면 **조기 종료**·**드롭아웃**·**가중치 감쇠**·**Denoising AE**를 검토합니다.","3":"**4단계: 평가·시각화·다운스트림**\n\n**손실 곡선**만 보지 말고 복원 $\\hat{x}$를 **직접 시각화**합니다. 잠재 벡터 $z$를 **2차원으로 투영**(예: t-SNE)해 군집·이상 여부를 볼 수 있습니다. **이상 탐지**는 정상만 학습한 뒤 재구성 오차 **임계값**을 검증셋으로 정합니다. 학습된 **인코더**를 고정하거나 미세조정해 **소량 라벨 분류**·**군집**에 붙이는 패턴이 흔합니다.","4":"**응용 한눈에 정리**\n\n| 목적 | 요지 |\n| --- | --- |\n| **이상 탐지** | 정상 데이터로만 학습 → **높은 재구성 오차** 샘플을 의심 |\n| **노이즈 제거** | **DAE**: 손상 입력 → 깨끗한 원본으로 복원 |\n| **차원 축소·시각화** | 좁은 $z$ 또는 $z$의 2D 투영으로 구조 파악 |\n| **표현 선행학습** | 인코더를 떼어 분류기 앞단·다른 과제에 **전이** |"},"problemSolving":{"0":"오토인코더 문제는 “**$z=f_\\theta(x)$, $\\hat{x}=g_\\phi(z)$**” 한 줄과 “**재구성 손실**로 $x$와 $\\hat{x}$를 맞춘다”는 목표를 같이 떠올리면 풀기 쉽습니다. **병목**에서는 보통 **$k \\ll d$**이고, **완전연결층** $d \\to k$ 한 층의 파라미터는 대략 **가중치 $d \\times k$ + 편향 $k$**로 세면 됩니다. **이미지를 한 줄로 펼친 길이**는 (세로)×(가로)(RGB면 **×3**), **패치 격자**(CLS 없이)는 $(H/p)\\times(W/p)$로 잡습니다(**ViT 패치 수·격자 계산**, Chapter 05 복습과 같은 줄).","1":"**이상 탐지**는 정상 데이터로만 **복원**을 학습한 뒤 **재구성 오차**가 큰 샘플을 의심하는 그림이고, **Denoising AE**는 손상된 입력을 깨끗한 원본으로 되돌리며 **견고한 표현**을 배웁니다. 실수 픽셀에는 **MSE** $\\frac{1}{d}\\sum_i(x_i-\\hat{x}_i)^2$, $[0,1]$ 흑백 등에는 **BCE**가 흔합니다. **압축 비**나 **$k/d$ 퍼센트**가 나오면 분자·분모를 정확히 대응시켜 봅니다.","2":"**합성곱 오토인코더(CAE)**는 Chapter 12 **CNN**으로 **국소 패턴·공간 구조**를 유지한 채 인코더·디코더를 쌓는 그림입니다. 병목 **$k$가 너무 크면** 정보가 거의 안 줄어들어 **항등 복사**에 가까워지기 쉬워, 문제는 종종 “**$k$를 줄이면** 무엇이 강해지는가”처럼 **압축과 표현력**의 트레이드오프를 묻습니다.","3":"다음 장 **VAE**는 이 **잠재 $z$**에 **확률분포**를 얹어 **생성**으로 확장합니다. “잠재를 **확률적으로** 다루며 **샘플링·생성**”이 키워드면 **VAE**와 연결해 보면 됩니다."},"summary":"**한 줄 요약** — 오토인코더는 인코더가 데이터를 좁은 병목($z$)으로 **압축**하고, 디코더가 이를 다시 원본($\\hat{x}$)으로 **복원**하는 과정을 통해, 스스로 데이터의 핵심 특징을 찾아내는 똑똑한 딥러닝 알고리즘입니다.\n\n**연결점:** 앞서 배운 선형층(Dense)과 CNN을 마음껏 조합하여 인코더와 디코더 블록을 조립할 수 있으며, 복잡한 데이터일수록 CNN을 쓴 합성곱 오토인코더가 유리합니다.\n\n**다음 장 예고:** 단순한 압축을 넘어, 이 잠재 공간($z$)에 정교한 **확률분포**를 얹어 우리가 원하는 새로운 얼굴이나 이미지를 무에서 유로 '생성'해 내는 마법, **VAE(변분 오토인코더)**의 세계로 넘어갑니다.","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","summary":"요약"},"formulaGuide":{"title":"수식, 이렇게 읽으면 됩니다 (오토인코더)","linear":"**1. 인코더·디코더 한 줄**\n\n$z = f_\\theta(x)$, $\\hat{x} = g_\\phi(z)$. 손실은 예를 들어 $\\mathcal{L} = \\|x-\\hat{x}\\|_2^2$ 입니다.\n\n- **$z$**: 병목에서의 **잠재 코드**\n- **$\\hat{x}$**: **복원된 출력**","xavierVariance":"**2. 병목과 압축**\n\n입력 차원 $d$, 병목 차원 $k \\ll d$이면, 압축 비는 대략 $k/d$ 입니다.\n\n- **$k$가 작을수록** 더 강한 압축(정보 손실 가능)\n- **$k$가 클수록** 복원은 쉬워지지만 요약력은 약해질 수 있음","heVariance":"**3. 선형 오토인코더와 PCA**\n\n활성화가 선형이고 MSE를 쓰면, 특정 조건에서 **주성분 방향**과 연결되는 직관이 있습니다(데이터와 제약에 따라 다름).\n\n- **비선형**이면 더 풍부한 표현이 가능","xavierUniform":"**4. 실무 팁**\n\n데이터 스케일을 맞추고, 병목·깊이를 조절하며, 필요하면 **노이즈를 넣는 DAE**로 견고한 표현을 학습합니다."},"formulaGuideDiagramCaption":"**한 줄로:** 입력 $x$가 인코더를 지나 **좁은 $z$**로 압축되고, 디코더가 $\\hat{x}$로 펼칩니다. 원본 $x$와 비교해 손실을 줄입니다.","formulaGuideDiagramAria":"오토인코더 도식: 입력에서 인코더 병목 잠재벡터 디코더 복원 손실로 이어짐","formulaGuideDiagramFrozenHint":"병목","advDlCh17FormulaGuideLossHint":"x와 x̂ 비교 · 재구성 손실","advDlCh17VisualInputLabel":"입력","visual":"애니메이션: 입력 → 인코더 → 병목 z → 디코더 → 복원 x_hat → 재구성 손실 순으로 단계가 강조됩니다.","problemSolvingLabel":"문제 풀이를 위한 설명","practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"문제 은행 **60문항**은 모두 **오토인코더** 맥락(압축·복원·병목·재구성·이상 탐지·CAE·이미지/패치·선형층 파라미터 등)입니다. **10문항** 출제 시 난이도는 **쉬움 4 → 중간 3 → 어려움 3**이며, **한 세션 안에서는 같은 유형(접두어+난이도)이 겹치지 않게** 뽑습니다.","practiceProblemsInstruction":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionCalc":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionConcept":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionOx":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionScenario":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionVote":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionAggregate":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionConfig":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionEnsemble":"문제를 읽고 가장 알맞은 선택지를 고르세요.","advDlCh17VisualIntro":"**입력 $x$**를 **인코더**가 잠재 **병목 $z$**로 압축하고, **디코더**가 다시 **$\\hat{x}$**로 펼칩니다. **재구성 손실**이 작을수록 원본과 비슷해집니다.","advDlCh17VisualConceptTitle":"오토인코더 개념: 인코더 → 병목 → 디코더","advDlCh17VisualSectionTitle":"오토인코더: 압축과 복원","advDlCh17VisualMetaphor":"긴 설명을 메모 한 줄로 줄였다가 다시 풀어 쓰는 복원 연습과 비슷합니다.","advDlCh17VisualTopInputLabel":"입력 이미지","advDlCh17VisualTopLatentLabel":"잠재 공간 표현","advDlCh17VisualTopReconLabel":"복원 이미지","advDlCh17VisualEncoderLabel":"인코더","advDlCh17VisualBottleneckLabel":"병목 z","advDlCh17VisualBottleneckHint":"차원이 가장 줄어드는 지점","advDlCh17VisualDecoderLabel":"디코더","advDlCh17VisualReconLabel":"복원 x̂","advDlCh17VisualLossLabel":"손실 L","advDlCh17VisualFlowTitle":"학습 흐름 한눈에","advDlCh17VisualStep0":"**① 입력:** 벡터·이미지 등 원본 데이터 $x$를 넣습니다.","advDlCh17VisualStep1":"**② 인코더:** $x$를 저차원 잠재 표현 $z$로 압축합니다.","advDlCh17VisualStep2":"**③ 병목:** $z$의 차원이 작아 정보가 요약됩니다.","advDlCh17VisualStep3":"**④ 디코더:** $z$에서 $\\hat{x}$로 공간을 다시 펼칩니다.","advDlCh17VisualStep4":"**⑤ 손실:** $x$와 $\\hat{x}$의 차이(MSE 등)를 줄이도록 학습합니다.","advDlCh17VisualStage0":"입력 x","advDlCh17VisualStage1":"인코더","advDlCh17VisualStage2":"병목 z","advDlCh17VisualStage3":"디코더","advDlCh17VisualStage4":"손실","problems":{"concept_0":"**오토인코더**의 학습 목표에 가장 가까운 것은?\n① 분류 정확도만 최대화\n② **입력을 잘 재구성하도록 재구성 손실을 줄인다**\n③ 강화학습 보상만 최대화\n④ 데이터를 삭제한다","concept_1":"잠재 벡터 $z$의 역할에 가장 가까운 것은?\n① 항상 입력과 같은 차원\n② **압축된 요약 표현**\n③ 출력 클래스 확률만 저장\n④ 학습률을 저장","concept_2":"흑백 이미지 벡터에 흔히 쓰는 재구성 손실은?\n① **MSE(평균제곱오차)**\n② 순수 교차엔트로피만(항상)\n③ 정확도\n④ F1 점수","concept_3":"병목 차원 $k$를 **줄이면** 일반적으로 기대되는 것은?\n① 항상 복원이 쉬워진다\n② 정보가 더 많이 남는다\n③ **더 강한 압축(표현력 제약)**\n④ 손실이 의미 없어진다","concept_4":"**Denoising AE**에 가까운 설명은?\n① 라벨을 모두 0으로 만든다\n② **손상된 입력을 깨끗한 타깃으로 복원하도록 학습**\n③ 항상 항등 함수를 학습\n④ 어텐션을 제거","concept_5":"정상 데이터만으로 학습한 뒤 **재구성 오차가 큰 샘플**을 의심하는 응용은?\n① 항상 분류\n② **이상 탐지**\n③ 데이터 증강만\n④ 양자화","ox_0":"오토인코더는 **인코더와 디코더**로 구성되는 경우가 많다.\n맞으면 1, 틀리면 0.","ox_1":"병목 $z$는 항상 입력 $x$보다 차원이 커야 한다.\n맞으면 1, 틀리면 0.","ox_2":"재구성 손실을 줄이는 것이 전형적인 학습 목표이다.\n맞으면 1, 틀리면 0.","ox_3":"선형 활성화 + MSE인 선형 AE는 **항상** 무조건 GAN과 동일하다.\n맞으면 1, 틀리면 0.","ox_4":"합성곱 층을 쓰면 공간 정보를 활용한 복원이 가능하다.\n맞으면 1, 틀리면 0.","ox_5":"오토인코더는 **분류 라벨 없이** 재구성만으로 학습할 수 있다.\n맞으면 1, 틀리면 0.","scenario_0":"**오토인코더 학습 중** GPU 메모리가 부족하다. **우선** 시도하기 좋은 것은?\n① 배치 크기·입력 크기·모델 폭을 줄인다\n② 학습률만 무한히 증가\n③ 데이터를 모두 삭제\n④ 손실을 제거","scenario_1":"이상 탐지에 쓰려면?\n① **정상 데이터로 재구성을 학습하고 큰 오차를 탐지**\n② 라벨을 무작위로 섞기\n③ 항상 전체 미세조정만\n④ 옵티마이저만 바꾸기","scenario_2":"노이즈가 많은 이미지에서 **견고한 표현**을 원한다면?\n① 데이터를 0으로만 채운다\n② **Denoising AE처럼 노이즈 입력을 깨끗한 원본으로 복원**\n③ 레이어를 0개로\n④ 학습을 중단","scenario_3":"병목이 너무 커서 항등 복사에 가깝다면?\n① **병목을 줄이거나 정규화를 강화**\n② 반드시 양자화만\n③ 데이터를 절반만 사용\n④ 학습률을 0으로 고정","vote_0":"$$28\\times28$ 흑백 이미지를 **한 줄로 펼친** 입력 차원 $d$는?","vote_1":"$$16\\times16$ 흑백 이미지를 펼친 $d$는?","vote_2":"$$32\\times32$ 흑백 이미지를 펼친 $d$는?","vote_3":"$$224\\times224$를 $16\\times16$ 패치로 나눈 **패치 개수**(CLS 없음)는?","scenario_4":"검증 MSE가 학습 MSE보다 훨씬 크다. 우선 의심할 것은?\n① **과적합**\n② 학습이 너무 느림\n③ 배치가 항상 1\n④ 옵티마이저 이름","scenario_5":"이미지 픽셀 스케일이 [0,255]로 들어간다면?\n① 그대로 두는 것이 항상 최선\n② **정규화([0,1] 등)를 검토**\n③ 라벨을 증가\n④ 채널을 삭제","scenario_6":"잠재 공간을 **확률적으로** 다루며 생성까지 하려면 다음 장의 무엇이 자연스러운가?\n① **VAE**\n② 항등만\n③ k-means만\n④ 단순 PCA만","scenario_7":"오토인코더의 $z$를 분류기 입력으로 쓰는 전략에 가까운 것은?\n① **표현 학습 후 소량의 라벨로 선형 분류**\n② 항상 랜덤 추측\n③ 데이터를 버림\n④ 손실을 제거","scenario_8":"CNN 인코더를 쓰는 이유에 가까운 것은?\n① **국소 패턴·공간 구조를 활용**\n② 항상 파라미터를 0으로\n③ RNN만 사용\n④ 패딩을 금지","scenario_9":"DAE에서 노이즈를 넣는 주된 목적에 가까운 것은?\n① **견고한 특징 학습**\n② 정확도를 항상 0으로\n③ 데이터 삭제\n④ 학습 중단","vote_4":"$$32\\times16$ 흑백 이미지를 펼친 $d$는?","vote_5":"$$32\\times32$ **RGB 3채널**을 펼친 $d$는?","vote_6":"가로 $16$, 세로 $8$ 흑백을 펼친 $d$는?","vote_7":"완전연결층 한 층 $d_{in}=100$, $d_{out}=20$ 가중치 개수(편향 제외)는?","vote_8":"$$6\\times6\\times2$ 텐서를 펼친 길이는?","vote_9":"입력 $d=1000$, 병목 $k=500$일 때 **$k/d$를 퍼센트로 정수**로 표현하면? (예: 50% → **50**)","aggregate_0":"**AE 실험**에서 병목 차원 $k$ 후보 세 값을 **[3,4,5]** 로 적어 두었을 때, 그 **합**은?","aggregate_1":"같은 방식으로 후보 **[2,6,7]** 의 합은?","aggregate_2":"병목 후보를 **6**으로 세 번 잡았을 때 ($6+6+6$) **합**은?","aggregate_3":"후보 **[2,3,6]** 의 **합**은?","ensemble_0":"**이미지 입력** $224\\times224$를 패치 $16\\times16$으로 나눌 때 **CLS 없이** 패치 토큰 개수는?","ensemble_1":"**패치 격자**: 한 변에 패치가 **8개**인 정사각형의 총 패치 수는?","ensemble_2":"선형 **인코더** 한 층 $d_{in}=20$, $d_{out}=20$일 때 **가중치 개수**(편향 제외)는?","ensemble_3":"$$96\\times96$ 입력을 패치 $8\\times8$, **CLS 없이** 나눈 패치 수는?","aggregate_4":"여러 번 시도한 병목 후보 **[7,7,7,7]** 의 **합**은?","aggregate_5":"후보 **[11,11,11]** 의 **합**은?","aggregate_6":"병목 후보 **3**을 **7번** 기록한 값들의 **합**은? ($3\\times7$)","aggregate_7":"후보 **[4,5,10]** 의 **합**은?","aggregate_8":"기록 **[3,4,5,6,6]** 의 **합**은?","aggregate_9":"동일 후보 **5**를 **6번** 더한 **합**은? ($5\\times6$)","config_0":"**이미지→패치 격자**: 가로·세로 **패치가 8개씩**인 정사각 격자의 총 칸 수는?","config_1":"한 변 패치 **9개**면 총 칸 수는?","config_2":"한 변 패치 **10개**면 총 칸 수는?","config_3":"한 변 패치 **11개**면 총 칸 수는?","config_4":"한 변 패치 **12개**면 총 칸 수는?","config_5":"한 변 패치 **6개**면 총 칸 수는?","config_6":"한 변 패치 **7개**면 총 칸 수는?","config_7":"한 변 패치 **16개**면 총 칸 수는?","config_8":"한 변 패치 **20개**면 총 칸 수는?","config_9":"한 변 패치 **25개**면 총 칸 수는?","ensemble_4":"$$30\\times30$ 흑백을 펼친 $d$는?","ensemble_5":"패치 토큰 **196개**에 **CLS 1개**를 붙이면 시퀀스 길이는?","ensemble_6":"입력 차원 $d=16$, 병목 $k=2$인 **선형 한 층** 인코더(가중치만, 편향 제외)의 가중치 개수는?","ensemble_7":"$$32\\times32$ 패치 $16\\times16$ 없이 **전체를 한 벡터로** 펼친 길이는?"},"problemSolutions":{"concept_0":"**예시:** MNIST 복원 실험에서 MSE를 줄입니다.\n\n**단계:** 목표는 입력 $x$와 $\\hat{x}$의 차이를 줄이는 것 → **2**.","concept_1":"**예시:** $z$는 저차원 요약.\n\n**단계:** **2**.","concept_2":"**예시:** 실수 픽셀에 MSE.\n\n**단계:** **1**.","concept_3":"**예시:** $k$를 줄이면 압축 강화.\n\n**단계:** **3**.","concept_4":"**예시:** 노이즈 입력→깨끗한 타깃.\n\n**단계:** **2**.","concept_5":"**예시:** 정상만 학습→오차 큰 샘플 이상.\n\n**단계:** **2**.","ox_0":"**예시:** 대부분 인코더-디코더 구조.\n\n**단계:** 참 **1**.","ox_1":"**예시:** 병목은 보통 더 작음.\n\n**단계:** 거짓 **0**.","ox_2":"**예시:** 전형적 목표.\n\n**단계:** 참 **1**.","ox_3":"**예시:** GAN과는 다른 목적·구조.\n\n**단계:** 거짓 **0**.","ox_4":"**예시:** ConvAE에서 공간 활용.\n\n**단계:** 참 **1**.","ox_5":"**예시:** 비지도 재구성.\n\n**단계:** 참 **1**.","scenario_0":"**단계:** 메모리 부족은 규모 축소가 우선 → **1**.","scenario_1":"**단계:** 정상 학습 후 오차 임계값 → **1**.","scenario_2":"**단계:** DAE가 노이즈 견고 표현에 적합 → **2**.","scenario_3":"**단계:** 병목 축소/정규화 → **1**.","vote_0":"**계산:** $28\\times28=784$. **정답 784**.","vote_1":"**계산:** $16\\times16=256$. **정답 256**.","vote_2":"**계산:** $32\\times32=1024$. **정답 1024**.","vote_3":"**계산:** $(224/16)^2=14^2=196$. **정답 196**.","scenario_4":"**단계:** 검증이 크면 과적합 의심 → **1**.","scenario_5":"**단계:** 스케일 정규화 → **2**.","scenario_6":"**단계:** VAE가 확률 잠재 → **1**.","scenario_7":"**단계:** 표현+소량 라벨 → **1**.","scenario_8":"**단계:** CNN이 공간 구조 → **1**.","scenario_9":"**단계:** DAE 목적은 견고함 → **1**.","vote_4":"**계산:** $32\\times16=512$. **정답 512**.","vote_5":"**계산:** $32\\times32\\times3=3072$. **정답 3072**.","vote_6":"**계산:** $16\\times8=128$. **정답 128**.","vote_7":"**계산:** $100\\times20=2000$. **정답 2000**.","vote_8":"**계산:** $6\\times6\\times2=72$. **정답 72**.","vote_9":"**계산:** $k/d=500/1000=0.5$ → 퍼센트 **50**.","aggregate_0":"**예시:** $3+4+5=12$. **정답 12**.","aggregate_1":"**예시:** $2+6+7=15$. **정답 15**.","aggregate_2":"**예시:** $6+6+6=18$. **정답 18**.","aggregate_3":"**예시:** $2+3+6=11$. **정답 11**.","ensemble_0":"**계산:** $(224/16)^2=196$. **정답 196**.","ensemble_1":"**계산:** $8\\times8=64$. **정답 64**.","ensemble_2":"**계산:** 가중치만 $20\\times20=400$. **정답 400**.","ensemble_3":"**계산:** $(96/8)^2=144$. **정답 144**.","aggregate_4":"**예시:** $7\\times4=28$. **정답 28**.","aggregate_5":"**예시:** $11\\times3=33$. **정답 33**.","aggregate_6":"**예시:** $3\\times7=21$. **정답 21**.","aggregate_7":"**예시:** $4+5+10=19$. **정답 19**.","aggregate_8":"**예시:** $3+4+5+6+6=24$. **정답 24**.","aggregate_9":"**예시:** $5\\times6=30$. **정답 30**.","config_0":"**계산:** $8\\times8=64$. **정답 64**.","config_1":"**계산:** $9\\times9=81$. **정답 81**.","config_2":"**계산:** $10\\times10=100$. **정답 100**.","config_3":"**계산:** $11\\times11=121$. **정답 121**.","config_4":"**계산:** $12\\times12=144$. **정답 144**.","config_5":"**계산:** $6\\times6=36$. **정답 36**.","config_6":"**계산:** $7\\times7=49$. **정답 49**.","config_7":"**계산:** $16\\times16=256$. **정답 256**.","config_8":"**계산:** $20\\times20=400$. **정답 400**.","config_9":"**계산:** $25\\times25=625$. **정답 625**.","ensemble_4":"**계산:** $30\\times30=900$. **정답 900**.","ensemble_5":"**계산:** $196+1=197$. **정답 197**.","ensemble_6":"**계산:** 가중치만 $16\\times2=32$. **정답 32**.","ensemble_7":"**계산:** $32\\times32=1024$. **정답 1024**."},"problemAnswers":{"concept_0":2,"concept_1":2,"concept_2":1,"concept_3":3,"concept_4":2,"concept_5":4,"ox_0":1,"ox_1":0,"ox_2":1,"ox_3":0,"ox_4":1,"ox_5":0,"scenario_0":1,"scenario_1":1,"scenario_2":2,"scenario_3":1,"vote_0":784,"vote_1":256,"vote_2":1024,"vote_3":196,"scenario_4":1,"scenario_5":2,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1,"vote_4":512,"vote_5":3072,"vote_6":128,"vote_7":2000,"vote_8":72,"vote_9":50,"aggregate_0":12,"aggregate_1":15,"aggregate_2":18,"aggregate_3":11,"ensemble_0":196,"ensemble_1":64,"ensemble_2":400,"ensemble_3":144,"aggregate_4":28,"aggregate_5":33,"aggregate_6":21,"aggregate_7":19,"aggregate_8":24,"aggregate_9":30,"config_0":64,"config_1":81,"config_2":100,"config_3":121,"config_4":144,"config_5":36,"config_6":49,"config_7":256,"config_8":400,"config_9":625,"ensemble_4":900,"ensemble_5":197,"ensemble_6":32,"ensemble_7":1024},"problemTestCodes":{"concept_0":"answer = 2\nassert answer == 2","concept_1":"answer = 2\nassert answer == 2","concept_2":"answer = 1\nassert answer == 1","concept_3":"answer = 3\nassert answer == 3","concept_4":"answer = 2\nassert answer == 2","concept_5":"answer = 4\nassert answer == 4","ox_0":"answer = 1\nassert answer == 1","ox_1":"answer = 0\nassert answer == 0","ox_2":"answer = 1\nassert answer == 1","ox_3":"answer = 0\nassert answer == 0","ox_4":"answer = 1\nassert answer == 1","ox_5":"answer = 0\nassert answer == 0","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 2\nassert answer == 2","scenario_3":"answer = 1\nassert answer == 1","vote_0":"answer = 784\nassert answer == 784","vote_1":"answer = 256\nassert answer == 256","vote_2":"answer = 1024\nassert answer == 1024","vote_3":"answer = 196\nassert answer == 196","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 2\nassert answer == 2","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1","vote_4":"answer = 512\nassert answer == 512","vote_5":"answer = 3072\nassert answer == 3072","vote_6":"answer = 128\nassert answer == 128","vote_7":"answer = 2000\nassert answer == 2000","vote_8":"answer = 72\nassert answer == 72","vote_9":"answer = 50\nassert answer == 50","aggregate_0":"values = [3, 4, 5]\nassert sum(values) == 12","aggregate_1":"values = [2, 6, 7]\nassert sum(values) == 15","aggregate_2":"values = [6, 6, 6]\nassert sum(values) == 18","aggregate_3":"values = [2, 3, 6]\nassert sum(values) == 11","ensemble_0":"answer = 196\nassert answer == 196","ensemble_1":"answer = 64\nassert answer == 64","ensemble_2":"answer = 400\nassert answer == 400","ensemble_3":"answer = 144\nassert answer == 144","aggregate_4":"values = [7, 7, 7, 7]\nassert sum(values) == 28","aggregate_5":"values = [11, 11, 11]\nassert sum(values) == 33","aggregate_6":"values = [3, 3, 3, 3, 3, 3, 3]\nassert sum(values) == 21","aggregate_7":"values = [4, 5, 10]\nassert sum(values) == 19","aggregate_8":"values = [3, 4, 5, 6, 6]\nassert sum(values) == 24","aggregate_9":"values = [5, 5, 5, 5, 5, 5]\nassert sum(values) == 30","config_0":"assert 8 * 8 == 64","config_1":"assert 9 * 9 == 81","config_2":"assert 10 * 10 == 100","config_3":"assert 11 * 11 == 121","config_4":"assert 12 * 12 == 144","config_5":"assert 6 * 6 == 36","config_6":"assert 7 * 7 == 49","config_7":"assert 16 * 16 == 256","config_8":"assert 20 * 20 == 400","config_9":"assert 25 * 25 == 625","ensemble_4":"answer = 900\nassert answer == 900","ensemble_5":"answer = 197\nassert answer == 197","ensemble_6":"answer = 32\nassert answer == 32","ensemble_7":"answer = 1024\nassert answer == 1024"},"problemDifficulty":{"concept_0":"easy","concept_1":"easy","concept_2":"easy","concept_3":"easy","concept_4":"easy","concept_5":"easy","ox_0":"easy","ox_1":"easy","ox_2":"easy","ox_3":"easy","ox_4":"easy","ox_5":"easy","scenario_0":"easy","scenario_1":"easy","scenario_2":"easy","scenario_3":"easy","vote_0":"easy","vote_1":"easy","vote_2":"easy","vote_3":"easy","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","vote_4":"medium","vote_5":"medium","vote_6":"medium","vote_7":"medium","vote_8":"medium","vote_9":"medium","aggregate_0":"medium","aggregate_1":"medium","aggregate_2":"medium","aggregate_3":"medium","ensemble_0":"medium","ensemble_1":"medium","ensemble_2":"medium","ensemble_3":"medium","aggregate_4":"hard","aggregate_5":"hard","aggregate_6":"hard","aggregate_7":"hard","aggregate_8":"hard","aggregate_9":"hard","config_0":"hard","config_1":"hard","config_2":"hard","config_3":"hard","config_4":"hard","config_5":"hard","config_6":"hard","config_7":"hard","config_8":"hard","config_9":"hard","ensemble_4":"hard","ensemble_5":"medium","ensemble_6":"hard","ensemble_7":"hard"},"problemOrder":["concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","ox_0","ox_1","ox_2","ox_3","ox_4","ox_5","scenario_0","scenario_1","scenario_2","scenario_3","vote_0","vote_1","vote_2","vote_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","vote_4","vote_5","vote_6","vote_7","vote_8","vote_9","aggregate_0","aggregate_1","aggregate_2","aggregate_3","ensemble_0","ensemble_1","ensemble_2","ensemble_3","aggregate_4","aggregate_5","aggregate_6","aggregate_7","aggregate_8","aggregate_9","config_0","config_1","config_2","config_3","config_4","config_5","config_6","config_7","config_8","config_9","ensemble_4","ensemble_5","ensemble_6","ensemble_7"]},"advDlCh18":{"chapter":"Chapter 21","title":"GAN 기초: 만들고 구분하기 대결","description":"GAN(Generative Adversarial Network)은 무언가를 창조해 내는 **생성기(Generator, $G$)**와 그것이 진짜인지 가짜인지 감식해 내는 **판별기(Discriminator, $D$)**가 서로 끝없이 경쟁하며 발전하는 혁신적인 인공지능 구조입니다. 비유하자면 '천재 위조지폐범'과 '베테랑 감식반 형사'의 숨 막히는 두뇌 싸움과 같습니다. 위조범은 형사를 완벽하게 속이기 위해 점점 더 정교한 가짜 지폐를 만들고, 형사는 이를 잡아내기 위해 감식 기술을 한계까지 끌어올립니다. 이 팽팽한 미니맥스(Minimax) 줄다리기의 끝에서 위조범은 결국 사람의 눈으로는 진짜와 구별할 수 없는 완벽한 창조물을 만들어냅니다. 이 장에서는 GAN을 관통하는 수학적 원리와 미니맥스 게임, 생성기가 매너리즘에 빠지는 모드 붕괴(Mode Collapse) 현상을 풍성한 예시와 함께 깊이 있게 탐구합니다.","sectionTitle":"GAN: 생성기와 판별기의 경쟁","whatIs":{"0":"**1. GAN의 핵심 구조: 창(생성기)과 방패(판별기)의 치열한 대결**\n\nGAN(Generative Adversarial Network)은 두 개의 인공지능이 서로를 이기기 위해 끝없이 싸우며 성장하는 독특한 구조입니다. **생성기(Generator, $G$)**는 어떻게든 가짜 데이터를 진짜처럼 만들어내려 하고, **판별기(Discriminator, $D$)**는 그것이 가짜인지 진짜인지 날카롭게 감별해 냅니다.\n* **비유하자면:** 미술품 위조꾼(생성기)이 가짜 그림을 그려오면, 감정사(판별기)가 돋보기를 들고 진품인지 위작인지 판별하는 상황과 같습니다. 위조꾼은 감정사를 속이기 위해 붓터치 하나까지 정교하게 발전하고, 감정사 역시 미세한 물감의 차이까지 잡아내도록 진화합니다.","1":"**2. GAN을 지배하는 단 하나의 절대 수식: 미니맥스(Minimax) 게임**\n\n이 둘의 팽팽한 싸움을 수학적으로 표현한 GAN의 핵심 수식은 다음과 같습니다.\n$\\min_G \\max_D V(D, G) = \\mathbb{E}_{x}[\\log D(x)] + \\mathbb{E}_{z}[\\log(1 - D(G(z)))]$\n* **판별기($D$)의 목표 (수식을 $\\max$로 키우기):** 진짜 데이터($x$)를 보면 $D(x)$를 $1$(진짜)로, 가짜 데이터($G(z)$)를 보면 $D(G(z))$를 $0$(가짜)으로 판별해야 점수가 올라갑니다.\n* **생성기($G$)의 목표 (수식을 $\\min$으로 줄이기):** 자기가 만든 가짜 데이터($G(z)$)를 판별기가 $1$(진짜)로 착각하게 만들어야($D(G(z)) \\to 1$), 수식의 뒤쪽 항목이 작아지며 게임에서 승리합니다.","2":"**3. 잠재 노이즈 $z$: 무한한 상상력의 씨앗**\n\n생성기에게 무언가를 만들라고 지시할 때 던져주는 무작위 숫자들의 모음을 **잠재 노이즈(Latent Noise, $z$)**라고 부릅니다.\n* **비유하자면:** 찰흙 공예가에게 건네는 '아무렇게나 뭉쳐진 찰흙 덩어리'입니다. 이 찰흙 덩어리($z$)의 모양이 미세하게 바뀔 때마다 완성된 조각상(얼굴, 풍경 이미지)의 표정이나 색감이 스르륵 마법처럼 변하게 됩니다.","3":"**4. 모드 붕괴(Mode Collapse): 우물 안 개구리가 된 위조꾼**\n\nGAN을 학습시키다 보면 가장 흔하게 겪는 악명 높은 오류입니다. 생성기가 다양한 이미지를 만들지 않고, **판별기를 완벽하게 속였던 딱 한 가지의 샘플만 무한히 복사해서 찍어내는 현상**을 말합니다.\n* **비유하자면:** 식당 주인이 '김치찌개'로 까다로운 음식 평론가에게 만점을 받자, 메뉴판의 다른 음식은 전부 갖다 버리고 1년 내내 모든 손님에게 김치찌개만 내오는 꼼수와 같습니다. 다양성이 생명인 AI에게 이는 큰 실패를 의미합니다.","4":"**5. 조건부 GAN(cGAN): 주문 제작형 마법 지팡이**\n\n기본 GAN은 무작위로 결과물을 내놓지만, 여기에 '조건(Condition, $y$)'을 붙여주면 **cGAN**이 됩니다.\n* **실생활 예시:** \"이번에는 '고양이'를 그려줘\", \"흑백 스케치 사진을 '컬러 사진'으로 바꿔줘\"처럼 원하는 클래스 레이블이나 텍스트를 $z$와 함께 꼬리표처럼 달아주어, 결과를 내 마음대로 조종할 수 있게 해주는 아주 유용한 확장형 모델입니다."},"whyImportant":{"0":"**1. 무에서 유를 창조하는 '생성형 AI'의 진정한 출발점**\n\n과거의 인공지능이 사진을 보고 \"이것은 강아지입니다\"라고 정답을 맞히는 '분류(Classification)' 모범생이었다면, GAN은 **세상에 존재하지 않는 강아지의 사진을 백지에서부터 그려내는 예술가**입니다. 이미지, 음악, 사람의 목소리까지 만들어내는 오늘날 생성형 AI 혁명의 가장 중요한 뼈대가 되었습니다.","1":"**2. 소름 돋도록 선명하고 극사실적인 디테일 (Sharpness)**\n\n다른 딥러닝 모델들(예: 오토인코더)은 틀리지 않으려고 평균적인 픽셀값을 내놓다 보니 결과물이 뿌옇고 안개가 낀 것처럼 흐릿해지는 단점이 있습니다. 하지만 GAN은 깐깐한 판별기라는 비평가를 통과해야 하므로, 아주 미세한 머리카락 한 올이나 피부의 질감까지 **칼로 베인 듯 선명하고 생생하게(Sharp)** 살려내는 데 압도적인 성능을 자랑합니다.","2":"**3. 데이터 가뭄을 단비로 적시는 '데이터 증강(Data Augmentation)'**\n\n자율주행 자동차를 훈련시켜야 하는데 '눈보라가 치는 밤거리' 사진이 너무 부족하다면 어떻게 할까요? GAN에게 몇 장의 사진을 보여주고 학습시키면, 진짜보다 더 진짜 같은 가상의 눈보라 사진을 수만 장 찍어낼 수 있습니다. 이처럼 구하기 힘든 희귀 질환 의료 데이터나 공장 불량품 사진을 AI 스스로 증식시켜 다른 모델의 교재로 쓰는 핵심 기술입니다."},"howUsed":{"0":"**1단계: 도화지의 규격을 통일하라 (데이터 정규화와 Tanh)**\n\nAI가 그림을 그리기 쉽게 이미지의 픽셀 값(0~255)을 수학적으로 다루기 편한 $[-1, 1]$의 범위로 눌러줍니다. 특히 생성기의 마지막 출력 필터로 $[-1, 1]$ 사이의 값만 내뱉는 **$tanh$ 함수**를 주로 사용하기 때문에, 진짜 사진(정답지)도 똑같이 $[-1, 1]$로 맞춰주어야 체급이 맞아 판별기가 공정하게 심사할 수 있습니다.","1":"**2단계: 심판의 잣대 세우기 (BCE 손실함수)**\n\n진짜인지 가짜인지 두 가지 중 하나를 고르는 문제이므로, 가장 기본적이고 강력한 **이진 교차 엔트로피(Binary Cross-Entropy, BCE)** 손실 함수를 사용합니다. 이때 판별기가 너무 오만해져서 \"이건 100% 진짜야!\"라고 극단적으로 판단하지 못하게, 정답률을 $1.0$ 대신 $0.9$로 살짝 낮춰서 가르치는 **라벨 스무딩(Label Smoothing)**이라는 꿀팁을 쓰면 훈련이 훨씬 안정됩니다.","2":"**3단계: 아슬아슬한 줄타기 훈련 (번갈아 학습하기)**\n\n생성기와 판별기를 한 번에 동시에 훈련하면 무조건 탈이 납니다. 가장 중요한 요령은 **번갈아 가며 훈련**하는 것입니다.\n* $D$를 먼저 똑똑하게 만들기: 진짜 데이터와 가짜 데이터를 보여주며 판별기를 먼저 $k$번 학습시킵니다.\n* $G$를 몰래 키우기: 그 후 생성기가 가짜 이미지를 만들어 판별기를 속이도록 $1$번 학습시킵니다.\n판별기가 너무 압도적으로 이겨버리면 생성기는 자포자기하여 학습을 멈추고(기울기 소실), 반대면 판별기가 바보가 됩니다. 섬세한 학습률(Learning rate) 조절이라는 '밀당'이 필수입니다.","3":"**4단계: 함정 피하기와 객관적 품질 검사 (안정화와 FID)**\n\n모드 붕괴(한 우물만 파는 꼼수)에 빠지지 않았는지 생성된 사진들을 수시로 눈으로 확인해야 합니다. 더불어 사람의 눈에만 그럴싸해 보이는 것을 막기 위해, 진짜 사진의 통계적 분포와 가짜 사진의 분포가 수학적으로 얼마나 비슷한지를 재는 **FID(Fréchet Inception Distance)** 지표를 계산합니다. FID 점수가 낮을수록 원본과 똑같이 훌륭한 그림을 그렸다는 뜻입니다."},"problemSolving":{"0":"**처음에는 이 한 줄만 잡으면 됩니다.** **생성기 $G$**는 노이즈 $z$로 **가짜**를 만들고, **판별기 $D$**는 **진짜 / 가짜**를 가릅니다. 문제에서 먼저 **누가 만드는지·누가 가리는지**만 확인한 뒤, **미니맥스**, **번갈아 학습**, **모드 붕괴** 키워드를 붙이면 됩니다.\n\n**숫자가 나오면:** 이미지를 한 줄로 펼친 길이는 (세로)×(가로)(RGB면 **×3**), 패치 격자(CLS 없이)는 $(H/p)\\times(W/p)$, 완전연결 한 층 가중치는 대략 $d_{\\mathrm{in}}\\times d_{\\mathrm{out}}$입니다.","1":"**예시 (입력 펼치기)** — GAN 흑백 $28\\times28$을 펼친 $d$? → **784**\n\n---\n\n**예시 (패치 격자)** — $224\\times224$, 패치 $16\\times16$, CLS 제외 → $14^2=$ **196**","2":"**예시 (개념)** — GAN에서 생성기 역할? ② **노이즈 $z$로 가짜 생성** → **2**\n\n---\n\n**예시 (계산)** — RGB $32\\times32$ 3채널 펼친 $d$? → **3072**\n\n---\n\n**예시 (응용)** — 판별기가 너무 강하면? ① **G/D 업데이트 균형**","3":"**정의** — 모드 붕괴는 거의 같은 샘플만 반복 낸다. → 해당 설명 선택\n\n---\n\n**참/거짓** — 조건부 GAN은 레이블·조건을 쓸 수 있다. → **1**"},"summary":"**한 줄 요약** — GAN은 생성기와 판별기가 서로 겨루며, 노이즈 $z$에서 현실적인 샘플을 만들어내는 생성 모델입니다.\n\n**핵심 포인트:** 데이터 스케일, 업데이트 균형, 모드 붕괴, 안정화 전략이 성능을 좌우합니다.\n\n**다음 연결:** 조건을 추가한 cGAN, 더 안정적인 변형들로 자연스럽게 확장됩니다.","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","summary":"요약"},"formulaGuide":{"title":"수식, 이렇게 읽으면 됩니다 (GAN)","linear":"**한 줄 요약:** $G$는 **가짜를 만들고**, $D$는 **진짜인지 가짜인지** 맞히려 합니다.\n\n$\\min_G \\max_D V(D,G)=\\mathbb{E}_{x\\sim p_{data}}[\\log D(x)] + \\mathbb{E}_{z\\sim p(z)}[\\log(1-D(G(z)))]$\n\n**$G$ (생성기):** 잡음 $z$를 넣으면 **새 데이터(가짜)**를 만들어냅니다.\n\n**$D$ (판별기):** 들어온 샘플이 **진짜일 확률**을 0~1로 냅니다.\n\n**$\\min_G \\max_D$:** $G$는 **자신에게 불리한** 쪽, $D$는 **유리한** 쪽으로 점수를 잡으려 **서로 반대 방향**으로 경쟁합니다. (그래서 **번갈아** 학습합니다.)\n\n**$V(D,G)$:** 두 네트워크가 겨루는 **목표 함수** 이름입니다. 아래 **왼쪽·오른쪽 두 항**을 더한 값입니다.\n\n**$\\mathbb{E}_{x\\sim p_{data}}[\\cdot]$ (왼쪽 항):** 실제 데이터 $x$를 **여러 번** 무작위로 뽑아, 그때그때의 $\\log D(x)$를 **평균** 낸 값입니다. **진짜 데이터**로 판별기를 키웁니다.\n\n**$\\log D(x)$:** $D(x)$가 **1에 가까울수록** 커집니다. 판별기는 진짜 $x$에 **“진짜다”** (높은 점수)를 주려 합니다.\n\n**$\\mathbb{E}_{z\\sim p(z)}[\\cdot]$ (오른쪽 항):** 노이즈 $z$를 **여러 번** 뽑아 $G(z)$로 가짜를 만든 뒤, $\\log(1-D(G(z)))$의 **평균**입니다. **가짜 데이터** 쪽입니다.\n\n**$G(z)$:** 그때 뽑은 $z$로 생성기가 만든 **가짜 한 샘플**입니다.\n\n**$\\log(1-D(G(z)))$:** 가짜에 $D$가 **가짜**라 판단할수록 ($D(G(z))$가 **0에 가까울수록**) 값이 **커집니다**. 생성기는 **판별기를 속이는** 쪽이 유리합니다.\n\n**$D(x)$ 정리:** 어떤 입력이든 **0(가짜)~1(진짜)** 사이의 **진짜일 확률**입니다."},"formulaGuideDiagramCaption":"**한 줄로:** 노이즈 $z$가 생성기로 들어가 가짜 샘플을 만들고, 판별기가 진짜/가짜를 구분하며 서로 경쟁합니다.","formulaGuideDiagramAria":"GAN 도식: 노이즈 생성기 가짜 샘플 판별기 진짜 가짜 경쟁","formulaGuideDiagramFrozenHint":"경쟁","advDlCh18FormulaGuideLossHint":"진짜/가짜 판별 · adversarial loss","advDlCh18VisualInputLabel":"이미지(진짜 또는 가짜)","visual":"애니메이션: 랜덤한 잡음 → 생성자 → 생성된 이미지, 이미지 → 판별자 → 진짜 같음 점수 순으로 강조됩니다.","problemSolvingLabel":"문제 풀이를 위한 설명","practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"문제 은행 **60문항**은 모두 **GAN** 맥락(생성기/판별기, 노이즈 벡터, 모드 붕괴, 안정화, 이미지 크기·패치 수·가중치 계산 등)입니다. **10문항** 출제 시 난이도는 **쉬움 4 → 중간 3 → 어려움 3**이며, 같은 유형(접두어+난이도)이 한 세션에서 겹치지 않도록 뽑습니다.","practiceProblemsInstruction":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionCalc":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionConcept":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionOx":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionScenario":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionVote":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionAggregate":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionConfig":"문제를 읽고 가장 알맞은 선택지를 고르세요.","practiceProblemsInstructionEnsemble":"문제를 읽고 가장 알맞은 선택지를 고르세요.","advDlCh18VisualIntro":"**진짜 사진**과 **잡음으로 만든 가짜**가 **판별자**에 들어가 **진짜 / 가짜**로 갈립니다. 먼저 **만드는 쪽(G)**과 **가리는 쪽(D)**만 구분해 보세요.","advDlCh18VisualConceptTitle":"개념: 생성자 ↔ 판별자","advDlCh18VisualSectionTitle":"GAN: 만들고 구분하기 대결","advDlCh18VisualMetaphor":"위조범과 감정사가 서로 실력을 끌어올리는 모습과 비슷합니다.","advDlCh18VisualBrandTitle":"GAN :","advDlCh18VisualLatentBridgeHint":"AE, VAE에서는 잠재 공간 벡터가 됨","advDlCh18VisualSamplingHint":"진짜 데이터에서 샘플링","advDlCh18VisualRealPoolLabel":"실제 데이터","advDlCh18VisualRealSampleLabel":"실제 샘플","advDlCh18VisualNoiseDistHint":"노이즈 분포에서 잠재 변수 샘플","advDlCh18VisualFakeGenHint":"가짜 이미지 생성","advDlCh18VisualGenBadge":"G","advDlCh18VisualDiscBadge":"D","advDlCh18VisualOutputRealLabel":"진짜","advDlCh18VisualOutputFakeLabel":"가짜","advDlCh18VisualTopInputLabel":"랜덤한 잡음","advDlCh18VisualTopLatentLabel":"생성된 이미지","advDlCh18VisualTopReconLabel":"판정 결과","advDlCh18VisualEncoderLabel":"생성자","advDlCh18VisualBottleneckLabel":"잠재 노이즈","advDlCh18VisualBottleneckHint":"무작위 벡터가 시작점","advDlCh18VisualDecoderLabel":"판별자","advDlCh18VisualReconLabel":"진짜/가짜 판단","advDlCh18VisualLossLabel":"적대적 손실","advDlCh18VisualScoreHint":"이미지가 얼마나 진짜 같은지를 예측","advDlCh18VisualFlowTitle":"학습 흐름 한눈에","advDlCh18VisualStep0":"**① 진짜 사진 준비:** 학습 데이터에서 **진짜 샘플** $x$를 하나 가져옵니다.","advDlCh18VisualStep1":"**② 잡음 넣기:** 어떤 그림을 만들지 정해 주는 **노이즈** $z$를 무작위로 뽑습니다.","advDlCh18VisualStep2":"**③ 생성기 작업:** 노이즈 $z$를 **가짜 샘플** $\\hat{x}$로 바꿉니다.","advDlCh18VisualStep3":"**④ 판별기 판단:** $x$와 $\\hat{x}$를 보고 **진짜 / 가짜**를 가릅니다.","advDlCh18VisualStep4":"**⑤ 번갈아 학습:** **G**와 **D**가 차례대로 조금씩 업데이트됩니다.","advDlCh18VisualStage0":"실제 데이터 샘플링","advDlCh18VisualStage1":"랜덤 잡음","advDlCh18VisualStage2":"생성자(G)","advDlCh18VisualStage3":"판별자(D)","advDlCh18VisualStage4":"진짜/가짜 판정","problems":{"concept_0":"**GAN**에서 생성기(Generator)의 역할에 가장 가까운 것은?\n① 진짜/가짜를 판별한다\n② **노이즈 $z$로 가짜 샘플을 만든다**\n③ 라벨만 저장한다\n④ 손실을 없앤다","concept_1":"잠재 노이즈 $z$에 대한 설명으로 가장 알맞은 것은?\n① 항상 입력과 같은 차원\n② **새 샘플 생성의 출발점이 되는 랜덤 벡터**\n③ 정답 클래스만 저장\n④ 학습률을 저장","concept_2":"GAN 판별기의 전형적인 출력 해석은?\n① 회귀값만 예측\n② **입력이 진짜일 확률**\n③ 데이터셋 이름\n④ 패치 수","concept_3":"GAN 학습이 불안정한 이유로 가장 가까운 것은?\n① 항상 정답이 고정되어 있어서\n② **생성기와 판별기가 함께 변해 최적화가 불안정해서**\n③ 데이터가 너무 작아서만\n④ CNN을 쓰기 때문만","concept_4":"모드 붕괴(mode collapse)에 가장 가까운 설명은?\n① 샘플이 너무 다양해지는 현상\n② **거의 같은 샘플만 반복 생성하는 현상**\n③ 학습률이 0이 되는 현상\n④ 라벨이 2개인 현상","concept_5":"조건부 GAN(cGAN)의 장점으로 가장 알맞은 것은?\n① 조건을 무시하고 무작위 생성만 한다\n② **레이블이나 조건으로 원하는 종류를 제어할 수 있다**\n③ 손실을 사용하지 않는다\n④ 판별기를 제거한다","ox_0":"GAN은 보통 **생성기와 판별기**가 경쟁하는 구조이다.\n맞으면 1, 틀리면 0.","ox_1":"생성기는 보통 **노이즈 $z$**를 입력으로 받아 샘플을 만든다.\n맞으면 1, 틀리면 0.","ox_2":"판별기는 입력이 진짜인지 가짜인지 구분하는 역할을 한다.\n맞으면 1, 틀리면 0.","ox_3":"GAN 학습은 항상 안정적이고 모드 붕괴가 일어나지 않는다.\n맞으면 1, 틀리면 0.","ox_4":"이미지 스케일을 생성기 출력 범위와 맞추는 것은 도움이 된다.\n맞으면 1, 틀리면 0.","ox_5":"조건부 GAN은 라벨이나 조건을 함께 사용할 수 있다.\n맞으면 1, 틀리면 0.","scenario_0":"**GAN 학습 초반**에 판별기가 너무 빨리 100%에 가까워진다. 우선 해볼 것은?\n① **생성기/판별기 업데이트 균형을 조절한다**\n② 학습률을 무한히 올린다\n③ 데이터를 모두 삭제한다\n④ 판별기를 제거한다","scenario_1":"생성 결과가 너무 비슷하고 다양성이 떨어진다. 가장 의심할 현상은?\n① 과적합만\n② **모드 붕괴**\n③ 패딩 오류만\n④ 정규화가 너무 강함만","scenario_2":"이미지 입력이 [0,255] 스케일인데 생성기는 tanh 출력을 쓴다. 먼저 할 일은?\n① **입력 스케일을 맞춰 정규화한다**\n② 라벨 수를 늘린다\n③ 판별기를 삭제한다\n④ 배치를 0으로 만든다","scenario_3":"조건부 GAN으로 숫자 7만 만들고 싶다. 가장 맞는 접근은?\n① 아무 조건 없이 생성\n② **레이블 7을 조건으로 넣는다**\n③ 판별기를 고정하지 않는다\n④ 노이즈를 제거한다","vote_0":"GAN에서 판별·생성 입력으로 쓰는 $28\\times28$ 흑백 이미지를 한 줄로 펼친 차원 $d$는?","vote_1":"GAN 입력으로 쓰는 $16\\times16$ 흑백 이미지를 펼친 $d$는?","vote_2":"GAN 입력으로 쓰는 $32\\times32$ 흑백 이미지를 펼친 $d$는?","vote_3":"GAN 판별기 맥락에서 $224\\times224$ 이미지를 $16\\times16$ 패치로 나눌 때(CLS 없음), 패치 개수는?","scenario_4":"GAN의 배치 크기가 64라면, 반으로 나눈 한쪽 크기는?\n① 16\n② **32**\n③ 48\n④ 64","scenario_5":"생성기 입력 노이즈 벡터 길이를 100으로 쓰는 경우, 주된 의미는?\n① **잠재 노이즈 차원**\n② 배치 수\n③ 패치 수\n④ 클래스 수","scenario_6":"판별기가 너무 강해 생성기 기울기가 거의 사라진다. 우선 고려할 것은?\n① **학습률·업데이트 비율·정규화**를 조정한다\n② 데이터셋을 절반 삭제한다\n③ 노이즈를 없앤다\n④ 출력을 0으로 고정한다","scenario_7":"GAN 결과를 볼 때 단순 손실만이 아니라 함께 보면 좋은 것은?\n① **샘플 품질과 다양성**\n② 파일 이름\n③ 숫자 정렬\n④ 패치 인덱스만","scenario_8":"조건부 GAN에서 텍스트 설명을 넣어 결과를 제어하고 싶다. 이때 가장 중요한 것은?\n① **조건 정보와 생성 목표를 일치시키는 것**\n② 판별기를 삭제하는 것\n③ 노이즈를 모두 0으로 만드는 것\n④ 배치를 1로 고정하는 것","scenario_9":"모드 붕괴가 보일 때 먼저 떠올릴 문제는?\n① **다양성 부족**\n② 패치 개수만 많음\n③ 라벨이 너무 많음\n④ 손실 함수가 0이 아님","vote_4":"GAN 전처리용 $32\\times16$ 흑백 이미지를 펼친 $d$는?","vote_5":"GAN RGB 생성에서 $32\\times32$ 3채널 이미지를 펼친 $d$는?","vote_6":"GAN용 흑백 입력(가로 16, 세로 8)을 펼친 $d$는?","vote_7":"GAN에서 흔히 쓰는 잠재 노이즈 벡터 길이가 100일 때 $z$의 차원은?","vote_8":"GAN 학습 배치 64를 반으로 나눈 한쪽 크기는?","vote_9":"GAN에서 입력 $d=1000$, 잠재 노이즈 차원 $k=500$일 때 $k/d$를 정수 퍼센트로 쓰면?","vote_10":"GAN 입력으로 쓰는 $24\\times24$ 흑백 이미지를 펼친 $d$는?","vote_11":"GAN 입력으로 쓰는 $48\\times48$ 흑백 이미지를 펼친 $d$는?","vote_12":"GAN RGB 생성에서 $16\\times16$ 3채널 이미지를 펼친 $d$는?","vote_13":"GAN 학습 배치 128을 반으로 나눈 한쪽 크기는?","ensemble_0":"GAN 판별기 맥락에서 $224\\times224$ 이미지를 $16\\times16$ 패치로 나눌 때(CLS 없음), 패치 토큰 수는?","ensemble_1":"GAN feature map을 한 변에 패치 8개인 정사각 격자로 볼 때 총 패치 수는?","ensemble_2":"GAN 판별기 선형 한 층에서 $d_{in}=20$, $d_{out}=20$일 때 가중치 수는?","ensemble_3":"GAN 판별기 맥락에서 $96\\times96$ 이미지를 $8\\times8$ 패치로 나눌 때 패치 수는?","vote_14":"GAN 입력으로 쓰는 $64\\times64$ 흑백 이미지를 펼친 $d$는?","vote_15":"GAN RGB 생성에서 $48\\times48$ 3채널 이미지를 펼친 $d$는?","vote_16":"GAN 생성기 입력 노이즈 벡터 길이를 256으로 쓰는 경우, $z$의 차원은?","vote_17":"GAN 학습 배치 256을 반으로 나눈 한쪽 크기는?","vote_18":"GAN 입력으로 쓰는 $80\\times80$ 흑백 이미지를 펼친 $d$는?","vote_19":"GAN RGB 생성에서 $24\\times24$ 3채널 이미지를 펼친 $d$는?","config_0":"GAN 판별기 feature map 격자에서 한 변에 패치 8개인 정사각의 총 칸 수는?","config_1":"GAN 판별기 feature map 격자에서 한 변에 패치 9개인 정사각의 총 칸 수는?","config_2":"GAN 판별기 feature map 격자에서 한 변에 패치 10개인 정사각의 총 칸 수는?","config_3":"GAN 판별기 feature map 격자에서 한 변에 패치 11개인 정사각의 총 칸 수는?","config_4":"GAN 판별기 feature map 격자에서 한 변에 패치 12개인 정사각의 총 칸 수는?","config_5":"GAN 판별기 feature map 격자에서 한 변에 패치 6개인 정사각의 총 칸 수는?","config_6":"GAN 판별기 feature map 격자에서 한 변에 패치 7개인 정사각의 총 칸 수는?","config_7":"GAN 판별기 feature map 격자에서 한 변에 패치 16개인 정사각의 총 칸 수는?","config_8":"GAN 판별기 feature map 격자에서 한 변에 패치 20개인 정사각의 총 칸 수는?","config_9":"GAN 판별기 feature map 격자에서 한 변에 패치 25개인 정사각의 총 칸 수는?","ensemble_4":"GAN 생성·판별 입력으로 $30\\times30$ 흑백 이미지를 펼친 $d$는?","ensemble_5":"GAN 판별 시퀀스에서 패치 토큰 196개에 CLS 1개를 붙이면 시퀀스 길이는?","ensemble_6":"GAN 생성기 선형 한 층에서 입력 차원 $d=16$, 잠재 $k=2$일 때 가중치 수는?","ensemble_7":"GAN에서 $32\\times32$ 이미지를 패치 없이 한 벡터로 펼친 길이는?"},"problemSolutions":{"concept_0":"GAN 개념을 떠올리면 정답은 2입니다.","concept_1":"GAN 개념을 떠올리면 정답은 2입니다.","concept_2":"GAN 개념을 떠올리면 정답은 1입니다.","concept_3":"GAN 개념을 떠올리면 정답은 3입니다.","concept_4":"GAN 개념을 떠올리면 정답은 2입니다.","concept_5":"GAN 개념을 떠올리면 정답은 4입니다.","ox_0":"문장의 참/거짓을 판단하면 1입니다.","ox_1":"문장의 참/거짓을 판단하면 0입니다.","ox_2":"문장의 참/거짓을 판단하면 1입니다.","ox_3":"문장의 참/거짓을 판단하면 0입니다.","ox_4":"문장의 참/거짓을 판단하면 1입니다.","ox_5":"문장의 참/거짓을 판단하면 0입니다.","scenario_0":"상황을 보면 가장 자연스러운 선택은 1입니다.","scenario_1":"상황을 보면 가장 자연스러운 선택은 1입니다.","scenario_2":"상황을 보면 가장 자연스러운 선택은 2입니다.","scenario_3":"상황을 보면 가장 자연스러운 선택은 1입니다.","vote_0":"단순 계산으로 784가 됩니다.","vote_1":"단순 계산으로 256가 됩니다.","vote_2":"단순 계산으로 1024가 됩니다.","vote_3":"단순 계산으로 196가 됩니다.","scenario_4":"상황을 보면 가장 자연스러운 선택은 1입니다.","scenario_5":"상황을 보면 가장 자연스러운 선택은 2입니다.","scenario_6":"상황을 보면 가장 자연스러운 선택은 1입니다.","scenario_7":"상황을 보면 가장 자연스러운 선택은 1입니다.","scenario_8":"상황을 보면 가장 자연스러운 선택은 1입니다.","scenario_9":"상황을 보면 가장 자연스러운 선택은 1입니다.","vote_4":"단순 계산으로 512가 됩니다.","vote_5":"단순 계산으로 3072가 됩니다.","vote_6":"단순 계산으로 128가 됩니다.","vote_7":"단순 계산으로 100가 됩니다.","vote_8":"단순 계산으로 32가 됩니다.","vote_9":"단순 계산으로 50가 됩니다.","vote_10":"단순 계산으로 576가 됩니다.","vote_11":"단순 계산으로 2304가 됩니다.","vote_12":"단순 계산으로 768가 됩니다.","vote_13":"단순 계산으로 64가 됩니다.","ensemble_0":"구조를 계산하면 196입니다.","ensemble_1":"구조를 계산하면 64입니다.","ensemble_2":"구조를 계산하면 400입니다.","ensemble_3":"구조를 계산하면 144입니다.","vote_14":"단순 계산으로 4096가 됩니다.","vote_15":"단순 계산으로 6912가 됩니다.","vote_16":"단순 계산으로 256가 됩니다.","vote_17":"단순 계산으로 128가 됩니다.","vote_18":"단순 계산으로 6400가 됩니다.","vote_19":"단순 계산으로 1728가 됩니다.","config_0":"격자/제곱 계산으로 64입니다.","config_1":"격자/제곱 계산으로 81입니다.","config_2":"격자/제곱 계산으로 100입니다.","config_3":"격자/제곱 계산으로 121입니다.","config_4":"격자/제곱 계산으로 144입니다.","config_5":"격자/제곱 계산으로 36입니다.","config_6":"격자/제곱 계산으로 49입니다.","config_7":"격자/제곱 계산으로 256입니다.","config_8":"격자/제곱 계산으로 400입니다.","config_9":"격자/제곱 계산으로 625입니다.","ensemble_4":"구조를 계산하면 900입니다.","ensemble_5":"구조를 계산하면 197입니다.","ensemble_6":"구조를 계산하면 32입니다.","ensemble_7":"구조를 계산하면 1024입니다."},"problemAnswers":{"concept_0":2,"concept_1":2,"concept_2":1,"concept_3":3,"concept_4":2,"concept_5":4,"ox_0":1,"ox_1":0,"ox_2":1,"ox_3":0,"ox_4":1,"ox_5":0,"scenario_0":1,"scenario_1":1,"scenario_2":2,"scenario_3":1,"vote_0":784,"vote_1":256,"vote_2":1024,"vote_3":196,"scenario_4":1,"scenario_5":2,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1,"vote_4":512,"vote_5":3072,"vote_6":128,"vote_7":100,"vote_8":32,"vote_9":50,"vote_10":576,"vote_11":2304,"vote_12":768,"vote_13":64,"ensemble_0":196,"ensemble_1":64,"ensemble_2":400,"ensemble_3":144,"vote_14":4096,"vote_15":6912,"vote_16":256,"vote_17":128,"vote_18":6400,"vote_19":1728,"config_0":64,"config_1":81,"config_2":100,"config_3":121,"config_4":144,"config_5":36,"config_6":49,"config_7":256,"config_8":400,"config_9":625,"ensemble_4":900,"ensemble_5":197,"ensemble_6":32,"ensemble_7":1024},"problemTestCodes":{"concept_0":"answer = 2\nassert answer == 2","concept_1":"answer = 2\nassert answer == 2","concept_2":"answer = 1\nassert answer == 1","concept_3":"answer = 3\nassert answer == 3","concept_4":"answer = 2\nassert answer == 2","concept_5":"answer = 4\nassert answer == 4","ox_0":"answer = 1\nassert answer == 1","ox_1":"answer = 0\nassert answer == 0","ox_2":"answer = 1\nassert answer == 1","ox_3":"answer = 0\nassert answer == 0","ox_4":"answer = 1\nassert answer == 1","ox_5":"answer = 0\nassert answer == 0","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 2\nassert answer == 2","scenario_3":"answer = 1\nassert answer == 1","vote_0":"answer = 784\nassert answer == 784","vote_1":"answer = 256\nassert answer == 256","vote_2":"answer = 1024\nassert answer == 1024","vote_3":"answer = 196\nassert answer == 196","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 2\nassert answer == 2","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1","vote_4":"answer = 512\nassert answer == 512","vote_5":"answer = 3072\nassert answer == 3072","vote_6":"answer = 128\nassert answer == 128","vote_7":"answer = 100\nassert answer == 100","vote_8":"answer = 32\nassert answer == 32","vote_9":"answer = 50\nassert answer == 50","vote_10":"answer = 576\nassert answer == 576","vote_11":"answer = 2304\nassert answer == 2304","vote_12":"answer = 768\nassert answer == 768","vote_13":"answer = 64\nassert answer == 64","ensemble_0":"answer = 196\nassert answer == 196","ensemble_1":"answer = 64\nassert answer == 64","ensemble_2":"answer = 400\nassert answer == 400","ensemble_3":"answer = 144\nassert answer == 144","vote_14":"answer = 4096\nassert answer == 4096","vote_15":"answer = 6912\nassert answer == 6912","vote_16":"answer = 256\nassert answer == 256","vote_17":"answer = 128\nassert answer == 128","vote_18":"answer = 6400\nassert answer == 6400","vote_19":"answer = 1728\nassert answer == 1728","config_0":"assert 8 * 8 == 64","config_1":"assert 9 * 9 == 81","config_2":"assert 10 * 10 == 100","config_3":"assert 11 * 11 == 121","config_4":"assert 12 * 12 == 144","config_5":"assert 6 * 6 == 36","config_6":"assert 7 * 7 == 49","config_7":"assert 16 * 16 == 256","config_8":"assert 20 * 20 == 400","config_9":"assert 25 * 25 == 625","ensemble_4":"answer = 900\nassert answer == 900","ensemble_5":"answer = 197\nassert answer == 197","ensemble_6":"answer = 32\nassert answer == 32","ensemble_7":"answer = 1024\nassert answer == 1024"},"problemDifficulty":{"concept_0":"easy","concept_1":"easy","concept_2":"easy","concept_3":"easy","concept_4":"easy","concept_5":"easy","ox_0":"easy","ox_1":"easy","ox_2":"easy","ox_3":"easy","ox_4":"easy","ox_5":"easy","scenario_0":"easy","scenario_1":"easy","scenario_2":"easy","scenario_3":"easy","vote_0":"easy","vote_1":"easy","vote_2":"easy","vote_3":"easy","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","vote_4":"medium","vote_5":"medium","vote_6":"medium","vote_7":"medium","vote_8":"medium","vote_9":"medium","vote_10":"medium","vote_11":"medium","vote_12":"medium","vote_13":"medium","ensemble_0":"medium","ensemble_1":"medium","ensemble_2":"medium","ensemble_3":"medium","vote_14":"hard","vote_15":"hard","vote_16":"hard","vote_17":"hard","vote_18":"hard","vote_19":"hard","config_0":"hard","config_1":"hard","config_2":"hard","config_3":"hard","config_4":"hard","config_5":"hard","config_6":"hard","config_7":"hard","config_8":"hard","config_9":"hard","ensemble_4":"hard","ensemble_5":"medium","ensemble_6":"hard","ensemble_7":"hard"},"problemOrder":["concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","ox_0","ox_1","ox_2","ox_3","ox_4","ox_5","scenario_0","scenario_1","scenario_2","scenario_3","vote_0","vote_1","vote_2","vote_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","vote_4","vote_5","vote_6","vote_7","vote_8","vote_9","vote_10","vote_11","vote_12","vote_13","ensemble_0","ensemble_1","ensemble_2","ensemble_3","vote_14","vote_15","vote_16","vote_17","vote_18","vote_19","config_0","config_1","config_2","config_3","config_4","config_5","config_6","config_7","config_8","config_9","ensemble_4","ensemble_5","ensemble_6","ensemble_7"]},"paperReviewInfluenceKernelVonMises":{"chapter":"Chapter PR-01","title":"Kernel von Mises Formula of the Influence Function","description":"이 논문은 영향 함수(IF)를 모델마다 손으로 유도해야 했던 기존 병목을, 커널과 스펙트럴 전개를 이용한 데이터 기반 계산 절차로 바꿉니다. 특히 점질량(point-mass) 섭동에서 자주 생기는 수치 불안정(ill-conditioned) 문제를 완화하고, 정규화된 추정기를 통해 실제 계산 가능성과 이론적 일관성(Consistency)을 함께 확보한 점이 핵심 기여입니다.","sectionTitle":"배우기 / 논문 리뷰 / 이론·수학 기반 / CPAL2026","viewOriginalPdf":"원문 논문 PDF 보기","coreFlow":{"0":"**[초록 & 서론] 3줄 요약 + 문제 제기**\n\n① 기존 영향 함수 계산은 모델이 바뀔 때마다 수학 유도를 다시 해야 해서 자동화가 어렵습니다.\n② 점질량(point-mass)으로 분포를 찌르는 고전 방식은 계산이 뾰족해져 수치적으로 불안정해지기 쉽습니다.\n③ 논문은 데이터를 여러 개의 \"부드러운 패턴\"으로 나눠 각각의 영향을 계산한 뒤 다시 합쳐서, 손계산 대신 컴퓨터로 안정적으로 영향 함수를 구할 수 있게 만듭니다.\n\n**일상 비유:** 아주 복잡한 마라탕 레시피가 있을 때, 건두부 한 조각이 국물 맛에 얼마나 영향을 주는지 알고 싶다고 해봅시다. 기존 방식은 냄비를 바늘로 콕 찌르듯 거칠게 자극해서 맛 변화를 재기 때문에 값이 출렁이기 쉽습니다. 이 논문은 바늘 대신 부드러운 물결처럼 여러 방향으로 살짝 흔들어 보고, 그 반응을 합쳐서 \"어떤 재료가 얼마나 맛을 바꿨는지\"를 더 안정적으로 계산하는 절대 미각 머신에 가깝습니다.","1":"$28","2":"**[제안 방법: 핵심 제안]**\n\n논문은 점질량 섭동을 직접 쓰지 않고, 고유함수 방향 경로 섭동 $P_t^j$를 따라 $\\theta$의 경로미분을 계산해 IF를 재구성합니다. 핵심 정리는 **Theorem 3.3 (Spectral von Mises formula)**이며, 모드별 기여를 합산하는 형태로 IF를 표현합니다. 여기에 정규화 로딩 $\\lambda$를 넣어 작은 고윳값 모드의 과증폭을 억제하고, 계산 안정성을 높입니다.","3":"$29","4":"**[실험 및 결과]**\n\n논문은 가장 기본적인 함수형 목표인 평균(Mean) 문제를 중심으로 장난감 몬테카를로 실험을 구성해, 제안한 스펙트럴 추정기가 실제 계산 환경에서 어떻게 동작하는지 보여줍니다. 핵심 확인 포인트는 두 가지입니다.\n\n첫째, **정규화 강도 $\\lambda$에 따른 편향-분산 이동**입니다. $\\lambda$가 너무 작으면 작은 고윳값 모드까지 강하게 반영되어 추정값이 요동(분산 증가)할 수 있고, 반대로 $\\lambda$가 너무 크면 중요한 모드까지 과도하게 눌려 참값에서 멀어지는 편향이 커질 수 있습니다. 즉, 논문이 말하는 감쇠 계수 $\\frac{1}{1+2\\lambda/\\sigma_j}$는 실제로 계산 안정성과 정보 보존 사이의 균형 손잡이 역할을 합니다.\n\n둘째, **표본 수 $n$ 증가에 따른 수렴성(Consistency)**입니다. 샘플이 늘어날수록 제안 추정기가 이론적 영향 함수에 점점 가까워지는 경향을 보이며, 이는 논문에서 제시하는 이론 결과(예: Theorem 4.7)와 같은 방향입니다. 쉽게 말해 데이터가 충분해질수록 \"컴퓨터가 계산한 IF\"가 \"수학적으로 기대되는 IF\"에 수렴한다는 점을 실험적으로도 확인한 것입니다.\n\n추가로 실무 관점에서 보면, 이 결과는 단순히 장난감 예제가 잘 맞았다는 의미를 넘어, 정규화 파라미터 선택을 통해 모델 민감도 분석을 **안정적으로 재현 가능**하게 만들 수 있다는 신호입니다. 즉, 어떤 데이터가 모델을 흔드는지 분석할 때 결과가 매번 들쭉날쭉하지 않고, 데이터가 커질수록 더 신뢰할 수 있는 방향으로 가는 추정기라는 점이 중요합니다.","5":"**[결론 및 한계점]**\n\n이 논문의 가장 큰 의의는 영향 함수 계산을 \"연구자 개인의 수기 유도 작업\"에서 \"데이터와 알고리즘으로 반복 가능한 계산 절차\"로 옮겼다는 데 있습니다. 기존에는 모델이 조금만 바뀌어도 IF를 다시 유도해야 해서 비용이 컸지만, 논문은 커널 기반 스펙트럴 전개와 경로미분 조합으로 공통 계산 프레임을 제시합니다. 특히 Nyström 기반 고유분해를 사용해 모드($\\sigma_j, e_j$)를 추정하고, 모드별 민감도를 정규화 가중합으로 재구성하는 흐름은 실무 구현 관점에서 매우 명확한 파이프라인입니다.\n\n실무적으로는 세 가지 활용 가치가 큽니다. 첫째, 예측에 과도한 영향을 주는 데이터 포인트를 찾아 라벨 오류나 이상치를 우선 점검할 수 있습니다. 둘째, 모델 업데이트 전후로 어떤 샘플의 영향력이 얼마나 바뀌었는지 비교해 디버깅 지표로 사용할 수 있습니다. 셋째, 설명가능 AI(XAI)나 강건 학습(robust ML) 맥락에서 \"이 모델이 왜 이런 결정을 했는가\"를 데이터 영향 관점으로 해석하는 기반을 제공합니다.\n\n다만 논문이 솔직하게 남겨둔 한계도 분명합니다. 가장 대표적인 것은 **수렴 속도(rate)**의 정밀 분석이 아직 열려 있다는 점입니다. 일관성(결국 맞는 값으로 간다)은 보였지만, \"얼마나 빠르게\" 가까워지는지는 별도 연구가 필요합니다. 또 하나는 경로미분 계산의 **완전 자동화(autodiff 통합)**입니다. 이론적으로는 경로미분 항이 핵심이지만, 이를 다양한 모델에서 안정적으로 자동 계산하는 엔지니어링 계층은 여전히 발전 여지가 큽니다. 따라서 이 논문은 \"문제를 완전히 끝낸 최종 답\"이라기보다, IF 계산을 실용화하는 매우 강력한 기준점이자 다음 연구를 여는 출발점으로 보는 것이 가장 정확합니다."},"mainMethodFiveSteps":{"0":"**1) 핵심 제안(개념 설명)**\n\n점질량으로 찌르는 방식 대신, 커널 고유함수 축으로 분포를 부드럽게 흔들고 경로미분을 합성해 IF를 계산합니다.","1":"**2) 일상 비유(직관)**\n\n기타 줄 하나를 세게 튕기면 잡음이 커지지만, 여러 줄을 적절히 섞어 연주하면 안정적인 화음을 얻습니다. IF도 한 점 자극 대신 다중 모드 합성이 안정적입니다.","2":"**3) 수식 완벽 해부(수학 설명)**\n\n가중치 $\\frac{1}{1+2\\lambda/\\sigma_j}$는 작은 $\\sigma_j$ 모드의 폭주를 막는 감쇠기입니다. 따라서 분산은 낮아지고, $\\lambda$를 크게 하면 편향은 커질 수 있습니다.","3":"**4) Math to Code(실전 코드)**\n\n아래 코드는 $\\sigma_j$, 경로미분 근사값, $e_j(x)$를 사용해 $\\psi_{P,\\lambda}(x)$를 계산합니다. 실제 논문의 계산 파이프라인(모드 분해 → 모드별 민감도 계산 → 감쇠 가중 합산)을 축약해 재현한 예시이며, 수식 기호를 변수명과 1:1로 대응했습니다.","4":"**5) 실제 AI 적용 사례**\n\n- 학습 데이터 중 예측에 큰 영향을 주는 샘플 탐지\n- 이상치/라벨 오류 데이터 우선 검수\n- 모델 업데이트 전후 민감도 비교"},"mathToCodeTitle":"논문 알고리즘 실전 코드 구현 (NumPy)","mathToCodeCode":"import numpy as np\n\n# sigma_j (고윳값) 벡터: 논문의 \\sigma_j\nsigma = np.array([8, 4, 2, 1], dtype=float)\n\n# pathwise derivative 근사값: [d/dt theta(P_t^j)]_{t=0}\ndtheta = np.array([6, 4, 2, 2], dtype=float)\n\n# e_j(x): 특정 x에서의 고유함수 값\ne_x = np.array([3, 2, 1, 1], dtype=float)\n\n# lambda: 정규화 하이퍼파라미터 (논문의 \\lambda)\nlambda_reg = 2.0\n\n# 분모 1 + 2\\lambda/\\sigma_j 계산\nshrink = 1.0 / (1.0 + 2.0 * lambda_reg / sigma)\n\n# 항별 기여도 = shrink_j * dtheta_j * e_j(x)\nterm = shrink * dtheta * e_x\n\n# r=4 저랭크 근사 영향 함수\npsi_hat = int(np.round(np.sum(term)))\n\nprint('shrink =', shrink.astype(int))\nprint('term =', term.astype(int))\nprint('psi_hat =', psi_hat)","mathToCodeOutput":"shrink = [0 0 0 0]\nterm = [10 4 1 0]\npsi_hat = 16","visualPlanTitle":"도식화: 한계와 제안의 극명한 대비","visualPlan":"왼쪽 한 덩어리는 **점질량·스파이크**에서 민감도가 크게 출렁이는 **전형적 한계**를, 오른쪽 두 단계는 **모드 분해와 정규화 가중합**으로 곡선을 **부드럽고 억제 가능하게 재구성하는 제안**을 한 화면에 붙였습니다. 색과 구역을 나눠 무엇이 바뀌는지 바로 대비되게 했습니다.","visualLimitBannerTitle":"기존 한계","visualLimitBannerDetail":"점질량 · 스파이크 → 민감도 폭주 · 불안정","visualProposalBannerTitle":"논문 제안","visualProposalBannerDetail":"스펙트럴 분해 → 정규화 재구성 → 안정적 IF","visualStep1Heading":"1) 기존 점질량 섭동","visualStep1Body":"spike로 인해 민감도 진동이 큼","visualStep2Heading":"2) 스펙트럴 분해","visualStep2Body1":"모드별 $(\\sigma_j, e_j)$ 로 분해","visualStep2Body2":"작은 $\\sigma_j$ 모드는 가중치로 감쇠","visualStep3Heading":"3) 정규화 재구성","visualStep3Body1":"가중합으로 IF를 부드럽게 복원","visualStep3Body2":"$$\\frac{1}{1+2\\lambda/\\sigma_j}$가 노이즈 모드 억제","visualVsLabel":"VS","visualVsAria":"기존 한계 영역과 논문 제안 영역을 구분하는 표시","summary":"이 논문은 영향 함수를 더 이상 \"모델별 수기 유도\" 문제로 두지 않고, 커널·스펙트럴 전개를 이용한 데이터 기반 계산 절차로 재정의했다는 점에서 의미가 큽니다. 실무 관점에서는 어떤 샘플이 예측을 얼마나 흔드는지 안정적으로 추적할 수 있어, 데이터 품질 점검·이상치 분석·모델 디버깅에 바로 연결됩니다. 동시에 정규화 강도 선택에 따른 편향-분산 균형, 수렴 속도(rate) 해석, 경로미분 자동화 같은 과제가 남아 있어 앞으로의 이론·시스템 확장이 중요한 다음 단계로 남습니다.","problemSolvingLabel":"문제 풀이를 위한 설명","problemSolving":{"0":"| 유형 | 풀이·예시 (논문 수식 기반 키워드 → 정답) |\n| :--- | :--- |\n| 기호 의미 | $\\lambda$는 정규화 강도, $\\sigma_j$는 고윳값, $e_j(x)$는 고유함수 값 |\n| 차원/개수 | 고유함수 5개를 쓰면 합의 항 수는 5 |\n| 감쇠 계산 | $\\sigma_j=4, \\lambda=2$이면 분모 $1+2\\lambda/\\sigma_j=2$ |\n| Toy 합산 | 항 기여도 [8,4,2,2]의 합은 16 |\n| 경향 해석 | $\\lambda$ 증가 시 작은 $\\sigma_j$ 모드 기여 감소 |\n| 코드 매칭 | $\\lambda \\leftrightarrow lambda_reg$, $\\sigma_j \\leftrightarrow sigma$ |","1":"**예시 A**\n\n문제 지문: $\\sigma_j=4$, $\\lambda=2$일 때 감쇠 분모 $1+2\\lambda/\\sigma_j$를 구하라.\n\n간단한 풀이 식: $1+2\\times2/4=2$\n\n정답: 2","2":"**예시 B**\n\n문제 지문: 항별 기여도가 [6, 4, 2, 4]이면 총합 IF 근사값은?\n\n간단한 풀이 식: $6+4+2+4=16$\n\n정답: 16"},"practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"아래는 60문제 풀에서 무작위로 뽑은 10문제입니다. 난이도는 쉬움 4 · 보통 3 · 어려움 3 순서이며, 정답은 정수만 입력합니다.","practiceProblemsInstruction":"문제 지시문과 실제 질문 사이에는 빈 줄이 있습니다. 정답은 반드시 정수로 답하세요.","problems":{"q00":"문제 지시문: 핵심 기여를 고르세요.\n\n실제 질문: 이 논문의 핵심은 무엇인가? ① 점질량 섭동을 더 세게 만들기 ② 커널-스펙트럴 방식으로 IF를 데이터 기반 계산 ③ CNN 분류기 추가","q01":"문제 지시문: 기호 의미를 고르세요.\n\n실제 질문: 수식에서 $\\lambda$가 의미하는 것은? ① 정규화 강도 ② 샘플 개수 ③ 클래스 수","q02":"문제 지시문: 기호 의미를 고르세요.\n\n실제 질문: 수식에서 $\\sigma_j$는 무엇인가? ① 고윳값 ② 배치 크기 ③ 레이어 수","q03":"문제 지시문: 기호 의미를 고르세요.\n\n실제 질문: $e_j(x)$는 무엇인가? ① $j$번째 고유함수 값 ② 손실 함수 ③ 옵티마이저","q04":"문제 지시문: 참/거짓을 판단하세요.\n\n실제 질문: 점질량 섭동은 수치적으로 불안정할 수 있다. 맞으면 1, 틀리면 0.","q05":"문제 지시문: 참/거짓을 판단하세요.\n\n실제 질문: $\\lambda$가 커지면 작은 $\\sigma_j$ 모드의 기여가 보통 더 줄어든다. 맞으면 1, 틀리면 0.","q06":"문제 지시문: 참/거짓을 판단하세요.\n\n실제 질문: 제안 공식은 고유함수 방향 기여도를 합으로 재구성한다. 맞으면 1, 틀리면 0.","q07":"문제 지시문: 개수 계산을 하세요.\n\n실제 질문: 합을 $j=1$부터 $r=6$까지 계산하면 항 개수는 몇 개인가?","q08":"문제 지시문: 분모 계산을 하세요.\n\n실제 질문: $\\lambda=2$, $\\sigma_j=4$일 때 $1+2\\lambda/\\sigma_j$ 값은?","q09":"문제 지시문: 분모 계산을 하세요.\n\n실제 질문: $\\lambda=3$, $\\sigma_j=3$일 때 $1+2\\lambda/\\sigma_j$ 값은?","q10":"문제 지시문: 분모 계산을 하세요.\n\n실제 질문: $\\lambda=1$, $\\sigma_j=2$일 때 $1+2\\lambda/\\sigma_j$ 값은?","q11":"문제 지시문: 분모 계산을 하세요.\n\n실제 질문: $\\lambda=4$, $\\sigma_j=8$일 때 $1+2\\lambda/\\sigma_j$ 값은?","q12":"문제 지시문: 단순 합산을 하세요.\n\n실제 질문: 항 기여도 [5, 4, 3]의 합은?","q13":"문제 지시문: 단순 합산을 하세요.\n\n실제 질문: 항 기여도 [6, 2, 2, 2]의 합은?","q14":"문제 지시문: 단순 합산을 하세요.\n\n실제 질문: 항 기여도 [9, 1, 3, 3]의 합은?","q15":"문제 지시문: 차이 계산을 하세요.\n\n실제 질문: 정규화 전 추정값 20, 정규화 후 추정값 16일 때 감소량은?","q16":"문제 지시문: 비율 개념을 정수로 답하세요.\n\n실제 질문: 쉬움/보통/어려움이 4/3/3일 때 한 세션 문제 수는?","q17":"문제 지시문: 개수 계산을 하세요.\n\n실제 질문: 60문제 중 쉬움 20, 보통 20, 어려움 20일 때 전체 합은?","q18":"문제 지시문: 개수 계산을 하세요.\n\n실제 질문: 고유함수 4개, 각 함수당 기여 항 1개를 쓰면 총 항 수는?","q19":"문제 지시문: 경향 문제를 푸세요.\n\n실제 질문: 다른 조건이 같을 때 $\\lambda$를 크게 했더니 작은 고윳값 모드 기여 항이 5에서 2로 줄었다. 감소량은?","q20":"문제 지시문: Toy 계산을 하세요.\n\n실제 질문: 기여도 [8, 4, 2, 2]의 총합을 구하라.","q21":"문제 지시문: Toy 계산을 하세요.\n\n실제 질문: 기여도 [10, 3, 1, 2]의 총합은?","q22":"문제 지시문: Toy 계산을 하세요.\n\n실제 질문: 기여도 [7, 5, 4]의 총합은?","q23":"문제 지시문: Toy 계산을 하세요.\n\n실제 질문: 기여도 [12, 6, 2]의 총합은?","q24":"문제 지시문: Toy 계산을 하세요.\n\n실제 질문: 기여도 [4, 4, 4, 4]의 총합은?","q25":"문제 지시문: Toy 계산을 하세요.\n\n실제 질문: 기여도 [3, 3, 5, 5]의 총합은?","q26":"문제 지시문: Toy 계산을 하세요.\n\n실제 질문: 기여도 [15, 1]의 총합은?","q27":"문제 지시문: Toy 계산을 하세요.\n\n실제 질문: 기여도 [11, 2, 3]의 총합은?","q28":"문제 지시문: Toy 계산을 하세요.\n\n실제 질문: 기여도 [6, 6, 2, 2]의 총합은?","q29":"문제 지시문: Toy 계산을 하세요.\n\n실제 질문: 기여도 [14, 2]의 총합은?","q30":"문제 지시문: 차원 계산을 하세요.\n\n실제 질문: $r=10$이면 합의 항 수는?","q31":"문제 지시문: 차원 계산을 하세요.\n\n실제 질문: $r=12$이면 합의 항 수는?","q32":"문제 지시문: 차원 계산을 하세요.\n\n실제 질문: $r=15$이면 합의 항 수는?","q33":"문제 지시문: 차원 계산을 하세요.\n\n실제 질문: $r=18$이면 합의 항 수는?","q34":"문제 지시문: 분모 계산을 하세요.\n\n실제 질문: $\\lambda=6$, $\\sigma_j=6$일 때 $1+2\\lambda/\\sigma_j$ 값은?","q35":"문제 지시문: 분모 계산을 하세요.\n\n실제 질문: $\\lambda=8$, $\\sigma_j=4$일 때 $1+2\\lambda/\\sigma_j$ 값은?","q36":"문제 지시문: 분모 계산을 하세요.\n\n실제 질문: $\\lambda=5$, $\\sigma_j=10$일 때 $1+2\\lambda/\\sigma_j$ 값은?","q37":"문제 지시문: 분모 계산을 하세요.\n\n실제 질문: $\\lambda=9$, $\\sigma_j=9$일 때 $1+2\\lambda/\\sigma_j$ 값은?","q38":"문제 지시문: 추정값 비교를 하세요.\n\n실제 질문: 전 28, 후 20이면 감소량은?","q39":"문제 지시문: 추정값 비교를 하세요.\n\n실제 질문: 전 35, 후 27이면 감소량은?","q40":"문제 지시문: 하드 계산을 하세요.\n\n실제 질문: 기여도 [20, 10, 6, 4]의 총합은?","q41":"문제 지시문: 하드 계산을 하세요.\n\n실제 질문: 기여도 [18, 12, 8, 2]의 총합은?","q42":"문제 지시문: 하드 계산을 하세요.\n\n실제 질문: 기여도 [16, 9, 7, 4]의 총합은?","q43":"문제 지시문: 하드 계산을 하세요.\n\n실제 질문: 기여도 [22, 8, 5, 1]의 총합은?","q44":"문제 지시문: 하드 계산을 하세요.\n\n실제 질문: 기여도 [14, 14, 6, 2]의 총합은?","q45":"문제 지시문: 하드 계산을 하세요.\n\n실제 질문: 기여도 [25, 5, 4, 2]의 총합은?","q46":"문제 지시문: 하드 계산을 하세요.\n\n실제 질문: 기여도 [30, 4, 1, 1]의 총합은?","q47":"문제 지시문: 하드 계산을 하세요.\n\n실제 질문: 기여도 [19, 9, 5, 3]의 총합은?","q48":"문제 지시문: 하드 계산을 하세요.\n\n실제 질문: 기여도 [17, 11, 6, 2]의 총합은?","q49":"문제 지시문: 하드 계산을 하세요.\n\n실제 질문: 기여도 [24, 7, 3, 2]의 총합은?","q50":"문제 지시문: 하드 분모 계산을 하세요.\n\n실제 질문: $\\lambda=10$, $\\sigma_j=5$일 때 $1+2\\lambda/\\sigma_j$ 값은?","q51":"문제 지시문: 하드 분모 계산을 하세요.\n\n실제 질문: $\\lambda=12$, $\\sigma_j=6$일 때 $1+2\\lambda/\\sigma_j$ 값은?","q52":"문제 지시문: 하드 분모 계산을 하세요.\n\n실제 질문: $\\lambda=14$, $\\sigma_j=7$일 때 $1+2\\lambda/\\sigma_j$ 값은?","q53":"문제 지시문: 하드 분모 계산을 하세요.\n\n실제 질문: $\\lambda=16$, $\\sigma_j=8$일 때 $1+2\\lambda/\\sigma_j$ 값은?","q54":"문제 지시문: 하드 분모 계산을 하세요.\n\n실제 질문: $\\lambda=18$, $\\sigma_j=9$일 때 $1+2\\lambda/\\sigma_j$ 값은?","q55":"문제 지시문: 하드 분모 계산을 하세요.\n\n실제 질문: $\\lambda=20$, $\\sigma_j=10$일 때 $1+2\\lambda/\\sigma_j$ 값은?","q56":"문제 지시문: 세트 크기 계산을 하세요.\n\n실제 질문: 문제풀 60개에서 10개를 한 세션에 내면 남는 문제 수는?","q57":"문제 지시문: 세트 크기 계산을 하세요.\n\n실제 질문: 쉬움 20개에서 세션당 쉬움 4개를 뽑으면 남는 쉬움 문제 수는?","q58":"문제 지시문: 세트 크기 계산을 하세요.\n\n실제 질문: 보통 20개에서 세션당 보통 3개를 뽑으면 남는 보통 문제 수는?","q59":"문제 지시문: 세트 크기 계산을 하세요.\n\n실제 질문: 어려움 20개에서 세션당 어려움 3개를 뽑으면 남는 어려움 문제 수는?"},"problemAnswers":{"q00":2,"q01":1,"q02":1,"q03":1,"q04":1,"q05":1,"q06":1,"q07":6,"q08":2,"q09":3,"q10":2,"q11":2,"q12":12,"q13":12,"q14":16,"q15":4,"q16":10,"q17":60,"q18":4,"q19":3,"q20":16,"q21":16,"q22":16,"q23":20,"q24":16,"q25":16,"q26":16,"q27":16,"q28":16,"q29":16,"q30":10,"q31":12,"q32":15,"q33":18,"q34":3,"q35":5,"q36":2,"q37":3,"q38":8,"q39":8,"q40":40,"q41":40,"q42":36,"q43":36,"q44":36,"q45":36,"q46":36,"q47":36,"q48":36,"q49":36,"q50":5,"q51":5,"q52":5,"q53":5,"q54":5,"q55":5,"q56":50,"q57":16,"q58":17,"q59":17},"problemSolutions":{"q00":"핵심은 점질량 직접 섭동을 대체하는 커널-스펙트럴 기반 IF 추정입니다. 기존 방식의 수치 불안정과 수기 유도 부담을 줄이는 것이 논문 기여이므로 정답은 2입니다.","q01":"$$\\lambda$는 정규화 강도를 조절해 작은 고윳값 모드의 과도한 기여를 줄이는 하이퍼파라미터입니다. 정답은 1입니다.","q02":"$$\\sigma_j$는 스펙트럴 분해에서 $j$번째 모드의 고윳값입니다. 정답은 1입니다.","q03":"$$e_j(x)$는 $j$번째 고유함수의 입력 $x$에서의 값입니다. 정답은 1입니다.","q04":"논문 문제의식 자체가 점질량 섭동의 수치적 취약성입니다. 참이므로 1입니다.","q05":"감쇠 계수 분모가 $1+2\\lambda/\\sigma_j$라서 $\\lambda$가 커지면 계수는 작아집니다. 참이므로 1입니다.","q06":"핵심 공식은 모드별 기여를 합하는 구조입니다. 참이므로 1입니다.","q07":"$$j=1$부터 $6$까지라서 항 개수는 6입니다.","q08":"$$1+2\\times2/4=1+1=2$이므로 정답은 2입니다.","q09":"$$1+2\\times3/3=1+2=3$이므로 정답은 3입니다.","q10":"$$1+2\\times1/2=1+1=2$입니다.","q11":"$$1+2\\times4/8=1+1=2$입니다.","q12":"$$5+4+3=12$입니다.","q13":"$$6+2+2+2=12$입니다.","q14":"$$9+1+3+3=16$입니다.","q15":"$$20-16=4$입니다.","q16":"$$4+3+3=10$입니다.","q17":"$$20+20+20=60$입니다.","q18":"함수 4개에 항 1개씩이면 총 4개입니다.","q19":"$$5-2=3$입니다.","q20":"$$8+4+2+2=16$입니다.","q21":"$$10+3+1+2=16$입니다.","q22":"$$7+5+4=16$입니다.","q23":"$$12+6+2=20$입니다.","q24":"$$4+4+4+4=16$입니다.","q25":"$$3+3+5+5=16$입니다.","q26":"$$15+1=16$입니다.","q27":"$$11+2+3=16$입니다.","q28":"$$6+6+2+2=16$입니다.","q29":"$$14+2=16$입니다.","q30":"$$r=10$이면 항 수는 10입니다.","q31":"$$r=12$이면 항 수는 12입니다.","q32":"$$r=15$이면 항 수는 15입니다.","q33":"$$r=18$이면 항 수는 18입니다.","q34":"$$1+2\\times6/6=1+2=3$입니다.","q35":"$$1+2\\times8/4=1+4=5$입니다.","q36":"$$1+2\\times5/10=1+1=2$입니다.","q37":"$$1+2\\times9/9=1+2=3$입니다.","q38":"$$28-20=8$입니다.","q39":"$$35-27=8$입니다.","q40":"$$20+10+6+4=40$입니다.","q41":"$$18+12+8+2=40$입니다.","q42":"$$16+9+7+4=36$입니다.","q43":"$$22+8+5+1=36$입니다.","q44":"$$14+14+6+2=36$입니다.","q45":"$$25+5+4+2=36$입니다.","q46":"$$30+4+1+1=36$입니다.","q47":"$$19+9+5+3=36$입니다.","q48":"$$17+11+6+2=36$입니다.","q49":"$$24+7+3+2=36$입니다.","q50":"$$1+2\\times10/5=1+4=5$입니다.","q51":"$$1+2\\times12/6=1+4=5$입니다.","q52":"$$1+2\\times14/7=1+4=5$입니다.","q53":"$$1+2\\times16/8=1+4=5$입니다.","q54":"$$1+2\\times18/9=1+4=5$입니다.","q55":"$$1+2\\times20/10=1+4=5$입니다.","q56":"$$60-10=50$입니다.","q57":"$$20-4=16$입니다.","q58":"$$20-3=17$입니다.","q59":"$$20-3=17$입니다."},"problemTestCodes":{"q00":"answer = 2\nassert answer == 2","q01":"answer = 1\nassert answer == 1","q02":"answer = 1\nassert answer == 1","q03":"answer = 1\nassert answer == 1","q04":"answer = 1\nassert answer == 1","q05":"answer = 1\nassert answer == 1","q06":"answer = 1\nassert answer == 1","q07":"assert 6 == 6","q08":"assert 1 + 2 * 2 // 4 == 2","q09":"assert 1 + 2 * 3 // 3 == 3","q10":"assert 1 + 2 * 1 // 2 == 2","q11":"assert 1 + 2 * 4 // 8 == 2","q12":"values = [5,4,3]\nassert sum(values) == 12","q13":"values = [6,2,2,2]\nassert sum(values) == 12","q14":"values = [9,1,3,3]\nassert sum(values) == 16","q15":"before = 20\nafter = 16\nassert before - after == 4","q16":"assert 4 + 3 + 3 == 10","q17":"assert 20 + 20 + 20 == 60","q18":"assert 4 * 1 == 4","q19":"assert 5 - 2 == 3","q20":"values = [8,4,2,2]\nassert sum(values) == 16","q21":"values = [10,3,1,2]\nassert sum(values) == 16","q22":"values = [7,5,4]\nassert sum(values) == 16","q23":"values = [12,6,2]\nassert sum(values) == 20","q24":"values = [4,4,4,4]\nassert sum(values) == 16","q25":"values = [3,3,5,5]\nassert sum(values) == 16","q26":"values = [15,1]\nassert sum(values) == 16","q27":"values = [11,2,3]\nassert sum(values) == 16","q28":"values = [6,6,2,2]\nassert sum(values) == 16","q29":"values = [14,2]\nassert sum(values) == 16","q30":"answer = 10\nassert answer == 10","q31":"answer = 12\nassert answer == 12","q32":"answer = 15\nassert answer == 15","q33":"answer = 18\nassert answer == 18","q34":"assert 1 + 2 * 6 // 6 == 3","q35":"assert 1 + 2 * 8 // 4 == 5","q36":"assert 1 + 2 * 5 // 10 == 2","q37":"assert 1 + 2 * 9 // 9 == 3","q38":"assert 28 - 20 == 8","q39":"assert 35 - 27 == 8","q40":"values = [20,10,6,4]\nassert sum(values) == 40","q41":"values = [18,12,8,2]\nassert sum(values) == 40","q42":"values = [16,9,7,4]\nassert sum(values) == 36","q43":"values = [22,8,5,1]\nassert sum(values) == 36","q44":"values = [14,14,6,2]\nassert sum(values) == 36","q45":"values = [25,5,4,2]\nassert sum(values) == 36","q46":"values = [30,4,1,1]\nassert sum(values) == 36","q47":"values = [19,9,5,3]\nassert sum(values) == 36","q48":"values = [17,11,6,2]\nassert sum(values) == 36","q49":"values = [24,7,3,2]\nassert sum(values) == 36","q50":"assert 1 + 2 * 10 // 5 == 5","q51":"assert 1 + 2 * 12 // 6 == 5","q52":"assert 1 + 2 * 14 // 7 == 5","q53":"assert 1 + 2 * 16 // 8 == 5","q54":"assert 1 + 2 * 18 // 9 == 5","q55":"assert 1 + 2 * 20 // 10 == 5","q56":"assert 60 - 10 == 50","q57":"assert 20 - 4 == 16","q58":"assert 20 - 3 == 17","q59":"assert 20 - 3 == 17"},"problemDifficulty":{"q00":"easy","q01":"easy","q02":"easy","q03":"easy","q04":"easy","q05":"easy","q06":"easy","q07":"easy","q08":"easy","q09":"easy","q10":"easy","q11":"easy","q12":"easy","q13":"easy","q14":"easy","q15":"easy","q16":"easy","q17":"easy","q18":"easy","q19":"easy","q20":"medium","q21":"medium","q22":"medium","q23":"medium","q24":"medium","q25":"medium","q26":"medium","q27":"medium","q28":"medium","q29":"medium","q30":"medium","q31":"medium","q32":"medium","q33":"medium","q34":"medium","q35":"medium","q36":"medium","q37":"medium","q38":"medium","q39":"medium","q40":"hard","q41":"hard","q42":"hard","q43":"hard","q44":"hard","q45":"hard","q46":"hard","q47":"hard","q48":"hard","q49":"hard","q50":"hard","q51":"hard","q52":"hard","q53":"hard","q54":"hard","q55":"hard","q56":"hard","q57":"hard","q58":"hard","q59":"hard"},"problemOrder":["q00","q01","q02","q03","q04","q05","q06","q07","q08","q09","q10","q11","q12","q13","q14","q15","q16","q17","q18","q19","q20","q21","q22","q23","q24","q25","q26","q27","q28","q29","q30","q31","q32","q33","q34","q35","q36","q37","q38","q39","q40","q41","q42","q43","q44","q45","q46","q47","q48","q49","q50","q51","q52","q53","q54","q55","q56","q57","q58","q59"]},"paperReviewCurseDepthLlm":{"chapter":"Chapter PR-02","title":"The Curse of Depth in Large Language Models","description":"현업에서 모델 압축의 한계를 돌파하거나, 대규모 모델의 성능 병목을 조금이라도 더 개선하기 위해 깊이를 키워 본 분이라면 이 논문의 문제의식이 바로 와닿습니다. 논문은 \"레이어를 더 쌓았는데 왜 뒤쪽은 점점 덜 일하는가?\"를 이론적으로 해부하고, **깊이에 따라 $\\frac{1}{\\sqrt{l}}$로 LayerNorm 출력을 제어하는 단 한 줄의 규칙**으로 깊은 층의 학습 기여를 되살립니다.","viewOriginalPdf":"원문 논문 PDF 보기","coreFlow":{"0":"$2a","1":"$2b","2":"$2c","3":"**[수식 작동 시뮬레이션] Toy Data Walkthrough**\n\n어려운 수식은 잠깐 내려놓고, \"신호 볼륨\"이 레이어를 지날 때 어떻게 변하는지만 보겠습니다.\n\n- 시작값을 **1.00**으로 둡니다. (입력 신호 크기)\n- LNS 규칙은 간단합니다: **뒤 레이어일수록 볼륨을 더 눌러준다**.\n\n1. **1층**\n 거의 그대로 통과합니다. 아직은 정보를 충분히 키워도 되는 구간입니다.\n\n2. **2층**\n 볼륨이 조금 줄어듭니다. \"과하게 커질 뻔한 값\"만 살짝 눌러 줍니다.\n\n3. **3층**\n 한 번 더 눌러 줍니다. 앞에서 쌓인 작은 노이즈가 커지는 속도가 눈에 띄게 느려집니다.\n\n4. **4층**\n 이제부터는 제동이 꽤 확실해집니다. 값이 갑자기 튀는 현상이 줄어듭니다.\n\n5. **5층**\n 뒤층 특유의 과증폭을 더 강하게 막습니다. 그렇다고 학습이 멈추지는 않습니다.\n\n6. **6층**\n 끝단에서도 신호가 무너지지 않고 안정적으로 유지됩니다. \"그냥 복사 통과\"가 아니라 의미 있는 변환이 남습니다.\n\n**핵심 직관 한 줄:** LNS는 초반엔 학습력을 살리고, 후반엔 폭주를 막아 줍니다. 그래서 깊은 모델이 끝까지 일하게 만듭니다.","4":"**[실험 및 결과]**\n\n논문은 130M급 모델부터 7B급 스케일까지 LNS를 적용해, 이론이 실제 대규모 학습에서도 통하는지 점검합니다.\n\n- **핵심 지표 1: 하이퍼파라미터 프리 적용성**\n Mix-LN류 기법은 추가 하이퍼파라미터를 조정해야 했고, 큰 모델이나 긴 학습에서 불안정성이 나타났습니다. 반면 LNS는 **깊이에 따른 고정 규칙 $\\frac{1}{\\sqrt{l}}$만 넣으면 되는 구조**라 구현 리스크가 매우 낮습니다.\n\n- **핵심 지표 2: 스케일이 커질수록 더 선명해지는 효과**\n OLMo 계열 실험에서는 기존 Pre-LN의 최종 loss가 2.69 수준에 머문 반면, LNS는 2.50까지 내려가며 더 나은 수렴 경향을 보였습니다. 즉, 깊이를 더 쌓았을 때 그 깊이가 실제 성능으로 돌아오기 시작한 것입니다.\n\n- **핵심 지표 3: 깊은 층 표현 다양성 유지**\n 기존 Pre-LN은 깊은 층으로 갈수록 각도 거리(angular distance)가 0에 가까워지며 표현이 뭉개지는 반면, LNS는 더 넓은 각도 거리를 유지해 뒤쪽 레이어도 서로 다른 특징을 학습함을 보여줍니다.\n\n**실무 해석**\n\n- 하이퍼파라미터 튜닝 지옥을 줄이고, 깊이 확장 실험의 재현성을 높입니다.\n- \"레이어 수만 늘렸는데 성능은 제자리\"인 병목을 완화해 GPU 시간당 성능 효율을 개선합니다.\n- 프리트레인 이후 SFT 단계에서 더 다양한 심층 표현을 활용할 여지를 만듭니다.","5":"**[결론 및 한계점]**\n\n**최종 의의 및 실무 활용 가치**\n\n1. **모델 압축과 경량화의 출발점 개선**\n 깊은 층이 실제로 일을 하게 되면, 이후 가지치기나 양자화를 하더라도 \"원래부터 죽어 있던 레이어\"를 다루는 것이 아니라 **밀도 있게 학습된 표현**을 기반으로 최적화할 수 있습니다.\n\n2. **SFT 및 다운스트림 일반화 잠재력 확대**\n 뒤쪽 레이어가 살아 있으면 태스크 적응 시 활용할 표현 공간이 넓어집니다. 즉, 파인튜닝에서 쓸 수 있는 카드가 더 많아집니다.\n\n3. **GPU 자원 효율 향상**\n 수천 GPU를 들여 깊이를 늘렸는데 뒤층이 놀고 있다면 낭비입니다. LNS는 그 낭비를 줄여, 같은 자원으로 더 똑똑한 깊이를 얻도록 돕습니다.\n\n**한계점 (Future Work)**\n\n- 분석 초점이 Pre-LN 중심이므로, Post-LN이나 Normalization-free 구조에 대한 일반화는 후속 연구가 필요합니다.\n- 멀티모달 환경에서는 텍스트와 비전 브랜치의 깊이 활용 패턴이 다를 수 있어, 모달리티별 제어 법칙 확장이 필요합니다.\n- $\\frac{1}{\\sqrt{l}}$ 외의 다른 함수형 스케일이 더 나은지에 대한 이론·실증 비교도 아직 열려 있습니다."},"visualPlanTitle":"도식화 기획: 통제 불능 증폭 vs 정밀 제어","visualPlan":"왼쪽은 깊이가 깊어질수록 분산이 누적되어 신호가 붕괴되는 기존 Pre-LN 경로, 오른쪽은 깊이별 스케일링으로 진폭을 안정화해 깊은 레이어까지 유효 신호가 유지되는 LNS 경로를 애니메이션으로 대비합니다.","visualLegacyTitle":"기존 Pre-LN","visualLegacyBody":"깊어질수록 잡음이 누적되어 뒤층이 사실상 항등 맵처럼 굳어집니다.","visualProposedTitle":"제안 LNS","visualProposedBody":"깊이별 제동으로 진폭을 안정화해 깊은 층도 끝까지 학습에 참여시킵니다.","visualAxisStart":"Layer 1","visualAxisEnd":"Layer L","visualLegacyCurveLabel":"분산 폭발","visualProposedCurveLabel":"제어된 진폭","visualContributionLabel":"레이어 기여도","visualLegacyBadgeLabel":"후반 레이어 항등화","visualProposedBadgeLabel":"깊은 레이어 기여 유지","summary":"LNS의 매력은 거대한 아키텍처를 갈아엎지 않고도, **깊이의 저주를 수식 한 줄로 정면 돌파한다**는 점입니다. 수학적으로는 분산 폭주와 항등화를 제어하고, 실무적으로는 깊이를 늘린 비용이 실제 성능 향상으로 돌아오게 만듭니다. 그래서 이 논문은 \"더 깊게 쌓는 법\"이 아니라, **깊이를 끝까지 일하게 만드는 법**을 알려주는 설계서로 읽는 것이 가장 정확합니다."},"paperReviewAlphaFormer":{"sectionTitle":"배우기 / 논문 리뷰 / 핵심 아키텍처·알고리즘 / CPAL2026 / AlphaFormer: End-to-End Symbolic Regression of Alpha Factors with Transformers","title":"AlphaFormer: End-to-End Symbolic Regression of Alpha Factors with Transformers","description":"금융·퀀트 현장에서 알파 팩터는 여전히 **수작업 공식 + 블랙박스 모델** 사이에서 갈팡질팡합니다. AlphaFormer는 트랜스포머를 **합성 시계열 데이터로 사전학습**해, 새 시장 데이터가 들어오면 **해석 가능한 심볼릭 공식**을 엔드투엔드로 빠르게 뱉어내는 파이프라인을 제안합니다. 이 글에서는 선형 풀 결합, IC 기반 평가, PPO로 정책을 안정화하는 수식을 한 줄씩 해부합니다.","viewOriginalPdf":"원문 논문 PDF 보기","coreFlow":{"0":"**[초록 & 서론] 3줄 요약 + 문제 제기**\n\n**3줄 요약**\n\n- **① 기존 기술의 치명적 한계:** 유전 프로그래밍(GP)이나 강화학습(RL) 기반 심볼릭 회귀는 **새 데이터셋마다 탐색을 처음부터** 다시 해야 해서, 과거에 쌓인 \"공식 문법\"을 거의 재사용하지 못합니다. 같은 요리를 매일 처음부터 발명하는 셈입니다.\n- **② 고전적 방식의 단점:** LightGBM·LSTM 등은 예측은 잘해도 **내부가 블랙박스**이고, 전문가가 손으로 공식을 짜는 방식은 탐색 공간이 너무 커서 확장이 어렵습니다.\n- **③ 논문의 핵심 해결책:** AlphaFormer는 트랜스포머를 **다양한 합성 주가 데이터로 사전학습**한 뒤, 실제 시장 $X_t$만 주면 **RPN 형태의 알파 공식을 즉시 생성**합니다. 한 번 시장의 문법을 몸에 익힌 뒤, 새 주방에서도 재료만 보면 요리를 내는 셰프에 가깝습니다.\n\n**맞춤 비유: 매번 레시피를 발명하는 로봇 vs 만능 레시피를 외운 마스터 셰프**\n\n기존 GP/RL 심볼릭 회귀는 **새 시장(새 주방)**에 갈 때마다 소금·설탕 비율을 무작위로 섞으며 맨땅에서 레시피를 찾는 로봇입니다. AlphaFormer는 **수많은 가짜 주방(합성 데이터)**에서 연습해 재료 조합의 문법을 익힌 뒤, 실전 재료 $X_t$만 보고 **즉석에서 공식(알파 팩터)**을 완성합니다. 블랙박스에 기대지 않으면서도, 탐색 비용은 크게 줄이는 방향입니다.","1":"$2d","2":"$2e","3":"$2f","4":"**[실험 및 결과]**\n\n논문이 강조하는 포인트를 실무 언어로 옮기면 다음과 같습니다.\n\n- **탐색 효율:** 강한 베이스라인 대비 **훨씬 적은 수의 후보 팩터**(예: 대략 3분의 1 수준의 생성 부담)로도 CSI300·CSI500에서 **IC·Rank IC를 앞서거나 최고권**에 들어갑니다. 즉 \"바늘구멍을 더 넓게\" 만든 게 아니라 **바늘을 들고 있는 손이 더 정확해진** 겁니다.\n- **추론 효율:** 추론 시 **추가적인 대규모 파라미터 업데이트 없이** 공식 생성·평가 파이프라인이 돌아간다는 점은, 실시간·준실시간 시그널 환경에서 중요합니다.\n- **일반화:** 합성 데이터를 **단일 생성기가 아니라 여러 아키텍처로 앙상블**할 때 IC가 크게 오릅니다. 더 흥미로운 것은 **중국 시장으로 사전학습한 모델을 미국 S&P500에 zero-shot**으로 옮겨도 경쟁력이 있다는 점 — 특정 거래소의 잡음만 외운 게 아니라 **연산·시계열 문법**을 어느 정도 일반화했다는 신호로 읽을 수 있습니다.\n\n**실무 해석:** 팩터 마이닝 비용(GPU 시간·실험 횟수)을 줄이면서도 설명 가능한 공식을 얻고 싶은 팀에게, \"사전학습 + 제한된 RL 미세조정\"은 **MLOps 관점에서 매력적인 타협점**입니다.","5":"**[결론 및 한계점]**\n\n**최종 의의 및 실무 활용 가치 (3가지 이내)**\n\n1. **자동화된 화이트박스 시그널:** 출력이 RPN/연산 트리이므로 리스크·컴플라이언스 팀과 **공식 문자열 그대로** 소통하기 쉽습니다.\n2. **탐색 예산 절감:** 사전학습이 \"시장 문법\"을 압축해 두어, 새 데이터에서 **처음부터 GP를 풀가동**하지 않아도 됩니다.\n3. **엔드투엔드 파이프라인:** 생성–선형결합–IC 평가–(필요 시) PPO가 한 흐름으로 묶여, 실험 재현성과 배포 스크립트가 단순해집니다.\n\n**한계점 (Future Work)**\n\n- **하드웨어 의존:** 논문 설정처럼 **GPU 중심** 학습·추론이 전제라, CPU-only 레거시 환경에는 맞지 않을 수 있습니다.\n- **시장 레짐:** Zero-shot이 인상적이지만, 극단적 구조 변화(규제·거래 정지·유동성 붕괴)에서는 **재학습·도메인 적응**이 여전히 필요할 수 있습니다.\n- **라벨·누수 설계:** IC는 라벨 정의(미래 수익 창, 공정한 시점 정렬)에 민감합니다. 좋은 생성기보다 **깨끗한 라벨 파이프라인**이 없으면 성능이 허상이 됩니다."},"visualPlanTitle":"도식화 기획: 통제 불능 탐색 vs 정밀 생성","visualPlan":"왼쪽은 **공식 탐색 공간**에 찍힌 무수한 시도(점)와 **목표(IC)에 닿지 못하는 들쭉날쭉한 궤적**으로 GP/RL의 맨땅 헤딩을 표현합니다. 오른쪽은 **합성 시계열 → 사전학습 → 토큰 시퀀스 생성 → IC/풀**로 이어지는 **한 줄 파이프라인**으로 AlphaFormer의 엔드투엔드 흐름을 보여 줍니다.","visualLegacyTitle":"기존: GP / RL 심볼릭 탐색","visualLegacyBody":"데이터셋이 바뀔 때마다 처음부터 넓게 찍어보고, 후보 팩터 수가 많아도 IC는 들쭉날쭉합니다.","visualProposedTitle":"제안: AlphaFormer","visualProposedBody":"합성 시계열로 문법을 익힌 뒤 적은 생성으로 IC 궤적이 안정적으로 올라가고, zero-shot 전이도 가능해집니다.","visualAxisStart":"시도 1","visualAxisEnd":"시도 N","visualLegacyCurveLabel":"무작위 탐색","visualProposedCurveLabel":"사전학습 생성","visualContributionLabel":"누적 효율","visualLegacyBadgeLabel":"과다 탐색","visualProposedBadgeLabel":"적은 팩터·높은 IC","summary":"AlphaFormer는 \"매 시장마다 처음부터 심볼릭 탐색\"을 \"**문법 사전학습 + 안전한 RL 미세조정**\"으로 바꿉니다. 선형 풀·L1·IC·PPO는 각각 **믹서, 가위, 심사위원, 안전벨트**처럼 역할이 나뉘어 있어, 수식이 길어도 한 장의 플로우로 기억할 수 있습니다. GPU 의존과 라벨 품질이라는 현실 제약은 염두에 두고, PoC부터 점진적으로 도입하는 것이 좋습니다."},"paperReviewPolarQuant":{"sectionTitle":"배우기 / 논문 리뷰 / 모델 최적화·경량화 / PolarQuant: Quantizing KV Caches with Polar Transformation","title":"Chapter 1: PolarQuant: Quantizing KV Caches with Polar Transformation","description":"긴 컨텍스트 LLM의 병목은 종종 파라미터가 아니라 **KV 캐시 메모리**입니다. PolarQuant는 이 병목을 정면으로 겨냥해, 랜덤 전처리 후 벡터를 **극좌표계로 바꾸고 각도만 짧게 저장**함으로써, 예전 방식처럼 **“원래 숫자로 되돌리는 부가 정보”를 계속 달고 다니는 부담**을 크게 줄입니다. 이 글은 논문의 정리와 수식을 천천히 풀어, 왜 각도 분포가 $\\pi/4$ 근방에 몰리고 왜 그 덕분에 초저비트 양자화가 가능한지를 실무 관점까지 연결해 설명합니다.","viewOriginalPdf":"원문 논문 PDF 보기","coreFlow":{"0":"$30","1":"$31","2":"$32","3":"$33","4":"$34","5":"**[결론 및 한계점]**\n\n**최종 의의 및 실무 활용 가치**\n\n1. PolarQuant는 \"양자화하려면 정규화 메타데이터를 반드시 저장해야 한다\"는 통념을 깨고, **극좌표 각도 양자화**라는 다른 좌표계를 제안했습니다.\n2. 긴 컨텍스트 서빙에서 가장 아픈 부분인 KV 캐시 메모리를 직접 겨냥하므로, 실제 서비스 비용과 최대 문맥 길이에 곧바로 영향을 줍니다.\n3. 어텐션 수식을 갈아엎지 않고 캐시 표현만 바꾸기 때문에, 추론 시스템 최적화 파이프라인에 현실적으로 끼워 넣기 좋습니다.\n\n**한계점 (Future Work)**\n\n- 코드북 생성은 아직 K-means류 절차에 기대는 부분이 있어, 분포식을 직접 활용하는 더 빠른 closed-form 설계가 남아 있습니다.\n- 논문의 강점은 장문맥 KV 캐시에 최적화되어 있으므로, 가중치 양자화나 activation 양자화로 그대로 일반화하려면 추가 검증이 필요합니다.\n- 랜덤 전처리와 복원 커널을 실제 서비스 스택에 넣을 때는 CUDA kernel 최적화, packing layout, batch별 병렬화 전략이 성능을 크게 좌우할 수 있습니다.","6":"**[도식화 기획] 극명한 대비 시각화**\n\n왼쪽 패널은 기존 블록 양자화를 보여 줍니다. 블록마다 값 범위가 제각각이고, 그 옆에 **복구용 보조 숫자**가 계속 붙어 저장비가 불어나는 그림입니다. 붉은 점선 궤적은 메모리를 줄이려 할수록 오히려 그 보조 정보가 발목을 잡는 상황을 상징합니다.\n\n오른쪽 패널은 PolarQuant 파이프라인입니다. 랜덤 전처리로 벡터를 부드럽게 섞고, 극좌표계에서 반지름 하나와 각도들을 뽑아 저장합니다. 상위 레벨 각도가 $45^\\circ$ 근방으로 몰리는 모습을 초록색 집중 구간으로 표현해, 왜 적은 비트로도 안정적으로 표현되는지를 시각적으로 보여 줍니다."},"visualPlanTitle":"KV 저장 흐름 비교","visualPlan":"기존은 블록마다 FP16 메타가 누적되고, PolarQuant는 r·각도로 정리합니다.","visualLegacyTitle":"블록 양자화","visualLegacyBody":"블록마다 ‘원래 값으로 되돌리는’ 보조 숫자가 따로 필요해, 비트는 줄어도 부담이 남습니다.","visualProposedTitle":"PolarQuant","visualProposedBody":"랜덤 전처리 후 극좌표로 바꾸고, 분포가 집중되는 각도만 양자화해 메모리를 더 가볍게 만듭니다.","visualAxisStart":"기존 방식","visualAxisEnd":"PolarQuant","visualLegacyCurveLabel":"메타데이터 부담 ↑","visualProposedCurveLabel":"저장 부담 ↓","visualContributionLabel":"메모리 효율","visualLegacyBadgeLabel":"+FP16 메타 / 블록","visualProposedBadgeLabel":"r + θ codebook","visualGlossary":{"title":"도표 기호, 이렇게 읽으면 됩니다","items":[{"term":"FP16","hint":"**반정밀도** 부동소수점(16비트). FP32보다 비트가 절반이라 같은 개수를 넣으면 메모리도 대략 절반, 다만 표현 눈금은 조금 거칠 수 있습니다."},{"term":"양자화","hint":"연속 실수를 **아주 짧은 정수 코드**로 맞춰 저장하는 일입니다. 나중에 쓰려면 **복원(역양자화)**과, 블록마다 **범위를 알려 주는 보조 숫자**가 필요할 때가 많습니다."},{"term":"KV","hint":"이전 토큰의 Key·Value를 담아 둔 캐시 벡터 한 덩어리입니다."},{"term":"INT4","hint":"숫자를 아주 짧게(4비트)만 적어 둔 값입니다. 그대로는 쓰기 어려워 보조 정보가 필요합니다."},{"term":"+meta / FP16","hint":"짧게 적어 둔 숫자를 원래 크기로 되돌리기 위해 붙이는 **추가 숫자들**. 보통 **정밀한 형식(예: FP16)**으로 따로 저장됩니다."},{"term":"× N","hint":"블록이 N개면 메타데이터도 비슷하게 N번 반복된다는 뜻입니다."},{"term":"S","hint":"벡터 좌표를 한 번 섞어 주는 랜덤 전처리 행렬입니다. 이후 극좌표로 바꾸기 쉽게 만듭니다."},{"term":"r","hint":"극좌표에서 반지름, 즉 벡터 전체의 크기(길이)입니다."},{"term":"θ","hint":"각도, 즉 방향입니다. 긴 실수 대신 코드북에서 몇 번째인지만 저장합니다."},{"term":"codebook","hint":"자주 나오는 각도 후보를 적어 둔 표입니다. 팔레트 번호만 저장해 비트를 아낍니다."}]},"summary":"PolarQuant의 아름다움은 **문제를 다른 좌표계로 옮겼다**는 데 있습니다. 기존 방법이 좌표축 위 숫자를 억지로 잘랐다면, PolarQuant는 랜덤 전처리로 분포를 정리한 뒤 길이와 방향으로 나누어 저장합니다. 그래서 정규화 오버헤드를 없애고도 장문맥 품질을 지키며, KV 캐시가 진짜 병목인 환경에서 특히 큰 가치를 냅니다."},"paperReviewAutomlAgent":{"sectionTitle":"배우기 / 논문 리뷰 / 자동 머신러닝 및 ML 파이프라인 / ICML 2025 / AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML","title":"AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML","description":"AutoML-Agent는 “AutoML을 자동으로”를 넘어, 데이터 검색부터 전처리, 모델 설계, HPO, 코드 생성과 배포까지 **풀 파이프라인을 끝까지** 끌고 가는 멀티 에이전트 LLM 프레임워크입니다. 이 글은 논문의 핵심 수학적 포맷(입력→계획→분해→실행→검증)을 읽기 쉽도록 한 줄씩 해부합니다.","viewOriginalPdf":"원문 PDF 보기","coreFlow":{"0":"**[초록 & 서론] 3줄 요약 + 문제 제기**\n\n**핵심 3줄 요약:**\n\n- **치명적 문제:** 기존 AutoML은 “자동”이라는 목표와 달리 실제로는 데이터 수집→전처리→모델 설계→HPO→코드 생성→배포까지 이어지는 설정과 조정이 많습니다. 그래서 전문가가 아니면 파이프라인을 구성하고 실행 조건을 맞추는 것 자체가 어렵고, 작은 불일치가 전체 실행 실패로 번지기 쉽습니다.\n- **전통적 한계:** LLM 기반 방식은 대개 파이프라인의 일부만 돕거나(예: 전처리 제안만, 모델 선택만), 계획을 한 번만 만들고 끝내는 경우가 많습니다. 그 결과 후보 탐색이 좁아지고, 실제 학습·실행을 반복하는 과정에서 속도와 안정성이 크게 떨어집니다.\n- **핵심 해결책:** AutoML-Agent는 데이터·모델·구현을 담당하는 역할이 분리된 **멀티 에이전트 프레임워크**로 문제를 끝까지 끌고 갑니다. 여기에 **Retrieval-Augmented Planning(RAP)**을 더해 최신 외부 지식(논문/코드/사례)을 참고해 후보 계획을 만들고, **Multi-Stage Verification**으로 실행 성공과 배포 가능성을 단계적으로 확인해 실패를 초기에 차단합니다.\n\n이제부터는 그 ‘통째로 자동화되는 과정’을 수식과 단계로 분해해 보겠습니다.","1":"$35","2":"$36","3":"$37","4":"$38","5":"**[결론 및 한계점]**\n\n**최종 의의 및 실무 활용 가치 (3가지 이내)**\n\n1. **풀 파이프라인 자동화의 기준점:** “일부만 자동화”가 아니라 검색→전처리→모델→코드→배포까지 연결한 설계 철학이 명확합니다.\n2. **멀티 에이전트 협업 + RAP:** 계획 탐색을 단발성 생성이 아니라, 외부 검색 힌트 기반 후보화로 바꿉니다.\n3. **검증으로 신뢰도 확보:** 코드가 실제로 돌아가는지/배포 가능한지에 초점을 둬서, LLM 자동화의 가장 흔한 실패(말은 되는데 코드가 깨짐)를 줄입니다.\n\n**한계점 (Future Work)**\n\n- **더 넓은 태스크 일반화:** 완전히 새로운 유형의 작업에는 skeleton/베이스 템플릿 의존이 남을 수 있습니다.\n- **백본 LLM 품질 의존:** 더 강한 LLM일수록 계획 품질과 코드 구현이 개선되는 경향이 있습니다.\n- **라벨/평가 설계 민감도:** 성능 지표(예: success rate, error/loss, 검증 기준)가 제대로 정의되지 않으면 “좋아 보이는 자동화”가 생길 수 있습니다.\n\n이제 마지막으로, 전체 오케스트레이션 흐름을 한 장 도식으로 정리합니다."},"visualPlanTitle":"[도식화] 풀 파이프라인 오케스트레이션 보드","visualPlan":"한 장의 흐름도로 정리합니다. 사용자 입력 $I$를 표준화해 $R$로 만든 뒤, **RAP**로 계획을 보강하고, **데이터·모델·코드** 단계가 분해된 작업을 병렬로 처리합니다. **멀티스테이지 검증**을 통과한 결과만 **배포** 단계로 넘어갑니다.","visualLegacyTitle":"기존 방식: 단일 플랜/순차 실행 병목","visualLegacyBody":"탐색이 길어지고, 단계 간 연결이 끊기면 코드/배포가 실패합니다. 실패가 반복되면 사용자가 디버깅을 떠안게 됩니다.","visualProposedTitle":"AutoML-Agent: RAP + 멀티 에이전트 + 멀티스테이지 검증","visualProposedBody":"요구사항을 표준화해 $R$로 만들고, 검색 증강 계획으로 후보를 생성한 뒤, 데이터/모델 에이전트를 병렬로 실행합니다. 마지막엔 검증으로 배포 가능한 결과만 남깁니다.","visualAxisStart":"자연어","visualAxisEnd":"배포","visualDiagramUserNode":"작업 지시","visualDiagramStdNode":"표준 요청","visualDiagramStdCaption":"파싱·표준화","visualLegacyCurveLabel":"비용↑ 성공↓","visualProposedCurveLabel":"성공률↑","visualContributionLabel":"Full-Pipeline 제어","visualLegacyBadgeLabel":"통제 불능","visualProposedBadgeLabel":"정밀 제어","visualDiagramData":"데이터","visualDiagramModel":"모델","visualDiagramOps":"코드·배포","visualDiagramVerify":"검증","visualDiagramShip":"배포","visualAnimPhases":["**작업 지시** — 사용자가 말로 적는 요구사항(논문의 $I$)입니다.","**표준 요청** — 도구와 검색이 읽을 수 있게 **표준 형태**로 정리한 결과(논문의 $R$)입니다.","**RAP** — 논문·코드·사례를 검색해 실행 계획 후보를 보강합니다.","**데이터** 단계 — 전처리·분할 등 입력을 준비합니다.","**모델** 단계 — 구조·학습·튜닝을 담당합니다.","**코드** 단계 — 실행 스크립트와 배포 준비까지 만듭니다.","**멀티스테이지 검증** — 실행·지표·배포 가능성을 단계마다 확인합니다.","**통과한 결과만** 최종 배포로 넘깁니다."],"datasetSectionTitle":"데이터셋 및 평가 설정","datasetSectionContent":"실험은 이미지·텍스트·정형·시계열·그래프를 포함한 벤치마크에서 수행되며, 성공률과 정규화 성능을 함께 평가합니다.","summary":"AutoML-Agent는 “자동화”를 한 조각씩이 아니라 **파이프라인 전체**로 정의하고, RAP로 계획 탐색을 가속하며, 분해된 멀티 에이전트와 멀티스테이지 검증으로 신뢰도를 잠가 둡니다. 그래서 수식이 길어도 전체 흐름은 한 문장으로 정리됩니다: **입력 표준화 → 후보 계획 생성 → 병렬 실행 → 최종 구현(배포)**."},"paperReviewSela":{"sectionTitle":"배우기 / 논문 리뷰 / 자동 머신러닝 및 ML 파이프라인 / ICLR 2025 / SELA: Tree-Search Enhanced LLM Agents for Automated Machine Learning","title":"SELA: Tree-Search Enhanced LLM Agents for Automated Machine Learning","description":"LLM 에이전트가 ML 코드를 짤 때 **다양성 부족·반복에도 불구하고 비최적**인 경우가 많고, 전통 AutoML은 **고정 파이프라인**에 갇혀 유연성이 떨어집니다.\n\n**MCTS**(몬테카를로 트리 탐색)는 실험·결정을 **트리**로 펼쳐 두고, 시뮬레이션(롤아웃)과 **검증 점수**로 **다음에 어느 가지를 시도할지** 정하는 탐색 방법입니다. **UCT-DP**는 트리에서 **다음 노드를 고를 때 쓰는 점수(UCT)**를 논문이 고친 것으로, **학습·실행처럼 비용이 큰 깊은 단계**가 **얕은 쪽만 훑는 탐색**에 밀리지 않도록 돕습니다.\n\n**SELA**는 파이프라인을 이런 **트리**로 두고 **MCTS**로 실험 순서를 정하며, **UCT-DP**로 깊은 단계를 우선 탐색합니다. 아래에서는 **논문에 나온 식은 그대로 두되**, 각 블록마다 **쉬운 말 요약**을 먼저 붙였습니다.","viewOriginalPdf":"원문 PDF 보기 (arXiv)","chapter1Lead":"# Chapter 1: SELA와 트리 탐색 기반 AutoML\n\n앞에서 설명한 내용과 같습니다. MCTS는 트리 위에서 롤아웃과 검증 점수로 다음에 시도할 가지를 고르는 방법이고, UCT-DP는 다음 노드를 고를 때 쓰는 UCT 식을 논문이 바꾼 것으로, 학습·실행처럼 비용이 큰 깊은 단계가 얕은 탐색에 밀리지 않도록 합니다.","mctsIntroTitle":"몬테카를로 트리 탐색(MCTS)이란?","mctsIntroDescription":"**쉬운 요약:** 앞으로 할 실험·결정을 **트리**에 그려 두고, 같은 네 단계를 계속 돌립니다.\n\n- **① 고르기(선택):** UCT 같은 규칙으로 **다음에 어느 노드**로 갈지 정해요.\n\n- **② 늘리기(확장):** 아직 없던 **새 자식 노드**(새 시도)를 트리에 붙여요.\n\n- **③ 시뮬(롤아웃):** 그 가지에서 코드를 돌리거나 시뮬해서 **검증 점수**를 얻어요.\n\n- **④ 올리기(역전파):** 그 점수를 **부모·조상 노드**로 올려서 방문 횟수·평균 점수를 갱신해요.\n\nSELA는 LLM이 제안한 파이프라인 가지를 **이 네 단계**로 검증 점수와 함께 탐색합니다.\n\n**UCT란?** (Upper Confidence Bound를 트리에 적용한 것) 형제 자식 노드 중 **다음에 어느 쪽으로 갈지** 고를 때 쓰는 점수식입니다. **지금까지 평균이 좋았던 가지**(잘 쓰기·활용)와 **아직 덜 가본 가지**(더 보기·탐험)를 **한 식 안에서** 섞어서, 숫자 비교로 다음 노드를 고릅니다. 논문의 **UCT-DP**는 이 UCT를 조금 바꿔 **깊은 학습·실행 단계**가 얕은 쪽만 훑는 데 밀리지 않게 합니다.","mctsPhaseRowTitle":"네 단계 (한 사이클)","mctsPhase1":"① 고르기","mctsPhase2":"② 늘리기","mctsPhase3":"③ 시뮬","mctsPhase4":"④ 올리기","mctsSvgRoot":"루트","mctsSvgLeft":"가지 A","mctsSvgRight":"가지 B","mctsSvgLeaf":"롤아웃","mctsSvgScore":"검증 점수 s","mctsCaption":"보라 점선은 “이번에 고른 경로” 예시입니다. 여러 번 반복되면 가지마다 점수가 쌓입니다.","coreFlow":{"0":"### [초록 & 서론] 3줄 요약 + 문제 제기\n\n**3줄 요약**\n\n- **기존 LLM 에이전트의 한계:** 코드 생성이 **다양성이 낮고**, 여러 번 시도해도 **최적에 가깝게 수렴하지 못하는** 경우가 많습니다.\n- **전통 AutoML의 한계:** Auto-sklearn 등 **고정 파이프라인·탐색 템플릿**에 가까워, 데이터·문제가 바뀔 때 **동적으로 파이프라인을 재구성**하기 어렵습니다.\n- **SELA의 핵심:** 파이프라인 구성을 **트리**로 표현하고 **몬테카를로 트리 탐색(MCTS)**으로 실험 순서를 정하며, **실험 점수 피드백**으로 다음 가지를 고릅니다. **UCT-DP**는 학습 비용이 큰 깊은 노드를 **얕은 탐색만 훑는 것보다 우선**하도록 UCT를 수정한 변형입니다.\n\n**맞춤 비유:** 모터스포츠에서 **공장 정비 매뉴얼 순서만** 밟는 것은 전통 AutoML에 가깝고, **서스펜션·엔진 맵·타이어압을 한꺼번에 바꾼 뒤 랩을 한 번만 돌고 끝내는** 방식은 단발성 LLM 생성에 가깝습니다. SELA는 **구간별 랩 타임과 텔레메트리를 보며**(검증 점수) **다음에 무엇을 손볼지 가지를 나눠 비교하는** 레이스 엔지니어에 가깝습니다.","1":"# Chapter 2: 배경 지식 — 본문 수식을 읽기 위한 다섯 가지\n\n### [배경 지식] 꼭 필요한 기초 개념\n\n- **AutoML:** 사람 개입을 줄이면서 전처리·모델·하이퍼파라미터 등을 **자동으로** 맞추려는 흐름 전체를 가리킵니다. “한 번에 끝”이 아니라 **시도–측정–수정**이 반복될 수 있습니다.\n\n- **LLM 에이전트:** 자연어로 받은 문제 설명과 데이터 요약을 바탕으로 **코드를 생성·실행**하는 구성입니다. SELA에서는 **계획(플랜)**과 **코드/실행**이 단계적으로 나뉩니다.\n\n- **탐색 공간(Search space):** 한 데이터셋·태스크에 대해 시도할 수 있는 **전처리·모델·하이퍼파라미터 조합**의 집합입니다. 조합 수가 폭발하므로 **무작정 전수 탐색**은 불가능에 가깝습니다.\n\n- **MCTS:** 게임(AlphaGo류)에서 쓰이듯, **트리 위에서 무작위 롤아웃과 통계**를 섞어 **유망한 가지**를 고르는 알고리즘입니다. **탐험(exploration)**과 **활용(exploitation)**의 균형이 핵심입니다.\n\n- **탐험 vs 활용:** 아직 적게 방문한 노드를 더 볼지(탐험), 이미 평균 보상이 좋은 노드를 깊게 갈지(활용)를 **한 수식 안에서 동시에** 조절합니다. SELA의 UCT-DP는 여기에 **“깊은 학습 단계 우선”**이라는 제약을 더합니다.","2":"$39","3":"$3a","4":"# Chapter 5: 실험 및 결과\n\n### [실험 및 결과]\n\narXiv 초록 기준, **20개 머신러닝 데이터셋**에서 전통적·에이전트 기반 AutoML과 비교했을 때, SELA는 **각 베이스라인 대비 약 65%~80% 구간에서 승률**을 보고합니다. 이는 “대부분 설정에서 SELA 쪽이 더 나은 정규화 성능을 자주 가져간다”는 **강한 일관성**을 시사합니다.\n\n추가로 논문은 **MCTS vs 무작위 탐색**에서 MCTS가 **더 높은 점수**를 내고, **롤아웃(시뮬레이션) 횟수를 늘릴수록** 성능이 **꾸준히 개선**되는 경향을 보입니다. 실무적으로는 **탐색 예산**(시간·API 호출)을 늘릴 때 **수확 체감**이 어디서 오는지 모니터링하기 좋습니다.\n\n**해석:** 고정 파이프라인만 쓰기엔 문제가 다양하고, LLM만 한 번 돌리기엔 **반복 개선**이 부족할 때, **트리 + 피드백**은 “실험 설계” 자체를 학습 가능한 객체로 만듭니다.","5":"# Chapter 6: 결론, 한계, 도식화 가이드\n\n### [결론 및 한계점]\n\n**최종 의의 및 실무 활용 가치 (3가지 이내)**\n\n1. **베이스라인 자동화:** 새 데이터셋에 대해 **사람이 파이프라인을 일일이 고르지 않고**도 강한 출발점을 찾을 수 있습니다.\n2. **캐싱·재실행:** 이전 롤아웃의 코드·중간 산출물을 저장하면 **API·GPU 비용**을 줄일 수 있습니다.\n3. **추적 가능성:** 트리에 **어떤 분기를 탔는지**가 남아, “왜 이 모델 조합이 되었는지”를 **로그로 설명**하기 쉽습니다.\n\n**한계점 (Future Work)**\n\n- **다른 순차 의사결정 영역**(로보틱스, 소프트웨어 공학 등)으로의 일반화는 추가 연구가 필요합니다.\n- 탐색 공간이 매우 커질 때 **샘플 효율**을 더 끌어올릴 여지가 있습니다.\n- 트리·MCTS 자체의 **설명 가능성**을 사용자에게 더 전달하려면 UI·로그 설계가 따로 필요합니다.\n\n### [도식화] 요약\n\n- **기존:** 선형·단발 흐름 — 피드백이 약하면 목표 성능까지 잘 안 이어질 수 있음.\n- **SELA:** 트리 위에서 **MCTS·UCT-DP**로 분기하고 **검증 점수**로 갱신 — 같은 화면의 **좌·우 패널**로 대비만 표시합니다."},"visualPlanTitle":"한눈에 보는 대비","visualPlan":"**왼쪽:** 고정 순서·단발 생성으로 피드백이 약할 수 있음. **오른쪽:** 트리 탐색으로 검증 점수를 반영해 가지를 고름. 아래는 **요약 도식**만 표시합니다.","visualLegacyTitle":"기존: 고정 파이프라인·단발 생성","visualLegacyBody":"한 번에 전체를 짜거나 규칙만 따르면 피드백 루프가 약하고, 시도 점들이 목표 성능으로 수렴하지 않을 수 있습니다.","visualProposedTitle":"SELA: 트리 탐색 + UCT-DP","visualProposedBody":"단계별로 가지를 나누고 검증 점수로 평균 보상을 갱신하며, 깊은 학습 단계를 우선할 여지를 둡니다.","visualAxisStart":"시작","visualAxisEnd":"목표 성능","visualLegacyCurveLabel":"산만한 시도 궤적","visualProposedCurveLabel":"트리 위 수렴","visualContributionLabel":"실험 난이도 축","visualLegacyBadgeLabel":"통제 어려움","visualProposedBadgeLabel":"정밀 실험","visualLegacyTemplateLabel":"고정 AutoML 템플릿 (순서·연산자 고정)","visualLegacyStageFe":"FE·전처리","visualLegacyStageModel":"모델","visualLegacyStageTrain":"학습·검증","visualLegacyDeadEndHint":"태스크 불일치 → 막다름","visualLegacyOneshotLabel":"단발 LLM: 전체 파이프라인 코드 σ를 한 번에 생성","visualLegacyOpenLoopLabel":"검증 점수 s가 다음 분기(Λ) 설계로 충분히 되돌아가지 않음","visualProposedInsightLabel":"Insight 후보 Λ (LLM)","visualProposedPrunedLabel":"UCT 낮음·탐색 제외","visualProposedFeedbackLabel":"검증 s → v(x), n 갱신","visualProposedCacheLabel":"코드 σ·중간 산출 캐시","visualProposedUctDpLabel":"UCT-DP: 깊은 학습 노드 우선","visualProposedRolloutLabel":"MCTS 롤아웃·시뮬레이션","visualProposedBestScoreLabel":"목표에 가까운 점수","visualSvgLabelPrep":"데이터 준비","visualSvgLabelModel":"모델 선택","visualSvgLabelTrain":"학습·평가","visualSvgLabelStuck":"여기서 막힘","visualSvgLabelOneShot":"한 번에 만든 코드","visualSvgLabelLowVal":"검증 점수 낮음","visualSvgLabelStart":"출발","visualSvgLabelSkip":"덜 좋은 가지","visualSvgLabelAvg":"지금까지 평균","visualSvgLabelDone":"목표 근처","visualSvgFeedbackLine":"검증 점수가 위로 전달됨","summary":"SELA는 **LLM이 만든 아이디어를 트리 위에서 MCTS로 배치**하고, **UCT-DP**로 학습 같은 **비싼 단계**를 헛돌지 않게 돕습니다. **NS**는 “여러 데이터셋 점수를 같은 방향 숫자로 맞추기”, **Rescaled NS**는 “SELA 점수를 1로 두고 다른 방법과 **몇 배**인지 보기”로 이해하면 됩니다. 캐싱과 로그는 **비용·설명**을 담당합니다. 한 줄로는 **“피드백 있는 실험이 곧 탐색이다”**입니다."},"mlChapters":{"mlSectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","problemSolving":"정리"},"mlKnnProblemSolvingLabel":"문제 풀이를 위한 설명","mlKnnVisualIntro":"새 데이터(?)에 가장 가까운 K=3개 이웃을 고른 뒤, 그들의 라벨로 다수결해 예측합니다.","mlKnnVisualCaption":"점선 원: 거리 순. K=3 이웃(보라) 라벨: 1, 2, 2 → 다수결 2","mlKnnVisualStep0":"① 학습 데이터 — 특성 공간의 점들 (라벨 1 또는 2)","mlKnnVisualStep1":"② 새 데이터(?) 등장 — 이 점의 라벨을 예측합니다","mlKnnVisualStep2":"③ 가장 가까운 K=3개까지 거리(점선 원)로 확인","mlKnnVisualStep3":"④ K=3 이웃 연결 — 가까운 순서로 선으로 표시","mlKnnVisualStep4":"⑤ 다수결: 라벨 1, 2, 2 → 예측 2","mlLinearRegressionVisualIntro":"데이터 점에 가장 잘 맞는 직선 $\\hat y = w x + b$를 찾습니다.","mlLinearRegressionVisualStep0":"① 학습 데이터 — (x, y) 산점도","mlLinearRegressionVisualStep1":"② 잘못된 초기 직선 — 경사 하강 전","mlLinearRegressionVisualStep2":"③ 직선이 학습되며 최적 위치로 이동","mlLinearRegressionVisualStep3":"④ 학습 완료 — 새 입력 $x$로 $\\hat y$ 예측","mlLinearRegressionVisualCaption":"$$y \\approx 0.7x + 1.1$ — 경사 하강법으로 $w$, $b$ 학습","mlLinearRegressionVisualLearningBadge":"학습 중...","mlLinearRegressionVisualPlay":"직선 학습 과정 보기","mlLinearRegressionVisualReplay":"다시보기","mlLinearRegressionProblemSolvingLabel":"문제 풀이를 위한 설명","mlMseVisualIntro":"**회귀 손실 예시:** 예측값 $\\hat y$와 실제값 $y$의 오차를 제곱해 평균 낸 것이 MSE입니다. (분류에서는 크로스엔트로피를 씁니다.)","mlMseVisualStep0":"① 데이터 점과 예측 직선 $\\hat y = w x + b$","mlMseVisualStep1":"② 각 점에서 직선까지의 오차(잔차) 막대","mlMseVisualStep2":"③ 오차 제곱 $(y_i - \\hat y_i)^2$ 시각화","mlMseVisualStep3":"④ MSE $= \\frac{1}{n}\\sum_i (y_i - \\hat y_i)^2$","mlMseVisualCaption":"MSE $= \\frac{1}{n}\\sum_i (y_i - \\hat y_i)^2$ — 손실이 작을수록 직선이 데이터에 잘 맞습니다.","mlMseVisualSquaresLabel":"오차 제곱 = 넓이 (한 변 = |잔차|)","mlMseProblemSolvingLabel":"문제 풀이를 위한 설명","mlLogisticProblemSolvingLabel":"문제 풀이를 위한 설명","mlDecisionTreeProblemSolvingLabel":"문제 풀이를 위한 설명","mlDecisionTreeVisualIntro":"루트에서 질문(조건)에 따라 예/아니오로 가지를 따라 내려가면 리프에서 예측값을 얻습니다.","mlDecisionTreeVisualStep0":"① 루트 노드 — 첫 번째 질문(예: 특성 $x_1 \\le 3$?)","mlDecisionTreeVisualStep1":"② 예(1) / 아니오(0)에 따라 왼쪽·오른쪽 자식으로 이동","mlDecisionTreeVisualStep2":"③ 내부 노드에서 질문 반복","mlDecisionTreeVisualStep3":"④ 리프 노드 — 더 이상 나누지 않고 예측 클래스 또는 값 출력","mlDecisionTreeVisualPathCaption0":"① 루트 노드 — 첫 번째 질문을 던집니다. 예/아니오에 따라 가지로 내려갑니다.","mlDecisionTreeVisualPathCaption1":"④ 경로 따라가기: 예(1) → 리프 0","mlDecisionTreeVisualPathCaption2":"⑤ 경로 따라가기: 아니오(0) → 리프 1","mlDecisionTreeVisualStep0Description":"① 루트 노드 — 첫 질문에서 예/아니오로 갈라져 왼쪽·오른쪽 가지로 내려갑니다.","mlDecisionTreeVisualLabelRoot":"루트","mlDecisionTreeVisualLabelYes":"예(1)","mlDecisionTreeVisualLabelNo":"아니오(0)","mlDecisionTreeVisualLabelQuestion":"질문","mlDecisionTreeVisualLabelLeaf0":"리프 0","mlDecisionTreeVisualLabelLeaf1":"리프 1","mlDecisionTreeVisualDiagramAriaLabel":"의사결정나무 구조: 루트-질문-리프","mlLogisticVisualIntro":"선형 점수 $z$가 클수록 $\\sigma(z)$가 1에 가까워져 class 1로 분류됩니다. $z=0$이 결정 경계입니다.","mlLogisticVisualCaption":"시그모이드 공식: $\\sigma(z) = \\frac{1}{1+e^{-z}}$. $z>0$이면 $\\hat y=1$, $z \\le 0$이면 $\\hat y=0$.","mlLogisticVisualFormulaExplain":"**수식 읽는 법** — $z$가 크게 음수면 $e^{-z}$가 커져 $\\sigma(z) \\approx 0$. $z=0$이면 $\\sigma(0)=0.5$. $z$가 크게 양수면 $e^{-z} \\approx 0$이라 $\\sigma(z) \\approx 1$. 즉 어떤 $z$든 0과 1 사이 확률로 눌러 넣는 공식입니다.","mlLogisticVisualXAxisLabel":"z (선형 점수)","mlLinearRegressionProblemSolvingTable":"$3b","mlKnnProblemSolvingTable":"**알고리즘 단계**\n\n- **입력** — 새 데이터의 특성 벡터 $\\mathbf{x}$\n- **저장된 데이터** — (특성, 라벨) 쌍들 $(\\mathbf{x}_i, y_i)$\n- **1단계** — $\\mathbf{x}$와 모든 $\\mathbf{x}_i$ 사이의 거리 $d(\\mathbf{x}, \\mathbf{x}_i)$ 계산\n- **2단계** — 거리가 작은 순으로 K개 선택\n- **3단계 (분류)** — K개의 라벨 중 **다수결**로 예측 $\\hat y$ 결정\n- **3단계 (회귀)** — K개의 $y_i$ 값의 **평균**을 예측 $\\hat y$ 로 사용","mlEnsembleVisualIntro":"여러 모델(나무)의 예측을 투표 또는 평균으로 합쳐 최종 예측을 냅니다.","mlEnsembleVisualStep0":"① 훈련 데이터에서 부트스트랩 샘플을 뽑아 여러 나무를 학습","mlEnsembleVisualStep1":"② 각 나무가 독립적으로 예측","mlEnsembleVisualStep2":"③ 분류: 다수결, 회귀: 평균 → 최종 예측","mlEnsembleVisualStep3":"④ 최종 예측이 결정됩니다","mlEnsembleVisualLabelData":"데이터","mlEnsembleVisualLabelVote":"투표/평균","mlEnsembleVisualLabelPrediction":"예측","mlEnsembleVisualLabelTree1":"나무1","mlEnsembleVisualLabelTree2":"나무2","mlEnsembleVisualLabelTree3":"나무3","mlEnsembleVisualAriaLabel":"앙상블 흐름: 데이터 → 나무들 → 투표/평균 → 예측","mlKmeansProblemSolvingLabel":"문제 풀이를 위한 설명","mlKmeansVisualIntro":"가장 가까운 중심에 점을 묶고, 중심을 소속 점들의 평균으로 옮기며 반복합니다.","mlKmeansVisualStep0":"① 데이터 — 라벨 없는 점들이 특성 공간에 흩어져 있음","mlKmeansVisualStep1":"② K개 중심 초기화 — 군집 개수 K만큼 중심(세모)을 둠","mlKmeansVisualStep2":"③ 할당 — 각 점을 가장 가까운 중심에 배정(색으로 구분)","mlKmeansVisualStep3":"④ 중심 갱신 — 각 군집의 점들 좌표 평균으로 중심을 옮김","mlKmeansVisualStep4":"⑤ 반복 — 할당과 갱신이 바뀌지 않을 때까지 반복","mlKmeansVisualCaption":"K-Means: 할당 → 갱신을 반복해 SSE(왜곡)를 줄입니다.","mlKmeansVisualAriaLabel":"K-평균 흐름: 데이터 → 초기 중심 → 할당 → 갱신 → 수렴","mlKmeansVisualMeanLabel":"평균","mlKmeansVisualPointDataLabel":"점: 데이터","mlKmeansVisualLineCaption":"선: 각 점이 속한 중심(μ)까지","mlKmeansVisualCenterMoveCaption":"중심이 군집 평균으로 이동","mlCrossValidationProblemSolvingLabel":"문제 풀이를 위한 설명","mlCrossValidationVisualIntro":"데이터를 훈련/검증/테스트로 나누고, K-Fold에서는 번갈아 검증해 평균으로 성능을 추정합니다.","mlCrossValidationVisualTitle":"① 5-Fold","mlCrossValidationVisualFoldLabel":"Fold {n}","mlCrossValidationVisualTrainLabel":"훈련","mlCrossValidationVisualValLabel":"검증","mlCrossValidationVisualScoreLabel":"검증 점수","mlCrossValidationVisualMeanLabel":"평균 μ","mlCrossValidationVisualStep0":"① 전체 데이터 — 모델이 학습·검증할 샘플 집합","mlCrossValidationVisualStep1":"② Train/Val/Test 분할 — 훈련으로 학습, 검증으로 튜닝, 테스트로 최종 평가","mlCrossValidationVisualStep2":"③ K-Fold — 데이터를 K개로 나누어 한 부분씩 검증 집합으로 쓰고 나머지로 학습","mlCrossValidationVisualStep3":"④ Fold별 검증 점수 — 각 Fold에서 한 번씩 검증해 $S_1, S_2, \\ldots, S_K$ 얻음","mlCrossValidationVisualStep4":"⑤ 평균 $\\bar{S} = \\frac{1}{K}\\sum_{k=1}^K S_k$ — 최종 성능 추정","mlCrossValidationVisualCaption":"교차 검증: 모의고사(검증)로 실력 추정, 수능(테스트)로 최종 확인.","mlCrossValidationVisualAriaLabel":"교차 검증 흐름: 데이터 → 분할 → K-Fold → Fold별 점수 → 평균","mlCrossValidationProblemPrompt":"아래 지시를 읽고 빈 칸 (?)에 정답을 입력하세요.","mlCrossValidationProblemPromptDefinition":"다음 설명이 맞으면 **참**, 틀리면 **거짓**을 고르세요.\n\n{statement}","mlCrossValidationProblemPromptDefinitionChoice":"{question}","mlCrossValidationProblemPromptHoldoutTrain":"데이터 {n}개를 훈련 비율 {trainRatio}로 나눌 때 훈련 개수는? (정수)","mlCrossValidationProblemPromptHoldoutTest":"데이터 {n}개를 훈련 비율 {trainRatio}로 나눌 때 테스트 개수는? (정수)","mlCrossValidationProblemPromptKfoldSize":"데이터 {n}개를 {K}-Fold로 나눌 때 한 Fold(검증 집합)의 크기는? (몫, 정수)","mlCrossValidationProblemPromptKfoldScoreMean":"K-Fold 검증 점수(%)가 {scores}일 때 평균(정수)을 구하세요.","mlCrossValidationProblemPromptScenario":"{scenario}","mlCrossValidationProblemPromptStratified":"{question}","mlCrossValidationStatement_0":"교차 검증은 훈련 데이터로만 채점하지 않고 검증·테스트로 나누어 성능을 추정한다.","mlCrossValidationStatement_1":"검증 집합은 모의고사처럼 하이퍼파라미터 선택이나 모델 비교에 쓴다.","mlCrossValidationStatement_2":"K-Fold에서는 데이터를 K개로 나누어 번갈아 검증하고 검증 점수의 평균을 최종 추정으로 쓴다.","mlCrossValidationStatement_3":"테스트 집합은 최종 성능 보고용으로 한 번만 사용한다.","mlCrossValidationStatement_4":"Hold-out은 데이터를 한 번만 훈련/검증(또는 훈련/테스트)으로 나누는 방법이다.","mlCrossValidationStatement_5":"과적합은 훈련 점수는 높은데 검증·테스트 점수가 낮을 때 의심한다.","mlCrossValidationStatement_6":"훈련 집합은 모델이 가중치·파라미터를 학습할 때 사용하는 데이터이다.","mlCrossValidationStatement_7":"K-Fold의 한 Fold 크기는 보통 n/K의 몫(정수)으로 둔다.","mlCrossValidationStatement_10":"검증 집합으로 학습한 뒤 그대로 최종 성능을 보고해도 된다.","mlCrossValidationStatement_11":"Hold-out이 K-Fold보다 항상 추정이 안정적이다.","mlCrossValidationStatement_12":"테스트 집합을 여러 번 사용해 모델을 고를 수 있다.","mlCrossValidationStatement_13":"훈련 데이터만으로 성능을 재면 일반화 성능을 정확히 알 수 있다.","mlCrossValidationStatement_14":"K-Fold에서 K가 크면 검증 횟수가 줄어든다.","mlCrossValidationQuestionChoice_0":"교차 검증의 주된 목적은? ① 일반화 성능 추정 ② 훈련 속도 향상 ③ 데이터 증강","mlCrossValidationQuestionChoice_1":"데이터가 적을 때 더 유리한 것은? ① Hold-out ② K-Fold ③ Stratified만","mlCrossValidationQuestionChoice_2":"모의고사에 비유되는 것은? ① 훈련 ② 검증 ③ 테스트","mlCrossValidationQuestionChoice_3":"클래스 비율을 유지하며 Fold를 나누는 것은? ① Hold-out ② 일반 K-Fold ③ Stratified K-Fold","mlCrossValidationQuestionChoice_4":"수능에 비유되는 것은? ① 훈련 ② 검증 ③ 테스트","mlCrossValidationQuestionChoice_5":"하이퍼파라미터를 고를 때 쓰는 집합은? ① 훈련 ② 검증 ③ 테스트","mlCrossValidationQuestionChoice_6":"여러 번 다른 구간으로 나누어 검증하는 것은? ① Hold-out ② K-Fold ③ 테스트만","mlCrossValidationQuestionChoice_7":"과적합을 의심할 수 있는 상황은? ① 훈련 점수 높고 검증 점수 높음 ② 훈련 점수 높고 검증 점수 낮음 ③ 훈련 점수 낮고 검증 점수 높음","mlCrossValidationScenario_0":"데이터가 1만 개 있고 한 번만 나누어 빠르게 평가하고 싶다.","mlCrossValidationScenario_1":"데이터가 500개뿐이고 여러 번 나눠서 검증 추정을 안정적으로 하고 싶다.","mlCrossValidationScenario_2":"훈련 80%, 테스트 20%로 한 번 나누고 테스트는 마지막에 한 번만 쓴다.","mlCrossValidationScenario_3":"분류 문제에서 클래스 비율이 90:10으로 불균형이라 Fold마다 비율을 맞추고 싶다.","mlCrossValidationScenario_4":"5번 번갈아 검증해 평균 정확도를 보고 싶다.","mlCrossValidationScenario_5":"한 번만 70:30으로 나누어 쓴다.","mlCrossValidationScenario_6":"검증 추정의 분산을 줄이기 위해 K번 반복 검증한다.","mlCrossValidationScenario_7":"이진 분류에서 양성 비율을 Fold마다 유지하고 싶다.","mlCrossValidationStratified_0":"Stratified K-Fold의 장점은? ① 클래스 비율 유지 ② 속도 빠름 ③ 메모리 적음","mlCrossValidationStratified_1":"분류에서 클래스가 불균형할 때 추천하는 것은? ① Hold-out만 ② Stratified K-Fold ③ 검증 생략","mlCrossValidationStratified_2":"Stratified는 주로 어떤 문제에 쓰나? ① 회귀만 ② 분류(클래스 비율 유지) ③ 군집화","mlEvaluationProblemPrompt":"아래 지시를 읽고 빈 칸 (?)에 정답을 입력하세요.","mlEvaluationProblemSolvingLabel":"문제 풀이를 위한 설명","mlEvaluationVisualIntro":"실제(행)와 예측(열)으로 2×2 혼동 행렬을 채운 뒤, 정확도·정밀도·재현율·F1을 계산합니다.","mlEvaluationVisualStep0":"① 실제 vs 예측 — 행: 실제 양성/음성, 열: 예측 양성/음성","mlEvaluationVisualStep1":"② 혼동 행렬 — TP, TN, FP, FN 네 칸 채우기","mlEvaluationVisualStep2":"③ 정확도 — (TP+TN)/전체, 전체 중 맞힌 비율","mlEvaluationVisualStep3":"④ 정밀도·재현율 — 정밀도: TP/(TP+FP), 재현율: TP/(TP+FN)","mlEvaluationVisualStep4":"⑤ F1 — 정밀도와 재현율의 조화평균","mlEvaluationVisualCaption":"혼동 행렬로 분류 모델의 성적표를 읽고, 목적에 맞는 지표를 고릅니다.","mlEvaluationVisualAriaLabel":"분류 평가: 혼동 행렬 → 정확도·정밀도·재현율·F1","mlEvaluationVisualMatrixTitle":"혼동 행렬 (2×2)","mlEvaluationVisualStepLineTP":"실제 양성 · 예측 양성 → TP","mlEvaluationVisualStepLineFN":"실제 양성 · 예측 음성 → FN","mlEvaluationVisualStepLineFP":"실제 음성 · 예측 양성 → FP","mlEvaluationVisualStepLineTN":"실제 음성 · 예측 음성 → TN","mlEvaluationVisualPredPos":"예측 양성","mlEvaluationVisualPredNeg":"예측 음성","mlEvaluationVisualActualPos":"실제 양성","mlEvaluationVisualActualNeg":"실제 음성","mlEvaluationVisualBadgeTP":"맞춘 양성 ✓","mlEvaluationVisualBadgeFN":"놓침 (실제 양성→예측 음성)","mlEvaluationVisualBadgeFP":"오탐 (실제 음성→예측 양성)","mlEvaluationVisualBadgeTN":"맞춘 음성 ✓","mlEvaluationVisualBadgeFixed":"TP·FN·FP·TN 네 칸을 구분한 뒤, 정확도·정밀도·재현율·F1을 계산합니다.","mlEvaluationProblemPromptDefinition":"다음 설명이 맞으면 **참**, 틀리면 **거짓**을 고르세요.\n\n{statement}","mlEvaluationProblemPromptDefinitionChoice":"{question}","mlEvaluationProblemPromptScenario":"{scenario}","mlEvaluationProblemPromptConfusionCount":"혼동 행렬에서 TP={tp}, TN={tn}, FP={fp}, FN={fn}일 때, {cell}의 값(정수)은?","mlEvaluationProblemPromptTotalCount":"혼동 행렬에서 TP={tp}, TN={tn}, FP={fp}, FN={fn}일 때, 전체 개수 n(정수)은?","mlEvaluationProblemPromptAccuracy":"혼동 행렬에서 TP={tp}, TN={tn}, FP={fp}, FN={fn}일 때, 정확도(%)(정수)는?","mlEvaluationProblemPromptPrecision":"혼동 행렬에서 TP={tp}, TN={tn}, FP={fp}, FN={fn}일 때, 정밀도(%)(정수)는?","mlEvaluationProblemPromptRecall":"혼동 행렬에서 TP={tp}, TN={tn}, FP={fp}, FN={fn}일 때, 재현율(%)(정수)는?","mlEvaluationProblemPromptF1":"혼동 행렬에서 TP={tp}, TN={tn}, FP={fp}, FN={fn}일 때, F1 점수(%)(정수)는?","mlEvaluationStatement_0":"혼동 행렬은 실제 클래스(행)와 예측 클래스(열)를 2×2로 나타낸 표이다.","mlEvaluationStatement_1":"정확도는 (TP+TN)을 전체 개수로 나눈 값이다.","mlEvaluationStatement_2":"정밀도의 분모는 TP+FP이다.","mlEvaluationStatement_3":"재현율의 분모는 TP+FN이다.","mlEvaluationStatement_4":"F1은 정밀도와 재현율의 조화평균이다.","mlEvaluationStatement_5":"TP는 실제 양성이고 예측도 양성인 경우의 수이다.","mlEvaluationStatement_6":"FN은 실제 양성인데 예측이 음성인 경우(놓친 것)이다.","mlEvaluationStatement_7":"불균형 데이터에서는 정확도만 보면 오해할 수 있다.","mlEvaluationStatement_10":"정밀도와 재현율은 항상 같다.","mlEvaluationStatement_11":"정확도가 높으면 항상 모델이 실무에 적합하다.","mlEvaluationStatement_12":"FP는 실제 양성인데 예측이 음성인 경우이다.","mlEvaluationStatement_13":"재현율의 분모는 TP+FP이다.","mlEvaluationStatement_14":"TN은 실제 양성이고 예측도 양성인 경우의 수이다.","mlEvaluationQuestionChoice_0":"정확도의 분자는? ① TP+TN ② TP+FP ③ TP+FN","mlEvaluationQuestionChoice_1":"정밀도의 분모는? ① TP+FN ② TP+FP ③ TN+FN","mlEvaluationQuestionChoice_2":"재현율이 중요한 상황은? ① 스팸을 정상으로 놓치는 것 허용 ② 질병을 놓치면 안 될 때 ③ 오탐을 최소화할 때","mlEvaluationQuestionChoice_3":"F1은 무엇의 조화평균인가? ① 정확도와 정밀도 ② 정밀도와 재현율 ③ 재현율과 정확도","mlEvaluationQuestionChoice_4":"TP가 의미하는 것은? ① 실제 양성, 예측 양성 ② 실제 음성, 예측 양성 ③ 실제 양성, 예측 음성","mlEvaluationQuestionChoice_5":"오탐(False Positive)은? ① FP ② FN ③ TN","mlEvaluationQuestionChoice_6":"놓침(False Negative)은? ① FP ② FN ③ 정밀도","mlEvaluationQuestionChoice_7":"전체 개수 n은? ① TP+TN ② TP+TN+FP+FN ③ TP+FP+FN","mlEvaluationScenario_0":"스팸 메일을 놓치면 안 되는 경우(정상 메일을 스팸으로 잘못 보내는 것은 어느 정도 허용). 중요한 지표는? ① 재현율 ② 정밀도 ③ 정확도","mlEvaluationScenario_1":"의료 진단에서 '질병 있는데 없다고 하면 안 될 때'. 중요한 지표는? ① 정확도 ② 재현율 ③ 정밀도","mlEvaluationScenario_2":"광고 클릭 예측에서 '클릭이라고 한 것 중 진짜 클릭 비율'을 높이고 싶을 때. 중요한 지표는? ① 재현율 ② 정밀도 ③ F1","mlEvaluationScenario_3":"사기 거래 탐지에서 사기를 놓치면 안 될 때. 중요한 지표는? ① 정밀도 ② 재현율 ③ 정확도","mlEvaluationScenario_4":"정밀도와 재현율을 균형 있게 보고 싶을 때 쓰는 지표는? ① 정확도 ② F1 ③ TP","mlEvaluationScenario_5":"클래스가 99:1로 불균형할 때 정확도만 보면? ① 신뢰할 수 있다 ② 오해할 수 있다 ③ F1과 같다","mlEvaluationScenario_6":"검색 결과 상위 10개 중 관련 문서 비율을 재는 지표에 가까운 것은? ① 재현율 ② 정밀도 ③ FN","mlEvaluationScenario_7":"실제 양성 중 모델이 맞힌 비율을 재는 것은? ① 정밀도 ② 재현율 ③ 정확도","mlRegularizationProblemPrompt":"문제를 읽고 아래에서 올바른 선택지를 고르세요.","mlRegularizationProblemSolvingLabel":"문제 풀이를 위한 설명","mlRegularizationVisualIntro":"손실을 줄일 때 '데이터 오차'뿐 아니라 '모델이 너무 복잡해지는 것'에 페널티를 더해, 암기왕이 아니라 원리를 아는 모델을 만듭니다.","mlRegularizationVisualVs":"대","mlRegularizationVisualLabelNoReg":"규제 없음","mlRegularizationVisualLabelWithReg":"규제 있음","mlRegularizationVisualLabelOverfit":"과적합","mlRegularizationVisualLabelGeneral":"일반화","mlRegularizationVisualStep0":"① 규제 없음 — 훈련 손실만 줄이면 훈련 데이터에 과하게 맞춤(**과적합**)","mlRegularizationVisualStep1":"② 규제 도입 — 손실 = 데이터 손실 + λ × 페널티. **λ가 크면 가중치가 억제됨**","mlRegularizationVisualStep2":"③ L2 규제 — **가중치 제곱합 $\\sum w_j^2$을 페널티로 더해 가중치를 작게 유지**","mlRegularizationVisualStep3":"④ L1 규제 — **가중치 절댓값 $\\sum |w_j|$를 더해 일부 가중치를 0으로 만들어 스파스함**","mlRegularizationVisualStep4":"⑤ 일반화 — 적당한 λ로 **훈련·검증 모두에서 잘 맞는 모델을 얻음**","mlRegularizationVisualCaption":"규제: 손실 + λ·페널티로 과적합을 막고 일반화 성능을 높입니다.","mlRegularizationVisualAriaLabel":"규제 흐름: 과적합 → 손실+페널티 → L1/L2 → 일반화","mlRecommendationProblemPrompt":"문제를 읽고 아래에서 올바른 선택지를 고르세요.","mlRecommendationProblemSolvingLabel":"문제 풀이를 위한 설명","mlRecommendationSubjectivePrompt":"한 줄로 이유를 작성하세요(평가하지 않음).","mlRecommendationSubjectivePlaceholder":"예: 유사도 가중치로 이웃의 평점을 평균내어 빈 칸을 예측합니다.","mlRecommendationVisualIntro":"사용자-아이템 평점 행렬에서 비슷한 사용자(이웃)를 찾아, 그들의 평점으로 빈 칸을 예측합니다.","mlRecommendationVisualStep0":"① 평점 행렬 — 행: 사용자, 열: 아이템. 알려진 평점과 빈 칸(?)이 있음","mlRecommendationVisualStep1":"② 유사도 계산 — 사용자끼리(또는 아이템끼리) 취향이 얼마나 비슷한지 계산","mlRecommendationVisualStep2":"③ 이웃 선택 — 가장 유사한 K명의 이웃 선택","mlRecommendationVisualStep3":"④ 예측 — 이웃들의 평점으로 가중 평균해 빈 칸 예측","mlRecommendationVisualStep4":"⑤ 추천 — 예측 점수가 높은 아이템을 사용자에게 추천","mlRecommendationVisualHowItWorks":"① 이웃 찾기 → ② 평점 참고 → ③ 빈 칸 예측 → ④ 추천","mlRecommendationVisualRowTitle":"같은 작품에 대한 이웃 평점 → 내 예상 평점 채우기","mlRecommendationVisualCardNeighbor1":"이웃 1 (비슷한 사용자)","mlRecommendationVisualCardNeighbor2":"이웃 2 (비슷한 사용자)","mlRecommendationVisualCardItem":"이 작품 (내가 아직 안 봄)","mlRecommendationVisualCardNeighbor1Short":"이웃 1","mlRecommendationVisualCardNeighbor2Short":"이웃 2","mlRecommendationVisualCardItemShort":"이 작품(안 봄)","mlRecommendationVisualCalc":"평균 예측: $\\hat{r}_{u,i}=\\frac{5+4}{2}=4.5\\approx4$ (이웃 평점 ★5, ★4) → 예상 ★4로 추천","mlRecommendationVisualBottomDesc":"비슷한 취향의 시청이 이 작품에 ★5, ★4를 줬어요 → 평균해서 ★4로 추천해요!","mlRecommendationVisualCaption":"협업 필터링: 유사 사용자 기반으로 빈 칸 $\\hat{r}_{u,i}$ 예측.","mlRecommendationVisualAriaLabel":"추천 흐름: 평점 행렬 → 유사도 → 이웃 → 가중 평균 예측","ml00":{"chapter":"Chapter 00","title":"머신러닝의 첫 단추: 데이터와 특성(Feature) 완벽 이해","description":"인공지능이라는 요리를 만들기 위해 가장 먼저 할 일은 좋은 **재료(데이터)**를 고르고, 요리하기 좋게 **손질(특성 추출)**하는 것입니다. 우리가 보는 세상의 모든 정보가 어떻게 **숫자 벡터**라는 마법의 주문으로 변하는지 그 흥미로운 과정을 시작해 봅시다.","sectionTitle":"데이터와 특성(Feature): AI가 세상을 보는 안경","whatIs":{"0":"**데이터는 AI의 '경험치'입니다** — 아이가 수많은 강아지를 보고 '강아지'라는 개념을 익히듯, AI는 **입력($x$)**과 **정답($y$, Label)**이 짝지어진 데이터를 통해 학습합니다. 예를 들어, '스팸 메일 본문($x$)'과 '스팸 여부($y$)'가 한 쌍의 데이터가 됩니다. 이 쌍이 수만 개 모인 것을 우리는 **데이터셋(Dataset)**이라 부릅니다.","1":"**특성(Feature)은 데이터의 '핵심 신분증'입니다** — 사과를 설명할 때 '빨갛다', '동그랗다', '달콤하다'라고 말하죠? 컴퓨터에게는 이들을 숫자로 바꾼 **[0.9(빨간 정도), 0.8(원형도), 7.5(당도)]**가 사과의 신분증이 됩니다. 이 숫자들의 묶음이 바로 **특성 벡터(Feature Vector)** $ \\mathbf{x} = [x_1, x_2, x_3]^\\top $ 입니다.","2":"**예시로 이해하기** — '중고차 가격'을 예측한다고 해봅시다. 여기서 '주행 거리', '연식', '사고 유무'가 바로 **특성(Feature)**입니다. 만약 '차 시트의 색깔' 같은 불필요한 특성을 넣으면 AI는 오히려 혼란에 빠집니다. 즉, **좋은 특성을 뽑아내는 것**이 머신러닝의 핵심 기술입니다."},"whyImportant":{"0":"**데이터의 질이 지능의 질을 결정합니다** — 'Garbage In, Garbage Out(쓰레기를 넣으면 쓰레기가 나온다)'이라는 말이 있습니다. 데이터가 편향되어 있거나 오답($y$)이 많으면, AI는 $ y = f(x) $라는 식을 풀 때 엉뚱한 정답지($f$)를 만들어버립니다. 수학적으로는 오차를 최소화하는 **최적화** 과정이 완전히 망가지는 것이죠.","1":"**특성은 고차원의 세계를 만듭니다** — 특성이 2개($x_1, x_2$)면 평면 위의 점이지만, 특성이 100개면 100차원 공간의 한 점이 됩니다. 우리는 볼 수 없지만, AI는 이 고차원 공간에서 **행렬(Matrix)** 계산을 통해 데이터 사이의 거리를 재고 유사도를 판별합니다.","2":"**학습의 효율성을 극대화합니다** — 똑똑한 특성 하나($x_{smart}$)가 멍청한 특성 100개보다 낫습니다. 데이터를 잘 정리해두면 나중에 배울 **미분(Gradient Descent)**을 할 때 훨씬 빠르게 정답에 도달할 수 있습니다. 이것이 바로 우리가 수학적 기초를 배우는 이유입니다."},"howUsed":{"0":"**AI의 사고방식 4단계** — 모든 머신러닝은 이 흐름을 따릅니다: **1) 데이터 수집** (원석 찾기) → **2) 특성 추출** (보석 깎기: 벡터화) → **3) 모델 학습** (함수 $f$ 조절하기) → **4) 결과 예측** (새로운 데이터 넣기). 이 과정에서 데이터는 끊임없이 **벡터와 행렬**로 변신하며 컴퓨터의 메모리를 통과합니다."},"problemSolving":{"0":"**데이터와 특성** — **데이터**는 (입력 $\\mathbf{x}$, 정답 $y$) 쌍의 모음이고, 관측을 숫자로 바꾼 **특성**이 모여 **특성 벡터** $\\mathbf{x}$를 이룹니다. **타겟**은 맞히고 싶은 $y$, **모델**은 $y \\approx f(\\mathbf{x})$를 학습한 함수이며, **평가**는 손실·지표로 예측 품질을 잽니다.","1":"**예시 (개념 이해)**\n\n특성 벡터로 표현되는 것에 가장 가까운 것은? ① 라벨만 ② 입력을 숫자로 만든 벡터 ③ 손실 함수\n\n입력을 숫자로 인코딩한 것이 특성·특성 벡터이다. → **정답 ②**\n\n---\n\n**예시 (비유로 보는 용어)**\n\n| 구분 | 현실의 예시 (내 집 마련) | 머신러닝 & 수학적 개념 |\n| :--- | :--- | :--- |\n| **데이터 (Data)** | 실제 거래된 아파트 정보들의 모음 | $(x, y)$ 순서쌍의 집합 |\n| **특성 (Feature)** | 평수, 역세권 여부, 층수 | **입력 벡터 ($\\mathbf{x}$)** |\n| **타겟 (Target)** | 최종 거래 가격 | **정답 라벨 ($y$)** |\n| **모델 (Model)** | \"평당 얼마다\"라고 계산하는 공식 | **함수 ($y = f(x)$)** |\n| **평가 (Evaluation)** | 예측가와 실제가의 차이 비교 | **손실 함수 (Loss Function)** |"}},"ml01":{"chapter":"Chapter 01","title":"결측치 처리: 데이터 공백을 채우는 전략","description":"결측치가 포함된 데이터에서 어떤 대치 전략을 선택하느냐에 따라 모델 성능과 신뢰도가 크게 달라집니다. 이 챕터에서는 단일대치와 다중대치, 이상치 탐지(Box Plot, Mahalanobis Distance, Isolation Forest, SVDD), 클래스 불균형 대응(Tomek Links, SMOTE, ADASYN, 복합 리샘플링)을 하나의 실전 파이프라인으로 연결합니다."},"ml02":{"chapter":"Chapter 02","title":"지도학습, 비지도학습, 자기지도학습","description":"머신러닝은 데이터를 학습하는 방식에 따라 크게 **지도학습**, **비지도학습**, **자기지도학습**으로 나뉩니다. **지도학습**은 정답이 주어진 문제집을 풀며 학습하는 것과 같고, **비지도학습**은 정답 없이 데이터의 특징을 관찰하여 스스로 비슷한 유형을 묶어내는 과정과 같습니다. 최근 주목받는 **자기지도학습**은 데이터의 일부를 가리고 스스로 빈칸을 추론하며 학습하는 자기주도적 방식입니다. 이 챕터에서는 세 가지 학습 방식의 핵심 개념과 수학적 원리, 그리고 실생활에서 어떻게 활용되는지 담백하게 정리합니다. 이를 통해 향후 다룰 다양한 머신러닝 알고리즘을 이해하기 위한 탄탄한 기초를 다질 수 있습니다.","sectionTitle":"학습 방식 세 가지: 지도·비지도·자기지도","whatIs":{"0":"**지도학습(Supervised Learning): 정답을 기반으로 한 학습**\n**입력 데이터 $\\mathbf{x}$**와 그에 대응하는 **정답(라벨) $y$**를 한 쌍으로 묶어 모델에 제공하는 방식입니다. 모델의 목표는 입력 데이터와 정답 사이의 규칙을 찾아내어 수학적 함수 $y = f(\\mathbf{x})$를 근사하는 것입니다. 학습이 완료되면 처음 보는 새로운 입력 $\\mathbf{x}$가 주어져도 알맞은 $y$를 예측할 수 있습니다.\n\n수학적으로는 훈련 데이터를 $\\mathcal{D} = \\{(\\mathbf{x}_1, y_1), (\\mathbf{x}_2, y_2), \\ldots\\}$ 형태로 두고, 손실 함수(예: MSE, cross-entropy)를 최소화하는 $f$를 찾는 **최적화** 문제로 풉니다. Ch02 이후의 KNN, 선형 회귀, 로지스틱 회귀는 모두 이 지도학습의 구체적인 사례입니다.\n\n* **실생활 예시 1 (분류)**: 이메일의 내용($\\mathbf{x}$)을 분석하여 '스팸'인지 '정상'인지($y$)를 구분하는 스팸 필터.\n* **실생활 예시 2 (회귀)**: 아파트의 평수, 역과의 거리($\\mathbf{x}$)를 바탕으로 실제 가격($y$)을 연속적인 수치로 예측하는 모델.\n* **실생활 예시 3 (의료)**: 환자의 검사 수치($\\mathbf{x}$)와 확진 결과($y$)로 질병 여부를 판단하는 보조 진단 시스템.","1":"**비지도학습(Unsupervised Learning): 데이터의 숨겨진 패턴 탐색**\n정답(라벨) $y$ 없이 오직 **입력 데이터 $\\mathbf{x}$**만 주어지는 학습 방식입니다. 특정 값을 예측하는 것이 아니라, 데이터 내부에 숨겨진 **구조, 패턴, 유사성**을 스스로 찾아내어 그룹화하는 것이 주된 목적입니다.\n\n직관적으로는 \"정답지 없이 문제만 쌓여 있는 상황\"입니다. 모델은 $\\mathbf{x}$들 사이의 **거리·유사도**를 기준으로 가까운 것끼리 묶거나(군집화), 고차원 데이터를 더 적은 차원으로 압축(차원 축소)하거나, 정상 패턴에서 크게 벗어난 **이상(anomaly)**을 찾습니다. 라벨이 전혀 없기 때문에 '어떤 그룹이 정답인지'는 사람이 나중에 해석해야 합니다.\n\n* **실생활 예시 1 (군집화)**: 쇼핑몰 고객들의 나이와 구매 이력($\\mathbf{x}$)을 분석하여 비슷한 소비 성향을 가진 고객군으로 나누는 고객 세분화 시스템.\n* **실생활 예시 2 (이상 탐지)**: 평소의 정상적인 신용카드 결제 패턴($\\mathbf{x}$)을 학습한 뒤, 이와 크게 다른 비정상적인 거래를 즉시 탐지하는 보안 솔루션.\n* **실생활 예시 3 (차원 축소)**: 수십 개 특성을 가진 데이터를 **2~3개 숫자로 줄이는 차원 축소**로 시각화하거나 노이즈를 줄이는 전처리. (구체적인 방법은 나중에 배우게 됩니다.)","2":"**자기지도학습(Self-Supervised Learning): 데이터 스스로 타깃 생성**\n사람이 직접 정답을 제공하는 대신, 데이터 자체의 구조를 활용해 **'가짜 정답(Pseudo-label)'**을 만들어 학습하는 방식입니다. 입력 데이터의 일부를 가리거나 변형한 뒤 이를 원래대로 복원하도록 유도합니다. 이 과정을 통해 모델은 데이터의 내재적 표현(Representation)과 문맥을 깊이 있게 파악하게 됩니다.\n\n흐름은 세 단계로 요약할 수 있습니다. (1) **가리기**: 문장의 일부 단어, 이미지의 일부 패치, 음성의 일부 구간 등을 [MASK]나 제거로 숨깁니다. (2) **예측하기**: 나머지 문맥만 보고 숨긴 부분을 맞히도록 모델을 학습합니다. (3) **활용하기**: 이렇게 배운 표현(representation)을 그대로 두고, 소량의 지도 학습만으로 분류·QA 등 다운스트림 태스크에 연결합니다. 라벨을 사람이 붙이지 않아도 되므로 대량의 텍스트·이미지를 활용할 수 있어, BERT·GPT 등 대규모 모델의 기반이 됩니다.\n\n* **실생활 예시 1 (언어 모델)**: 방대한 텍스트에서 '나는 오늘 아침에 [ ]을 먹었다'처럼 특정 단어를 가리고, 문맥을 통해 빈칸의 단어를 예측하며 언어의 규칙을 학습하는 대규모 언어 모델(LLM).\n* **실생활 예시 2 (비전)**: 이미지의 한 영역을 가리고 나머지 픽셀로 그 영역을 복원하도록 하여 시각적 표현을 학습하는 모델.\n* **실생활 예시 3 (대조 학습)**: 같은 이미지를 회전·자르기한 두 버전은 '같은 것', 다른 이미지는 '다른 것'으로 두고, 표현이 비슷하게 나오도록 학습하는 방식."},"whyImportant":{"0":"**데이터 특성과 구축 비용을 고려한 학습 방법 선택**\n모든 데이터에 정확한 정답(라벨)을 구축하는 것은 많은 시간과 비용을 요구합니다. 정답 데이터가 충분하다면 **지도학습**이 효과적이지만, 그렇지 않다면 확보하기 쉬운 비라벨 데이터를 적극적으로 활용해야 합니다. 상황에 맞춰 **비지도학습**으로 데이터의 전반적인 구조를 파악하거나, **자기지도학습**으로 모델의 표현력을 높이는 전략적인 접근이 필요합니다.\n\n또한 **해석 가능성**도 다릅니다. 지도학습은 '입력에 대해 왜 이 정답인가'를 손실·경로로 어느 정도 설명할 수 있지만, 비지도·자기지도는 '어떤 구조를 찾았는지'를 시각화·클러스터 이름 등으로 따로 해석해야 합니다. 문제의 목적(예측이 필요한지, 구조 발견이 필요한지)에 맞는 방식을 고르는 것이 중요합니다.","1":"**효율적인 AI 모델 파이프라인 구축 (Pre-training & Fine-tuning)**\n실제 머신러닝 시스템에서는 이 방식들을 혼합하여 모델의 효율을 극대화합니다. 대량의 라벨 없는 데이터로 **자기지도학습**을 수행하여 일반적인 패턴을 먼저 학습시키는 '사전학습(Pre-training)'을 거친 뒤, 특정 목적에 맞는 소량의 정답 데이터로 **지도학습**을 진행하여 성능을 최적화하는 '미세조정(Fine-tuning)' 기법이 현대 AI 모델 개발의 표준으로 자리 잡고 있습니다.\n\n**비지도**는 전처리·탐색 단계에서 자주 쓰입니다. 예를 들어 고객 데이터를 먼저 K-Means로 군집한 뒤, 각 군집에 사람이 의미를 붙이고(예: '충성 고객', '이탈 위험'), 그 다음 지도 학습으로 이탈 예측 모델을 만드는 식입니다. 이렇게 세 가지 학습 방식을 구분해 두면 설계가 명확해지고, 데이터 수와 라벨 비용에 맞는 현실적인 파이프라인을 세울 수 있습니다."},"howUsed":{"0":"**지도학습의 주요 알고리즘**\n입력 데이터와 명확한 정답이 주어졌을 때 주로 사용됩니다. 향후 다룰 **Ch02 KNN (K-최근접 이웃)**, **Ch03 선형 회귀**, **Ch04 로지스틱 회귀** 등은 모두 입력($\\mathbf{x}$)과 정답($y$) 쌍을 기반으로 예측 함수를 훈련하는 대표적인 지도학습 모델입니다.\n\n* **분류(Classification)**: 스팸 필터, 질병 예측, 이미지 분류(강아지/고양이) 등 **범주형** 정답을 맞히는 문제.\n* **회귀(Regression)**: 집값 예측, 판매량 예측, 온도 예측 등 **연속값**을 맞히는 문제. Ch03 선형 회귀, Ch04 손실 함수(MSE)에서 수식과 최적화를 배웁니다.","1":"**비지도학습의 주요 알고리즘**\n데이터의 내재적 구조를 파악해야 할 때 사용됩니다. **Ch08 K-Means (K-평균)** 챕터에서는 정답 라벨 없이 데이터 간의 유사도와 거리를 계산하여 비슷한 군집(Cluster)으로 묶는 방법을 다룹니다. 또한, **많은 특성을 2~3개로 줄이는 차원 축소**도 비지도학습의 중요한 활용입니다.\n\n* **군집화(Clustering)**: K-Means, 계층적 군집화 등으로 비슷한 데이터끼리 묶어 고객 세분화, 주제별 문서 그룹화 등에 활용.\n* **차원 축소**: 고차원 데이터를 2~3개 숫자로 줄여 시각화하거나 노이즈를 제거하는 전처리. (구체적인 방법은 나중에 배우게 됩니다.)\n* **이상 탐지**: 정상 데이터만으로 '정상 영역'을 학습한 뒤, 그 밖의 데이터를 이상으로 플래그.","2":"**자기지도학습의 주요 알고리즘**\n대규모 데이터의 특징을 추출하는 최신 딥러닝 분야에서 활발히 사용됩니다. 구글의 **BERT**나 오픈AI의 **GPT**와 같은 거대 언어 모델(LLM)은 텍스트의 일부를 가리고 예측하며 언어를 학습합니다. 컴퓨터 비전 분야에서도 이미지의 변형본들을 스스로 비교하여 특징을 학습하는 **대조 학습(Contrastive Learning)** 기법으로 폭넓게 응용됩니다.\n\n* **언어**: BERT(가린 단어 예측), GPT(다음 토큰 예측) 등. 사전학습 후 QA, 요약, 감성 분석 등 소량 라벨로 미세조정.\n* **비전**: 이미지 일부 복원, SimCLR·MoCo 등 대조 학습으로 같은 이미지의 서로 다른 변형은 가깝게, 다른 이미지는 멀게.\n* **멀티모달**: 이미지-텍스트 쌍에서 캡션을 가리고 예측하거나, 대조 학습으로 정렬된 표현을 학습."},"problemSolving":{"0":"지도·비지도·자기지도 유형 문제는 「라벨이 **사람이 붙인 것**인가 / **없는가** / **데이터에서 만든 타깃**인가」만 떠올리면 풀기 쉽습니다. **지도학습**은 $(\\mathbf{x}, y)$ 쌍으로 $y=f(\\mathbf{x})$를 학습하고, **비지도학습**은 라벨 없이 $\\mathbf{x}$만으로 군집·구조를 찾으며, **자기지도학습**은 가린 단어·다음 토큰처럼 스스로 만든 목표로 표현을 배운 뒤 소량 라벨로 쓰는 흐름이 대표적입니다.","1":"**예시 (개념 이해 문제)**\n\n스팸 여부처럼 **사람이 붙인 라벨**로 분류를 배우는 경우에 가까운 것은? ① 지도 ② 비지도 ③ 자기지도\n\n사람이 정답을 미리 붙여 둔 데이터로 학습하는 것이 지도학습에 해당합니다. → **정답 ①**\n\n---\n\n**예시 (O/X 문제)**\n\n\"라벨 없이 고객만 묶는 학습은 비지도학습에 해당한다.\" 맞으면 1, 틀리면 0.\n\n정답 라벨 없이 군집·구조만 찾는 것이 비지도학습의 특징입니다. → **정답 1**\n\n---\n\n**예시 (응용 문제)**\n\n가려진 단어를 맞히며 표현을 배우는 방식에 가까운 것은? ① 지도만 ② 군집만 ③ 마스크 언어모델·대조학습\n\n데이터에서 스스로 타깃을 만들어 표현을 학습하는 흐름이 자기지도에 가깝습니다. → **정답 ③**"},"mlSupervisedUnsupervisedSelfVisualIntro":"머신러닝의 세 가지 학습 방식: 지도(입력–정답 쌍), 비지도(라벨 없음), 자기지도(스스로 만든 타깃).","mlSupervisedUnsupervisedSelfVisualStep0":"지도학습: (입력, 정답) 쌍으로 예측 함수 학습","mlSupervisedUnsupervisedSelfVisualStep1":"비지도학습: 라벨 없이 구조·군집 발견","mlSupervisedUnsupervisedSelfVisualStep2":"자기지도학습: 데이터에서 만든 타깃으로 표현 학습","mlSupervisedUnsupervisedSelfProblemSolvingLabel":"문제 풀이를 위한 설명","mlSupervisedUnsupervisedSelfVisualPhase0Title":"지도학습: 입력 x와 정답 y가 쌍을 이룹니다","mlSupervisedUnsupervisedSelfVisualPhase0Caption":"쌍 (x, y)이 순서대로 주어지면 모델이 규칙을 배웁니다","mlSupervisedUnsupervisedSelfVisualPhase1Title":"비지도학습: 입력 x만 있습니다 (정답 y 없음)","mlSupervisedUnsupervisedSelfVisualPhase1Caption":"y(정답)는 없고 x만 있습니다. 일부 x가 가렸다 나타났다 해도 → 모델은 구조·군집만 찾습니다","mlSupervisedUnsupervisedSelfVisualPhase1NoLabelBadge":"라벨 없음","mlSupervisedUnsupervisedSelfVisualPhase2Title":"자기지도학습: 빈칸을 가리고 그 빈칸을 예측합니다","mlSupervisedUnsupervisedSelfVisualPhase2Caption1":"일부를 가립니다","mlSupervisedUnsupervisedSelfVisualPhase2Caption2":"모델이 빈칸을 예측합니다","mlSupervisedUnsupervisedSelfVisualPhase2Caption3":"예측한 단어로 채워집니다","mlSupervisedUnsupervisedSelfVisualPhase2Prefix":"나는 ","mlSupervisedUnsupervisedSelfVisualPhase2Suffix":" 먹었다","mlSupervisedUnsupervisedSelfVisualPhase2Filled":"밥","mlSupervisedUnsupervisedSelfVisualPhase2Example":"예: 문장 빈칸 맞추기 → 표현 학습 (BERT 등)","mlSupervisedUnsupervisedSelfVisualPhase2Step1":"가리기","mlSupervisedUnsupervisedSelfVisualPhase2Step2":"예측","mlSupervisedUnsupervisedSelfVisualPhase2Step3":"채우기","mlSupervisedUnsupervisedSelfVisualAutoCycle":"세 가지 방식이 동시에 애니메이션됩니다","problemAnswerHint":"보기에서 알맞은 학습 방식을 고르세요.","mcAnswerSupervised":"지도학습","mcAnswerUnsupervised":"비지도학습","mcAnswerSelfSupervised":"자기지도학습","mcAnswerDistractor":"강화학습","problems":{"definition_1_0":"입력과 정답(라벨)이 짝지어진 데이터로 학습하는 방식은? ①지도 ②비지도 ③자기지도","definition_1_1":"다음 중 (입력 $\\mathbf{x}$, 정답 $y$) 쌍으로 $y=f(\\mathbf{x})$를 배우는 학습은? ①지도 ②비지도 ③자기지도","definition_1_2":"선생님이 붉은펜으로 채점해 주는 것에 비유할 수 있는 학습 방식은? ①지도 ②비지도 ③자기지도","definition_1_3":"분류나 회귀에서 사람이 붙인 라벨을 사용하는 학습은? ①지도 ②비지도 ③자기지도","definition_1_4":"(입력, 정답) 쌍으로 분류나 회귀를 배우는 대표적 학습 방식은? ①지도 ②비지도 ③자기지도","definition_1_5":"데이터에 정답(타깃)이 함께 주어져 그 정답을 맞히도록 학습하는 방식은? ①지도 ②비지도 ③자기지도","definition_2_0":"라벨 없이 입력만으로 구조·패턴·군집을 찾는 학습은? ①지도 ②비지도 ③자기지도","definition_2_1":"정답 $y$가 없이 $\\mathbf{x}$만 있을 때 데이터의 그룹을 찾는 방식은? ①지도 ②비지도 ③자기지도","definition_2_2":"라벨 없이 비슷한 데이터끼리 묶는 군집화에 해당하는 학습 방식은? ①지도 ②비지도 ③자기지도","definition_2_3":"스스로 유형만 찾아 묶는 것에 비유할 수 있는 학습은? ①지도 ②비지도 ③자기지도","definition_2_4":"차원 축소, 이상 탐지에 많이 쓰이는 라벨 없는 학습은? ①지도 ②비지도 ③자기지도","definition_2_5":"사람이 붙인 정답 없이 데이터의 구조만 발견하는 방식은? ①지도 ②비지도 ③자기지도","definition_3_0":"데이터 자체에서 만든 '가짜 정답'으로 학습하는 방식은? ①지도 ②비지도 ③자기지도","definition_3_1":"가린 단어 맞히기, 다음 문장 예측처럼 스스로 타깃을 만드는 학습은? ①지도 ②비지도 ③자기지도","definition_3_2":"문장에서 일부를 가리고 그 부분을 맞히며 배우는 학습은? ①지도 ②비지도 ③자기지도","definition_3_3":"대량의 비라벨 데이터로 표현(representation)을 배우는 데 쓰이는 방식은? ①지도 ②비지도 ③자기지도","definition_3_4":"문제지를 스스로 만들어 푸는 것에 비유할 수 있는 학습은? ①지도 ②비지도 ③자기지도","definition_3_5":"스스로 '같은 것·다른 것' 쌍을 만들어 표현을 배우는 학습 방식은? ①지도 ②비지도 ③자기지도","taskClassify_0":"스팸 메일 분류(스팸/정상 라벨 있음)는 어떤 학습에 해당하나요? ①지도 ②비지도 ③자기지도","taskClassify_1":"고객 구매 데이터만 있고 라벨 없이 비슷한 고객끼리 묶는 작업은? ①지도 ②비지도 ③자기지도","taskClassify_2":"문장에서 가린 단어를 맞히며 단어 표현을 배우는 것은? ①지도 ②비지도 ③자기지도","taskClassify_3":"아파트 가격 예측(평수·위치 → 가격)은? ①지도 ②비지도 ③자기지도","taskClassify_4":"이미지만 있고 라벨 없이 유사 이미지끼리 묶는 군집화는? ①지도 ②비지도 ③자기지도","taskClassify_5":"대량 텍스트로 사전학습한 뒤 소량 라벨로 미세조정하는 전 단계 학습은? ①지도 ②비지도 ③자기지도","taskClassify_6":"의료 영상과 '질병 유무' 라벨로 질병 예측 모델을 만드는 것은? ①지도 ②비지도 ③자기지도","taskClassify_7":"라벨 없이 '비슷한 고객끼리 묶기'만 하는 고객 세분화는? ①지도 ②비지도 ③자기지도","taskClassify_8":"다음 문장 예측으로 문맥 표현을 배우는 것은? ①지도 ②비지도 ③자기지도","taskClassify_9":"시험 점수 예측(공부 시간 → 점수)은? ①지도 ②비지도 ③자기지도","taskClassify_10":"이상 거래 탐지(정상만 있고 이상 라벨이 거의 없을 때)에 가까운 것은? ①지도 ②비지도 ③자기지도","taskClassify_11":"이미지의 한 부분을 나머지로 예측하며 표현을 배우는 것은? ①지도 ②비지도 ③자기지도","scenario_0":"병원에서 과거 환자 데이터(증상, 검사 수치)와 확진 결과(라벨)로 '이 환자는 A병인가?'를 학습시킨다. 이는? ①지도 ②비지도 ③자기지도","scenario_1":"쇼핑몰에서 구매 기록만 있고 별도 라벨 없이 고객을 몇 개 그룹으로 나눈다. 이는? ①지도 ②비지도 ③자기지도","scenario_2":"위키백과 문장에서 15% 단어를 가리고, 그 단어를 맞히는 과제로 모델을 학습한다. 이는? ①지도 ②비지도 ③자기지도","scenario_3":"날씨·날짜와 아이스크림 판매량(라벨)으로 내일 판매량을 예측하는 모델을 만든다. 이는? ①지도 ②비지도 ③자기지도","scenario_4":"영상 데이터에 라벨 없이 비슷한 장면끼리 묶어 인덱싱한다. 이는? ①지도 ②비지도 ③자기지도","scenario_5":"대량 문서에서 '다음 문장'을 맞히는 과제로 문맥 표현을 학습한 뒤, 소량 QA 라벨로 미세조정한다. 전 단계는? ①지도 ②비지도 ③자기지도","scenario_6":"강아지·고양이 사진과 각각의 종(라벨)으로 분류기를 학습한다. 이는? ①지도 ②비지도 ③자기지도","scenario_7":"주식 가격 시계열만 있고 라벨 없이 패턴 구간을 나눈다. 이는? ①지도 ②비지도 ③자기지도","scenario_8":"같은 문장을 다른 표현으로 바꾼 뒤 '의미가 같다'를 타깃으로 표현을 학습한다. 이는? ①지도 ②비지도 ③자기지도","scenario_9":"입사 지원서(경력, 학력)와 합격 여부(라벨)로 합격 예측 모델을 만든다. 이는? ①지도 ②비지도 ③자기지도","scenario_10":"뉴스 기사만 있고 주제 라벨 없이 기사들을 주제별로 묶는다. 이는? ①지도 ②비지도 ③자기지도","scenario_11":"음성에서 일부 구간을 가리고 복원하는 과제로 음성 표현을 배운다. 이는? ①지도 ②비지도 ③자기지도","trueFalse_0":"\"입력과 정답이 짝지어진 데이터로 학습한다\"는 지도학습 설명이다. 이에 해당하는 학습 방식은? ①지도 ②비지도 ③자기지도","trueFalse_1":"\"라벨 없이 데이터의 구조만 찾는다\"는 비지도학습 설명이다. 이에 해당하는 학습 방식은? ①지도 ②비지도 ③자기지도","trueFalse_2":"\"데이터에서 스스로 만든 타깃(가린 단어 등)으로 학습한다\"는 자기지도학습 설명이다. 이에 해당하는 학습 방식은? ①지도 ②비지도 ③자기지도","trueFalse_3":"(입력, 정답) 쌍으로 어떤 값을 예측하는 함수를 맞춘다. 이는 어떤 학습인가? ①지도 ②비지도 ③자기지도","trueFalse_4":"라벨 없이 데이터만 보고 K개 그룹으로 나눈다. 이는 어떤 학습인가? ①지도 ②비지도 ③자기지도","trueFalse_5":"문장에서 가린 단어를 맞히며 배우는 학습은? ①지도 ②비지도 ③자기지도","trueFalse_6":"사람이 붙인 합격/불합격 라벨로 학습한다. 이는 어떤 학습인가? ①지도 ②비지도 ③자기지도","trueFalse_7":"\"정답 없이 데이터만 보고 비슷한 것끼리 묶는다\"는 비지도학습 설명이다. 이에 해당하는 학습 방식은? ①지도 ②비지도 ③자기지도","trueFalse_8":"스스로 만든 '같은 것/다른 것' 쌍으로 표현을 배운다. 이는 어떤 학습인가? ①지도 ②비지도 ③자기지도","trueFalse_9":"훈련 시 (입력, 정답) 쌍을 쓰고 새 입력에 대해 정답을 예측한다. 이는 어떤 학습인가? ①지도 ②비지도 ③자기지도","trueFalse_10":"이상 탐지에서 정상 데이터만으로 '정상 영역'을 학습하는 것은 비지도에 가깝다. 이에 해당하는 학습 방식은? ①지도 ②비지도 ③자기지도","trueFalse_11":"\"다음에 올 문장을 맞히며 문맥을 배운다\"는 자기지도학습에 해당한다. 이에 해당하는 학습 방식은? ①지도 ②비지도 ③자기지도"}},"ml03":{"chapter":"Chapter 03","title":"K-최근접 이웃 (KNN): 끼리끼리 모이기","description":"주변에 어떤 친구들이 있느냐를 보면 그 사람이 누구인지 알 수 있듯이, KNN은 새로운 데이터가 들어왔을 때 가장 가까운 거리에 있는 **'K명의 이웃'**이 누구인지를 확인하여 정답을 맞히는 알고리즘입니다. 복잡한 수식 공부 없이도 **직관적인 거리** 개념만으로 동작하는 머신러닝의 가장 친절한 첫걸음입니다.","sectionTitle":"K-최근접 이웃 (KNN): 끼리끼리 모이기","whatIs":{"0":"**KNN이란? '다수결의 원칙'입니다** — 새로운 데이터(점)가 나타나면, 이미 정답을 알고 있는 기존 데이터들 사이에서 **가장 가까운 K개**를 찾아봅니다. 그리고 그 K개가 가진 정답 중 가장 많은 것을 새 데이터의 정답으로 정합니다. 예를 들어, 내 주변 가장 가까운 집 5곳(K=5) 중 4곳이 '맛집'이라면, 우리 집도 맛집 구역에 있다고 판단하는 식입니다.","1":"**'가깝다'는 기준은 수학적 거리로 잽니다** — 머신러닝에서 가깝다는 느낌적인 느낌이 아니라 **특성 공간(Feature Space)**에서의 수치입니다. 가장 흔히 쓰이는 **유클리드 거리(Euclidean Distance)** 공식은 피타고라스 정리와 닮았습니다: $d(\\mathbf{x}, \\mathbf y) = \\sqrt{\\sum_{i}(x_i - y_i)^2}$. 특성이 키와 몸무게 2개라면, 평면 위의 두 점 사이를 자로 잰 직선 거리와 같습니다.","2":"**K는 우리가 직접 정하는 '이웃의 수'입니다** — K를 얼마로 잡느냐에 따라 AI의 성격이 변합니다. K가 너무 작으면(K=1) 주변 사람 한 명의 의견에 휘둘리는 귀 얇은 모델이 되고, K가 너무 크면 너무 많은 의견을 듣느라 개성을 잃고 뭉툭해집니다. 보통 **홀수**로 설정하여 투표 결과가 비기는 상황을 방지합니다."},"whyImportant":{"0":"**게으르지만 똑똑한 학습법 (Lazy Learning)** — KNN은 미리 공식을 외우지 않습니다. 평소에는 데이터를 가만히 가지고 있다가, 정작 문제가 주어지면 그제야 이웃들을 찾아 나섭니다. 덕분에 **훈련 시간은 0초**에 가깝지만, 데이터가 엄청나게 많아지면 일일이 거리를 재느라 대답이 조금 느려질 수 있다는 특징이 있습니다.","1":"**결과가 왜 나왔는지 설명하기 쉽습니다** — 인공지능이 왜 이런 판단을 내렸는지 궁금할 때가 있죠? KNN은 \"당신과 가장 비슷한 이웃 5명을 찾아보니 이들이 모두 A라고 답했기 때문입니다\"라고 **근거(이웃)**를 직접 보여줄 수 있어 신뢰감이 높습니다. ","2":"**데이터의 지도를 그리는 기준점** — 딥러닝 같은 복잡한 기술을 쓰기 전에 KNN을 먼저 돌려보면 \"이 데이터들이 끼리끼리 잘 모여 있는가?\"를 쉽게 파악할 수 있습니다. 즉, 데이터의 난이도를 측정하는 **기준선(Baseline)** 역할을 훌륭히 수행합니다."},"howUsed":{"0":"**분류(Classification): '이건 뭐야?'** — 과일의 무게와 색깔 데이터를 보고 사과인지 포도인지 맞히는 작업입니다. 스팸 메일 차단, 환자의 수치를 보고 질병 유무를 판단하는 등 **범주**를 나눌 때 빛을 발합니다.","1":"**회귀(Regression): '얼마나 될까?'** — 주변 아파트 5곳의 최근 거래가 평균을 내어 우리 집 시세를 예측하는 것처럼, 연속적인 **숫자값**을 추정할 때도 쓰입니다. 이때는 이웃들 값의 **평균**을 정답으로 씁니다.","2":"**주의할 점: 단위 맞추기(Scaling)** — 예를 들어 '소득(만 원 단위)'과 '나이(세 단위)'가 특성일 때, 숫자가 큰 소득이 거리에 엄청난 영향을 줍니다. 그래서 반드시 **정규화**를 통해 모든 특성의 범위를 0~1 사이로 맞춘 뒤 거리를 재야 공평한 판단이 가능합니다."},"problemSolving":{"0":"**KNN** — 새 점 $\\mathbf{x}$와 학습 점들 사이 **거리**를 재고, 가장 가까운 **K개** 이웃의 라벨로 **분류는 다수결·회귀는 평균**으로 예측합니다. 훈련 단계에서 가중치를 저장하지 않는 **게으른 학습(Lazy Learning)**이며, 특성 스케일이 다르면 **정규화·표준화** 후 거리를 재야 공정합니다.","1":"**예시 (알고리즘 단계)**\n\n- **입력** — 새 데이터의 특성 벡터 $\\mathbf{x}$\n- **저장된 데이터** — (특성, 라벨) 쌍들 $(\\mathbf{x}_i, y_i)$\n- **1단계** — $\\mathbf{x}$와 모든 $\\mathbf{x}_i$ 사이의 거리 $d(\\mathbf{x}, \\mathbf{x}_i)$ 계산\n- **2단계** — 거리가 작은 순으로 K개 선택\n- **3단계 (분류)** — K개의 라벨 중 **다수결**로 예측 $\\hat y$ 결정\n- **3단계 (회귀)** — K개의 $y_i$ 값의 **평균**을 예측 $\\hat y$ 로 사용\n\n---\n\n**예시 (거리 계산)**\n\n평면 위 두 점 A(0,0), B(3,4)의 유클리드 거리(정수)는? $d = \\sqrt{(3-0)^2+(4-0)^2} = 5$. → **정답 5**\n\n---\n\n**예시 (분류 다수결)**\n\nK=5이고 가장 가까운 다섯 이웃의 라벨이 순서대로 1, 1, 2, 2, 2일 때 예측 클래스는?\n\n2가 3표로 가장 많다. → **정답 2**\n\n---\n\n**예시 (회귀 평균)**\n\nK=3 회귀에서 세 이웃의 목표값이 10, 12, 14일 때 예측 $\\hat y$는?\n\n$(10+12+14)/3=12$. → **정답 12**\n\n---\n\n**예시 (스케일)**\n\n「소득(큰 수)과 나이(작은 수)」를 그대로 두면 거리가 한쪽 특성에 쏠린다. 보통 먼저 하는 전처리에 가까운 것은? ① Min-Max 정규화 등 스케일 맞추기 ② K를 무조건 1로 줄이기\n\n①. → **정답 ①**"},"problemSolvingTable":"**알고리즘 단계**\n\n- **입력** — 새 데이터의 특성 벡터 $\\mathbf{x}$\n- **저장된 데이터** — (특성, 라벨) 쌍들 $(\\mathbf{x}_i, y_i)$\n- **1단계** — $\\mathbf{x}$와 모든 $\\mathbf{x}_i$ 사이의 거리 $d(\\mathbf{x}, \\mathbf{x}_i)$ 계산\n- **2단계** — 거리가 작은 순으로 K개 선택\n- **3단계 (분류)** — K개의 라벨 중 **다수결**로 예측 $\\hat y$ 결정\n- **3단계 (회귀)** — K개의 $y_i$ 값의 **평균**을 예측 $\\hat y$ 로 사용"},"ml04":{"chapter":"Chapter 04","title":"선형 회귀 (Linear Regression): 데이터의 흐름을 꿰뚫는 선","sectionTitle":"선형 회귀: 데이터의 흐름을 꿰뚫는 선","description":"복잡하게 흩어진 데이터들 사이에서 **'가장 잘 어울리는 하나의 직선'**을 긋는 과정입니다. 이 직선 하나만 잘 찾으면, 새로운 데이터가 들어왔을 때 그 결과값을 바로 예측할 수 있습니다. 머신러닝이 어떻게 수학(함수, 미분)을 이용해 '학습'하는지 보여주는 가장 기초적이면서도 강력한 모델입니다.","whatIs":{"0":"**직선을 찾는 탐정** — 선형 회귀는 입력($x$)과 정답($y$) 사이에 **직선 관계**가 있다고 가정합니다. 중학교 때 배운 일차함수 $y = ax + b$ 기억나시나요? 여기서 기울기 $a$는 **가중치 $w$**, 절편 $b$는 **편향 $b$**라고 부르며, $y = wx + b$라는 식을 완성하는 것이 목표입니다.","1":"**'가장 잘 맞는다'는 건?** — 우리가 그은 선이 실제 데이터 점들과 얼마나 가까운지를 봅니다. 예측한 값 $\\hat y$와 실제 값 $y$의 차이(오차)를 가장 작게 만드는 $w$와 $b$를 찾는 것이 핵심입니다. 이때 오차를 계산하는 도구를 **손실 함수(Loss Function)**라고 합니다.","2":"**공식을 배우는 모델** — KNN이 시험 때마다 교과서를 뒤져서(이웃을 찾아서) 답을 낸다면, 선형 회귀는 **공식($y=wx+b$)을 머릿속에 외운 상태**입니다. 그래서 새로운 문제($x$)가 나오면 공식에 대입해 즉시 답($y$)을 낼 수 있어 속도가 훨씬 빠릅니다."},"whyImportant":{"0":"**머신러닝 학습의 정석** — '오차를 줄이는 방향으로 조금씩 수정한다'는 머신러닝의 핵심 원리를 배웁니다. 산 정상에서 가장 낮은 골짜기로 내려가는 것처럼, 미분(기울기)을 이용해 오차를 줄여나가는 **경사 하강법(Gradient Descent)**의 기초가 됩니다.","1":"**설명 가능한 AI** — 결과가 왜 그렇게 나왔는지 설명하기 좋습니다. 예를 들어 '집 크기($x$)'와 '집값($y$)'의 관계에서 가중치 $w$가 양수($+$)라면, **\"집이 클수록 집값이 비싸진다\"**라고 명확히 해석할 수 있습니다. 이는 비즈니스 의사결정에서 매우 중요합니다.","2":"**딥러닝의 씨앗** — 현재 가장 강력한 AI인 딥러닝(신경망)도 사실 이 선형 회귀를 수없이 겹쳐 놓은 구조입니다. 선형 회귀를 이해하면 최신 AI 모델의 작동 원리도 절반은 이해한 셈입니다."},"howUsed":{"0":"**숫자 예측의 달인** — 결과값이 '합격/불합격' 같은 범주가 아니라, **연속된 숫자**일 때 사용합니다. (예: 내일의 기온 예측, 택시 이동 거리에 따른 요금 예측, 공부 시간에 따른 시험 점수 예측)","1":"**중요한 요인 골라내기** — 여러 입력 요소($x_1, x_2, ...$) 중 무엇이 결과에 큰 영향을 주는지 알 수 있습니다. $y = 3x_1 + 0.1x_2$라는 식이 있다면, 가중치가 큰 $x_1$이 $x_2$보다 훨씬 중요한 요소임을 알 수 있습니다.","2":"**데이터 크기에 따른 전략** — 데이터가 적을 땐 수학 공식(정규방정식)으로 한방에 답을 찾지만, 데이터가 방대할 땐 **경사 하강법**을 통해 조금씩 정답에 가까워지는 방식을 사용합니다."},"visual":"직선이 데이터에 맞춰 학습되는 과정을 보여주는 시각화입니다.","problemSolving":{"0":"**선형 회귀** — 모델은 $\\hat y = wx + b$. **학습**은 손실(MSE 등)을 줄이도록 $w$, $b$를 갱신하는 과정이고, **예측**은 주어진 $x$를 식에 대입하는 것입니다. **기울기**는 두 점으로, **절편**은 $b=y-wx$, **잔차**는 $y-\\hat y$입니다.","1":"$3c"}},"ml05":{"chapter":"Chapter 05","title":"손실 함수 (MSE·크로스엔트로피·R²): 정답과 예측의 오차 재기","sectionTitle":"손실 함수 (MSE·크로스엔트로피·R²): 정답과 예측의 오차 재기","description":"**손실 함수**는 모델이 얼마나 틀렸는지를 **한 숫자**로 재는 도구입니다. **회귀**(연속값 예측)에서는 예측 $\\hat y$와 실제 $y$의 차이를 제곱해 평균 낸 **평균 제곱 오차(MSE)**가 대표적입니다. **분류**(범주·확률)에서는 정답 클래스에 대한 **예측 확률**이 얼마나 빗나갔는지를 **크로스엔트로피**로 잽니다. 아래 도식은 손실 함수 중 **회귀 예시로 MSE**가 어떻게 줄어드는지 보여 줍니다.","whatIs":{"0":"**회귀: MSE로 오차를 재기**\n\n모델이 얼마나 틀렸는지를 한눈에 보여 주는 **성적표**가 필요합니다.\n\n- **잔차** — 실제값 $y$에서 예측값 $\\hat y$를 뺀 값.\n- **SSE** — 각 점의 $(y-\\hat y)^2$을 모두 더한 **오차 제곱합**(Sum of Squared Errors).\n- **MSE** — SSE를 데이터 개수 $n$으로 나눈 **평균 제곱 오차**.\n\n$\\text{MSE} = \\frac{1}{n}\\sum (y - \\hat y)^2 = \\text{SSE}/n$ — 값이 작을수록 모델이 데이터에 잘 맞습니다.","1":"**왜 그냥 더하지 않고 제곱할까요?**\n\n- 오차 $+5$와 $-5$는 방향만 다를 뿐 **같은 크기의 틀림**입니다. 그냥 더하면 $0$으로 상쇄될 수 있습니다.\n- **제곱**하면 항상 양수가 되어 크기만 비교할 수 있습니다.\n- 큰 오차에는 더 큰 **벌점(페널티)**가 가해져, 모델이 큰 실수를 피하도록 유도합니다.","2":"**선형 회귀의 목표**\n\n직선 $\\hat y = wx + b$가 데이터를 잘 대변한다는 것은, **SSE**를 $n$으로 나눈 **MSE**가 최소가 되도록 기울기 $w$와 절편 $b$를 고른다는 뜻입니다.\n\n**경사 하강법**은 이 MSE를 줄이는 방향으로 $w$, $b$를 조금씩 업데이트합니다.","3":"**회귀: MSE는 잔차의 제곱 평균**\n\nMSE는 잔차(오차) $y_i-\\hat y_i$를 제곱해 평균으로 만든 오차 점수입니다. 예측이 실제에 가까울수록 잔차가 줄어 MSE도 작아집니다.","4":"**MSE 수식을 풀어 읽기**\n\n$\\text{MSE} = \\frac{1}{n}\\sum_i (y_i - \\hat y_i)^2$\n\n- **$i$** — 데이터 번호(몇 번째 점인지).\n- **$y_i$** — 그 점의 **실제값**.\n- **$\\hat y_i$** — 그 점의 **예측값**.\n- **$y_i - \\hat y_i$** — **잔차**.\n- **$(y_i - \\hat y_i)^2$** — 그 점의 **제곱 오차**.\n- **$\\sum_i$** — 모든 점을 더하면 **SSE**.\n- **$\\frac{1}{n}$** — 평균을 내어 **MSE**.\n\n예측이 실제에 가까울수록 잔차와 MSE가 작아집니다.","5":"---\n\n**분류: 크로스엔트로피**\n\n크로스엔트로피는 분류에서 \"정답 클래스일 확률\"을 기준으로 손실을 매기는 방법입니다.\n\n**이진 분류**는 아래 **이진 크로스엔트로피 수식을 풀어 읽기**에서 $\\ell$을 구성 요소별로 해석합니다.\n\n**이진 크로스엔트로피 수식을 풀어 읽기**\n\n$\\ell = -\\big(y\\log\\hat p + (1-y)\\log(1-\\hat p)\\big)$\n\n- **$y \\in \\lbrace 0,1 \\rbrace$** — 정답 라벨.\n- **$\\hat p$** — 클래스 1일 확률(0~1).\n- **$\\log$** — 보통 **자연로그**.\n\n**$y=1$일 때** — $(1-y)\\log(1-\\hat p)=0$이므로 $\\ell = -\\log\\hat p$만 남습니다. $\\hat p$가 1에 가까울수록 손실이 작습니다.\n\n**$y=0$일 때** — $y\\log\\hat p=0$이므로 $\\ell = -\\log(1-\\hat p)$. $1-\\hat p$는 클래스 0일 확률에 해당합니다.\n\n$y\\log\\hat p$와 $(1-y)\\log(1-\\hat p)$ 중 **항상 한쪽만** 살아 있어, 정답 쪽 확률을 키우도록 유도합니다.\n\n**다중 클래스** — 정답 클래스 $k$에 대해 보통\n\n$\\ell = -\\log \\hat p_k$\n\n(일반적으로 **소프트맥스** 확률을 사용). 정답 클래스의 예측 확률 $\\hat p_k$가 낮을수록 손실이 커지고, 학습은 그 확률을 높이는 방향으로 가중치를 움직입니다.","6":"$3d"},"whyImportant":{"0":"**학습의 나침반** — 머신러닝 모델은 학습할 때 '어디로 가야 할지'를 모릅니다. 회귀에서 손실이 MSE일 때, MSE가 **'이 값이 작아지는 쪽으로 가라'**고 방향을 알려줍니다. MSE가 줄어드는 방향이 곧 (회귀에서) 모델이 나아가야 할 방향입니다.","1":"**MSE: 미분하기 좋은 부드러운 곡선** — 제곱 함수($x^2$)는 그래프로 그리면 밥그릇처럼 매끄러운 곡선 모양이 됩니다. 뾰족한 부분이 없어서 **미분(기울기 계산)**이 아주 쉽습니다. 덕분에 경사 하강법을 적용하여 최저점(오차가 가장 적은 곳)을 찾기에 수학적으로 가장 유리합니다.","2":"**RMSE로 단위 되찾기** — MSE는 오차를 **제곱**해서 평균을 내기 때문에 단위가 '$y$의 제곱'이 됩니다(예: 가격 예측인데 단위가 '원²'). 실무에서는 \"평균적으로 몇 원, 몇 도 틀리나요?\"처럼 **원래 단위**로 말하고 싶을 때가 많습니다. 이때 MSE에 루트($\\sqrt{}$)를 씌운 **RMSE(Root Mean Squared Error, 제곱근 평균 제곱 오차)**를 씁니다. RMSE $= \\sqrt{\\text{MSE}}$ 이므로, MSE를 이해하면 RMSE도 자연스럽게 이해할 수 있습니다.","3":"**문제 유형에 맞는 손실** — 연속값이면 MSE가 자연스럽고, 클래스·확률이면 크로스엔트로피가 **최대우도추정**과 잘 맞아 분류·딥러닝에서 표준입니다. **Ch.05 로지스틱 회귀**에서는 시그모이드로 나온 확률 $\\hat p$와 이 손실이 어떻게 연결되는지 이어서 다룹니다."},"howUsed":{"0":"**수치 예측(회귀) 모델 훈련** — 아파트 가격, 내일의 기온, 주식 가격 등 **연속된 숫자**를 맞히는 문제에서 가장 기본적으로 **MSE**를 씁니다.","1":"**모델 간 성능 비교 (회귀)** — A 모델과 B 모델 중 누가 더 일을 잘하는지 모를 때, 두 모델의 MSE를 계산해봅니다. **MSE 숫자가 더 작은 모델**이 더 우수한 모델로 선정됩니다.","2":"**딥러닝 회귀 출력층** — 인공신경망이 **숫자**를 예측하는 문제를 풀 때도 출력층에서 정답과의 거리를 재기 위해 MSE를 자주 사용합니다.","3":"**분류·확률 예측** — 로지스틱 회귀, 소프트맥스 분류, 신경망의 **클래스 확률**을 학습할 때는 **크로스엔트로피**를 최소화하는 설정이 일반적입니다."},"visual":"...","problemSolving":{"0":"**손실 함수** — 회귀에서는 잔차 제곱의 평균 **MSE** $= \\frac{1}{n}\\sum_i (y_i-\\hat y_i)^2$, 분류에서는 정답 확률을 맞추는 **크로스엔트로피**, 회귀 설명력은 **$R^2 = 1 - \\text{SSE}/\\text{SST}$**로 평균 예측 대비 얼마나 나아졌는지 봅니다. 단위를 맞추려면 **RMSE** $=\\sqrt{\\text{MSE}}$를 씁니다.","1":"**예시 (MSE)**\n\n$n=2$, 잔차가 3과 -3일 때 제곱 오차 합(SSE)은?\n\n$3^2+(-3)^2=18$. → **정답 18**\n\n---\n\n**예시 (크로스엔트로피 개념)**\n\n이진 분류에서 정답 $y=1$인데 $\\hat p=0.9$이면 손실은 대체로? ① 매우 큼 ② $-\\log 0.9$에 가깝게 작음 ③ 항상 0\n\n정답 클래스 확률이 높을수록 손실이 작아진다. → **정답 ②**\n\n---\n\n**예시 (R² 해석)**\n\nSSE가 SST보다 작으면 $R^2$는? ① 항상 음수 ② 0과 1 사이일 수 있음 ③ 항상 1\n\nSSE0$일 수 있다. → **정답 ②**"}},"ml06":{"chapter":"Chapter 06","title":"로지스틱 회귀 (Logistic Regression): 합격일까 불합격일까?","sectionTitle":"로지스틱 회귀: 합격일까 불합격일까?","description":"선형 회귀가 '예상 점수'를 예측한다면, 로지스틱 회귀는 **'YES or NO'**를 판별하는 분류 전문가입니다. 예를 들어, \"공부 시간에 따른 시험 점수\"를 맞히는 게 아니라, \"이 점수면 **합격(1)**일까 **불합격(0)**일까?\"를 맞힙니다. 이를 위해 점수를 0과 1 사이의 **'확률'**로 바꿔주는 **시그모이드 함수**라는 도구를 사용합니다.","whatIs":{"0":"**마법의 S-커브, 시그모이드** — 선형 회귀로 계산한 점수 $z$는 아주 큰 숫자일 수도 있고 음수일 수도 있습니다. 하지만 확률은 무조건 0%에서 100%(0~1) 사이여야 하죠. **시그모이드 함수** $\\sigma(z) = \\frac{1}{1+e^{-z}}$는 어떤 숫자가 들어와도 **0과 1 사이의 값**으로 부드럽게 압축해주는 역할을 합니다.","1":"**운명의 커트라인 (결정 경계)** — 시그모이드 함수가 \"합격 확률은 0.7(70%)입니다\"라고 알려주면, 모델은 최종 결정을 내려야 합니다. 보통 **0.5(50%)**를 기준으로 삼습니다. 확률이 0.5 이상이면 **1(Yes/양성)**, 0.5 미만이면 **0(No/음성)**으로 분류합니다.","2":"**속은 선형 회귀와 같다?** — 로지스틱 회귀도 내부적으로는 선형 회귀처럼 $z = wx + b$ 공식을 써서 점수를 먼저 계산합니다. 단지 이 점수를 그대로 내보내지 않고, 시그모이드라는 **'확률 변환기'**에 한 번 통과시킨다는 점만 다릅니다.","3":"**수식 $\\sigma(z) = \\frac{1}{1+e^{-z}}$ 읽는 법**\n\n**분모** $1+e^{-z}$: $e$는 자연상수(약 2.718)이고, 지수 $-z$ 때문에 $z$가 음수면 $e^{-z}$가 커지고, $z$가 양수면 $e^{-z}$가 0에 가까워집니다.\n\n- **$z$가 크게 음수**일 때: $e^{-z}$가 매우 커지면 분모가 커져 $\\sigma(z) \\approx 0$.\n- **$z=0$**일 때: $e^{0}=1$이므로 $\\sigma(0) = 1/(1+1) = 0.5$.\n- **$z$가 크게 양수**일 때: $e^{-z} \\approx 0$이면 분모 $\\approx 1$이라 $\\sigma(z) \\approx 1$.\n\n따라서 이 공식은 어떤 실수 $z$든 **0과 1 사이의 확률**로 압축합니다."},"whyImportant":{"0":"**세상은 '예/아니오' 투성이** — 스팸 메일인가? (Yes/No), 암인가? (Yes/No), 고객이 물건을 살까? (Yes/No). 현실 세계의 수많은 문제는 **두 가지 중 하나를 선택**하는 이진 분류(Binary Classification) 문제입니다. 로지스틱 회귀는 이 분야의 가장 기초가 되는 모델입니다.","1":"**확신을 숫자로 보여준다** — 단순히 \"합격입니다\"라고 하는 것보다, \"합격 확률이 **98%**입니다\"라고 하면 훨씬 신뢰가 가죠? 로지스틱 회귀는 단순 분류를 넘어, 모델이 그 결과에 대해 **얼마나 확신하는지(확률)**를 알려주기 때문에 의사결정에 매우 유용합니다.","2":"**딥러닝으로 가는 징검다리** — 인공지능(딥러닝)의 신경망 하나하나는 사실 로지스틱 회귀와 매우 비슷하게 작동합니다. 이 개념을 확실히 잡으면 나중에 딥러닝을 배울 때 \"아, 이게 그거였구나!\" 하고 쉽게 이해할 수 있습니다."},"howUsed":{"0":"**스팸 필터** — 이메일의 제목이나 특정 단어를 분석해 \"이 메일이 스팸일 확률\"을 계산하고, 일정 확률이 넘으면 스팸함으로 보냅니다.","1":"**의료 진단 AI** — 환자의 엑스레이 사진이나 혈액 검사 수치를 입력받아 \"특정 질병이 있을 확률\"을 예측하여 의사의 진단을 돕습니다.","2":"**마케팅 및 추천** — \"이 고객이 이번 달에 서비스를 해지할까?\", \"이 유저가 광고를 클릭할까?\" 등을 예측하여 맞춤형 쿠폰을 보내거나 광고를 보여줍니다."},"visual":"시그모이드와 결정 경계를 보여주는 로지스틱 회귀 시각화입니다.","problemSolving":{"0":"**로지스틱 회귀** — 선형 점수 $z = \\mathbf{w}^\\top\\mathbf{x} + b$에 **시그모이드** $\\sigma(z)=\\frac{1}{1+e^{-z}}$를 씌워 0~1 **확률**로 만듭니다. 보통 $\\sigma(z)\\ge 0.5$이면 $\\hat y=1$, 미만이면 $0$입니다. $z=0$이 **결정 경계**에 해당합니다.","1":"**예시 (O/X)**\n\n\"$z=0$이면 $\\sigma(z)=0.5$이다.\" 맞으면 1, 틀리면 0.\n\n$\\sigma(0)=1/(1+1)=0.5$. → **정답 1**\n\n---\n\n**예시 (판정)**\n\n$\\sigma(z)=0.7$이면 임계값 0.5 기준 예측 클래스는? ① 0 ② 1\n\n$0.7\\ge 0.5$이므로 1. → **정답 ②**\n\n---\n\n**예시 (부호)**\n\n$z>0$이면 보통 $\\hat y$는? ① 0 ② 1\n\n$z>0$이면 $\\sigma(z)>0.5$로 $\\hat y=1$. → **정답 ②**"}},"ml07":{"chapter":"Chapter 07","title":"의사결정나무 (Decision Tree): 스무고개로 정답 찾기","description":"의사결정나무(Decision Tree)는 우리가 흔히 아는 **'스무고개' 게임**과 똑같은 방식으로 작동하는 매력적인 머신러닝 모델입니다. 데이터를 분석해 질문을 던지고 '예' 또는 '아니오'로 대답하며 정답을 찾아가는 과정을 나무가 가지를 뻗어나가는 모양으로 보여줍니다. 수학적 지식이 깊지 않아도 결과가 나온 이유를 누구나 쉽게 이해할 수 있어, 실제 비즈니스 현장에서 가장 널리 사랑받는 기법입니다.","sectionTitle":"의사결정나무: 스무고개로 정답 찾기","whatIs":{"0":" **의사결정나무의 기본 구조** — 나무를 거꾸로 뒤집어 놓은 모습을 상상해 보세요! 맨 위에는 첫 번째 질문이 자리한 **루트 노드(Root Node)**가 있습니다. 여기서부터 데이터에 질문(조건)을 던져 '예'와 '아니오'에 따라 갈래길(**내부 노드**)을 타게 됩니다. 계속해서 질문을 거쳐 더 이상 쪼개지지 않는 끝부분인 **리프 노드(Leaf Node)**에 도착하면, 비로소 최종 **예측값**을 얻게 됩니다.","1":"**스무고개 게임과 완벽하게 똑같습니다** — 머릿속으로 동물을 맞히는 스무고개를 한다고 생각해 볼까요? '다리가 4개인가요?' $\\rightarrow$ (예) $\\rightarrow$ '초식 동물인가요?' $\\rightarrow$ (아니오) $\\rightarrow$ '호랑이!' 처럼 질문을 통해 정답의 범위를 점점 좁혀나갑니다. 의사결정나무도 마찬가지로 '고객의 나이가 30세 미만인가?' 같은 명확한 기준을 세워 데이터를 두 그룹으로 나누며 정답을 향해 나아갑니다.","2":"**좋은 질문의 기준: 불순도(Impurity) 낮추기** — 데이터가 여러 종류로 지저분하게 섞여 있는 상태를 **불순도**라고 합니다. 질문을 통해 데이터를 나누었을 때, 같은 종류끼리 깔끔하게 모이도록(불순도가 낮아지도록) 만드는 것이 목표입니다. 이를 계산하는 핵심 수식 두 가지를 소개합니다.\n\n* **지니 불순도:** $G = 1 - \\sum p_i^2$\n* **엔트로피:** $H = -\\sum p_i \\log_2 p_i$\n* **💡 수식 쉽게 이해하기:** 두 수식 모두 기호가 복잡해 보이지만, 핵심은 $p_i$ (전체 중 특정 데이터가 차지하는 **비율**)입니다. 만약 한 상자 안에 사과만 100% ($p=1$) 들어있다면 두 수식의 계산 결과는 모두 $0$이 됩니다. 즉, '**불순도가 0이다 = 아주 깔끔하게 100% 잘 분류되었다**'는 뜻입니다. 반대로 사과와 배가 반반씩 섞여 있다면 불순도 값은 커집니다.","3":"**정보 이득(Information Gain): 질문의 가치 평가** — 그렇다면 어떤 질문이 가장 훌륭한 질문일까요? 복잡한 수식 대신 개념으로 이해해 봅시다. **'질문하기 전의 불순도'**에서 **'질문한 후의 불순도'**를 뺀 값을 **정보 이득**이라고 부릅니다. 쉽게 말해 **'이 질문을 던졌더니 데이터가 이전보다 얼마나 더 깔끔하게 정리되었나?'**를 측정하는 점수입니다. AI는 학습 과정에서 이 정보 이득 점수가 가장 높은(가장 똑똑한) 질문을 최우선으로 선택해 가지를 뻗어 나갑니다.","4":"**마지막 잎새(리프)에서의 최종 결정** — 꼬리에 꼬리를 무는 질문 끝에 **리프 노드**에 도착하면 최종 예측을 수행합니다.\n\n| 모델 유형 | 결정 방식 (예시) | 최종 출력 결과 |\n| :--- | :--- | :--- |\n| **분류(Classification)** | 리프에 모인 데이터의 **다수결** 원칙 | 가장 많은 클래스 (예: '강아지') |\n| **회귀(Regression)** | 리프에 모인 데이터의 **평균값** 계산 | 연속적인 수치 (예: '50만 원') |\n\n새로운 데이터가 들어와도 이 경로만 그대로 따라가면 아주 쉽게 예측 결과를 얻을 수 있습니다!","5":"**투머치토커 방지하기: 가지치기(Pruning)** — 스무고개에서 너무 세세하고 쓸데없는 질문만 계속하다 보면, 내가 가진 연습 문제(훈련 데이터)에만 딱 맞고 실전에서는 엉뚱한 답을 내놓는 **과적합(Overfitting)** 상태에 빠지게 됩니다. 이를 방지하기 위해 나무가 너무 깊게 자라지 못하도록 잔가지를 싹둑 잘라내는 **가지치기** 작업이 필수입니다. 이렇게 잘 다듬어진 나무들은 훗날 거대한 숲을 이루는 **앙상블 모델**(랜덤 포레스트 등)의 튼튼한 뼈대가 됩니다."},"whyImportant":{"0":"**속마음을 다 보여주는 투명한 AI (설명 가능한 AI)** — 복잡한 딥러닝 모델은 결론을 내놔도 '왜 그렇게 판단했는지' 알기 어려운 블랙박스 같습니다. 반면, 의사결정나무는 '나이가 30세 미만이고, 소득이 3천만 원 이상이어서 대출을 승인했습니다'처럼 판단의 **이유를 명확한 질문 경로로 설명**해 줍니다. 신뢰가 생명인 금융, 의료 분야에서 사랑받는 이유입니다.","1":" **직선을 넘어선 유연함 (비선형 경계 표현)** — 단순한 선형 회귀 모델이 데이터를 자를 때 반듯한 직선(가위)만 쓸 수 있었다면, 의사결정나무는 종이를 여러 번 접어서 오려내듯 **계단 모양**으로 구역을 잘게 나눌 수 있습니다. 덕분에 복잡하게 얽혀있는 데이터 패턴도 정교하게 분리해 냅니다.","2":"**더 강력한 마법의 기초 뼈대 (앙상블의 기본 단위)** — 나무 한 그루는 때로 변덕스럽고 예측 성능에 한계가 있을 수 있습니다. 하지만 이 나무들을 수백 그루 모아 숲을 이루면(**랜덤 포레스트**), 데이터 분석 대회를 휩쓰는 최고 수준의 AI가 탄생합니다. 즉, 의사결정나무는 고급 머신러닝으로 가기 위한 필수 관문입니다."},"howUsed":{"0":"**은행의 깐깐한 대출 심사관 (신용 평가)** — '연봉이 5천만 원 이상인가요?', '최근 1년 내 연체 기록이 있나요?' 같은 조건의 가지를 따라 내려가며, 최종적으로 이 고객에게 대출을 해줄지 말지를 명확한 기준에 따라 판단합니다.","1":"**친절한 의사 선생님의 진단 보조 (의료 진단)** — 환자의 건강 데이터(혈압, 콜레스테롤 수치 등)를 바탕으로 의학적 스무고개를 진행하여, 특정 질병에 걸렸을 확률이 높은지 예측하고 의사의 최종 진단을 돕습니다.","2":"**마케터의 비밀 무기 (고객 이탈 및 구매 예측)** — '우리 쇼핑몰에 가입한 지 6개월이 넘었는가?', '최근 한 달간 로그인 횟수가 3회 이하인가?' 등을 따져보고, 곧 우리 서비스를 떠날 것 같은 VIP 고객을 찾아내어 미리 할인 쿠폰을 발송하는 등 맞춤형 마케팅 전략을 세웁니다."},"problemSolving":{"0":"**의사결정나무** — 루트에서 조건에 따라 가지를 타고 내려가 **리프**에서 예측합니다. 분류 리프는 **다수결**, 회귀 리프는 **평균**입니다. 불순도는 **지니** $G=1-\\sum_i p_i^2$ 또는 **엔트로피** $H=-\\sum_i p_i\\log_2 p_i$로 측정합니다.","1":"**예시 (경로 따라가기)**\n\n문제에서 0=왼쪽(아니오), 1=오른쪽(예)이면, 루트에서 비트열을 따라 리프에 도달한 뒤 그 리프의 **예측값**을 읽으면 됩니다.\n\n---\n\n**예시 (지니 불순도)**\n\n한 클래스만 100%($p=1$)일 때 지니 불순도 $G=1-\\sum p_i^2$는?\n\n완전히 순수하면 $G=0$. → **정답 0**\n\n---\n\n**예시 (리프 다수결)**\n\n리프에 클래스 0이 2개, 1이 5개면 예측 클래스는?\n\n5>2이므로 1. → **정답 1**"},"visual":"질문을 따라 분기하며 예측하는 의사결정나무 시각화입니다."},"ml08":{"chapter":"Chapter 08","title":"XGBoost, LightGBM, CatBoost","description":"부스팅 3대장을 비교하며 실무 모델 선택 기준을 익힙니다.","sectionTitle":"XGBoost, LightGBM, CatBoost","whatIs":{"0":"**XGBoost**는 2차 미분(헤시안)과 규제를 적극 활용해 정확도를 끌어올리는 정석형 부스팅입니다.","1":"**LightGBM**은 리프 중심(leaf-wise) 성장과 히스토그램 기반 분할로 대용량에서 빠른 학습이 강점입니다.","2":"**CatBoost**는 범주형 데이터를 순서 기반 인코딩으로 안정적으로 다루며, 전처리 부담을 줄여줍니다."},"whyImportant":{"0":"세 모델은 모두 트리 부스팅 계열이지만, **속도·안정성·범주형 처리**에서 장단점이 달라 데이터 특성에 맞춘 선택이 필요합니다.","1":"실무에서는 \"무조건 최고 모델\"보다 **데이터 크기, 피처 타입, 학습 시간 제약**에 맞는 모델을 고르는 판단력이 더 중요합니다."},"howUsed":{"0":"정형 데이터 분류/회귀에서 XGBoost를 기준선으로 두고, 대용량이면 LightGBM, 범주형 비중이 높으면 CatBoost를 우선 검토합니다.","1":"교차검증 점수와 학습 시간, 과적합 여부를 함께 비교해 최종 모델을 결정합니다."},"problemSolving":{"0":"**모델 선택형**은 데이터 특성에 맞는 알고리즘을 고르고, **개념형 O/X**는 핵심 특성을 판별하며, **계산형**은 트리 개수·학습 라운드 같은 기본 수량을 읽어 푸는 방식으로 접근합니다.","1":"**예시 문제 1 (모델 선택)**\n\n범주형 변수가 많고 원-핫 인코딩 비용을 줄이고 싶을 때 우선 검토할 모델은? ① XGBoost ② LightGBM ③ CatBoost\n\n범주형 처리에 강한 모델은 CatBoost입니다. → **정답 ③**\n\n---\n\n**예시 문제 2 (모델 선택)**\n\n표본 수가 매우 크고 학습 속도가 중요한 상황에서 먼저 시도할 모델은? ① XGBoost ② LightGBM ③ CatBoost\n\n대용량·학습 속도 측면에서는 LightGBM을 우선 검토합니다. → **정답 ②**\n\n---\n\n**예시 문제 3 (정의형 O/X)**\n\n\"XGBoost는 규제(regularization)와 2차 미분 정보를 활용하는 부스팅 계열이다.\" 맞으면 1, 틀리면 0.\n\n설명이 맞습니다. → **정답 1**"},"visual":"XGBoost·LightGBM·CatBoost의 선택 기준(정확도·속도·범주형 처리)을 비교하는 시각화입니다."},"ml09":{"chapter":"Chapter 09","title":"앙상블 (Ensemble)과 랜덤 포레스트: 집단 지성의 힘","description":"앙상블(Ensemble)은 여러 인공지능 모델의 예측을 하나로 합쳐서 훨씬 더 강력하고 똑똑한 결과를 만들어내는 마법 같은 방법입니다. 혼자 고민하는 것보다 여러 전문가가 머리를 맞대면(집단 지성) 더 훌륭한 결론이 나오는 것과 완벽히 같은 원리입니다. 대표적인 기법인 배깅, 부스팅과 이를 의사결정나무에 적용한 '랜덤 포레스트'까지, 초보자도 쉽게 이해할 수 있도록 재미있는 비유와 함께 알아봅니다.","sectionTitle":"앙상블과 랜덤 포레스트: 집단 지성의 힘","whatIs":{"0":" **앙상블의 기본 아이디어: 백지장도 맞들면 낫다** — 앙상블은 **여러 개의 모델**을 팀으로 꾸려, 각자의 예측을 모아 최종 결론을 내리는 기법입니다. 법정에서 배심원들이 투표로 판결을 내리듯, 하나의 모델만 쓸 때보다 오답을 낼 확률(분산)이 확 줄어들고 예측이 훨씬 **안정적**으로 바뀝니다. 범주를 맞히는 분류 문제에서는 **다수결(투표)**, 숫자를 맞히는 회귀 문제에서는 **예측값의 평균**을 사용합니다.","1":"**왜 하나보다 여럿이 나을까요? (집단 지성의 힘)** — 100명의 사람에게 눈대중으로 소의 무게를 맞혀보라고 하면, 개개인의 대답은 틀릴지 몰라도 100명의 '평균'을 내면 실제 소의 무게와 놀랍도록 비슷해집니다. 여러 모델이 **독립적으로** 판단하고 결과를 모으면, 개별 모델이 가진 엉뚱한 오차들은 서로 상쇄되고 진짜 **공통된 정답의 신호**만 남게 되기 때문입니다.","2":"**세 가지 대표 앙상블 기법: 배깅, 부스팅, 스태킹** —\n(1) **배깅(Bagging)**: 여러 모델에게 무작위로 뽑은 서로 다른 모의고사(데이터)를 풀게 한 뒤, 공평하게 투표하는 방식입니다.\n(2) **부스팅(Boosting)**: 첫 번째 모델이 틀린 문제를 두 번째 모델이 집중적으로 공부하고, 또 틀린 걸 세 번째가 공부하는 식으로 **약점을 보완하며 순차적으로** 학습하는 오답 노트 방식입니다.\n(3) **스태킹(Stacking)**: 여러 현장 요원(기본 모델)들의 보고서를 바탕으로, 팀장(메타 모델)이 최종 결정을 내리는 방식입니다.","3":" **랜덤 포레스트(Random Forest): 개성 넘치는 나무들의 숲** — 배깅 방식에 '의사결정나무' 수백 그루를 심어 만든 숲입니다. 나무들이 다 똑같은 생각만 하면 앙상블의 의미가 없겠죠? 그래서 나무를 키울 때 **데이터의 특성(질문 거리)도 무작위로 일부만** 골라서 주어집니다. 어떤 나무는 '나이'만 보고 판단하고, 어떤 나무는 '소득'만 보고 판단하게 만들어 **다양성**을 극대화하는 것이 핵심 비법입니다.","4":"**수식으로 보는 투표와 평균** — 복잡한 수식 대신 개념만 기억하세요! 분류 문제에서 다수결이란 단순히 '가장 많은 나무가 지목한 정답'을 고르는 것입니다. 집값을 예측하는 것과 같은 회귀 문제에서는 아래 핵심 수식처럼 모든 나무가 부른 값을 더한 뒤 나무의 수로 나눕니다.\n* **평균 수식:** $\\hat y = \\frac{1}{B}\\sum_{b=1}^B \\hat y_b$\n* **의미:** $B$는 숲에 있는 총 나무의 수이고, $\\hat y_b$는 $b$번째 나무가 예측한 값입니다. (예: 3그루가 각각 100, 150, 200을 예측했다면 최종 예측은 150)","5":"**OOB(Out-of-Bag) 평가: 자가 진단 모의고사** — 배깅이나 랜덤 포레스트는 모델을 훈련시킬 때 전체 데이터에서 일부만 무작위로 뽑아서 씁니다. 이때 **뽑히지 않고 남은 데이터(Out-of-Bag)**들이 자연스럽게 생기는데, 이를 버리지 않고 해당 데이터를 보지 못한 나무들의 성능을 평가하는 '모의고사'용으로 알뜰하게 재활용합니다. 덕분에 따로 테스트 데이터를 떼어놓지 않아도 모델의 실력을 가늠할 수 있습니다."},"whyImportant":{"0":"**바람에 흔들리지 않는 튼튼한 숲** — 의사결정나무 '한 그루'는 데이터가 조금만 바뀌어도 나무 모양이 확 변할 만큼 예민합니다. 하지만 랜덤 포레스트처럼 '수백 그루의 숲'을 이루면, 몇 그루가 엉뚱한 답을 내더라도 전체 숲의 결정은 흔들리지 않습니다. 실전에서 압도적으로 안정적인 성능을 자랑합니다.","1":"**Ch06 의사결정나무의 완벽한 확장판** — 앞서 배운 나무의 구조(불순도, 정보 이득 등)를 그대로 사용합니다. 즉, 새로운 복잡한 규칙을 배우는 것이 아니라, 이미 배운 나무들을 '어떻게 잘 모아서 투표시킬 것인가'의 문제이므로 이전 챕터의 지식이 100% 활용됩니다.","2":"**현업과 데이터 대회의 치트키** — 랜덤 포레스트는 특별히 복잡한 설정을 만지지 않아도 기본적으로 성능이 매우 뛰어나, 실무자들의 '첫 번째 시도 모델'로 가장 사랑받습니다. 또한 어떤 변수가 중요한지(특성 중요도) 알려주기 때문에 현업에서 결과의 이유를 설명하기도 좋습니다."},"howUsed":{"0":"**비즈니스의 만능 해결사 (분류·회귀 공통)** — '이메일이 스팸인가 아닌가?' 같은 분류 문제부터, '내일의 주가는 얼마일까?' 같은 회귀 문제까지 형태를 가리지 않고 거의 모든 비즈니스 문제에 투입될 수 있습니다.","1":"**핵심 원인 찾기 (특성 중요도)** — 대출 심사 모델을 만들었을 때, 나무들이 공통적으로 가장 많이 의존한 질문이 '연봉'이라면 연봉이 대출에 가장 중요한 변수(Feature)임을 찾아낼 수 있습니다. 불필요한 데이터를 걸러내는 데 큰 도움을 줍니다.","2":"**다양한 실전 적용 사례** — 신용카드 사기 거래 탐지, 넷플릭스나 유튜브의 콘텐츠 추천 시스템, 공장 설비의 고장 시기 예측 등 정확도와 안정성이 생명인 거의 모든 산업 분야의 심장 역할을 하고 있습니다."},"problemSolving":{"0":"**모델 선택형**은 데이터 특성에 맞는 알고리즘을 고르고, **개념형 O/X**는 핵심 특성을 판별하며, **계산형**은 트리 개수·학습 라운드 같은 기본 수량을 읽어 푸는 방식으로 접근합니다.","1":"**예시 문제 1 (다수결)**\n\n클래스 0이 3표, 클래스 1이 5표이면 최종 예측 클래스는? ① 0 ② 1\n\n더 많은 표는 클래스 1입니다. → **정답 ②**\n\n---\n\n**예시 문제 2 (회귀 평균)**\n\n나무 3그루의 예측이 6, 9, 12이면 평균은?\n\n$(6+9+12)/3=9$. → **정답 9**\n\n---\n\n**예시 문제 3 (OOB 개수)**\n\n전체 10그루 중 어떤 샘플이 6그루의 부트스트랩에만 포함되었다면 OOB에 해당하는 나무 수는?\n\n$10-6=4$. → **정답 4**\n\n---\n\n**예시 문제 4 (정의형 O/X)**\n\n\"회귀 앙상블의 최종 예측은 보통 여러 나무 예측값의 평균이다.\" 맞으면 1, 틀리면 0.\n\n설명이 맞습니다. → **정답 1**"},"visual":"여러 모델의 투표/평균으로 예측하는 앙상블 시각화입니다."},"ml10":{"chapter":"Chapter 10","title":"K-평균 군집화 (K-Means): 정답 없이 끼리끼리 묶기","description":"정답(라벨) 없이 데이터만 보고 비슷한 것끼리 묶는 **비지도학습**의 대표 알고리즘입니다. Ch01에서 배운 '비지도학습'이 실제로 어떻게 동작하는지, **거리**를 기준으로 K개의 그룹(군집)을 만드는 K-Means를 통해 개념 → 직관 → 수식 → 실전 순으로 알아봅니다. KNN(Ch02)에서 썼던 거리 공식을 다시 쓰고, '끼리끼리 묶기'를 반복할수록 더 뚜렷한 군집이 만들어지는 과정을 시각화와 함께 배웁니다.","sectionTitle":"K-평균 군집화: 정답 없이 끼리끼리 묶기","whatIs":{"0":"**K-Means란? 정답 없이 거리로 끼리끼리 묶기** — 라벨 $y$가 전혀 주어지지 않은 데이터 $\\mathbf{x}_1, \\mathbf{x}_2, \\ldots$만 있을 때, **가장 가까운 것끼리** K개의 그룹으로 나누는 알고리즘입니다. '가깝다'는 기준은 Ch02 KNN에서처럼 **유클리드 거리** $d(\\mathbf{x}, \\boldsymbol{\\mu}) = \\sqrt{\\sum_j (x_j - \\mu_j)^2}$를 사용합니다. 각 그룹은 **한 개의 대표점(중심, centroid)** $\\boldsymbol{\\mu}_k$로 요약되고, 반복적으로 '점을 가장 가까운 중심에 배정' → '각 군집의 점들 평균으로 중심 갱신'을 하여 군집이 안정될 때까지 진행합니다.","1":"**K는 '몇 개의 그룹으로 나눌지'를 정하는 수** — K-Means에서는 **군집 개수 K**를 사람이 미리 정해 줍니다. K=2면 두 덩어리, K=3이면 세 덩어리로 나뉩니다. 정답 라벨이 없기 때문에 '어떤 군집이 정답인가'는 알 수 없고, 단지 '비슷한 것끼리 묶인 결과'만 얻습니다. 실무에서는 K를 바꿔 가며 결과를 보고, 도메인 지식이나 엘보우 법·실루엣 점수 등으로 적절한 K를 고릅니다.","2":"**목표: 군집 내 거리 합(SSE) 최소화** — 알고리즘이 최소화하려는 것은 **왜곡(SSE, Sum of Squared Errors)** $J = \\sum_{k=1}^K \\sum_{i \\in C_k} \\|\\mathbf{x}_i - \\boldsymbol{\\mu}_k\\|^2$ 입니다. 즉, 각 점이 자기 군집의 중심과 얼마나 가까운지의 제곱합을 줄이는 것입니다. 중심 갱신 공식 $\\boldsymbol{\\mu}_k = \\frac{1}{|C_k|}\\sum_{i \\in C_k} \\mathbf{x}_i$는 '그 군집에 속한 점들의 좌표 평균'으로, 이렇게 옮기면 해당 군집의 SSE가 줄어듭니다.","3":"**수식이 부담스럽다면** — 거리 공식은 '한 점과 한 중심 사이의 길이'를 재는 것이고, SSE $J$는 '군집이 얼마나 뭉쳐 있는지'를 숫자로 잡은 것입니다. 중심 갱신식은 말 그대로 '그 군집에 속한 점들 좌표의 평균'을 구하는 식이라, 단계만 따라가면 자연스럽게 읽히도록 아래 **수식 설명**에서 기호별로 풀어 썼습니다."},"whyImportant":{"0":"**Ch01 비지도학습의 대표 사례** — Ch01에서 '라벨 없이 구조·군집을 찾는 학습'으로 비지도학습을 소개했습니다. K-Means는 그 말을 실제로 구현한 대표 알고리즘입니다. 고객 세분화, 문서/이미지 클러스터링, 이상 탐지 전처리 등에서 라벨이 없을 때 첫 번째로 시도하는 방법입니다.","1":"**고객 세분화·세그멘테이션** — 쇼핑몰에서 '구매 이력만 있고 고객 유형 라벨이 없을 때' K-Means로 비슷한 고객끼리 묶어 VIP/일반/이탈 위험 등 세그먼트를 만든 뒤, 사람이 각 군집에 의미를 붙여 활용합니다. 이후 Ch09 교차 검증, Ch12 추천 등과 연결되는 전처리 단계로도 쓰입니다.","2":"**직관적이고 구현이 단순함** — 할당 단계(가장 가까운 중심 고르기)와 갱신 단계(평균 계산)만 반복하면 되므로 코드로 짜기 쉽고, 2차원으로 시각화하면 '끼리끼리 묶이는' 과정을 눈으로 확인할 수 있어 학습하기 좋습니다."},"howUsed":{"0":"**군집화(Clustering)** — 고객 세분화, 주제별 문서/뉴스 묶기, 이미지 색상/영역 압축, 유전자 표현형 그룹 찾기 등 '비슷한 것끼리 묶기'가 목적일 때 사용합니다.","1":"**전처리·특성 요약** — 군집 번호를 새 특성으로 붙여서 지도 학습 모델에 넣거나, 군집별 대표(중심)만 남겨 데이터 크기를 줄이는 용도로 씁니다.","2":"**K 선택** — K는 사용자가 정합니다. 여러 K에 대해 SSE·실루엣 등을 보고 꺾이는 지점(엘보우)이나 해석 가능성을 고려해 선택합니다."},"problemSolving":{"0":"**K-Means** — 라벨 없이 데이터만 주어지면 **K개 중심**을 두고, **할당**(가장 가까운 중심)과 **갱신**(군집 내 점들의 평균으로 중심 이동)을 반복합니다. 목표는 SSE $J = \\sum_{k}\\sum_{i \\in C_k} \\|\\mathbf{x}_i - \\boldsymbol{\\mu}_k\\|^2$ 를 줄이는 것이고, 중심은 $\\boldsymbol{\\mu}_k = \\frac{1}{|C_k|}\\sum_{i \\in C_k} \\mathbf{x}_i$ 로 갱신합니다.","1":"**예시 (용어 정리)**\n\n- **거리 제곱** — $(x_2-x_1)^2+(y_2-y_1)^2$ 등. 비교만 하면 제곱근 없이 제곱합으로도 가능.\n- **할당** — 각 중심까지 거리(또는 거리 제곱)가 **가장 작은** 군집 번호에 점을 배정.\n- **중심 갱신** — 군집에 속한 점들 좌표의 **평균**이 새 중심.\n- **SSE** — 점–중심 거리 제곱의 합; 작을수록 뭉침.\n\n---\n\n**예시 (할당)**\n\n중심 $\\mu_1=(0,0)$, $\\mu_2=(4,0)$일 때 점 $(2,0)$의 군집 번호(동률이면 1번)?\n\n거리 제곱 둘 다 4. 보통 1번. → **정답 1**\n\n---\n\n**예시 (중심 갱신)**\n\n군집에 $(1,2)$, $(3,4)$만 있으면 새 중심의 $\\bar{x}$는?\n\n$(1+3)/2=2$. → **정답 2**\n\n---\n\n**예시 (거리 제곱)**\n\n점 $(1,2)$와 중심 $(4,6)$의 거리 제곱은?\n\n$3^2+4^2=25$. → **정답 25**\n\n---\n\n**예시 (SSE 개념)**\n\n$J$가 작아질수록 군집은? ① 더 흩어진다 ② 더 잘 뭉친다\n\n$J$가 작을수록 중심에 가깝게 모임. → **정답 ②**"},"visual":"할당과 중심 갱신을 반복하는 K-Means 시각화입니다."},"ml11":{"chapter":"Chapter 11","title":"교차 검증 (Cross Validation): 모의고사와 수능","description":"인공지능 모델이 자기가 공부한 연습 문제만 달달 외워서 푸는 '우물 안 개구리'가 되는 것을 막기 위한 필수 과정입니다. 수능을 앞둔 수험생이 **모의고사**를 통해 자신의 진짜 실력을 객관적으로 점검하고 약점을 보완하듯, 머신러닝 모델도 **훈련 데이터**로만 채점받지 않고 **검증(Validation)**과 **테스트(Test)**라는 낯선 문제들로 평가받아야 합니다. 이 챕터에서는 데이터를 쪼개어 모델의 진짜 실력을 검증하는 **교차 검증(Cross Validation)**의 다양한 기법(Hold-out, K-Fold 등)과 이를 통해 모델의 신뢰성을 높이는 방법을 알아봅니다.","sectionTitle":"교차 검증: 모의고사와 수능","whatIs":{"0":"**교차 검증이란? '풀어본 문제로 채점하지 않기'** — 만약 수학 시험을 볼 때, 문제집에서 풀었던 문제와 토씨 하나 틀리지 않고 똑같이 출제된다면 어떨까요? 학생이 원리를 이해한 건지, 아니면 문제의 답만 달달 외운 **과적합(Overfitting)** 상태인지 알 길이 없습니다. 인공지능도 마찬가지입니다. 모델을 학습시킨 데이터로 또다시 테스트를 하면 항상 100점이 나오기 마련입니다. 그래서 우리가 가진 전체 데이터를 **훈련(Train)**, **검증(Validation)**, **테스트(Test)** 세 묶음으로 쪼개어, 처음 보는 낯선 데이터에서도 모델이 제 실력을 발휘하는지 깐깐하고 공정하게 평가하는 과정이 바로 교차 검증입니다.","1":"**데이터를 쪼개는 3단계 역할 분담** — 데이터를 나누는 가장 이상적인 황금비율과 각 역할은 다음과 같습니다.\n\n- **훈련(Train) 데이터** — 비유: 개념서 / 기본 문제집. 인공지능이 패턴을 찾고 공식을 학습(가중치 조절)하는 데 쓰는 주교재입니다. 일반적인 비율: 약 70~80%.\n- **검증(Validation) 데이터** — 비유: 9월 모의고사. 학습 중간에 실력을 점검하고, 학습 방향(하이퍼파라미터)을 수정하는 데 씁니다. 일반적인 비율: 약 10~15%.\n- **테스트(Test) 데이터** — 비유: 대망의 수능 시험. 모든 학습이 끝난 후, 실전에 투입하기 전 **단 한 번만** 꺼내어 최종 점수를 매깁니다. 일반적인 비율: 약 10~15%.","2":"**어떻게 쪼갤까? Hold-out과 K-Fold** — 데이터를 쪼개는 방법에는 크게 두 가지가 있습니다. 첫 번째는 피자를 칼로 단 한 번 슥 잘라서 한쪽은 먹고 한쪽은 남기듯, 데이터를 한 번만 훈련용과 테스트용으로 나누는 **Hold-out(홀드아웃)** 방식입니다. 아주 쉽고 빠르지만, 만약 우연히 쉬운 문제들만 테스트용으로 빠지면 모델의 성능이 뻥튀기될 수 있는 '운'이 작용합니다. 이 단점을 완벽히 극복한 것이 바로 **K-Fold(K-겹) 교차 검증**입니다. 전체 데이터를 K개의 조각(Fold)으로 낸 다음, 돌아가면서 한 조각씩 모의고사(검증) 용도로 쓰고 나머지는 훈련용으로 씁니다. 이렇게 하면 모든 데이터가 최소 한 번씩은 모의고사 문제로 출제되므로 '운'에 좌우되지 않는 아주 객관적인 실력 평가가 가능해집니다.","3":"**수식으로 보는 K-Fold의 최종 성적** — K-Fold 검증이 끝나면 K번의 모의고사를 치렀으니 성적표도 K개가 나옵니다. 모델의 최종 진짜 실력은 이 K번의 성적을 모두 합쳐서 평균을 낸 값으로 결정합니다.\n\n* **평균 성적 수식:** $\\bar{S} = \\frac{1}{K}\\sum_{k=1}^K S_k$\n\n* **수식 기호 설명:** $K$는 Fold 개수(모의고사 횟수), $S_k$는 $k$번째 Fold를 검증용으로 썼을 때 받은 점수(정확도·MSE 등)입니다. $\\sum_{k=1}^K S_k$는 $S_1 + S_2 + \\cdots + S_K$를 뜻하므로, 전체를 $K$로 나눈 $\\bar{S}$가 **K개 검증 점수의 평균**이 됩니다. 이 평균 $\\bar{S}$를 모델의 최종 성능 추정값으로 씁니다.\n\n* **숫자 예:** 5-Fold로 5번 시험을 봤고 점수가 80, 85, 90, 80, 85점이면 $\\bar{S} = (80+85+90+80+85)/5 = 84$점이 진짜 평균 점수가 됩니다."},"whyImportant":{"0":"**우물 안 개구리 탈출 (과적합 감지)** — 모델이 자기가 연습한 훈련 데이터에서는 99점을 받는데, 처음 보는 검증 데이터에서는 50점을 받는다면? 이는 개념은 모르고 답만 외운 **과적합** 상태임이 틀림없습니다. 교차 검증은 모델이 실전에 나가 대형 사고를 치기 전에 이런 '암기왕'들을 미리 솎아내는 강력한 필터 역할을 합니다.","1":"**어디서든 통하는 진짜 실력 증명 (일반화 성능 추정)** — 기업이 AI를 도입하는 이유는 과거의 데이터를 맞히기 위해서가 아니라, '앞으로 일어날 미래'를 예측하기 위해서입니다. K-Fold처럼 여러 번 교차해서 꼼꼼히 검증을 거친 모델은, 나중에 처음 보는 생소한 데이터가 들어와도 당황하지 않고 안정적으로 정답을 맞힐 확률(일반화 성능)이 매우 높습니다.","2":"**최적의 공부법 찾기 (하이퍼파라미터 튜닝과 모델 선택)** — 모델을 만들 때 나무의 깊이를 3으로 할지 5로 할지, 이웃(K-NN)을 3명 볼지 5명 볼지(하이퍼파라미터) 고민될 때가 있습니다. 이때 다양한 설정으로 각각 모의고사(검증 데이터)를 치러보고 가장 점수가 잘 나오는 설정을 고르면 됩니다! 모의고사와 수능(테스트 데이터)이 엄격하게 분리되어 있기 때문에, 꼼수 없이 가장 똑똑한 모델을 공정하게 선발할 수 있습니다."},"howUsed":{"0":"**데이터 과학자의 필수 작업 루틴 (실무 파이프라인)** — 실무에서 데이터를 건네받으면, 가장 먼저 하는 일이 금고에 '테스트 데이터'를 10% 정도 떼어서 꼭꼭 숨겨두는 것입니다. 나머지 90%를 지지고 볶으며(훈련 및 K-Fold 검증) 최고의 모델을 깎아 만든 뒤, 프로젝트 발표 전날 숨겨둔 테스트 데이터를 딱 한 번 꺼내어 \"우리 모델의 최종 예측 정확도는 92%입니다!\"라고 자신 있게 보고하게 됩니다.","1":"**인공지능 올림픽 개최 (여러 알고리즘의 공정한 비교)** — '우리 쇼핑몰 고객 이탈 예측에는 로지스틱 회귀가 좋을까, 랜덤 포레스트가 좋을까?' 궁금할 때, 똑같은 K-Fold 룰을 적용해 두 알고리즘을 공정하게 경쟁시킵니다. 똑같은 조건으로 모의고사를 5번씩 치르게 한 뒤 평균 점수($\\bar{S}$)가 더 높은 알고리즘을 최종 우승자로 선정하여 실제 서비스에 투입합니다."},"problemSolving":{"0":"**정리**\n\n교차 검증은 모델이 훈련할 때 쓰인 데이터로만 성능을 재면 안 된다는 전제에서 출발합니다. 수능을 앞둔 수험생이 모의고사로 실력을 점검하듯, 머신러닝에서도 **훈련 데이터**로만 채점하면 '연습 문제만 외운 상태'인지 알 수 없습니다. 그래서 전체 데이터를 **훈련**, **검증**, **테스트** 세 역할로 나눕니다. **훈련** 데이터로 모델이 패턴을 학습하고, **검증** 데이터는 학습 도중 실력을 점검하거나 하이퍼파라미터를 고를 때 사용합니다. **테스트** 데이터는 모든 학습이 끝난 뒤, 실전에 쓰기 전 **단 한 번만** 꺼내어 최종 성능을 보고할 때만 씁니다. 데이터를 나누는 방식에는 **Hold-out**과 **K-Fold**가 있습니다. Hold-out은 데이터를 한 번만 훈련용과 테스트용(또는 검증용)으로 쪼개는 방법이고, K-Fold는 데이터를 K개 구간으로 나누어 한 구간씩 번갈아 검증용으로 쓰고 나머지로 훈련하는 방식입니다. K-Fold를 쓰면 모든 데이터가 한 번씩은 검증에 쓰이므로, 한 번만 나누는 것보다 성능 추정이 더 안정적입니다.","1":"**예시 (용어·계산 정리)**\n\n- **훈련 개수 (Hold-out)** — $n \\times (\\text{비율}/100)$ 등\n- **테스트 개수** — $n - \\text{훈련 개수}$\n- **한 Fold 크기** — $\\lfloor n / K \\rfloor$\n- **검증 점수 평균** — $(S_1 + \\cdots + S_K) / K$\n- **Stratified** — 각 Fold가 클래스 비율 유지\n\n---\n\n**예시 (정의 O/X)**\n\n\"테스트 데이터는 여러 번 써도 된다\"가 맞으면 1, 틀리면 0.\n\n최종 보고용 테스트는 보통 한 번만 쓰는 것이 원칙에 가깝다. → **정답 0**\n\n---\n\n**예시 (Hold-out 훈련 개수)**\n\n데이터 100개, 훈련 비율 80%일 때 훈련 개수는?\n\n$80$. → **정답 80**\n\n---\n\n**예시 (Hold-out 테스트 개수)**\n\n위 설정에서 테스트 개수는?\n\n$20$. → **정답 20**\n\n---\n\n**예시 (K-Fold 한 Fold 크기)**\n\n100개를 5-Fold로 나눌 때 한 Fold 크기는?\n\n$20$. → **정답 20**\n\n---\n\n**예시 (K-Fold 평균)**\n\n5-Fold 점수 80, 80, 90, 80, 90의 평균(정수)은?\n\n$84$. → **정답 84**\n\n---\n\n**예시 (Stratified)**\n\nStratified K-Fold가 말하는 것은? ① Fold마다 클래스 비율 유지 ② 무작위만\n\n①. → **정답 1**"},"visual":"데이터 분할과 K-Fold 평가 흐름을 보여주는 시각화입니다."},"ml12":{"chapter":"Chapter 12","title":"분류 평가 지표 (Evaluation): 혼동 행렬과 모델의 성적표","description":"분류 인공지능 모델이 시험을 치른 후 받는 **'상세 성적표'**에 대해 알아봅니다. 단순히 \"전체 문제 중 몇 점 맞았어?\"(정확도)라고 묻는 것을 넘어, \"어떤 문제를 어떻게 틀렸어?\"를 꼼꼼히 따져보는 **혼동 행렬(Confusion Matrix)**의 개념을 배웁니다. 스팸 메일 필터나 암 진단 AI처럼 실생활에서 '틀리는 방식'이 치명적인 결과를 낳을 수 있는 비즈니스 상황에서, **정밀도, 재현율, F1 점수** 같은 다채로운 지표들이 어떻게 모델의 진짜 실력을 증명해 주는지 직관적인 비유와 함께 설명합니다.","sectionTitle":"분류 평가 지표: 혼동 행렬과 모델의 성적표","whatIs":{"0":"**혼동 행렬(Confusion Matrix)이란? 인공지능의 상세 성적표** — 학교 시험에서 '맞은 개수'만 달랑 보면 이 학생이 수학을 잘하는지 영어를 잘하는지 알 수 없습니다. 분류 모델도 마찬가지로, 모델이 예측한 결과와 **실제 정답(행)**, 그리고 모델의 **예측(열)**을 나란히 비교해 2×2 표로 만든 것을 **혼동 행렬**이라고 합니다. 이 표의 네 칸을 들여다보면 모델이 무엇을 잘 맞히고 어떤 부분에서 '혼동'을 겪으며 헛발질을 하고 있는지 한눈에 파악할 수 있습니다.","1":"**네 칸의 비밀: TP, TN, FP, FN** — 유명한 '양치기 소년과 늑대' 비유로 이해해 볼까요? 여기서 '양성(Positive)'은 늑대가 나타났다고 외치는 것이고, '음성(Negative)'은 평화로운 상태입니다.\n* **TP (맞춘 양성, True Positive):** 실제 늑대가 왔고(1), 소년도 늑대라고 외침(1). 마을을 구한 최고의 상황입니다.\n* **TN (맞춘 음성, True Negative):** 늑대가 안 왔고(0), 소년도 얌전히 조용함(0). 평화로운 상황입니다.\n* **FP (오탐, False Positive):** 늑대가 안 왔는데(0), 소년이 늑대라고 거짓말함(1). 마을 사람들이 무기를 들고 뛰어나오는 헛고생을 합니다. (False Alarm)\n* **FN (놓침, False Negative):** 실제 늑대가 왔는데(1), 소년이 자느라 조용함(0). 양들이 다 잡아먹히는 최악의 대참사입니다. (Miss)\n* 전체 데이터 개수 $n = \\mathrm{TP} + \\mathrm{TN} + \\mathrm{FP} + \\mathrm{FN}$ 입니다.","2":"**정확도(Accuracy)의 아찔한 함정** — 전체 문제 중에서 정답을 맞힌 비율을 의미합니다. 수식으로는 $\\text{정확도} = \\frac{\\mathrm{TP}+\\mathrm{TN}}{n}$ 입니다. 아주 직관적이지만 무서운 함정이 있습니다. 만약 100일 중 99일이 평화롭고 단 1일만 늑대가 온다고 가정해 봅시다. 매일 눈을 감고 \"늑대 안 와!\"라고만 외치는 바보 로봇도 정확도는 무려 99%가 나옵니다. 진짜 잡아야 할 늑대(양성)가 매우 적은 '불균형한 데이터' 상황에서는 정확도라는 숫자 하나만 믿으면 절대 안 됩니다.","3":"**정밀도(Precision)와 재현율(Recall): 쫓아야 할 두 마리 토끼** —\n* **정밀도 (신중함의 척도):** \"내가 늑대라고 외쳤을 때, 그게 진짜 늑대일 확률이 얼마나 돼?\" 모델이 **양성이라고 예측한 것 중 진짜 양성의 비율**입니다. $\\text{정밀도} = \\frac{\\mathrm{TP}}{\\mathrm{TP}+\\mathrm{FP}}$. 거짓말(FP)을 안 하고 확실할 때만 말할수록 올라갑니다.\n* **재현율 (예민함의 척도):** \"실제 늑대가 나타난 사건들 중에서, 내가 몇 번이나 눈치채고 경고했어?\" **실제 양성 중에서 모델이 맞힌 비율**입니다. $\\text{재현율} = \\frac{\\mathrm{TP}}{\\mathrm{TP}+\\mathrm{FN}}$. 단 한 마리의 늑대도 놓치지 않을수록(FN이 적을수록) 올라갑니다.","4":"**F1 점수 (F1 Score): 정밀도와 재현율의 황금 밸런스** — 정밀도와 재현율은 시소와 같아서, 하나를 높이려고 무리하면 다른 하나가 뚝 떨어지기 마련입니다. 이 둘을 하나의 숫자로 깔끔하게 요약한 점수가 **F1 점수**입니다. 일반적인 평균이 아닌 **조화평균**을 사용합니다. $\\text{F1} = \\frac{2 \\cdot \\mathrm{TP}}{2\\cdot\\mathrm{TP}+\\mathrm{FP}+\\mathrm{FN}}$. 조화평균의 마법 덕분에, 정밀도나 재현율 둘 중 하나라도 형편없이 낮으면 F1 점수도 바닥을 치게 됩니다. 어느 한쪽에 치우치지 않는 훌륭한 균형감을 가진 모델을 찾고 싶을 때 주로 씁니다.","5":"**AUC (Area Under the ROC Curve): 모델의 등급 판정기** — 모델이 단순히 \"양성/음성\"으로만 답을 내는 게 아니라, \"90% 확률로 늑대다\"처럼 확률 점수를 줄 때 평가하는 지표입니다. 0부터 1 사이의 값으로 나오며, **진짜 양성인 데이터에게 진짜 음성인 데이터보다 대체로 더 높은 확률 점수를 잘 부여하는지(구분력)**를 봅니다. 1점 만점이면 정답을 완벽하게 줄 세운 것이고, 0.5점이면 눈 감고 동전을 던져서 찍는 것과 같습니다. 임계값을 이리저리 바꾸기 전에 모델 자체의 튼튼한 '기초 체력'을 비교할 때 아주 유용합니다."},"whyImportant":{"0":"**정확도 99%의 거짓말에 속지 않기 위해** — 신용카드 사기 탐지 AI를 만들었다고 상상해 봅시다. 10만 건의 결제 중 사기 결제는 단 1건입니다. AI가 아무 일도 안 하고 무조건 \"전부 정상 결제입니다\"라고만 찍어도 정확도는 99.999%가 나옵니다. 하지만 이 AI는 사기꾼을 단 한 명도 잡지 못하는(재현율 0%) 쓸모없는 모델입니다. 혼동 행렬을 그려 **정밀도**와 **재현율**을 뜯어보아야만 모델이 진짜 제 역할을 하고 있는지, 아니면 꼼수를 부리고 있는지 낱낱이 밝혀낼 수 있습니다.","1":"**실무는 '어떤 실수를 더 용납할 수 있는가'의 치열한 싸움입니다** — 비즈니스 목적에 따라 목숨을 걸어야 하는 지표가 달라집니다.\n* **재현율(놓침 방지)이 생명인 곳:** 암 진단 모델. 건강한 사람을 암 환자로 오해(FP)해서 재검사를 받게 하더라도, 진짜 암 환자를 놓쳐서(FN) 치료 시기를 놓치게 만드는 대참사는 무조건 막아야 합니다.\n* **정밀도(오탐 방지)가 생명인 곳:** 스팸 메일 필터. 진짜 스팸 메일 한두 개를 놓쳐서(FN) 내 편지함에 들어오는 건 지우면 그만이지만, 사장님이 보낸 중요한 업무 메일을 스팸으로 오해(FP)해서 스팸함에 처박아버리면 회사 생활에 큰 위기가 찾아옵니다."},"howUsed":{"0":"**AI 서비스의 최종 합격 여부 심사 (이진 분류 평가)** — 코로나19 양성/음성 판정, 유튜브의 유해 영상 차단/허용, 은행의 대출 승인/거절 등 두 가지 중 하나를 고르는 수많은 실무 AI 프로젝트들이 배포되기 직전, 혼동 행렬을 그려 정밀도와 재현율, F1 점수를 종합적으로 검토받습니다.","1":"**알람의 민감도 조절하기 (임계값 튜닝)** — AI는 보통 0부터 1 사이의 확률을 내놓습니다. \"확률이 몇 % 이상일 때 알람을 울릴까?\" 이 기준선(임계값)을 조절하면서 비즈니스 상황에 맞게 모델을 길들입니다. 보안이 극도로 삼엄한 국가 기관이라면 기준을 팍 낮춰서 조금만 이상해도 알람이 울리게(재현율 극대화) 만들고, 반대로 알림이 너무 자주 울려 사용자가 짜증을 내는 앱이라면 기준을 깐깐하게 높여서 아주 확실할 때만 알람이 울리게(정밀도 극대화) 세팅합니다."},"problemSolving":{"0":"**혼동 행렬·지표** — **TP/TN/FP/FN**으로 2×2로 나누고 $n=\\mathrm{TP}+\\mathrm{TN}+\\mathrm{FP}+\\mathrm{FN}$. **정확도** $(\\mathrm{TP}+\\mathrm{TN})/n$, **정밀도** $\\mathrm{TP}/(\\mathrm{TP}+\\mathrm{FP})$, **재현율** $\\mathrm{TP}/(\\mathrm{TP}+\\mathrm{FN})$, **F1**은 정밀도·재현율의 조화평균. 불균형 데이터는 정밀도·재현율을 함께 봅니다.","1":"**예시 (용어·계산 정리)**\n\n- **TP** — 실제 양성, 예측 양성\n- **TN** — 실제 음성, 예측 음성\n- **FP** — 오탐\n- **FN** — 놓침\n- **정확도(%)** — $100 \\times (\\mathrm{TP}+\\mathrm{TN}) / n$\n- **정밀도(%)** — $100 \\times \\mathrm{TP} / (\\mathrm{TP}+\\mathrm{FP})$\n- **재현율(%)** — $100 \\times \\mathrm{TP} / (\\mathrm{TP}+\\mathrm{FN})$\n- **F1(%)** — $100 \\times 2\\mathrm{TP} / (2\\mathrm{TP}+\\mathrm{FP}+\\mathrm{FN})$\n\n---\n\n**예시 (정확도)**\n\nTP=10, TN=70, FP=10, FN=10일 때 정확도(%)(정수)는?\n\n$80$. → **정답 80**\n\n---\n\n**예시 (정밀도)**\n\nTP=10, FP=10일 때 정밀도(%)(정수)는?\n\n$50$. → **정답 50**\n\n---\n\n**예시 (재현율)**\n\nTP=10, FN=10일 때 재현율(%)(정수)는?\n\n$50$. → **정답 50**\n\n---\n\n**예시 (F1)**\n\nTP=10, FP=10, FN=10일 때 F1(%)(정수)는?\n\n$50$. → **정답 50**"},"visual":"혼동 행렬과 평가 지표 계산 과정을 보여주는 시각화입니다."},"ml13":{"chapter":"Chapter 13","title":"규제 (Regularization): 암기왕의 한계 극복하기","description":"머신러닝 모델이 문제집의 정답만 달달 외우는 **'암기왕'**이 되는 것을 막아주는 핵심 기술입니다. 훈련 데이터에 너무 꼭 맞추려다 보면, 조금만 다른 새로운 문제가 나와도 쩔쩔매게 되는데 이를 **과적합(Overfitting)**이라고 부릅니다. **규제(Regularization)**는 모델이 '데이터의 오차'를 줄이는 동시에 **'너무 복잡하고 억지스러운 수식을 만들지 않도록' 페널티(벌점)**를 부여합니다. 이를 통해 잔가지는 쳐내고 진짜 중요한 패턴만 깨우친, 실전(일반화)에 강한 모델을 만들어냅니다.","sectionTitle":"규제: 암기왕의 한계 극복하기","whatIs":{"0":"**규제(Regularization)란? 복잡함에 가하는 '벌점'**\n\n모델이 훈련 데이터의 사소한 노이즈나 예외 상황까지 억지로 맞추려다 보면 모델의 수식이 꼬불꼬불하고 쓸데없이 복잡해집니다. 규제는 모델의 **총 손실(Loss)**을 계산할 때, 단순히 '정답과 얼마나 틀렸는가(오차)'에만 신경 쓰지 않고 **'모델이 얼마나 복잡한가(가중치의 크기)'**를 더해 벌점을 줍니다. 벌점을 받기 싫은 모델은 자연스럽게 더 단순하고 깔끔한 형태를 유지하게 됩니다.","1":"**직관적 비유: 벼락치기 암기왕 vs 원리를 파고드는 학생**\n\n문제집(훈련 데이터)의 숫자 하나하나까지 외워버린 벼락치기 학생은 모의고사 점수는 100점이지만, 수능(새로운 데이터)에서는 참패합니다. 반면 원리를 이해한 학생은 모의고사에서 한두 개 틀릴지언정 수능에서는 흔들리지 않고 고득점을 받습니다. 규제는 모델에게 **'잔가지(과도한 가중치)를 쳐내고 큰 줄기(핵심 패턴)만 보라'**고 강제하여 실전 융통성을 길러주는 선생님 같은 역할을 합니다.","2":"**수학적 형태: 두 가지 마법의 수식 (L1과 L2)**\n\n규제는 모델에 벌점을 주는 방식에 따라 크게 두 가지로 나뉩니다.\n\n- **L2 규제 (Ridge)**: 가중치의 제곱을 벌점으로 사용합니다. 목표 함수는 $J = \\text{MSE} + \\lambda \\sum_{j} w_j^2$ 가 됩니다. 가중치가 너무 커지는 것을 둥글둥글하게 골고루 눌러줍니다.\n- **L1 규제 (Lasso)**: 가중치의 절댓값을 벌점으로 사용합니다. 목표 함수는 $J = \\text{MSE} + \\lambda \\sum_{j} |w_j|$ 가 됩니다. 덜 중요한 특징의 가중치를 아예 **0**으로 만들어버려서, 핵심 특징만 남기는(스파스) 특징이 있습니다.","3":"**실생활 예시: 스팸 메일 필터링과 의료 진단**\n\n스팸 메일을 걸러낼 때, 훈련 메일에 우연히 들어있던 평범한 단어('안녕하세요' 등)에 높은 가중치를 주면 정상 메일도 스팸으로 걸러내는 끔찍한 실수를 합니다. 이때 규제를 적용하면 특정 단어 하나에만 집착하는(가중치가 폭발하는) 현상을 막아줍니다. 의료 진단에서도 수많은 환자 데이터 중 '환자복 색깔' 같은 무의미한 정보에 AI가 속지 않도록 돕습니다.","4":"**수식 읽기: 초보자를 위한 수식 해부**\n\n- **총 손실 수식 (L2 예시)**: $J = \\text{MSE} + \\lambda \\sum_{j} w_j^2$\n - **$J$ (제이)**: 우리가 최종적으로 제일 작게(최소화) 만들고 싶은 **'최종 성적표'**입니다. 이 값이 작을수록 좋은 모델입니다.\n - **$\\text{MSE}$**: 예측값과 실제 정답이 얼마나 차이 나는지 보여주는 **'오차 점수'**입니다.\n - **$\\lambda$ (람다)**: 우리가 직접 설정하는 **'벌점의 강도'**입니다. 이 값이 커지면 호랑이 선생님처럼 복잡한 모델에 엄청난 벌점을 내리고, 작아지면 벌점을 거의 주지 않습니다.\n - **$\\sum_{j} w_j^2$ (L2 페널티)**: 모델이 가진 모든 가중치($w$)를 제곱해서 더한 값입니다. 가중치가 조금이라도 커지면 이 값이 확 늘어나서 $J$가 커지므로, 모델은 알아서 가중치를 작게 유지하려고 노력합니다.\n\n- **L1 페널티 ($\\lambda \\sum_{j} |w_j|$)**\n - L2가 제곱을 썼다면, L1은 가중치의 **절댓값($|w_j|$)**을 씁니다. L1은 마치 깐깐한 정리 정돈 전문가 같아서, 쓸모없는 가중치는 가차 없이 **0**으로 지워버립니다."},"whyImportant":{"0":"**실전(일반화) 성능이 진정한 목표이기 때문입니다**\n\n머신러닝의 진정한 가치는 연습할 때가 아니라 **'처음 보는 데이터(테스트 데이터)'**를 만났을 때 빛을 발해야 합니다. 규제를 적용하면 훈련 데이터에서의 정확도는 살짝 떨어질 수 있지만, 실전에서의 정확도는 훨씬 높아집니다. 이처럼 미지의 데이터에도 잘 대응하는 능력을 **일반화(Generalization)**라고 합니다.","1":"**균형의 미학: 편향-분산 트레이드오프 (Bias-Variance Tradeoff)**\n\n모델이 너무 단순하면 문제를 아예 못 푸는 **편향(Bias, 과소적합)**이 커지고, 너무 복잡하면 데이터의 노이즈까지 외우는 **분산(Variance, 과적합)**이 커집니다. 이 둘은 시소 같아서 하나가 내려가면 하나가 올라갑니다. 규제 강도 $\\lambda$를 조절하는 것은 이 시소의 완벽한 **수평(균형점)**을 찾는 과정입니다.","2":"**인간의 몫: $\\lambda$ (하이퍼파라미터) 찾기**\n\n$\\lambda$는 AI가 스스로 학습하는 값이 아니라, **사람이 직접 세팅해 주어야 하는 다이얼(하이퍼파라미터)**입니다. 다이얼을 너무 세게 돌리면 모델이 바보가 되고, 너무 약하게 돌리면 다시 암기왕이 됩니다. 그래서 여러 개의 $\\lambda$ 값을 돌려보고 가장 실전 성적이 좋은 값을 찾아내는 과정이 꼭 필요합니다."},"howUsed":{"0":"**기본 모델에 날개 달기 (Ridge & Lasso)**\n\n우리가 흔히 쓰는 **선형 회귀**나 **로지스틱 회귀** 수식 끝에 방금 배운 L1, L2 벌점 수식을 슬쩍 더해주기만 하면 됩니다.\n\n- 선형 회귀 + L2 규제 = **릿지(Ridge) 회귀**\n- 선형 회귀 + L1 규제 = **라쏘(Lasso) 회귀**\n\n컴퓨터가 알아서 벌점이 포함된 총 손실을 줄이는 방향(경사 하강법 등)으로 학습하며 가중치를 조절해 줍니다.","1":"**실무에서의 3단계 파이프라인 (적용 순서)**\n\n실무에서는 다음 순서로 규제를 다룹니다.\n\n**1. 데이터 분할**: 전체 데이터를 [훈련용 / 검증용 / 테스트용]으로 나눕니다.\n\n**2. $\\lambda$ 오디션 진행**: $\\lambda$ 값을 0.01, 0.1, 1, 10 등 다양하게 바꿔가며 훈련용 데이터로 여러 개의 모델을 만듭니다.\n\n**3. 우승자 선정 및 실전 투입**: 검증용 데이터로 시험을 쳐서 가장 점수가 높은 $\\lambda$ 모델을 최종 우승자로 뽑습니다. 그리고 마지막으로 테스트용 데이터로 단 한 번의 최종 실력을 평가합니다."},"problemSolving":{"0":"**규제** — 손실에 **데이터 오차**(MSE 등)와 **λ×페널티**를 더해 가중치가 커지는 것을 억제하고 **과적합**을 줄입니다. **L2(Ridge)**는 $\\sum_j w_j^2$, **L1(Lasso)**는 $\\sum_j|w_j|$로 스파스 해를 유도합니다. λ는 **하이퍼파라미터**입니다.","1":"**예시 (수식 정리)**\n\n- **L2 페널티** — $w=(2,3,1)$ → $4+9+1=14$\n- **총 손실** — MSE=20, λ=2, 페널티=5 → $J=30$\n- **L1 페널티** — $w=(2,-3,1)$ → $2+3+1=6$\n\n---\n\n**예시 (정의)**\n\n규제의 주된 목적은? ① 과적합 완화 ② 훈련 속도 ③ 데이터 증강\n\n①. → **정답 1**\n\n---\n\n**예시 (O/X)**\n\n\"규제는 훈련 오차만 최소화하면 된다\" 맞으면 1, 틀리면 0.\n\n페널티 항이 있어야 한다. → **정답 0**\n\n---\n\n**예시 (λ)**\n\n$J = \\text{MSE} + \\lambda\\cdot(\\text{페널티})$에서 λ는? ① 규제 강도 ② 학습률\n\n①. → **정답 1**\n\n---\n\n**예시 (L2)**\n\n$w_1=2,w_2=3,w_3=1$일 때 $\\sum_j w_j^2$는?\n\n$14$. → **정답 14**\n\n---\n\n**예시 (총 손실)**\n\nMSE=20, λ=2, L2 페널티=5일 때 $J$는?\n\n$30$. → **정답 30**\n\n---\n\n**예시 (L1)**\n\n$w=(2,-3,1)$일 때 $\\sum_j|w_j|$는?\n\n$6$. → **정답 6**\n\n---\n\n**예시 (L1 vs L2)**\n\n일부 가중치를 정확히 0으로 만들기 쉬운 쪽은? ① L1 ② L2\n\n①. → **정답 1**"},"visual":"규제로 과적합을 완화하는 과정을 보여주는 시각화입니다.","problems":{"definition_0":"규제(Regularization)의 주된 목적은? ① 과적합 완화 ② 훈련 속도 향상 ③ 데이터 증강","definition_1":"손실 함수에 '가중치에 대한 페널티'를 더해 모델을 단순하게 만드는 방법은? ① 규제 ② 정규화 ③ 앙상블","definition_2":"과적합을 줄이기 위해 손실에 λ·(페널티)를 더하는 기법은? ① 규제 ② 경사 하강 ③ K-Fold","definition_3":"L2 규제에서 페널티 항은? ① $\\sum w_j$ ② $\\sum w_j^2$ ③ $\\sum |w_j|$","definition_4":"L1 규제에서 페널티 항은? ① $\\sum w_j$ ② $\\sum w_j^2$ ③ $\\sum |w_j|$","definition_5":"λ(람다)가 클수록 모델은 어떻게 변하는가? ① 더 복잡해진다 ② 더 단순해진다 ③ 변하지 않는다","definition_6":"일부 가중치를 0으로 만들어 스파스한 모델을 만드는 규제는? ① L1 ② L2 ③ 둘 다","definition_7":"가중치를 작게 유지하되 0으로 만들기보다는 줄이는 규제는? ① L1 ② L2 ③ 둘 다","definition_8":"Ridge 회귀는 어떤 규제를 쓰는가? ① L1 ② L2 ③ 없음","definition_9":"Lasso 회귀는 어떤 규제를 쓰는가? ① L1 ② L2 ③ 없음","trueFalse_0":"규제를 쓰면 훈련 오차는 늘어날 수 있지만 일반화 성능이 나아질 수 있다. 맞으면 1, 틀리면 0.","trueFalse_1":"λ가 0이면 규제가 없고, λ가 크면 페널티가 커져 가중치가 억제된다. 맞으면 1, 틀리면 0.","trueFalse_2":"L2 규제의 페널티는 가중치의 절댓값의 합이다. 맞으면 1, 틀리면 0.","trueFalse_3":"L1 규제는 일부 가중치를 정확히 0으로 만드는 경향이 있다. 맞으면 1, 틀리면 0.","trueFalse_4":"규제 강도 λ는 보통 교차 검증으로 선택한다. 맞으면 1, 틀리면 0.","trueFalse_5":"과적합일 때 규제를 강화(λ를 키우면) 도움이 될 수 있다. 맞으면 1, 틀리면 0.","trueFalse_6":"규제 없이 훈련 손실만 최소화하면 검증 성능이 항상 좋다. 맞으면 1, 틀리면 0.","trueFalse_7":"총 손실 = 데이터 손실 + λ × 페널티 형태로 두는 것이 규제의 기본이다. 맞으면 1, 틀리면 0.","choice_0":"총 손실 J = MSE + λ·(페널티)에서 λ의 역할은? ① 규제 강도 ② 학습률 ③ 배치 크기","choice_1":"L2 페널티 $\\sum w_j^2$이 크면 모델은? ① 더 복잡하다 ② 가중치가 크다 ③ 페널티만 크고 가중치는 학습으로 작아진다","choice_2":"Ridge와 Lasso의 공통점은? ① 모두 L1만 쓴다 ② 모두 가중치에 페널티를 준다 ③ 모두 분류만 한다","choice_3":"규제를 쓰지 않으면(λ=0) 어떤 일이 생기기 쉬운가? ① 언더피팅 ② 과적합 ③ 학습 불가","choice_4":"검증 성능을 보고 λ를 고를 때 사용하는 방법은? ① 훈련만 반복 ② 교차 검증 ③ 테스트 여러 번","l2Penalty_0":"가중치가 $w_1=1$, $w_2=2$, $w_3=2$일 때 L2 페널티 $\\sum_j w_j^2$의 값(정수)은?","l2Penalty_1":"가중치가 $w_1=0$, $w_2=3$, $w_3=4$일 때 L2 페널티 $\\sum_j w_j^2$의 값(정수)은?","l2Penalty_2":"가중치가 $w_1=2$, $w_2=2$일 때 L2 페널티 $w_1^2+w_2^2$의 값(정수)은?","l2Penalty_3":"가중치가 $w_1=1$, $w_2=1$, $w_3=1$, $w_4=1$일 때 L2 페널티 $\\sum_j w_j^2$의 값(정수)은?","l2Penalty_4":"가중치가 $w_1=3$, $w_2=4$일 때 L2 페널티의 값(정수)은?","totalLoss_0":"MSE=10, λ=1, L2 페널티 $\\sum w_j^2=6$일 때 총 손실 J=MSE+λ·(페널티)의 값(정수)은?","totalLoss_1":"MSE=16, λ=2, L2 페널티 $\\sum w_j^2=5$일 때 총 손실 J(정수)는?","totalLoss_2":"MSE=8, λ=4, L2 페널티=2일 때 J(정수)는?","totalLoss_3":"MSE=12, λ=3, 페널티=4일 때 J=MSE+λ·페널티(정수)는?","totalLoss_4":"MSE=20, λ=2, 페널티=10일 때 J(정수)는?","l1Penalty_0":"가중치가 $w_1=2$, $w_2=-3$, $w_3=1$일 때 L1 페널티 $\\sum |w_j|$의 값(정수)은?","l1Penalty_1":"가중치가 $w_1=1$, $w_2=2$, $w_3=3$일 때 L1 페널티의 값(정수)은?","l1Penalty_2":"가중치가 $w_1=-1$, $w_2=2$일 때 L1 페널티 $|w_1|+|w_2|$의 값(정수)은?","l1Penalty_3":"가중치가 $w_1=4$, $w_2=0$, $w_3=3$일 때 L1 페널티의 값(정수)은?","l1Penalty_4":"가중치가 $w_1=5$, $w_2=5$일 때 L1 페널티의 값(정수)은?","concept_0":"규제에서 '일반화'의 의미는? ① 훈련 데이터만 잘 맞추기 ② 처음 보는 데이터에서도 잘 맞추기 ③ 데이터 개수 늘리기","concept_1":"편향-분산 트레이드오프에서 규제를 강화하면? ① 분산이 커진다 ② 분산이 줄어든다 ③ 편향만 커진다","concept_2":"규제 항을 손실에 더하면 최적화 시 가중치가 어떻게 되는가? ① 제한 없이 커질 수 있다 ② 일정 수준 이상 커지면 손실이 늘어나 억제된다 ③ 항상 0이다","concept_3":"Lasso(L1)를 쓰는 실용적 이유 중 하나는? ① 계산이 L2보다 빠르다 ② 일부 특성만 선택(스파스)해 해석이 쉽다 ③ 항상 L2보다 성능이 좋다","concept_4":"Ridge(L2)와 Lasso(L1)를 동시에 쓰는 규제는? ① Elastic Net ② Dropout ③ Batch Norm","concept_5":"하이퍼파라미터 λ를 바꿀 때 비교하는 지표는 주로? ① 훈련 손실 ② 검증(또는 교차 검증) 성능 ③ 파라미터 개수","concept_6":"과적합이 심할 때 먼저 시도해 볼 수 있는 것은? ① λ 줄이기 ② λ 키우기 또는 데이터 늘리기 ③ 모델 더 복잡하게","concept_7":"규제의 효과를 '암기왕의 한계 극복'에 비유하면, 암기왕은? ① 훈련 데이터에만 과하게 맞춘 모델 ② 일반화가 잘 된 모델 ③ λ가 큰 모델","concept_8":"손실 J = MSE + λ·(L2 페널티)에서 λ=0이면? ① 규제만 있다 ② 규제가 없다(일반 최소제곱과 동일) ③ L1과 같다","concept_9":"검증 오차가 훈련 오차보다 훨씬 크다면 보통? ① 언더피팅 ② 과적합 ③ 적절한 적합","definition_10":"Elastic Net은 어떤 규제를 함께 쓰는가? ① L1만 ② L2만 ③ L1과 L2","trueFalse_8":"L2 규제를 쓰면 가중치가 0이 되는 경우가 L1보다 많다. 맞으면 1, 틀리면 0.","choice_5":"페널티 항 $\\lambda \\sum w_j^2$에서 λ가 0이면? ① 규제가 없다 ② 규제가 최대다 ③ L1과 같다"}},"ml14":{"chapter":"Chapter 14","title":"추천 시스템 기초 (Collaborative Filtering)","description":"넷플릭스나 유튜브에서 '이런 콘텐츠는 어때요?'라는 추천을 받아보고 신기해했던 적이 있으신가요? **협업 필터링(Collaborative Filtering)**은 나와 취향이 비슷한 사람들이 높게 평가한 항목을 나에게 추천해 주는 아주 똑똑하고 직관적인 방식입니다. 마치 점심 메뉴를 고를 때 입맛이 비슷한 친구의 추천을 믿고 가는 것과 같죠. 이 챕터에서는 빈칸이 가득한 평점 행렬을 어떻게 채워나가는지, 나와 닮은 '이웃'을 어떻게 찾는지, 그리고 실제 서비스에서는 어떤 식으로 활용되는지 초보자도 쉽게 이해할 수 있도록 단계별로 알아보겠습니다.","sectionTitle":"추천 시스템 기초: 협업 필터링","whatIs":{"0":"**협업 필터링이란? (다른 사람의 지혜 빌리기)** — 협업 필터링은 말 그대로 다른 사용자들의 **과거 행동 데이터(평점, 클릭, 구매 내역 등)**를 바탕으로 나에게 딱 맞는 항목을 골라내는 기술입니다. '나와 비슷한 취향을 가진 사람이 좋아한 것이라면, 나도 좋아할 확률이 높다'는 아주 자연스럽고 인간적인 아이디어에서 출발했습니다. 넷플릭스의 영화 추천, 아마존의 상품 추천, 스포티파이의 음악 추천 등 우리가 매일 사용하는 거의 모든 플랫폼에서 가장 핵심적으로 사용되는 원리입니다.","1":"**이웃(Neighbor)의 선택을 믿어보세요** — 영화를 고르는 상황을 상상해 볼까요? 나와 내 친구가 평소에 액션 영화 A와 B에 모두 만점을 주었다고 가정해 봅시다. 그런데 그 친구가 최근에 개봉한 스릴러 영화 C에도 만점을 주었다면 어떨까요? 나 역시 영화 C를 재미있게 볼 가능성이 매우 높겠죠. 이처럼 나와 비슷한 패턴으로 평가를 내린 사람들을 머신러닝에서는 **이웃(Neighbor)**이라고 부릅니다. 이 이웃들의 평점 데이터를 모아 내가 아직 보지 않은 영화에 대한 내 반응을 **예측(Prediction)**하는 것이 바로 협업 필터링의 마법입니다.","2":"**수학적 표현: 평점 행렬과 예측의 원리** — 수많은 사용자와 아이템 간의 관계를 표로 만든 것을 **평점 행렬(Rating Matrix)**이라고 합니다. 가로는 영화, 세로는 사용자로 이루어진 거대한 엑셀 표를 상상해 보세요. 우리는 세상의 모든 영화를 보지 않기 때문에 대부분의 칸은 비어있을 것입니다. 이 빈칸을 채우는 것이 우리의 목표입니다. 특정 사용자 $u$가 아직 보지 않은 아이템 $i$에 대해 어떤 평점을 줄지 예측하는 핵심 수식은 다음과 같습니다.\n\n$\\displaystyle \\hat{r}_{u,i} = \\frac{\\sum_{v \\in N_u} s_{u,v} \\cdot r_{v,i}}{\\sum_{v \\in N_u} \\lvert s_{u,v} \\rvert}$\n\n(의미: 예측 평점 = 이웃들이 준 평점을 유사도로 나눈 가중 평균)\n\n이 수식은 전혀 복잡하지 않습니다! $\\hat{r}_{u,i}$는 우리가 알고 싶은 **예측 평점**입니다. $N_u$는 나와 비슷한 **이웃들**을 의미하고, $s_{u,v}$는 나와 이웃 간의 **유사도(얼마나 취향이 비슷한가)**를 나타냅니다. $r_{v,i}$는 **이웃이 그 아이템에 준 실제 평점**이죠. 즉, 나와 취향이 더 비슷한(유사도가 높은) 이웃의 의견에 더 높은 **가중치**를 주어 평균을 내는 '가중 평균' 방식입니다. 얼마나 비슷한지는 보통 **코사인 유사도(Cosine Similarity)**라는 방법으로 측정합니다.","3":"**실전에서의 한계점과 해결책** — 협업 필터링이 완벽한 것은 아닙니다. 가장 큰 문제는 **콜드 스타트(Cold Start)**입니다. 새로 가입한 사용자나 갓 등록된 신상품은 쌓인 데이터가 전혀 없기 때문에 추천을 해줄 이웃도, 참고할 평점도 없습니다. 또한, 너무 많은 상품에 비해 사용자들이 남긴 평점이 턱없이 부족한 **희소성(Sparsity)** 문제도 발생합니다. 이를 해결하기 위해 실무에서는 상품 자체의 정보(장르, 색상, 감독 등)를 분석하는 **콘텐츠 기반 필터링(Content-based Filtering)**을 섞어 쓰거나, 행렬의 숨은 의미를 수학적으로 찾아내는 **행렬 분해(Matrix Factorization)** 기법을 활용하여 단점을 보완합니다."},"whyImportant":{"0":"**비즈니스 성공과 사용자 경험(UX)의 핵심 열쇠** — 현대의 플랫폼에서 '맞춤형 추천'은 선택이 아닌 필수입니다. 사용자는 수백만 개의 상품 속에서 헤매지 않고 원하는 것을 즉시 찾을 수 있어 만족도가 올라가고, 플랫폼은 자연스럽게 매출 증대와 체류 시간 연장이라는 두 마리 토끼를 잡을 수 있습니다. 특히 협업 필터링은 아이템에 대한 복잡한 설명(예: 이 영화의 장르는 무엇이고 감독은 누구인지 등)을 일일이 입력하지 않아도, 오직 **사용자들의 행동 패턴**만으로도 강력한 **개인화(Personalization)**가 가능하다는 엄청난 장점을 가집니다.","1":"**머신러닝 응용의 훌륭한 출발점** — 추천 시스템은 일반적인 머신러닝의 분류(스팸 메일인지 아닌지 맞추기)나 회귀(내일의 집값 예측하기) 문제와는 조금 다릅니다. 사람마다 정답(취향)이 모두 다르고, 거대한 **행렬의 텅 빈 공간을 지능적으로 채워 넣는 퍼즐**과 같기 때문입니다. 이 협업 필터링의 기본 개념과 평점 행렬의 원리를 탄탄히 다져두면, 이후에 등장하는 넷플릭스 알고리즘의 핵심 기술인 **행렬 분해(Matrix Factorization)**나 최신 기술인 **딥러닝 기반 추천 시스템**을 이해하는 데 아주 든든한 디딤돌이 될 것입니다."},"howUsed":{"0":"**두 가지 접근법: 유저 기반 vs 아이템 기반** — 협업 필터링은 누구를 기준으로 삼느냐에 따라 두 가지로 나뉩니다. 첫째, **유저 기반(User-based)**은 '나와 취향이 비슷한 사람'을 찾아 그 사람이 본 것을 추천합니다. 둘째, **아이템 기반(Item-based)**은 사람 대신 상품 자체의 관계에 집중합니다. 쇼핑몰에서 흔히 보는 '이 상품을 구매한 사람들이 함께 구매한 다른 상품'이 바로 이 방식입니다. 실무에서는 계산 속도가 빠르고 예측이 더 안정적이라는 이유로 주로 **아이템 기반** 협업 필터링이 훨씬 더 널리 쓰입니다. 둘 다 원리와 수식 구조는 매우 비슷합니다.","1":"**조금 더 정교한 예측: 사람마다 다른 기준 맞추기** — 앞서 본 가중 평균 수식에는 한 가지 맹점이 있습니다. 바로 '사람마다 점수를 주는 잣대가 다르다'는 점이죠. 어떤 사람은 웬만하면 후하게 5점을 주고, 어떤 사람은 아주 깐깐해서 최고점이 3점일 수 있습니다. 이를 보정하기 위해 각 사용자의 **평균 평점**($\\bar{r}_u$)을 기준으로 점수가 얼마나 높은지, 낮은지를 계산하는 방식을 사용합니다.\n\n$\\displaystyle \\hat{r}_{u,i} = \\bar{r}_u + \\frac{\\sum_{v \\in N_u} s_{u,v}(r_{v,i} - \\bar{r}_v)}{\\sum_{v \\in N_u} \\lvert s_{u,v} \\rvert}$\n\n(의미: 내 평균 + 이웃들이 ‘자기 평균 대비’ 얼마나 더 줬는지의 가중 평균)\n\n이 수식은 내 평균 평점에다가, '비슷한 이웃들이 본인들의 평균 평점보다 얼마나 더 높게 혹은 낮게 평가했는지'를 가중 평균 내어 더해주는 방식입니다. 깐깐한 사람과 후한 사람의 차이를 없애주어 훨씬 더 개인의 성향을 잘 반영할 수 있습니다! 이렇게 만든 모델이 얼마나 정확한지는 주로 실제 평점과 예측 평점의 차이를 계산하는 **MAE(평균 절대 오차)**나 **RMSE(평균 제곱근 오차)** 같은 평가 지표로 확인합니다.","2":"**더 넓은 세상으로: 행렬 분해와 하이브리드 추천** — 초보 단계를 넘어 실제 기업의 대규모 서비스 환경으로 가면, 거대하고 텅 빈 평점 행렬을 두 개의 작고 꽉 찬 행렬로 쪼개는 **행렬 분해(Matrix Factorization, MF)** 기술을 만나게 됩니다. 이는 사용자와 아이템 사이에 숨겨진 '잠재적 특징(Latent Factor)'을 찾아내어 빈칸을 훨씬 더 정확하고 빠르게 예측합니다. 또한, 협업 필터링의 영원한 숙제인 콜드 스타트를 극복하기 위해, 콘텐츠 자체의 특성(예: 액션 장르, 주연 배우 등)을 분석하는 기술과 섞어 쓰는 **하이브리드(Hybrid) 추천 시스템**이 오늘날 글로벌 IT 기업들의 표준으로 자리 잡고 있습니다."},"problemSolving":{"0":"**협업 필터링** — 다른 사용자의 **행동(평점·클릭 등)**으로 **이웃**을 찾고, 이웃 평점으로 빈 칸 $\\hat{r}_{u,i}$를 **단순 평균** 또는 **가중 평균**으로 채웁니다. **평점 행렬**은 행=사용자, 열=아이템이며 흔히 희소합니다. 콜드 스타트·희소성은 콘텐츠 기반·MF·하이브리드로 보완합니다.","1":"**예시 (풀이 요약)**\n\n- **정의** — 다른 사용자 **행동** 기반 = 협업 필터링\n- **평점 행렬** — 행=사용자, 열=아이템, 칸 수=사용자 수×아이템 수\n- **단순 평균** — $\\hat{r} = \\frac{1}{K}\\sum r_{v,i}$\n- **가중 평균** — $\\hat{r} = \\frac{\\sum s_{u,v} r_{v,i}}{\\sum |s_{u,v}|}$\n\n---\n\n**예시 (정의)**\n\n협업 필터링에 가장 가까운 것은? ① 다른 사용자 행동 기반 ② 장르만 ③ 무작위\n\n①. → **정답 1**\n\n---\n\n**예시 (단순 평균)**\n\n이웃 평점 3, 4, 5의 평균은?\n\n$4$. → **정답 4**\n\n---\n\n**예시 (행렬 칸 수)**\n\n사용자 3명, 아이템 4개일 때 칸 수는?\n\n$12$. → **정답 12**\n\n---\n\n**예시 (가중 평균)**\n\n평점 4,5,3에 가중치 2,1,1이면 가중 평균은?\n\n$(8+5+3)/4=4$. → **정답 4**"},"visual":"평점 행렬 기반 추천 흐름을 보여주는 시각화입니다.","problems":{"definition_0":"협업 필터링이란? ① 다른 사용자 행동(평점·클릭) 기반 추천 ② 아이템 특성(장르 등) 기반 추천 ③ 무작위 추천","definition_1":"'비슷한 취향의 사용자'가 좋아한 항목을 추천하는 방식은? ① 협업 필터링 ② 지도 학습 ③ K-Means","definition_2":"유저 기반 협업 필터링에서 '이웃'이란? ① 나와 취향이 비슷한 사용자 ② 같은 지역 사용자 ③ 같은 연령대 사용자","definition_3":"평점 행렬에서 행과 열은 각각? ① 행=사용자, 열=아이템 ② 행=아이템, 열=사용자 ③ 행=시간, 열=평점","definition_4":"Cold Start 문제란? ① 신규 사용자·아이템은 이웃이 없어 추천이 어려움 ② 서버가 멈추는 현상 ③ 평점이 너무 많은 현상","definition_5":"협업 필터링에서 유사도를 구하는 목적은? ① 비슷한 사용자(또는 아이템) 찾기 ② 평점 정규화 ③ 행렬 압축","definition_6":"이웃들의 평점으로 빈 칸을 채우는 예측은? ① 협업 필터링의 핵심 단계 ② 전처리 ③ 평가 지표","definition_7":"코사인 유사도·피어슨 상관계수는? ① 사용자(또는 아이템) 간 유사도 지표 ② 손실 함수 ③ 활성화 함수","definition_8":"아이템 기반 협업 필터링에서는? ① 비슷한 아이템을 찾아 추천 ② 비슷한 사용자만 사용 ③ 평점 행렬을 쓰지 않음","definition_9":"희소성 문제란? ① 평점이 매우 적어 행렬이 대부분 비어 있음 ② 평점이 너무 많음 ③ 사용자가 너무 많음","definition_10":"MAE·RMSE는 추천 시스템에서? ① 예측 정확도 평가 지표 ② 유사도 지표 ③ 행렬 크기","definition_11":"하이브리드 추천은? ① 협업+콘텐츠 등 여러 방식 결합 ② 협업만 사용 ③ 추천 없음","trueFalse_0":"협업 필터링은 다른 사용자들의 평점을 이용해 추천한다. 맞으면 1, 틀리면 0.","trueFalse_1":"이웃이 많을수록(K가 클수록) 예측이 항상 더 정확하다. 맞으면 1, 틀리면 0.","trueFalse_2":"평점 행렬은 보통 희소하다(대부분 칸이 비어 있다). 맞으면 1, 틀리면 0.","trueFalse_3":"Cold Start는 신규 사용자에게 추천이 어려운 문제를 말한다. 맞으면 1, 틀리면 0.","trueFalse_4":"유저 기반과 아이템 기반은 모두 유사도와 이웃 개념을 사용한다. 맞으면 1, 틀리면 0.","trueFalse_5":"예측값은 이웃 평점의 단순 평균으로만 구할 수 있다. 맞으면 1, 틀리면 0.","trueFalse_6":"행렬 분해(Matrix Factorization)는 추천에서 빈 칸 예측에 쓰인다. 맞으면 1, 틀리면 0.","trueFalse_7":"협업 필터링만으로 모든 Cold Start를 완벽히 해결할 수 있다. 맞으면 1, 틀리면 0.","trueFalse_8":"넷플릭스·이커머스 등에서 협업 필터링이 널리 쓰인다. 맞으면 1, 틀리면 0.","choice_0":"협업 필터링의 핵심 아이디어는? ① 비슷한 사용자의 행동을 빌림 ② 아이템 설명만 사용 ③ 무작위 선택","choice_1":"평점 행렬의 한 칸이 의미하는 것은? ① 한 사용자가 한 아이템에 준 평점 ② 사용자 수 ③ 아이템 수","choice_2":"이웃 K명의 평점으로 예측할 때 쓰는 기본 식은? ① 평균(또는 가중 평균) ② 최댓값 ③ 최솟값","choice_3":"유사도를 높이 쓰는 이유는? ① 비슷한 이웃을 고르기 위해 ② 평점을 정규화하기 위해 ③ 행렬을 압축하기 위해","choice_4":"희소한 행렬에서 생기는 문제는? ① 유사도 추정이 불안정 ② 계산이 너무 빠름 ③ 사용자가 없음","choice_5":"추천 품질을 숫자로 재는 지표는? ① MAE·RMSE ② 유사도 ③ 행렬 크기","choice_6":"아이템 기반 추천에서 '비슷한 아이템'을 찾을 때 쓰는 것은? ① 아이템 간 유사도 ② 사용자 수 ③ 평점 합","choice_7":"Cold Start 완화를 위해 함께 쓰는 방법은? ① 콘텐츠 기반·하이브리드 ② 협업만 ③ 추천 안 함","scenario_0":"신규 가입 사용자에게 첫 추천을 할 때 어려운 점은? ① Cold Start(이웃·평점 없음) ② 평점이 너무 많음 ③ 유사도가 1임","scenario_1":"'이 상품을 본 사람들은 이것도 봤습니다'에 가까운 방식은? ① 아이템 기반 협업 필터링 ② 유저 기반만 ③ 무작위","scenario_2":"평점이 거의 없는 새 영화를 추천하려 할 때 어려운 점은? ① Cold Start(아이템 쪽) ② 이웃이 너무 많음 ③ 유사도가 0임","scenario_3":"협업 필터링과 장르·태그를 함께 쓰는 방식은? ① 하이브리드 ② 협업만 ③ 콘텐츠만","scenario_4":"넷플릭스처럼 '당신을 위한 추천'을 할 때 기반이 되는 것은? ① 개인화(협업·콘텐츠 등) ② 모두 동일 추천 ③ 광고만","scenario_5":"행렬이 매우 희소할 때 추천 품질을 높이려면? ① 행렬 분해·하이브리드 등 보완 ② 이웃 수만 늘림 ③ 평점 삭제","concept_0":"K명의 이웃을 고를 때 K는? ① 사용자가 정하는 하이퍼파라미터 ② 항상 1 ③ 항상 전체 사용자","concept_1":"가중 평균 예측에서 가중치로 쓰는 것은? ① 유사도 ② 평점만 ③ 무작위","concept_2":"행렬 분해(Matrix Factorization)의 목적은? ① 빈 칸 예측·차원 축소 ② 평점 삭제 ③ 유사도 제거","concept_3":"평점 행렬의 크기(칸 수)는? ① (사용자 수)×(아이템 수) ② 사용자 수만 ③ 아이템 수만","concept_4":"이웃 평점이 3, 4, 5일 때 단순 평균 예측값(정수)은? ① 4 ② 5 ③ 3","concept_5":"유저 기반에서 예측에 쓰는 데이터는? ① 이웃 사용자들의 해당 아이템 평점 ② 나의 과거 평점만 ③ 아이템 설명만","concept_6":"MAE가 작을수록 의미하는 것은? ① 예측이 실제에 가깝다 ② 예측이 나쁘다 ③ 무관하다","concept_7":"콘텐츠 기반 추천은? ① 아이템 특성(장르·태그) 기반 ② 협업만 ③ 무작위","concept_8":"Cold Start를 완화하는 방법은? ① 콘텐츠·인기 항목·하이브리드 ② 이웃 수만 늘리기 ③ 추천 중단","neighborPredict_0":"이웃 3명의 평점이 3, 4, 5일 때 평균 예측값(정수)은?","neighborPredict_1":"이웃 3명의 평점이 2, 4, 6일 때 평균 예측값(정수)은?","neighborPredict_2":"이웃 3명의 평점이 4, 4, 4일 때 평균 예측값(정수)은?","neighborPredict_3":"이웃 3명의 평점이 1, 3, 5일 때 평균 예측값(정수)은?","neighborPredict_4":"이웃 4명의 평점이 2, 2, 4, 4일 때 평균 예측값(정수)은?","neighborPredict_5":"이웃 3명의 평점이 5, 5, 5일 때 평균 예측값(정수)은?","matrixCells_0":"사용자 3명, 아이템 4개일 때 평점 행렬의 칸 수(정수)는?","matrixCells_1":"사용자 5명, 아이템 6개일 때 평점 행렬의 칸 수(정수)는?","matrixCells_2":"사용자 2명, 아이템 10개일 때 평점 행렬의 칸 수(정수)는?","matrixCells_3":"사용자 4명, 아이템 5개일 때 평점 행렬의 칸 수(정수)는?","matrixCells_4":"사용자 6명, 아이템 5개일 때 평점 행렬의 칸 수(정수)는?","weightedPredict_0":"이웃 평점이 4, 5, 3이고 가중치가 2, 1, 1일 때 가중 평균 예측값(정수)은?","weightedPredict_1":"이웃 평점이 3, 5이고 가중치가 1, 1일 때 가중 평균 예측값(정수)은?","weightedPredict_2":"이웃 평점이 5, 3, 4이고 가중치가 2, 2, 2일 때 가중 평균 예측값(정수)은?","weightedPredict_3":"이웃 평점이 2, 4이고 가중치가 1, 1일 때 가중 평균 예측값(정수)은?","weightedPredict_4":"이웃 평점이 5, 5, 1이고 가중치가 1, 1, 2일 때 가중 평균 예측값(정수)은?"}}},"mlCh01":{"chapter":"Chapter 01","title":"결측치 처리: 데이터 공백을 채우는 전략","description":"우리가 마주하는 실무 데이터는 엑셀의 빈칸처럼 값이 비어 있는 **결측치(Missing Value)**가 아주 흔합니다. 이 빈칸을 무시하고 넘어가면 인공지능 모델이 아예 작동을 멈추거나, 완전히 엉뚱한(편향된) 결과를 낼 수 있습니다. 이 챕터에서는 데이터에 생긴 '빵꾸'를 메우는 방법부터, 너무 튀는 데이터(**이상치**)를 솎아내고, 한쪽으로 치우친 데이터(**클래스 불균형**)를 바로잡는 과정까지, 머신러닝의 든든한 기초 체력이 되는 **데이터 품질 파이프라인**을 완벽하고 알기 쉽게 정리합니다.","sectionTitle":"결측치 처리란? 공백을 줄이고 신뢰를 높이는 데이터 전처리","whatIs":{"0":"**결측치란?** 데이터 테이블에서 값이 비어 있는 상태입니다. 마치 이빨이 빠진 퍼즐과 같습니다. 실무에서는 설문조사에서 답변을 안 하거나, 센서가 고장 나서 기록이 끊기거나, 데이터를 옮기는 중에 유실되는 등 다양한 이유로 발생합니다.","1":"**결측 메커니즘(MCAR/MAR/MNAR)**은 빈칸이 '왜' 생겼는지 그 원인을 따지는 것입니다. **MCAR**(완전 무작위 결측 · Missing Completely At Random)은 실수로 설문지에 커피를 쏟아 글씨가 지워진 것처럼 완전히 우연한 빈칸입니다. **MAR**(무작위 결측 · Missing At Random)은 '남성' 응답자가 '화장품 소비량'을 적지 않은 것처럼 다른 변수와 연관된 경우입니다. **MNAR**(비무작위 결측 · Missing Not At Random)은 '소득이 낮은 사람'이 일부러 '소득' 칸을 비워두는 것처럼, 빈칸 자체에 뼈아픈 의미가 숨어있는 경우입니다.","2":"**처리 전략**은 크게 세 가지입니다. 쿨하게 지워버리는 **삭제**, 하나의 값으로 대충 메우는 **단일대치**, 여러 번 정교하게 채워보고 평균을 내는 **다중대치**가 있습니다. 각각 잃는 데이터의 양과 처리 속도가 다르기 때문에 상황에 맞춰 골라 써야 합니다.","3":"**단일대치와 다중대치**: **단일대치**는 빈칸을 '평균'이나 '가장 많이 나온 값'으로 한 번에 쓱싹 채우는 방법입니다. 빠르지만 위험할 수 있습니다. 반면 **다중대치**는 빈칸에 들어갈 법한 그럴싸한 값들을 여러 번 채워보고(가상 세계를 여러 개 만들고), 그 결과들을 종합해 가장 안전한 결론을 도출하는 꼼꼼한 방법입니다. 단일대치에서 자주 쓰는 값은 **평균값(연속형)**, **중앙값(이상치가 많을 때)**, **최빈값(범주형)**이며, 상황에 따라 **회귀대치·KNN 대치·Hot-deck** 같은 방법도 사용합니다.","4":"**이상치 탐지의 두 관점**: 하나의 변수만 보고 튄 값을 찾는 **단변량 탐지(Box Plot)**와, 여러 변수를 묶어서 조합이 이상한 점을 찾는 **다변량 탐지(Mahalanobis/Isolation Forest/SVDD)**는 서로 다른 문제를 해결합니다. 실무에서는 보통 둘 다 확인해야 놓치는 케이스가 줄어듭니다.","5":"**클래스 불균형 보정**: 데이터가 한쪽 클래스로 치우치면 모델은 소수 클래스를 '없는 것처럼' 학습하기 쉽습니다. 이를 보완하기 위해 Tomek Links(경계 정리), SMOTE/ADASYN(소수 샘플 합성), SMOTE+Tomek(합성 후 정리) 같은 전략을 조합합니다.","6":"**핵심 메시지**: 결측치 처리는 단독 기술이 아니라, 이상치 탐지/불균형 보정과 연결된 **하나의 품질 파이프라인 설계 문제**입니다."},"whyImportant":{"0":"**기계는 빈칸을 싫어합니다.** 빈칸을 방치하면 컴퓨터는 계산 자체를 할 수 없어 에러를 뱉습니다. OMR 카드에 마킹을 안 하면 채점을 아예 못 하는 것과 똑같습니다.","1":"**잘못 채우면 단단히 착각합니다.** 모든 빈칸을 무작정 '0'이나 '평균값'으로 채우면 데이터의 원래 특징(분포)이 망가집니다. 모델은 빈칸을 채운 가짜 데이터를 '진짜'라고 굳게 믿어버리는 과도한 확신(Overconfident prediction)에 빠집니다.","2":"**전처리는 세트 메뉴입니다.** 결측치만 채웠다고 끝이 아닙니다. 비정상적인 값(이상치)을 골라내고, 희귀한 데이터의 비율(불균형)을 맞춰주는 작업까지 한 호흡에 설계해야만, 모델이 실전 환경에서 당황하지 않고 제 실력을 발휘할 수 있습니다.","3":"**공정성과 안전성에도 직결됩니다.** 특정 그룹에서 결측이 더 많이 발생(MAR/MNAR)하면, 잘못된 대치는 집단별 성능 격차를 키울 수 있습니다. 전처리 단계에서 편향 신호를 점검해야 모델의 신뢰성을 지킬 수 있습니다.","4":"**모델 선택보다 먼저 성능을 좌우합니다.** 같은 알고리즘이라도 전처리 품질이 다르면 결과가 크게 달라집니다. 실무에서는 '좋은 모델'보다 '좋은 데이터 흐름'이 더 큰 이득을 만드는 경우가 많습니다.","5":"**운영 단계(배포 후) 안정성도 좋아집니다.** 결측·이상치·불균형에 대한 기준을 미리 정해두면, 새 데이터가 들어와도 일관된 규칙으로 처리되어 재학습/모니터링이 쉬워집니다."},"howUsed":{"0":"**실전 흐름**: 데이터를 관찰(EDA) → 빈칸이 생긴 이유 추측 → 대치 전략 선택 → 너무 튀는 값 잡기(**이상치 탐지**: Box Plot 등) → 데이터 비율 맞추기(**클래스 불균형 보정**: SMOTE 등) → 드디어 모델 학습 및 평가의 순서로 진행됩니다.","1":"**단일대치 기본식**: 빈칸을 평균으로 채운다면 $x_{miss} \\leftarrow \\bar{x}$, 크기순으로 줄을 세웠을 때 딱 중간에 있는 값으로 채운다면 $x_{miss} \\leftarrow \\mathrm{median}(x)$ 로 표현합니다.","2":"**다중대치 개념**: $m$개의 완성된 평행우주(데이터셋)를 만든 다음, 각각에서 얻은 결론($\\theta_k$)을 합쳐서 평균을 냅니다. $\\bar{\\theta}=\\frac{1}{m}\\sum_{k=1}^{m}\\theta_k$","3":"**IQR 기반 Box Plot(박스 플롯) 규칙**: 정상 데이터의 울타리를 치는 공식입니다. 하한선 $Q_1-1.5\\times IQR$부터 상한선 $Q_3+1.5\\times IQR$까지를 울타리로 정하고, 이 밖으로 넘어가면 이상치(비정상)로 판단합니다.","4":"**공분산(Covariance)이란?** 두 변수가 **함께** 얼마나 움직이는지를 수치로 나타낸 것입니다. 직관적으로는 “키가 큰 사람이 대체로 몸무게도 더 나가는가?” 같은 **동행 관계**를 측정합니다. 수식으로는 $\\mathrm{cov}(X,Y)=\\mathbb{E}[(X-\\mu_X)(Y-\\mu_Y)]$ 입니다. 여러 변수의 공분산을 한 번에 모으면 **공분산 행렬** $\\Sigma$가 되고, 이 $\\Sigma$가 데이터 구름(타원)의 방향/늘어짐을 결정합니다.","5":"**Mahalanobis 거리 (마할라노비스 거리)**: 단순한 ‘직선거리’가 아니라, 공분산(분포 모양)을 반영한 ‘표준화된 거리’입니다. 즉, 데이터가 **많이 퍼진 방향**으로의 이동은 덜 벌점, **잘 안 퍼지는 방향**으로의 이동은 더 큰 벌점을 줍니다. $D_M(\\mathbf{x})=\\sqrt{(\\mathbf{x}-\\boldsymbol\\mu)^\\top\\Sigma^{-1}(\\mathbf{x}-\\boldsymbol\\mu)}$ (여기서 $\\Sigma^{-1}$ 때문에 공분산이 핵심입니다).","6":"**Isolation Forest (아이솔레이션 포레스트)**: 이상치는 ‘군집에서 멀다’라기보다 **빨리 고립(isolate)** 된다고 봅니다. 데이터를 무작위로 쪼개는(랜덤 분할) 나무들을 많이 만들었을 때, 어떤 점이 **몇 번 안 쪼개도** 혼자 떨어져 나오면 이상치일 가능성이 큽니다. 장점은 고차원에서도 잘 동작하고, 분포 가정이 약하다는 점입니다.","7":"**SVDD (Support Vector Data Description)**: 정상 데이터만으로 ‘정상 영역’을 하나의 **경계(최소 부피의 감싸는 구/원, 또는 커널로 휘어진 경계)**로 학습한 뒤, 경계 밖을 이상치로 판단하는 방법입니다. 핵심 직관은 “정상은 한 덩어리로 감쌀 수 있다”이며, 원-클래스(One-class) 이상치 탐지에 자주 쓰입니다.","8":"**Class Imbalance(클래스 불균형)**: 양성(희귀) 클래스가 너무 적으면 모델이 ‘다수만 맞히는’ 방향으로도 점수가 높아 보일 수 있습니다. 그래서 정확도만 보지 말고 재현율(Recall), 정밀도(Precision), F1, PR-AUC 같은 지표를 함께 보고, 필요하면 리샘플링으로 분포를 조정합니다.","9":"**Tomek Links (토멕 링크)**: 서로 다른 클래스의 두 점이 **서로의 가장 가까운 이웃**이면, 그 쌍은 경계에서 ‘헷갈리는(겹치는)’ 부분일 가능성이 큽니다. 보통 다수 클래스 쪽 점(또는 둘 다)을 제거해 경계를 정리하는 **언더샘플링 기반 정제(cleaning)** 기법입니다.","10":"**SMOTE**: 소수 클래스 샘플 $\\mathbf{x}$와 이웃 $\\mathbf{x}_{nn}$을 골라, 그 사이를 선형 보간해 합성 샘플을 만듭니다. $\\mathbf{x}_{new}=\\mathbf{x}+\\lambda(\\mathbf{x}_{nn}-\\mathbf{x})$, $\\lambda\\sim U(0,1)$. 단순 복사보다 과적합을 줄이지만, 경계에 노이즈가 많으면 오히려 나쁜 샘플도 늘릴 수 있습니다.","11":"**SMOTE를 활용한 복합 Resampling (예: SMOTE+Tomek)**: 먼저 SMOTE로 소수 클래스를 ‘늘리고’, 그 다음 Tomek Links로 경계의 겹침을 ‘정리’합니다. 한마디로 **메움(oversample) → 청소(clean)** 순서로 생각하면 쉽습니다.","12":"**ADASYN**: SMOTE의 아이디어를 한 단계 더 밀어, “어려운 구간(주변이 다수 클래스인 소수 샘플)”에 **더 많은 합성 샘플**을 배분합니다. 즉, 학습이 헷갈리는 경계 주변을 더 촘촘히 채우는 전략이라서, 분포가 복잡할수록 도움이 될 수 있습니다."},"summary":"**결측치 처리란 무엇인가요? (한 줄 요약 치트시트)**\n- 결측치를 처리할 때 무조건 맞는 '마법의 정답'은 없으며, 데이터가 **왜 비었는지 원인(MCAR/MAR/MNAR)**을 먼저 파악하는 것이 핵심입니다.\n- **단일대치**는 쉽고 빠르지만 불확실성을 무시하고, **다중대치**는 통계적으로 탄탄하지만 계산 비용이 큽니다.\n- 이상치는 **단변량(Box Plot)**과 **다변량(Mahalanobis/Isolation Forest/SVDD)**을 함께 봐야 놓침이 줄어듭니다.\n- 불균형 보정은 **Tomek(정리)**, **SMOTE/ADASYN(합성)**, **SMOTE+Tomek(복합)**처럼 목적에 맞게 선택/조합합니다.\n- 최종적으로는 전처리 전후 성능을 비교해(Recall, F1, PR-AUC 등) 실제로 좋아졌는지 검증해야 합니다.\n\n**자주 묻는 질문 요약**\n- 결측치 처리는 단순한 빈칸 채우기가 아니라, **이상치·불균형까지 포함한 데이터 품질 파이프라인** 설계입니다.\n- 지도학습 모델 성능이 낮다면, 모델 변경 전 결측 메커니즘과 대치 방식부터 점검하는 것이 보통 더 효과적입니다.","problemSolving":{"0":"결측·대치·이상치·불균형 유형 문제는 「**빈칸이 왜 생겼는지**(MCAR·MAR·MNAR) / **한 번 채울지 여러 번 채울지**(단일·다중대치) / **한 변수만 볼지 공분산까지 볼지**(단변량·다변량 이상치) / **비율·경계를 어떻게 다룰지**(지표·리샘플링)」만 떠올리면 풀기 쉽습니다. **MCAR**은 결측 발생이 **관측·비관측 값을 포함해** 다른 정보와 **독립**(무작위에 가깝다)이라는 가정, **MAR**은 **관측된 다른 변수**와 결측 메커니즘이 연관될 수 있다는 가정, **MNAR**은 **비관측 값 자체**(민감도 등)가 관측 여부를 바꾼다는 가정으로 구분합니다. **단일대치**는 $x_{\\mathrm{miss}} \\leftarrow \\bar{x}$처럼 한 번 채우고, **다중대치**는 $m$개 완성 데이터셋의 추정치 $\\hat\\theta_k$를 $\\bar{\\theta}=\\frac{1}{m}\\sum_{k=1}^{m}\\hat\\theta_k$로 결합하는 흐름이 대표적입니다. **단변량 이상치**는 $Q_1-1.5\\,\\mathrm{IQR}$, $Q_3+1.5\\,\\mathrm{IQR}$ 울타리(Box Plot)로 보고, **다변량**은 $D_M(\\mathbf{x})=\\sqrt{(\\mathbf{x}-\\boldsymbol\\mu)^\\top\\Sigma^{-1}(\\mathbf{x}-\\boldsymbol\\mu)}$처럼 공분산을 반영한 Mahalanobis·Isolation Forest·SVDD가 키워드입니다. **불균형**에서는 정확도만이 아니라 Recall·F1·PR-AUC를 함께 보고, **SMOTE**로 소수를 늘린 뒤 **Tomek**으로 경계 쌍을 정리하는 **oversample → clean**이 자주 나옵니다.","1":"$3e"},"sectionLabels":{"whatIs":"개념","whyImportant":"직관","howUsed":"수학적 설명","summary":"실전 적용","problemSolving":"문제 풀이"},"problemSolvingLabel":"문제 풀이를 위한 설명","imputationTable":{"title":"단일대치에서 자주 쓰는 대표값/방법","caption":"주요 단일대치 방법을 정의와 간단 수식으로 정리한 표입니다.","headers":{"method":"대치값/방법","definition":"정의(간단 수식)"},"rows":{"0":{"method":"평균값(Mean)","definition":"관측값 평균으로 대치: $x_{miss} \\leftarrow \\bar{x}=\\frac{1}{n}\\sum_{i=1}^{n}x_i$"},"1":{"method":"중앙값(Median)","definition":"중앙 순위 값으로 대치: $x_{miss} \\leftarrow \\mathrm{median}(x)$"},"2":{"method":"최빈값(Mode)","definition":"가장 자주 나온 값으로 대치: $x_{miss} \\leftarrow \\arg\\max_v\\,\\mathrm{count}(x=v)$"},"3":{"method":"회귀·KNN·Hot-deck","definition":"회귀: $\\hat{x}=f(\\mathbf{z})$, KNN: $x_{miss}\\leftarrow\\frac{1}{k}\\sum_{j\\in N_k}x_j$, Hot-deck: $x_{miss}\\leftarrow x_{donor}$"}}},"practiceProblemsTitle":"실전 문제","practiceProblemsIntro":"60문제 풀에서 무작위 10문제입니다. 난이도는 쉬움 4·보통 3·어려움 3입니다.","practiceProblemsInstruction":"①~④ 중 하나를 고른 뒤 정답 확인을 누르세요.","checkAnswer":"정답 확인","correctAnswer":"정답입니다!","wrongAnswer":"오답입니다. 다시 시도해 보세요.","testCodeLabel":"Test code","visualIntro":"결측치 처리부터 이상치/불균형 보정까지 이어지는 데이터 품질 파이프라인","visualStep0":"결측 탐지: 결측률과 패턴 확인","visualStep1":"결측 처리: 삭제/단일대치/다중대치 선택","visualStep2":"이상치 탐지: Box Plot, Mahalanobis, Isolation Forest, SVDD","visualStep3":"불균형 보정: Tomek, SMOTE, ADASYN, SMOTE+Tomek","visualStep4":"⑤ 모델 학습 및 검증: 일반화 성능 확인","visualAriaLabel":"결측치 처리와 데이터 품질 개선 흐름 다이어그램","problemSolvingFallback":"결측치 처리란 무엇인지 질문이 나오면, 결측 메커니즘(MCAR/MAR/MNAR) 식별 → 단일/다중대치 선택 → Box Plot·Mahalanobis·Isolation Forest·SVDD로 이상치 점검 → Tomek/SMOTE/ADASYN/복합 리샘플링 순으로 풀이합니다.","visualDiagram":{"hintStep0":"관찰: 결측 패턴을 먼저 본다","hintStep1":"선택: 단일대치 vs 다중대치","hintStep2":"점검: 이상치(단변량/다변량)","hintStep3":"보정: 불균형(합성→정리)","clickMechanismCards":"아래 MCAR · MAR · MNAR 카드를 눌러 패턴을 바꿔 보세요.","pipelineNavAria":"파이프라인 단계","chipPattern":"결측 패턴","chipImpute":"대치","chipOutlier":"이상치","chipImbalance":"불균형","panelDetectTitle":"결측 탐지(패턴)","badgeMcar":"MCAR(무작위)","badgeMar":"MAR(조건부)","badgeMnar":"MNAR(값-의존)","legendObserved":"관측","legendMissing":"결측","gridColorHint":"표의 색이 “왜 빈칸이 생겼을까?” 힌트입니다","tooltipObserved":"관측","tooltipMissing":"결측","mcarLine1":"MCAR","mcarLine2":"완전 무작위 결측 · Missing Completely At Random","mcarLine3":"모양이 산발적 → “완전 우연” 가능","marLine1":"MAR","marLine2":"무작위 결측 · Missing At Random","marLine3":"세로 줄처럼 특정 열·그룹에만 몰림 → “조건이 있으면 빈칸이 생김”","mnarLine1":"MNAR","mnarLine2":"비무작위 결측 · Missing Not At Random","mnarLine3":"특정 값 구간(꼬리)에 집중 → “빈칸 자체가 의미”","panelImputeTitle":"결측 처리: 단일대치 vs 다중대치","imputePhase0":"빈칸 확인","imputePhase1":"단일대치","imputePhase2":"다중대치","imputePhase3":"결합","singleTitle":"단일대치(1회)","singleLead":"빈칸마다 “똑같은 한 값”이 들어감","singleFoot":"빈칸을 한 값으로 채움 → **빠르지만** 데이터가 “덜 흔들리는” 착시(분산 과소추정)가 생길 수 있음","multiTitle":"다중대치(m회)","multiLead":"여러 “가능한 채움” → 마지막에 평균·불확실성 반영","multiFoot":"여러 번 채워서 후보를 만들고 → 마지막에 **결합(평균/분산)**하여 불확실성을 반영","boxTitle":"단변량 이상치: Box Plot(IQR)","boxPhase0":"상자(Q1~Q3)","boxPhase1":"울타리(1.5×IQR)","boxPhase2":"울타리 밖 점=후보","boxChip1":"상자","boxChip2":"울타리","boxChip3":"밖 점","boxPlotStagesAria":"박스플롯 단계","fenceLower":"하한","fenceUpper":"상한","boxSummary":"한 줄 요약: **Q1·Q3 → IQR → 1.5×IQR 울타리** 밖 점을 이상치 후보로 본다","mvTitle":"다변량 이상치: “조합”이 이상한 점","mvPhase0":"거리(공분산)","mvPhase1":"고립(짧은 경로)","mvPhase2":"경계(정상 영역)","mahalPara1":"두 축이 함께 움직이면(공분산) 점들이 **타원 구름**이 됩니다. 타원 안은 흔한 조합, **타원에서 멀리 튄 조합**을 의심합니다.","mahalPara2":"상관(공분산)을 반영한 거리로 판단","mahalBadge":"타원 기준 멀면 이상치 후보","ifPara1":"무작위로 칼질할 때 **몇 번 안 잘라도 혼자 덩그러니** 나오면 → **“숨어 있기 어려운 점”**으로 본다고 기억하세요.","ifPara2":"무작위 분할에서 “빨리” 고립되는 점","ifBadge":"짧은 경로로 고립 → 이상치 후보","svddPara1":"정상만 모아 **말풍선 같은 경계**를 그립니다. 안쪽=익숙한 데이터, **바깥=낯선 데이터**.","svddPara2":"정상 데이터를 감싸는 “경계”를 학습","svddBadge":"경계 밖 → 이상치 후보","imbTitle":"클래스 불균형: SMOTE/ADASYN + Tomek Links","imbIntro":"**Tomek Links**는 “클래스가 다른 두 점이 서로에게 가장 가까운 이웃”인 짝을 찾아, 경계를 헷갈리게 하는 쪽(보통 **다수** 쪽 점)을 빼서 결정 경계를 정리하는 방법입니다.","imbSmoteAdasynIntro":"**SMOTE**는 소수 샘플과 이웃 사이를 보간해 합성 샘플을 만들고, **ADASYN**은 다수에 둘러싸인 ‘어려운’ 소수 주변에 더 많이 합성해 경계 근처를 더 촘촘히 메우는 방식입니다.","imbPhase0":"경계에서 소수 클래스가 밀림","imbPhase1":"합성으로 빈 곳 메움","imbPhase2":"Tomek로 경계 정리","imbWhyTitle":"왜 문제가 되나?","imbWhyBody":"불균형이 심하면 모델이 “다수만 맞히는” 방향으로 학습되어도 점수가 좋아 보일 수 있습니다. 그래서 재현율/F1 같은 지표를 함께 보고, 데이터 자체도 보정합니다.","imbMajor":"다수(85%)","imbMinor":"소수(15%)","imbHowTitle":"어떻게 고치나? (시각화)","imbHowLead":"직선이 아닌 **곡선 경계**로 생각하면, 경계에 붙은 잡음을 SMOTE·Tomek로 다루는 그림이 더 자연스럽습니다.","imbChip0":"경계 혼잡","imbChip1":"합성으로 메움","imbChip2":"Tomek로 정리","imbChip2Title":"서로 다른 클래스인데 서로 최근접 이웃인 짝에서 다수 쪽을 제거해 경계를 정리합니다.","imbTomekCallout":"그래프에서 노란 링: 경계에 끼어든 **다수(회색)** 점이 Tomek 후보입니다. 정리되면 희미해져 경계가 덜 지저분해집니다.","chartDenseTop":"위: 다수가 빽빽","chartSparseBottom":"아래: 소수 (+합성)","imbBoundaryMsg":"경계 근처는 잡음(오분류)이 늘기 쉬움","imbFlow1":"흐름: SMOTE/ADASYN으로 소수 **주변을 촘촘히** → **Tomek Links**로 경계에 붙은 **서로 다른 클래스 최근접 짝** 중 다수 쪽을 걷어내 경계를 정리","imbFlow2":"한 줄 직관: 합성으로 점이 늘어난 뒤, “다른 클래스인데 서로 제일 가까운 이웃”인 점끼리 짝을 지으면 그중 경계를 지저분하게 하는 **다수 점**을 빼 줍니다.","legMinor":"소수","legMajor":"다수","legSyn":"합성(SMOTE/ADASYN)","legCurve":"곡선 경계","pointTitleMajor":"다수","pointTitleMajorTomek":"경계에 끼어든 다수(정리 후보)","pointTitleSyn":"합성(SMOTE/ADASYN)"}},"mlCh07":{"chapter":"Chapter 07","title":"XGBoost, LightGBM, CatBoost: 실전 머신러닝의 3대장","description":"우리가 엑셀 표처럼 생긴 데이터(정형 데이터)를 다룰 때, 딥러닝조차 가볍게 이겨버리는 머신러닝 생태계의 절대 강자들이 있습니다. 바로 **부스팅(Boosting)** 계열의 모델들입니다.\n\n부스팅이란 여러 명의 '평범한 학생(약한 모델)'이 순서를 정해놓고, 앞사람이 틀린 문제만 집중적으로 공부해서 결국 '천재적인 정답지(강한 모델)'를 만들어내는 아주 똑똑한 협업 방식입니다. 이 챕터에서는 실무와 데이터 분석 대회(Kaggle 등)를 휩쓸고 있는 **부스팅 3대장(XGBoost, LightGBM, CatBoost)**의 특징을 완벽하게 해부하고, '내 데이터에는 어떤 모델을 골라야 할지' 명확한 기준을 세워드립니다.","sectionTitle":"CH07 부스팅 3대장: 오답 노트를 완벽하게 정복하는 알고리즘","whatIs":{"0":"**1. 부스팅(Boosting)의 핵심 원리: 오답 노트 이어달리기**\n\n**개념:** 부스팅은 여러 개의 결정 트리(Decision Tree)를 **순차적으로** 연결하는 앙상블 기법입니다. 핵심은 '앞선 트리가 예측에 실패한 오차(잔차)를 다음 트리가 집중적으로 학습'하는 것입니다.\n\n**직관적 비유:** 수학 시험을 준비하는 스터디 그룹을 상상해 보세요. 1번 학생이 모의고사를 푼 뒤, 틀린 문제들만 모아 '오답 노트'를 만듭니다. 2번 학생은 이 오답 노트만 미친 듯이 파고들어 보완합니다. 3번 학생은 2번 학생이 또 틀린 문제만 풉니다. 이렇게 수백 명이 약점을 보완해 나가면 최종적으로 틀릴 확률이 거의 없는 완벽한 팀이 됩니다.\n\n**핵심 수식:** $F_t(x)=F_{t-1}(x)+\\eta h_t(x)$\n\n- $F_t(x)$: 이번 단계($t$)까지 합쳐서 만든 최종 예측값\n- $F_{t-1}(x)$: 이전 단계까지의 예측값\n- $h_t(x)$: 이전 단계의 **오류(오답 노트)**만 집중적으로 맞히려고 새로 투입된 트리\n- $\\eta$ (에타): **학습률(learning rate)**. 새로 투입된 트리의 의견을 얼마나 반영할지 정하는 '신뢰도'입니다. 이 값이 작을수록 꼼꼼하게 학습하지만 시간이 오래 걸릴 수 있습니다.\n\n**실전 적용:** 은행의 대출 부도 예측, 쇼핑몰의 고객 이탈 예측, 광고 클릭률(CTR) 예측 등 **표 형태로 된 데이터**에서는 이 부스팅 방식이 현재 인류가 가진 최고의 무기 중 하나입니다.","1":"**2. XGBoost (eXtreme Gradient Boosting): 흔들리지 않는 국밥 같은 기본기**\n\n**개념:** 가장 먼저 대중화되어 부스팅의 부흥기를 이끈 전설적인 모델입니다. 오차를 줄이는 것에 더해, 모델이 너무 복잡해지는 것을 막는 **정규화(Regularization) 수식**이 기본적으로 포함되어 있어 매우 안정적입니다.\n\n**직관적 비유:** 아주 엄격하고 꼼꼼한 선생님입니다. 진도를 나가는 것도 중요하지만, 학생들이 얕은 지식으로 아는 척(과적합)을 하면 가차 없이 페널티를 주어 기초를 탄탄하게 다지도록 만듭니다.","2":"**3. LightGBM: 대용량 데이터도 순식간에 읽어내는 스피드광**\n\n**개념:** XGBoost가 좋긴 한데, 데이터가 수백만 건이 넘어가면 학습 시간이 너무 오래 걸렸습니다. 이를 해결하기 위해 마이크로소프트에서 만든 모델이 LightGBM입니다. 데이터를 히스토그램(연속값을 구간으로 묶어 bin 표현)으로 처리해 계산을 줄이고, 트리를 양옆으로 균형 있게 키우는 **레벨 와이즈** 대신 **오차가 가장 큰 리프 하나를 깊게 파고드는 리프 와이즈(leaf-wise)** 성장 전략을 씁니다.\n\n**직관적 비유:** 두꺼운 전공 서적을 읽을 때, 이미 아는 챕터는 과감히 건너뛰고 시험에 꼭 나올 것 같은 챕터 하나만 밤새워 깊게 파고드는 '효율성 끝판왕' 대학생과 같습니다.\n\n**실전 주의점:** 한 우물만 너무 깊게 파기 때문에 **과적합(Overfitting)**에 취약합니다. 그래서 트리의 최대 깊이(`max_depth`)나 잎에 남아야 할 최소 데이터 수(`min_data_in_leaf`)를 반드시 제한해 주어야 합니다.","3":"**4. CatBoost: 범주형 데이터의 마술사**\n\n**개념:** 얀덱스(Yandex)에서 개발한 모델로, 이름부터 **Category**와 **Boosting**의 합성어입니다. 직업(개발자, 의사, 학생), 지역(서울, 부산, 제주) 같은 **범주형 변수(Categorical Feature)**를 복잡한 전처리(예: 원-핫 인코딩) 없이 스스로 잘 처리합니다.\n\n**직관적 비유:** 시험을 치를 때는 **앞쪽 문제를 푸는 순간 뒤쪽 정답을 미리 보면 안 되는 것**과 같습니다. 모델도 학습 중에 미래 정보(정답 통계)를 몰래 보면 실제보다 성능이 과장되는 **데이터 누수**가 생깁니다. CatBoost의 **Ordered Statistics**는 이런 \"미리 정답 보기\"를 막도록 순서를 지켜 통계를 만드는 방식이라, 누수 위험을 낮추고 기본 설정만으로도 안정적인 성능이 잘 나옵니다.","4":"$3f","5":"$40"},"whyImportant":{"0":"**실무 데이터의 '치트키'**\n\n이미지나 텍스트가 아닌, 회사에서 매일 엑셀로 보는 데이터(DB 테이블)를 다룰 때는 딥러닝보다 오히려 부스팅 모델들이 **빠르고 정확한 경우가 많습니다**. 복잡한 딥러닝을 설계하기 전, **가장 강력한 기준선(Baseline)**을 세울 때 1순위로 쓰입니다.","1":"**데이터의 성격에 따른 무기 선택**\n\n이 3대장의 특징을 알면 프로젝트 성공률이 올라갑니다.\n\n- 데이터가 적당하고 **극강의 안정성**이 필요하다면? **XGBoost**\n- 데이터가 수천만 건이고 **서버 비용·시간**을 아껴야 한다면? **LightGBM**\n- **범주형(문자열 카테고리) 피처**가 너무 많아 전처리가 골치 아프다면? **CatBoost**","2":"**비용과 성능의 예술적인 줄다리기**\n\n부스팅은 강력한 만큼 제어해야 할 **하이퍼파라미터**가 많습니다. 학습률(`learning_rate`), 트리의 깊이(`max_depth`), 트리 개수(`n_estimators`)의 관계를 이해하면, 과적합을 막으면서도 최고의 정확도에 가깝게 모델을 다듬을 수 있습니다."},"howUsed":{"0":"**① 실무 파이프라인의 정석**\n\n결측치를 다루고 카테고리를 다루는 전처리를 한 뒤 $\\rightarrow$ 데이터를 **학습용/검증용**으로 나눕니다 $\\rightarrow$ 부스팅 모델을 학습시키고 $\\rightarrow$ **SHAP** 등으로 \"왜 이 고객이 이탈할 것이라 예측했는지\" 특성 중요도를 시각화해 비즈니스 팀에 공유합니다.","1":"**② 운영 팁: 멈출 때를 아는 지혜 (Early Stopping)**\n\n트리를 무한정 많이 만든다고 항상 좋은 것은 아닙니다. 오답 노트를 너무 많이 쓰면 결국 '그 문제집의 정답 위치'만 외워버리는 **과적합**이 생깁니다. 검증 데이터(Validation Set) 점수가 더 이상 오르지 않고 오히려 떨어지기 시작하면, **그 즉시 학습을 멈추는 얼리 스토핑(Early Stopping)**은 실무에서 사실상 필수에 가깝습니다.","2":"**③ 비즈니스 목표와 지표 맞추기**\n\n모델이 수학적으로 잘 학습하는 것도 중요하지만, 회사의 목표와 맞아야 합니다.\n\n- **고객 이탈 여부 맞히기(분류):** 단순 정확도보다 **AUC**나 **F1**을 함께 봅니다.\n- **내일의 주가·매출 예측(회귀):** **RMSE**나 **MAE**로 실제 값과 얼마나 어긋나는지 추적합니다."},"summary":"**한 줄 요약 치트시트**\n\n| 모델명 | 핵심 키워드 | 장점 | 단점/주의점 |\n| :--- | :--- | :--- | :--- |\n| **XGBoost** | 정규화, 안정성 | 기본기가 탄탄하고 어디서든 평타 이상 | 대용량 데이터에서 학습이 비교적 느릴 수 있음 |\n| **LightGBM** | 속도, 리프 중심 | 메모리를 적게 쓰고 학습 속도가 매우 빠름 | 데이터가 작으면 과적합되기 쉬움 |\n| **CatBoost** | 범주형, 기본값 | 귀찮은 카테고리 전처리 부담을 줄여 줌 | 무겁고, 모델 용량이 커질 수 있음 |\n\n결국 이 세 모델 모두 **'잔차(오차)를 단계적으로 줄여 가며 여러 나무를 합친다'**는 부스팅의 철학을 공유합니다.","problemSolving":{"0":"**연습 문제·실전 풀이 팁**\n\n- 챕터 하단 연습 문제는 모두 **4지선다**입니다. 계산 문항도 **보기 문자열** 중 올바른 값을 고르세요.\n- **LightGBM·leaf-wise** 문제는 `max_depth`, `min_data_in_leaf`, `num_leaves` 같이 **과적합을 막는 제약**과 자주 함께 나옵니다.\n- 모델 고르기 문제는 **데이터 크기**, **범주형 비율**, **지연 시간(추론 속도)**를 키워드로 두고, 위 표(XGBoost/LightGBM/CatBoost)와 설명을 대응시키면 빠르게 좁힐 수 있습니다.\n- 이론형은 $F_t(x)=F_{t-1}(x)+\\eta h_t(x)$, 정규화 항 $\\Omega(f)$, 히스토그램·ordered statistics 같은 **용어 정의**를 문장 안에서 먼저 찾아 보세요."},"sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","summary":"요약","problemSolving":"문제 풀이·실전 팁"},"problemSolvingLabel":"문제 풀이를 위한 설명","practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"아래는 60문제 문제풀에서 무작위로 뽑은 10문제입니다. 난이도는 쉬움→보통→어려움 순서(4·3·3)입니다.","practiceProblemsInstruction":"안내와 질문을 읽고, ①~④ 보기 중 정답을 한 가지 골라 선택한 뒤 정답 확인을 누르세요.","boostingTestCodeLabel":"테스트 코드","boostingVisualIntro":"초기 오차를 다음 트리가 보정하고, 이를 여러 번 반복해 최종 예측 오차를 낮춥니다.","boostingVisualIntroPanels":"세 라이브러리는 트리를 키우는 규칙이 다릅니다. 레벨와이즈·리프와이즈·대칭(oblivious) 성장을 패널별 애니메이션으로 비교해 보세요.","boostingVisualAriaLabel":"XGBoost 레벨와이즈, LightGBM 리프와이즈, CatBoost 대칭 트리 성장 비교 도식","boostingVisualTitleXgb":"XGBoost","boostingVisualTitleLgb":"LightGBM","boostingVisualTitleCat":"CatBoost","boostingVisualCaptionXgb":"레벨와이즈\n같은 깊이를 채운 뒤 다음 층으로","boostingVisualCaptionLgb":"리프와이즈\n손실 감소가 큰 리프부터 분할","boostingVisualCaptionCat":"Oblivious\n같은 깊이에서 동일 분할(대칭)","boostingVisualPhaseCaption0":"① XGBoost: 레벨와이즈로 같은 깊이를 채운 뒤 다음 층으로 확장합니다.","boostingVisualPhaseCaption1":"② LightGBM: 리프와이즈로 손실 감소가 큰 잎 노드부터 분할합니다.","boostingVisualPhaseCaption2":"③ CatBoost: oblivious 트리 — 같은 깊이에서 동일한 분할(대칭 구조)입니다.","boostingVisualPhaseCaption3":"세 방식을 나란히 비교하면 성장 규칙의 차이가 한눈에 들어옵니다.","boostingVisualStep0":"① 초기 모델: 큰 오차가 남아 있음","boostingVisualStep1":"② 트리1~트리2: 잔차를 순차 보정","boostingVisualStep2":"③ 트리3: 남은 어려운 패턴 보완","boostingVisualStep3":"④ 최종 앙상블: 누적 예측으로 성능 향상","checkAnswer":"정답 확인","correctAnswer":"정답입니다!","wrongAnswer":"보기를 다시 확인해 보세요."},"mathChapters":{"mathCumulativeVisualTitle":"기초 수학 개념 흐름","mathCumulativeVisualLabel":"기초 수학 챕터별 개념 비주얼","sectionLabels":{"whatIs":"어떤 개념인지","whyImportant":"왜 중요한지","howUsed":"어떻게 쓰이는지","problemSolving":"문제 풀이를 위한 설명"},"mathSymbolPaletteTitle":"수학 기호집","mathSymbolPaletteDescription":"그리스 문자·연산자·집합 기호 등 수학 기호와 읽는 법(발음)을 확인할 수 있어요. 기호를 클릭하면 복사돼요.","mathSymbolPaletteSearchPlaceholder":"기호 이름 또는 한글(예: 알파, 시그마, 편미분)으로 검색","mathSymbolPaletteNoResults":"검색 결과가 없어요.","mathSymbolPaletteHint":"기호를 클릭하면 클립보드에 복사돼요.","mathSymbolCategoryGreekLower":"그리스 문자 (소문자)","mathSymbolCategoryGreekUpper":"그리스 문자 (대문자)","mathSymbolCategoryOperators":"연산자","mathSymbolCategoryRelations":"관계","mathSymbolCategoryArrows":"화살표","mathSymbolCategorySets":"집합·수 체계","mathSymbolCategoryLogic":"논리","mathSymbolCategoryCalculus":"미적분","mathSymbolCategoryMisc":"기타","math00":{"chapter":"Chapter 00","title":"기초 수학과 인공지능: AI의 언어를 배우다","description":"딥러닝과 머신러닝을 이해하기 위해 왜 수학이 필요한지, 그리고 어떤 수학적 도구들이 쓰이는지 그 지도를 함께 그려봅니다.","sectionTitle":"딥러닝과 머신러닝을 이해하기 위해 왜 수학이 필요할까요?","visualIntro":"인공지능 입력이 수학을 거쳐 예측으로 이어지는 흐름을 시각화해 봅시다.","visualInputLabel":"입력","visualInputTypes":"이미지, 글, 소리","visualMathLabel":"기초 수학","visualMathTopics":"함수 · 벡터 · 행렬","whatIs":{"0":"**인공지능을 이해하려면 수학이라는 안경이 필요해요** — 딥러닝과 머신러닝은 우리가 주는 이미지, 글, 소리를 모두 **숫자**로 바꾸어 받아들입니다. 그 숫자들이 **함수**라는 통로를 지나고 **곱셈과 덧셈**을 반복하며 정답을 찾아가죠. 이 모든 과정이 수학으로 기록되기 때문에, 수학을 알면 인공지능의 **내부 동작**을 선명하게 읽을 수 있습니다.","1":"**어떤 수학 도구들을 사용하게 될까요?** — 입력과 출력의 규칙을 정하는 **함수**, 수많은 데이터를 묶어서 한 번에 처리하는 **벡터와 행렬**, 모델이 스스로 공부하며 정답으로 향하게 돕는 **미분**, 그리고 결과의 가능성을 측정하는 **확률과 분포**를 배우게 됩니다. 이 도구들이 모여 똑똑한 인공지능을 만듭니다.","2":"**정리하자면** — 인공지능은 숫자와 함수라는 단단한 지반 위에서 동작합니다. 인공지능이 왜 그런 결과를 내놓았는지 해석하고 더 나은 모델을 만들기 위해서는 **함수**, **극한**, **미분**, **확률** 같은 기초 체력이 반드시 필요합니다. 이 코스는 바로 그 기초를 하나씩 쌓아가는 여정입니다."},"whyImportant":{"0":"**인공지능의 결정 근거를 알기 위해** — 인공지능이 내린 모든 결정은 결국 **숫자와 함수**의 계산 결과입니다. 우리가 함수나 미분을 배우는 이유는 인공지능의 계산 과정을 따라가며 **왜 그런 답이 나왔는지** 논리적으로 이해하기 위해서입니다.","1":"**인공지능 모델에서 수학이 일하는 자리** — 모델의 각 **층(레이어)**은 가중치를 곱하고 더하는 **함수**의 집합입니다. 또한 인공지능이 학습하며 오차를 줄여가는 과정은 **기울기(그라디언트)**라는 미분 개념을 사용하죠. 확률은 인공지능이 자신의 예측을 얼마나 확신하는지 보여주는 지표가 됩니다.","2":"**우리가 함께 나아갈 로드맵 (Ch01~Ch12)** — 본 코스는 데이터의 흐름을 다루는 **함수(Ch01~03)**, 변화의 기초를 다루는 **극한과 연속(Ch04~05)**, 학습의 핵심인 **미분(Ch06~08)**, 누적과 확률의 기초가 되는 **적분(Ch09)**, 그리고 불확실성을 다루는 **확률과 분포(Ch10~12)** 순서로 진행됩니다."},"howUsed":{"0":"**현실과 수학의 연결 고리** — 인공지능 모델은 **입력 → 숫자 변환 → 함수 반복 → 출력**의 구조를 가집니다. **함수**는 이 구조의 벽돌이고, **미분**은 더 똑똑해지기 위해 벽돌을 깎는 정이며, **확률**은 완성된 건물의 안정성을 검사하는 도구입니다. 이 기초 수학을 마스터하면 딥러닝의 복잡한 수식들이 비로소 의미 있는 문장으로 보이기 시작할 것입니다."},"problemSolving":{"0":"| 구분 | 인공지능에서의 역할 | 핵심 수학 개념 |\n| --- | --- | --- |\n| **입력과 출력** | 데이터를 넣고 답을 얻는 기본 틀 | 함수, 지수, 로그 |\n| **학습(Training)** | 오차를 줄여 정답에 가까워지는 과정 | 극한, 미분, 연쇄 법칙 |\n| **예측과 판단** | 불확실한 결과 중 최선을 고르는 것 | 확률, 통계, 정규 분포 |"}},"math01":{"chapter":"Chapter 01","title":"함수: 입력과 출력을 잇는 AI의 기본 단위","description":"함수는 입력 하나에 출력 하나가 대응되는 규칙입니다. 인공지능이 입력을 출력으로 바꾸는 방식도 이 함수 개념과 직접 이어져요.","sectionTitle":"함수란 무엇인가","visualIntro":"입력 $x$를 넣으면 출력 $y$가 하나로 정해지는 규칙이에요. 아래는 $x$ → $f$ → $y$ 흐름을 보여 줍니다.","visualCaption":"예: $x=3$이면 $f(x)=2x+1$에서 7","whatIs":{"0":"**함수(Function)**는 두 집합 사이의 엄격한 **대응 관계(Mapping)**입니다. 입력값들의 집합인 **정의역(Domain)**의 모든 원소가, 출력값들의 집합인 **공역(Codomain)**의 원소에 **오직 하나씩** 연결되어야 합니다. 자판기 버튼을 눌렀는데 음료수가 안 나오거나 두 개가 동시에 나오면 고장이듯, 함수도 하나의 입력엔 반드시 하나의 출력이 있어야 합니다.","1":"수학적으로 $y = f(x)$라고 씁니다. 여기서 $x$는 **독립변수(원인)**, $y$는 **종속변수(결과)**입니다. AI 관점에서 보면 $x$는 우리가 제공하는 **데이터**(이미지 픽셀, 문장, 센서 값)이고, $y$는 AI가 계산해 낸 **예측값**(고양이 여부, 다음 단어, 주가 예측)입니다. 함수 $f$는 이 데이터들을 정답으로 바꿔주는 **변환기(Transformer)** 역할을 합니다.","2":"**인공지능 모델** 그 자체가 거대한 **합성함수**입니다. 입력 데이터가 첫 번째 함수(층)를 통과해 변환되고, 그 결과가 다시 다음 함수(층)로 들어가는 과정이 수십 번 반복됩니다. 수학에서 $y = f(g(h(x)))$처럼 함수를 겹쳐 쓰듯, 딥러닝은 수많은 함수를 층층이 쌓아 복잡한 데이터의 패턴을 읽어냅니다."},"whyImportant":{"0":"**현실 세계를 모델링(Modeling)**할 수 있기 때문입니다. '공부를 많이 하면 성적이 오른다'는 막연한 관계를 $y = ax + b$라는 **일차함수**로 표현하면, 우리는 공부 시간($x$)에 따른 예상 성적($y$)을 정확히 계산할 수 있습니다. AI는 이보다 훨씬 복잡한 비선형 관계(이미지와 물체 이름 등)를 함수로 근사(Approximation)하여 문제를 해결합니다.","1":"**최적화(Optimization)**의 대상이 됩니다. AI 학습의 목표는 정답과 예측값 사이의 오차를 최소화하는 것입니다. 이 오차를 계산하는 것도 **손실 함수(Loss Function)**라는 함수이고, 이 함수의 최솟값을 찾기 위해 미분을 사용합니다. 즉, 함수로 정의되지 않으면 AI를 학습시킬 수학적 근거가 사라집니다.","2":"**변화(Change)**를 다루는 언어입니다. 입력이 조금 변할 때 출력이 얼마나 변하는지(기울기)를 알아야 AI가 정답을 향해 조금씩 나아갈 수 있습니다. 함수는 입력과 출력의 **인과관계**를 수학식으로 명확히 보여주기 때문에, 우리는 AI가 어떤 근거로 그런 판단을 내렸는지 분석할 수 있게 됩니다."},"howUsed":{"0":"**인공지능**의 모든 뉴런은 작은 **함수**입니다. 입력 신호($x$)들에 가중치($w$)를 곱해 더한 뒤($wx+b$), **활성화 함수(Activation Function)**를 통과시켜 다음 뉴런으로 보냅니다. 이때 ReLU나 Sigmoid 같은 함수들이 신호를 켤지 말지 결정하며, 이런 작은 함수들이 모여 인간의 뇌처럼 복잡한 판단을 내립니다.","1":"**데이터 변환(Transformation)**에 쓰입니다. 우리가 보는 사진은 컴퓨터에게 그저 수만 개의 숫자($x$) 덩어리입니다. AI는 이 숫자들을 함수에 통과시켜 차원을 줄이거나 늘리며, '귀 모양', '눈 모양' 같은 핵심 특징($y$)만 남깁니다. 이것은 수학적으로 고차원 벡터를 저차원 공간으로 매핑하는 함수 연산입니다.","2":"**확률(Probability)**을 계산합니다. 분류 문제의 마지막 단계에서 사용하는 **소프트맥스(Softmax)** 함수는, AI가 뱉어낸 무작위 숫자들을 '합이 1인 확률'로 바꿔줍니다. 덕분에 AI는 \"이 사진은 90% 확률로 강아지입니다\"라고 말할 수 있게 됩니다. 이처럼 함수는 날것의 데이터를 우리가 이해할 수 있는 정보로 가공해 줍니다."},"problemSolving":{"0":"| 함수 | 예시 (입력 → 출력) |\n| --- | --- |\n| $f(x)=x+1$ | 3 → 4, 10 → 11 |\n| $g(x)=2x$ | 3 → 6, 10 → 20 |\n| $h(x)=x^2$ | 3 → 9, $-2$ → 4 |","1":"아래 비주얼처럼 $f(x)=2x+1$에서 $x=3$이면 7, $x=10$이면 21이 나옵니다. 문제의 빈 칸을 채우세요."}},"math02":{"chapter":"Chapter 02","title":"지수와 지수함수: 성장과 활성화의 수학","description":"지수는 같은 수를 거듭 곱한 횟수를 나타내고, 지수함수는 그 규칙을 변수로 쓴 함수예요. 딥러닝의 활성화 함수·손실 설계에서 쓰입니다.","sectionTitle":"지수와 지수함수란 무엇인가","visualIntro":"밑 $a$를 정해 두고, 지수 $x$에 따라 $a^x$ 값이 하나로 정해져요. 아래는 $2^x$ 예시를 보여 줍니다.","visualCaption":"예: $2^0=1$, $2^1=2$, $2^2=4$, $2^3=8$","whatIs":{"0":"**지수(Exponent)**는 어떤 수(밑, Base)를 횟수(지수)만큼 거듭해서 곱하는 연산입니다. 종이를 42번만 접으면 지구에서 달까지 닿는다는 말처럼, 더하기($+$)가 아닌 곱하기($\\times$)로 연결되어 수가 **폭발적으로 커지는(Exponential Growth)** 성질을 가집니다.","1":"**지수함수**는 이 거듭제곱의 횟수를 변수 $x$로 둔 함수($y = a^x$)입니다. 다항함수($x^2$)는 변수가 밑에 있지만, 지수함수는 변수가 머리 위에 있습니다. 이는 **'현재 크기에 비례해서 성장한다'**는 뜻입니다. $a>1$이면 $x$가 커질수록 값이 하늘을 뚫을 듯 치솟고(**지수적 성장**), $00$)**이 중요합니다. 0이나 음수의 로그는 정의되지 않습니다. 그래서 AI 코드에서 $\\log(0)$이 되어 에러가 나는 것을 막기 위해 아주 작은 수($\\epsilon$, 엡실론)를 더해주는 테크닉을 자주 씁니다. 또한 자연상수 $e$를 밑으로 하는 **자연로그($\\ln$)**는 미분 계산을 깔끔하게 만들어주어 딥러닝의 표준으로 쓰입니다."},"whyImportant":{"0":"**언더플로우(Underflow) 방지**가 필수적이기 때문입니다. AI가 확률 $0.1$을 100번 곱하면 $0.1^{100}$이 되는데, 컴퓨터는 이를 '너무 작아서 표현 불가능한 0'으로 취급해버립니다. 하지만 로그를 씌우면 $\\log(0.1^{100}) = 100 \\times \\log(0.1) = -100$이 되어, 컴퓨터가 충분히 다룰 수 있는 **'의미 있는 숫자'**로 살아남습니다.","1":"**정보량(Entropy)**을 측정하는 자(Ruler)입니다. 확률이 낮을수록(희귀할수록) 로그값의 크기는 커집니다(절댓값 기준). \"내일 해가 서쪽에서 뜬다\" 같은 희박한 사건은 정보량이 크고, \"내일 아침이 온다\" 같은 뻔한 사건은 정보량이 0에 가깝습니다. AI는 이 로그 기반의 정보량을 이용해 **'얼마나 놀라운 정보를 배웠는가'**를 측정합니다.","2":"**틀린 것에 대해 가혹하게 처벌**합니다. 로그 함수의 그래프($y=\\ln x$, $00$이므로 $\\tan\\theta<0$. |","problemTypeTable":"**문제 유형별 풀이 (현재 출제 규칙 반영)**\n\n| 유형 | 설명 | 답 구하는 법 |\n| --- | --- | --- |\n| **단위원 좌표형** | x 또는 y 또는 $x+y$를 묻는 문제 | 표준각 위치를 잡고 $x=\\cos\\theta$, $y=\\sin\\theta$로 읽기 |\n| **사분면 부호형** | 함수값의 +, - 판별 | 사분면에서 $x,y$ 부호 확인 후 $\\sin,\\cos,\\tan=\\frac{y}{x}$ 부호 결정 |\n| **항등식형** | $\\sin^2\\theta+\\cos^2\\theta$ 값 | 기본 항등식 $\\sin^2\\theta+\\cos^2\\theta=1$ 바로 적용 |","examplesByType":"---\n\n**예시 (단위원 좌표형)**\n\n단위원에서 $\\theta=270^\\circ$일 때 $x+y$를 구하세요.\n\n**풀이**\n\n1) $270^\\circ$의 점은 $(0,-1)$\n2) $x+y=0+(-1)=-1$\n\n따라서 **정답 -1**\n\n---\n\n**예시 (사분면 부호형)**\n\n$2$사분면에서 $\\tan\\theta$의 부호를 구하세요.\n\n**풀이**\n\n1) 2사분면에서 $\\sin\\theta>0$, $\\cos\\theta<0$\n2) $\\tan\\theta=\\frac{\\sin\\theta}{\\cos\\theta}<0$\n\n따라서 **정답 음수(-)**\n\n---\n\n**예시 (항등식형)**\n\n$\\sin^2\\theta+\\cos^2\\theta$의 값을 구하세요.\n\n**풀이**\n\n1) 단위원의 기본 항등식은 $\\sin^2\\theta+\\cos^2\\theta=1$\n2) 각도와 무관하게 항상 1\n\n따라서 **정답 1**"},"summary":"**한 줄 요약:** 삼각함수는 단순히 각도를 넣으면 비율이 나오는 계산기를 넘어, **원 운동과 파동**을 설명하는 가장 완벽한 언어입니다. 대관람차(단위원) 위에서 나의 가로($\\cos\\theta$), 세로($\\sin\\theta$) 위치를 파악하는 직관적인 상상만으로도 기초 개념부터 인공지능의 주기 데이터 처리, 포지셔널 인코딩까지 모든 원리가 하나의 실로 꿰어집니다.","problemSolvingLabel":"문제 풀이를 위한 설명","practiceProblemsTitle":"연습 문제","practiceProblemsIntro":"문제 은행 60문항 중 랜덤 10문항이 출제됩니다. 출제 시 문제유형은 가능한 한 중복되지 않게 고르고, 난이도는 쉬움→보통→어려움 순서로 배치됩니다.","problemPromptQuadrantSign":"{quadrant}사분면에서 {func}의 부호를 구하세요. (양수=1, 음수=-1)","problemPromptPeriodDeg":"의 주기(도 단위)를 구하세요.","problemPromptIntSum":"정수 합 문제: {a} + {b} = ?","problemPromptUnitCircleCoord":"단위원에서 θ={deg}°일 때 {axis} 값을 구하세요.","problemPromptCoterminalAngle":"{deg}°와 동경인 0°~360° 각도를 고르세요.","problemPromptQuadrantFromAngle":"각 θ={deg}°는 몇 사분면에 있나요? (1~4)","problems":{"trig_00":"sin(0°)의 값은?","trig_01":"cos(0°)의 값은?","trig_02":"sin(90°)의 값은?","trig_03":"cos(180°)의 값은?","trig_04":"tan(45°)의 값은?","trig_05":"tan(0°)의 값은?","trig_06":"sin(180°)의 값은?","trig_07":"cos(360°)의 값은?","trig_08":"단위원에서 90° 점의 y좌표는?","trig_09":"단위원에서 180° 점의 x좌표는?","trig_10":"sin(270°)의 값은?","trig_11":"cos(270°)의 값은?","trig_12":"tan(135°)의 값은?","trig_13":"tan(225°)의 값은?","trig_14":"tan(315°)의 값은?","trig_15":"sin(360°)의 값은?","trig_16":"cos(90°)의 값은?","trig_17":"sin(30°)의 부호는?","trig_18":"4사분면에서 cos의 부호는?","trig_19":"2사분면에서 tan의 부호는?","trig_20":"y=sin(x)의 기본 주기(도 단위)는?","trig_21":"y=cos(x)의 기본 주기(도 단위)는?","trig_22":"y=sin(2x)의 주기(도 단위)는?","trig_23":"y=cos(3x)의 주기(도 단위)는?","trig_24":"y=sin(4x)의 주기(도 단위)는?","trig_25":"y=cos(6x)의 주기(도 단위)는?","trig_26":"y=sin(12x)의 주기(도 단위)는?","trig_27":"y=sin(x)+cos(x)에서 계수 합(1+1)은?","trig_28":"sin²θ+cos²θ의 값은?","trig_29":"tanθ=sinθ/cosθ에서 cosθ=1, sinθ=0이면 tanθ는?","trig_30":"단위원에서 θ=0°일 때 (cosθ, sinθ)의 x좌표는?","trig_31":"단위원에서 θ=90°일 때 (cosθ, sinθ)의 y좌표는?","trig_32":"단위원에서 θ=180°일 때 y좌표는?","trig_33":"단위원에서 θ=270°일 때 x좌표는?","trig_34":"sin(540°)의 값은?","trig_35":"cos(540°)의 값은?","trig_36":"sin(720°)의 값은?","trig_37":"cos(720°)의 값은?","trig_38":"tan(405°)의 값은?","trig_39":"tan(720°)의 값은?","trig_40":"hour=0일 때 sin(2π·hour/24)의 값은?","trig_41":"hour=6일 때 sin(2π·hour/24)의 값은?","trig_42":"hour=12일 때 cos(2π·hour/24)의 값은?","trig_43":"hour=18일 때 sin(2π·hour/24)의 값은?","trig_44":"포지셔널 인코딩에서 sin/cos를 함께 쓰는 주된 이유로 가장 가까운 것은? (1:주기정보 보존, 0:완전무작위)","trig_45":"23시와 0시를 원형으로 가깝게 만들기 위한 변환 쌍 개수는? (sin, cos)","trig_46":"주기 인코딩에서 사용하는 핵심 함수 개수(sin, cos)는?","trig_47":"sin/cos 인코딩은 선형 숫자 인코딩의 경계 불연속을 완화한다면 1, 아니면 0","trig_48":"y=sin(8x)의 주기(도 단위)는?","trig_49":"y=cos(9x)의 주기(도 단위)는?","trig_50":"y=sin(10x)의 주기(도 단위)는?","trig_51":"y=cos(15x)의 주기(도 단위)는?","trig_52":"sin(90°)+cos(180°)의 값은?","trig_53":"cos(0°)+cos(180°)의 값은?","trig_54":"sin(270°)+1의 값은?","trig_55":"tan(45°)+tan(225°)의 값은?","trig_56":"단위원에서 θ=90°일 때 x+y의 값은?","trig_57":"단위원에서 θ=180°일 때 x+y의 값은?","trig_58":"단위원에서 θ=270°일 때 x+y의 값은?","trig_59":"단위원에서 θ=360°일 때 x+y의 값은?"},"problemAnswers":{"trig_00":0,"trig_01":1,"trig_02":1,"trig_03":-1,"trig_04":1,"trig_05":0,"trig_06":0,"trig_07":1,"trig_08":1,"trig_09":-1,"trig_10":-1,"trig_11":0,"trig_12":-1,"trig_13":1,"trig_14":-1,"trig_15":0,"trig_16":0,"trig_17":1,"trig_18":1,"trig_19":-1,"trig_20":360,"trig_21":360,"trig_22":180,"trig_23":120,"trig_24":90,"trig_25":60,"trig_26":30,"trig_27":2,"trig_28":1,"trig_29":0,"trig_30":1,"trig_31":1,"trig_32":0,"trig_33":0,"trig_34":0,"trig_35":-1,"trig_36":0,"trig_37":1,"trig_38":1,"trig_39":0,"trig_40":0,"trig_41":1,"trig_42":-1,"trig_43":-1,"trig_44":1,"trig_45":2,"trig_46":2,"trig_47":1,"trig_48":45,"trig_49":40,"trig_50":36,"trig_51":24,"trig_52":0,"trig_53":0,"trig_54":0,"trig_55":2,"trig_56":1,"trig_57":-1,"trig_58":-1,"trig_59":1},"problemSolutions":{"trig_00":"예시: θ=0°는 원의 오른쪽 끝점입니다. 단계1) sin은 y좌표. 단계2) y=0. 정답 0.","trig_01":"예시: θ=0°에서 점은 (1,0). 단계1) cos는 x좌표. 단계2) x=1. 정답 1.","trig_02":"예시: θ=90°에서 점은 (0,1). 단계1) sin은 y좌표. 단계2) y=1. 정답 1.","trig_03":"예시: θ=180°에서 점은 (-1,0). 단계1) cos는 x좌표. 단계2) x=-1. 정답 -1.","trig_04":"예시: 45°는 기울기 1 대각선. 단계1) tan=sin/cos. 단계2) 45°에서 sin=cos. 정답 1.","trig_05":"예시: 0°에서는 수평 방향. 단계1) tan=기울기. 단계2) 기울기 0. 정답 0.","trig_06":"예시: θ=180° 점은 (-1,0). 단계1) sin은 y좌표. 단계2) y=0. 정답 0.","trig_07":"예시: 360°는 한 바퀴 회전 후 원점 방향 복귀. 단계1) 0°와 동일. 단계2) cos=1. 정답 1.","trig_08":"예시: θ=90° 점 (0,1). 단계1) y좌표 확인. 단계2) 1. 정답 1.","trig_09":"예시: θ=180° 점 (-1,0). 단계1) x좌표 확인. 단계2) -1. 정답 -1.","trig_10":"예시: θ=270° 점 (0,-1). 단계1) sin은 y. 단계2) -1. 정답 -1.","trig_11":"예시: θ=270° 점 (0,-1). 단계1) cos는 x. 단계2) 0. 정답 0.","trig_12":"예시: 135°는 2사분면. 단계1) 기준각 45°의 tan=1. 단계2) 2사분면 tan 음수. 정답 -1.","trig_13":"예시: 225°는 3사분면. 단계1) 기준각 45°. 단계2) 3사분면 tan 양수. 정답 1.","trig_14":"예시: 315°는 4사분면. 단계1) 기준각 45°. 단계2) 4사분면 tan 음수. 정답 -1.","trig_15":"예시: 360°는 0°와 같음. 단계1) sin 0°=0. 단계2) 동일값. 정답 0.","trig_16":"예시: 90°의 점은 (0,1). 단계1) cos는 x. 단계2) 0. 정답 0.","trig_17":"예시: 30°는 1사분면. 단계1) 1사분면 sin 양수. 단계2) 양수=1로 표기. 정답 1.","trig_18":"예시: 4사분면은 x>0,y<0. 단계1) cos는 x 성분. 단계2) 양수=1. 정답 1.","trig_19":"예시: 2사분면은 sin+, cos-. 단계1) tan=sin/cos. 단계2) 음수=-1. 정답 -1.","trig_20":"예시: sin은 360°마다 반복. 단계1) 주기 정의. 단계2) 360. 정답 360.","trig_21":"예시: cos도 360° 주기. 단계1) 기본주기 확인. 단계2) 360. 정답 360.","trig_22":"예시: sin(kx)의 주기=360/k. 단계1) k=2. 단계2) 360/2=180. 정답 180.","trig_23":"예시: cos(3x) 주기 계산. 단계1) 360/3. 단계2) 120. 정답 120.","trig_24":"예시: sin(4x) 주기 계산. 단계1) 360/4. 단계2) 90. 정답 90.","trig_25":"예시: cos(6x) 주기 계산. 단계1) 360/6. 단계2) 60. 정답 60.","trig_26":"예시: sin(12x) 주기 계산. 단계1) 360/12. 단계2) 30. 정답 30.","trig_27":"예시: 식 y=sin(x)+cos(x). 단계1) 계수 읽기 1,1. 단계2) 합 2. 정답 2.","trig_28":"예시: 단위원 점 (x,y)는 x²+y²=1. 단계1) x=cosθ,y=sinθ. 단계2) 합 1. 정답 1.","trig_29":"예시: tan=sin/cos. 단계1) 0/1 계산. 단계2) 0. 정답 0.","trig_30":"예시: θ=0° 점 (1,0). 단계1) x좌표. 단계2) 1. 정답 1.","trig_31":"예시: θ=90° 점 (0,1). 단계1) y좌표. 단계2) 1. 정답 1.","trig_32":"예시: θ=180° 점 (-1,0). 단계1) y좌표. 단계2) 0. 정답 0.","trig_33":"예시: θ=270° 점 (0,-1). 단계1) x좌표. 단계2) 0. 정답 0.","trig_34":"예시: 540°=180°+360°. 단계1) 주기 360° 제거. 단계2) sin180°=0. 정답 0.","trig_35":"예시: 540°를 180°로 환원. 단계1) 540-360=180. 단계2) cos180°=-1. 정답 -1.","trig_36":"예시: 720°=2바퀴. 단계1) 0°와 동일. 단계2) sin0°=0. 정답 0.","trig_37":"예시: 720°=0°. 단계1) cos0°=1. 단계2) 정답 1.","trig_38":"예시: 405°=45°+360°. 단계1) tan45°=1. 단계2) 주기로 동일. 정답 1.","trig_39":"예시: 720°=0°. 단계1) tan0°=0. 단계2) 정답 0.","trig_40":"예시: hour=0. 단계1) θ=2π·0/24=0. 단계2) sin0=0. 정답 0.","trig_41":"예시: hour=6. 단계1) θ=2π·6/24=π/2. 단계2) sin(π/2)=1. 정답 1.","trig_42":"예시: hour=12. 단계1) θ=π. 단계2) cosπ=-1. 정답 -1.","trig_43":"예시: hour=18. 단계1) θ=3π/2. 단계2) sin(3π/2)=-1. 정답 -1.","trig_44":"예시: 모델 학습에서 주기 정보 보존이 목적. 단계1) sin/cos는 원형 위치 보존. 단계2) 정답 1.","trig_45":"예시: hour를 원형좌표로 바꿀 때 (sin, cos) 두 값 사용. 단계1) 두 축 필요. 단계2) 2. 정답 2.","trig_46":"예시: 기본 원형 인코딩 함수는 sin,cos. 단계1) 개수 세기. 단계2) 2. 정답 2.","trig_47":"예시: 23↔0 경계 완화 여부를 묻는 OX형. 단계1) sin/cos는 완화함. 단계2) 참=1. 정답 1.","trig_48":"예시: sin(8x) 주기. 단계1) 360/8. 단계2) 45. 정답 45.","trig_49":"예시: cos(9x) 주기. 단계1) 360/9. 단계2) 40. 정답 40.","trig_50":"예시: sin(10x) 주기. 단계1) 360/10. 단계2) 36. 정답 36.","trig_51":"예시: cos(15x) 주기. 단계1) 360/15. 단계2) 24. 정답 24.","trig_52":"예시: sin90 + cos180. 단계1) 1 + (-1). 단계2) 0. 정답 0.","trig_53":"예시: cos0 + cos180. 단계1) 1 + (-1). 단계2) 0. 정답 0.","trig_54":"예시: sin270 + 1. 단계1) -1 + 1. 단계2) 0. 정답 0.","trig_55":"예시: tan45 + tan225. 단계1) 1 + 1. 단계2) 2. 정답 2.","trig_56":"예시: θ=90° 점 (0,1). 단계1) x+y=0+1. 단계2) 1. 정답 1.","trig_57":"예시: θ=180° 점 (-1,0). 단계1) x+y=-1+0. 단계2) -1. 정답 -1.","trig_58":"예시: θ=270° 점 (0,-1). 단계1) x+y=0-1. 단계2) -1. 정답 -1.","trig_59":"예시: θ=360° 점 (1,0). 단계1) x+y=1+0. 단계2) 1. 정답 1."},"problemTestCodes":{"trig_00":"answer=0\nassert answer==0","trig_01":"answer=1\nassert answer==1","trig_02":"answer=1\nassert answer==1","trig_03":"answer=-1\nassert answer==-1","trig_04":"answer=1\nassert answer==1","trig_05":"answer=0\nassert answer==0","trig_06":"answer=0\nassert answer==0","trig_07":"answer=1\nassert answer==1","trig_08":"answer=1\nassert answer==1","trig_09":"answer=-1\nassert answer==-1","trig_10":"answer=-1\nassert answer==-1","trig_11":"answer=0\nassert answer==0","trig_12":"answer=-1\nassert answer==-1","trig_13":"answer=1\nassert answer==1","trig_14":"answer=-1\nassert answer==-1","trig_15":"answer=0\nassert answer==0","trig_16":"answer=0\nassert answer==0","trig_17":"answer=1\nassert answer==1","trig_18":"answer=1\nassert answer==1","trig_19":"answer=-1\nassert answer==-1","trig_20":"answer=360\nassert answer==360","trig_21":"answer=360\nassert answer==360","trig_22":"answer=180\nassert answer==180","trig_23":"answer=120\nassert answer==120","trig_24":"answer=90\nassert answer==90","trig_25":"answer=60\nassert answer==60","trig_26":"answer=30\nassert answer==30","trig_27":"answer=2\nassert answer==2","trig_28":"answer=1\nassert answer==1","trig_29":"answer=0\nassert answer==0","trig_30":"answer=1\nassert answer==1","trig_31":"answer=1\nassert answer==1","trig_32":"answer=0\nassert answer==0","trig_33":"answer=0\nassert answer==0","trig_34":"answer=0\nassert answer==0","trig_35":"answer=-1\nassert answer==-1","trig_36":"answer=0\nassert answer==0","trig_37":"answer=1\nassert answer==1","trig_38":"answer=1\nassert answer==1","trig_39":"answer=0\nassert answer==0","trig_40":"answer=0\nassert answer==0","trig_41":"answer=1\nassert answer==1","trig_42":"answer=-1\nassert answer==-1","trig_43":"answer=-1\nassert answer==-1","trig_44":"answer=1\nassert answer==1","trig_45":"answer=2\nassert answer==2","trig_46":"answer=2\nassert answer==2","trig_47":"answer=1\nassert answer==1","trig_48":"answer=45\nassert answer==45","trig_49":"answer=40\nassert answer==40","trig_50":"answer=36\nassert answer==36","trig_51":"answer=24\nassert answer==24","trig_52":"answer=0\nassert answer==0","trig_53":"answer=0\nassert answer==0","trig_54":"answer=0\nassert answer==0","trig_55":"answer=2\nassert answer==2","trig_56":"answer=1\nassert answer==1","trig_57":"answer=-1\nassert answer==-1","trig_58":"answer=-1\nassert answer==-1","trig_59":"answer=1\nassert answer==1"},"problemDifficulty":{"trig_00":"easy","trig_01":"easy","trig_02":"easy","trig_03":"easy","trig_04":"easy","trig_05":"easy","trig_06":"easy","trig_07":"easy","trig_08":"easy","trig_09":"easy","trig_10":"easy","trig_11":"easy","trig_12":"easy","trig_13":"easy","trig_14":"easy","trig_15":"easy","trig_16":"easy","trig_17":"easy","trig_18":"easy","trig_19":"easy","trig_20":"medium","trig_21":"medium","trig_22":"medium","trig_23":"medium","trig_24":"medium","trig_25":"medium","trig_26":"medium","trig_27":"medium","trig_28":"medium","trig_29":"medium","trig_30":"medium","trig_31":"medium","trig_32":"medium","trig_33":"medium","trig_34":"medium","trig_35":"medium","trig_36":"medium","trig_37":"medium","trig_38":"medium","trig_39":"medium","trig_40":"hard","trig_41":"hard","trig_42":"hard","trig_43":"hard","trig_44":"hard","trig_45":"hard","trig_46":"hard","trig_47":"hard","trig_48":"hard","trig_49":"hard","trig_50":"hard","trig_51":"hard","trig_52":"hard","trig_53":"hard","trig_54":"hard","trig_55":"hard","trig_56":"hard","trig_57":"hard","trig_58":"hard","trig_59":"hard"},"problemOrder":["trig_00","trig_01","trig_02","trig_03","trig_04","trig_05","trig_06","trig_07","trig_08","trig_09","trig_10","trig_11","trig_12","trig_13","trig_14","trig_15","trig_16","trig_17","trig_18","trig_19","trig_20","trig_21","trig_22","trig_23","trig_24","trig_25","trig_26","trig_27","trig_28","trig_29","trig_30","trig_31","trig_32","trig_33","trig_34","trig_35","trig_36","trig_37","trig_38","trig_39","trig_40","trig_41","trig_42","trig_43","trig_44","trig_45","trig_46","trig_47","trig_48","trig_49","trig_50","trig_51","trig_52","trig_53","trig_54","trig_55","trig_56","trig_57","trig_58","trig_59"],"cosineVisualTitle":"코사인 유사도 벡터 비주얼","cosineVisualHint":"두 벡터 방향이 비슷할수록 cos 값이 1에 가까워집니다.","cosineVisualNow":"현재 코사인 유사도:","cosineVisualHigh":"유사도 높음","cosineVisualMedium":"유사도 보통","cosineVisualLow":"유사도 낮음"}}},"now":"$undefined","timeZone":"UTC","children":["$L41","$L42","$L43"]}]