3:["$","$L1d",null,{"formats":"$undefined","locale":"ja","messages":{"meta":{"title":"みんなのAI","description":"無料AI教育。基礎数学・ディープラーニング・機械学習をチャプター別に学べます。内積、ニューラルネット、逆伝播からKNN、回帰、アンサンブルまで。ディープラーニング入門・機械学習講座。","keywords":"ディープラーニング, 機械学習, AI教育, 基礎数学, ディープラーニング入門, 機械学習講座, AI学習, ニューラルネット, 逆伝播, KNN, 回帰, 無料講座","learnTitle":"学ぶ","learnPageSeoTitle":"基礎ディープラーニング | 学ぶ","learnDescription":"チャプター別ディープラーニング：内積・行列積・ニューラルネット・逆伝播を段階的に学習。視覚化と問題で概念を習得し、ミニニューラルネットプレイグラウンドで試せます。","learnKeywords":"ディープラーニング, 内積, 行列積, ニューラルネット, 逆伝播, 線形層, 活性化関数, AI学習, チャプター学習","learnMathTitle":"基礎数学とAI | 学ぶ","learnMathDescription":"AIのための基礎数学。関数、ベクトル、行列、指数・対数、一様・正規分布をチャプター別に。ディープラーニング理解の土台。","learnMathKeywords":"基礎数学, 関数, ベクトル, 行列, AI数学, 正規分布, ディープラーニング数学","learnMlTitle":"機械学習 | 学ぶ","learnMlDescription":"機械学習入門から実践まで。KNN、線形・ロジスティック回帰、決定木、アンサンブル、K-means、交差検証、レコメンドを章ごとに。","learnMlKeywords":"機械学習, KNN, 線形回帰, ロジスティック回帰, 決定木, アンサンブル, K-means, 交差検証, レコメンド, 機械学習講座","learnMidMlTitle":"中級機械学習 | 学ぶ","learnMidMlDescription":"実務データ向けの前処理（スケーリング・エンコーディング・欠損補完）、PCA、SVM、ブースティング基礎、DBSCAN・GMM・異常検知、パイプライン、ハイパーパラメータチューニングを章ごとに学びます。","learnMidMlKeywords":"中級機械学習, スケーリング, エンコーディング, 欠損補完, PCA, SVM, ブースティング, AdaBoost, GBM, DBSCAN, GMM, パイプライン, Optuna","learnAdvDlTitle":"発展ディープラーニング | 学ぶ","learnAdvDlDescription":"Transformer・BERT・GPT・FlashAttention・ViT・自己教師あり学習・プロンプト・LoRA・QLoRA・RLHF・DPO・RAG・エージェント・GNN・XAI・オートエンコーダ・VAE・GAN・拡散・VLM・音声・知識蒸留・デプロイまで、大規模モデルと生成AIを章ごとに学びます。","learnAdvDlKeywords":"発展ディープラーニング, Transformer, BERT, GPT, FlashAttention, ViT, LoRA, QLoRA, RLHF, DPO, RAG, LLMエージェント, GNN, Grad-CAM, VAE, GAN, 拡散モデル, Stable Diffusion, CLIP, Whisper, 知識蒸留, TensorRT, vLLM","learnMidDlTitle":"中級ディープラーニング | 学ぶ","learnMidDlDescription":"重み初期化・Adam・学習率スケジューリング・正則化・バッチ/層正規化・データ拡張・CNN・プーリング・ResNet・軽量CNN・転移学習・物体検出・画像分割・トークン化・単語埋め込み・1D CNN・RNN・LSTM・GRU・エンコーダ-デコーダ・アテンションまで、安定学習と非構造データを章ごとに学びます。","learnMidDlKeywords":"中級ディープラーニング, 重み初期化, Xavier, He, Adam, RMSprop, 学習率スケジューリング, 正則化, ドロップアウト, バッチ正規化, 層正規化, データ拡張, CNN, プーリング, ResNet, MobileNet, 転移学習, YOLO, SSD, U-Net, トークン化, BPE, Word2Vec, GloVe, RNN, LSTM, GRU, アテンション","learnMidMathTitle":"中級数学 | 学ぶ","learnMidMathDescription":"ベクトル・行列・線形変換・固有値・勾配・ヤコビアン・ヘッセ行列・テイラー級数・凸最適化・条件付き確率・ベイズ・共分散・多変量正規・MLE・エントロピー・クロスエントロピーまで、多変数と不確実性を扱う中級数学を章ごとに学びます。","learnMidMathKeywords":"中級数学, ベクトル空間, 内積, 行列, 線形変換, 逆行列, 行列式, ランク, 固有値, 固有ベクトル, 勾配, ヤコビアン, ヘッセ, テイラー級数, 凸最適化, 条件付き確率, ベイズの定理, 共分散, MLE, エントロピー, KLダイバージェンス","learnAdvMathTitle":"上級数学 | 学ぶ","learnAdvMathDescription":"SVD・テンソル・ラグランジュ・マルコフ・モンテカルロ・MCMC・EM・MAP・変分推論・ワッサーシュタイン・MDP・フーリエ・グラフラプラシアン・SDE・ランジュバン・情報幾何など、生成モデルと深い最適化のための上級数学を章ごとに学びます。","learnAdvMathKeywords":"上級数学, SVD, 擬似逆行列, テンソル, ラグランジュ, KKT, マルコフ, モンテカルロ, MCMC, EM, MAP, 変分推論, ワッサーシュタイン, MDP, ベルマン, フーリエ, グラフラプラシアン, SDE, ランジュバン, スコアマッチング, 情報幾何","learnAdvMlTitle":"上級機械学習 | 学ぶ","learnAdvMlDescription":"特徴量エンジニアリング・PCA・t-SNE・SVM・カーネル・ブースティング・XGBoost・不均衡データ・異常検知・DBSCAN・GMM・ハイパーパラメータ・交差検証・XAI・SHAP・時系列・推薦システムなど、非線形・複雑データ・解釈可能性を扱う上級機械学習を章ごとに学びます。","learnAdvMlKeywords":"上級機械学習, 特徴量エンジニアリング, PCA, t-SNE, UMAP, SVM, カーネル, ブースティング, XGBoost, LightGBM, SMOTE, 異常検知, DBSCAN, GMM, ハイパーパラメータ, Optuna, XAI, SHAP, LIME, 時系列, ARIMA, Prophet, 行列分解, FM","learnPaperReviewHubTitle":"論文レビュー | 学ぶ","learnPaperReviewHubDescription":"AI・ディープラーニングの論文をテーマ別に整理したハブです。理論、最適化、アーキテクチャ、表形式データ、ビジョン、NLP、XAI、データ中心、エッジ・ウェブ、ドメイン応用などから選べます。","learnPaperReviewHubKeywords":"論文レビュー, AI論文, ディープラーニング, 機械学習, 学ぶ","playgroundTitle":"AI Playground | ニューラルネット・CNN・KNN・強化学習","playgroundDescription":"ブラウザ無料 AI Playground：MLP 分類器、KNN 近傍分類、畳み込み CNN、Q学習ブランコ、SGD・Adam 損失地形、Attention プレイグラウンドで ML・DL を体験。","playgroundKeywords":"AI Playground, KNN, K-最近傍, ニューラルネット, CNN, 最適化, SGD, Adam, Q学習, Attention, 無料 AI 実験","playgroundNnClassifierTitle":"ニューラルネット分類 Playground","playgroundNnClassifierDescription":"ブラウザでニューラルネット分類器を直接学習できる無料ラボ。K-カルチャーデータ、特徴量トグル、隠れ層の追加・ニューロン調整、学習率・正則化、リアルタイムの決定境界と損失で逆伝播・ミニバッチ SGD を体験。","playgroundNnClassifierKeywords":"ニューラルネット分類, Playground, MLP, 決定境界, 逆伝播, ミニバッチ SGD, 活性化関数, ReLU, Tanh, L1 L2 正則化, ディープラーニングデモ","playgroundRlTitle":"ブランコ強化学習エージェント Playground","playgroundRlDescription":"Q学習でロボットがブランコを押すタイミングを学ぶ無料ブラウザラボ。振り子物理・6環境・α・γ・ε 調整・エピソード報酬グラフ・ベルマン更新の数式で強化学習入門。","playgroundRlKeywords":"強化学習, Q学習, ブランコ, 振り子, RL エージェント, RL Playground, ε-greedy, 報酬関数, エピソード, ベルマン, MDP, 無料 RL シミュレータ","playgroundRlAbout":"強化学習（Q学習）","playgroundRlFeature1":"振り子ブランコの物理シミュレーション","playgroundRlFeature2":"6種類の環境プリセット（ロープ・摩擦・風）","playgroundRlFeature3":"リアルタイム Q学習と報酬チャート","playgroundRlFaq1Q":"ここで何を学べますか？","playgroundRlFaq1A":"角度と角速度を離散化したQ表で、左に押す・そのまま・右に押すの3動作を学習します。高さに応じた報酬とε-greedyでRLの基本ループを体験できます。","playgroundRlFaq2Q":"報酬はどう決まりますか？","playgroundRlFaq2A":"各ステップでブランコの高さ(1−cos θ)に比例した報酬を与え、十分高いとボーナスを加えます。押す行動には小さなコストがあり、速度・角度が極端だとエピソード終了です。","playgroundRlFaq3Q":"α、γ、εとは？","playgroundRlFaq3A":"αは学習率、γは割引率、εはランダム行動の割合です。スライダーで調整し、学習曲線の変化を観察できます。","playgroundCnnTitle":"畳み込み CNN Playground | feature map・カーネル実習","playgroundCnnDescription":"16×16 K-カルチャー画像に 3×3 畳み込みフィルタを適用し feature map をリアルタイム確認できる無料 CNN ラボ。Sobel・ブラー・シャープ・エッジ等 7 プリセット、ReLU・マックスプーリング、スライドアニメーション・パディングで畳み込み入門。","playgroundCnnKeywords":"CNN, 畳み込み, convolution, feature map, カーネル, フィルタ, ReLU, max pooling, Sobel, エッジ検出, コンピュータビジョン, Playground, K-カルチャー, 無料 CNN シミュレータ","playgroundCnnAbout":"畳み込みニューラルネット (CNN)","playgroundCnnFeature1":"太極・丹青・ハングル・K-Pop の K-カルチャー入力","playgroundCnnFeature2":"Identity・ブラー・Sobel 等 3×3 カーネルプリセット 7 種とクリック編集","playgroundCnnFeature3":"畳み込み→ReLU→プーリングパイプラインの可視化","playgroundCnnFeature4":"▶ 再生・ステップでカーネルスライドアニメーション","playgroundCnnFeature5":"Valid・Same パディング切替","playgroundCnnFaq1Q":"畳み込みは何をしますか？","playgroundCnnFaq1A":"小さなフィルタ（カーネル）を画像上でスライドし、近傍ピクセルの重み付き和を計算します。エッジやテクスチャなど空間的パターンを抽出する CNN の基本演算です。","playgroundCnnFaq2Q":"Sobel フィルタはなぜ使うのですか？","playgroundCnnFaq2A":"Sobel X/Y は明るさの変化が大きい方向（縦横のエッジ）を強調します。学習前でも手動フィルタで輪郭が feature map に現れます。","playgroundCnnFaq3Q":"ReLU とマックスプーリングは？","playgroundCnnFaq3A":"ReLU は負の応答を 0 に切り捨てます。2×2 マックスプーリングは 4 マス中最大値だけ残し、サイズを縮小して位置ずれに強くします。","playgroundCnnFaq4Q":"どのカーネルプリセットが使えますか？","playgroundCnnFaq4A":"Identity、Gaussian blur、Sharpen、Sobel X/Y（縦横エッジ）、Edge（ラプラシアン型）、Emboss の 7 種です。各プリセットが feature map で強調するパターンを比較できます。","playgroundCnnFaq5Q":"アニメーションはどう動きますか？","playgroundCnnFaq5A":"▶ 再生またはステップでカーネルが入力グリッドをスライドし、畳み込み出力を 1 セルずつ埋めます。続けて ReLU と 2×2 マックスプーリングも同様に進み、CNN 1 層の流れを段階的に確認できます。","playgroundCnnFaq6Q":"インストール不要で無料ですか？","playgroundCnnFaq6A":"はい。ブラウザだけで動く無料の教育用 Playground です。Python や TensorFlow なしで畳み込み・feature map・プーリングを視覚的に体験できます。","playgroundTransformerTitle":"Attention プレイグラウンド | Self-Attention・QKV 実習","playgroundTransformerDescription":"短い文でクエリトークンを選び、Q·K 内積→softmax→V 重み付き和をリアルタイム確認できる無料 Self-Attention 実験室。BERT/GPT 因果マスク、√d_k スケール、注意行列ヒートマップ、段階アニメーションで Transformer 入門。","playgroundTransformerKeywords":"アテンション, attention, self-attention, セルフアテンション, transformer, トランスフォーマー, QKV, softmax, causal mask, 因果マスク, scaled dot-product, Playground, ディープラーニング実習, 無料アテンションシミュレータ, NLP","playgroundTransformerAbout":"Scaled Dot-Product Self-Attention","playgroundTransformerFeature1":"4種類の短文プリセットとクエリトークン選択","playgroundTransformerFeature2":"Q·K^T スコアと softmax 重みの N×N ヒートマップ","playgroundTransformerFeature3":"BERT（全体）vs GPT（因果）マスク切替","playgroundTransformerFeature4":"√d_k スケール・数式パネル・トークン接続 SVG","playgroundTransformerFeature5":"▶ 再生・1ステップで scores→softmax→output","playgroundTransformerFaq1Q":"Q, K, V とは？","playgroundTransformerFaq1A":"Query は「何を探すか」、Key は「何を含むか」、Value は「実際に取り出す情報」です。Q と K の内積で関連スコアを作り、softmax で重みにして V を重み付き和し、トークン表現を更新します。","playgroundTransformerFaq2Q":"なぜ softmax？","playgroundTransformerFaq2A":"内積スコアを 0〜1 の重みに変え、各クエリ行の合計が 1 になります。最も関連の高いトークンにより大きな注意を集中させる仕組みです。","playgroundTransformerFaq3Q":"因果マスク（causal mask）とは？","playgroundTransformerFaq3A":"GPT のように左から右へ生成するとき、未来トークン (j>i) のスコアを −∞ にして softmax 後の重みを 0 にします。BERT は双方向で全トークンを同時に見られます。","playgroundTransformerFaq4Q":"√d_k で割る理由は？","playgroundTransformerFaq4A":"次元 d_k が大きいと内積が大きくなり softmax が尖りすぎます。√d_k でスケールを安定させ、学習と解釈の両方に役立ちます。","playgroundTransformerFaq5Q":"インストール不要で無料ですか？","playgroundTransformerFaq5A":"はい。ブラウザだけで動く無料の教育用 Playground です。PyTorch や TensorFlow なしで Self-Attention の QKV→softmax→重み付き和を視覚的に体験できます。","playgroundOptimizerTitle":"損失地形ラボ Playground | SGD・Momentum・Adam 比較","playgroundOptimizerDescription":"2D 損失地形上で SGD・Momentum・Adam が同じ起点からどう違う経路で最小値を探すか比較できる無料の最適化ラボ。学習率・慣性係数の調整、ボウル・サドル・Rosenbrock 谷、リアルタイム経路と損失表示。","playgroundOptimizerKeywords":"最適化, optimizer, SGD, Momentum, Adam, 勾配降下, 損失関数, loss landscape, 学習率, Playground, 深層学習実習","playgroundOptimizerAbout":"勾配降下法と適応型最適化","playgroundOptimizerFeature1":"ボウル・サドル・Rosenbrock 谷の3種地形","playgroundOptimizerFeature2":"SGD・Momentum・Adam の同時経路比較","playgroundOptimizerFeature3":"学習率・β・クリック開始点・数式パネル","playgroundOptimizerFaq1Q":"なぜ3つのオプティマイザを同時に動かすのですか？","playgroundOptimizerFaq1A":"同じ起点・同じ学習率でも、アルゴリズムごとに経路と収束速度が大きく異なります。SGD は単純ですが谷で振動し、Momentum は慣性で方向を保ち、Adam はステップごとに適応的な学習率を使います。","playgroundOptimizerFaq2Q":"Rosenbrock 谷(valley)とは？","playgroundOptimizerFaq2A":"f(x,y)=(1−x)²+10(y−x²)² の細く曲がった谷です。実際のニューラルネットの損失地形に似ており、学習率とオプティマイザの選び方で発散したり非常に遅く収束したりする典型例です。","playgroundOptimizerFaq3Q":"開始点はどう変えますか？","playgroundOptimizerFaq3A":"損失キャンバスをクリックすると白い開始マーカーが移動し、3つの経路が最初から描き直されます。地形プリセットを変えると、その地形のデフォルト開始点にリセットされます。","playgroundOptimizerFaq4Q":"鞍点地形になぜ最小値が2つあるのですか？","playgroundOptimizerFaq4A":"f(x,y)=(x²−1)²+y² は中央 (0,0) に鞍点、左右 (-1,0)・(1,0) に最小値がある二重井戸です。開始位置によってどの谷に収束するか、鞍をどう通過するかを比較できます。","playgroundKnnTitle":"KNN 近傍分類 Playground | K-最近傍・多数決","playgroundKnnDescription":"2D K-カルチャーデータで K-最近傍（KNN）分類を試せる無料 ML ラボ。K・ユークリッド/マンハッタン距離、クリッククエリ、近傍の接続線・決定領域・テスト精度をリアルタイム表示。","playgroundKnnKeywords":"KNN, K-最近傍, k-nearest neighbors, 機械学習, Playground, 多数決, ユークリッド距離, マンハッタン距離, 決定境界, 分類, ml03, 無料 ML シミュレータ","playgroundKnnAbout":"K-最近傍分類","playgroundKnnFeature1":"太極・丹青・K-Wave・K-Pop K-データセット","playgroundKnnFeature2":"K・距離尺度・クエリクリック・近傍ハイライト","playgroundKnnFeature3":"決定領域ヒートマップ・テスト精度・多数決表","playgroundKnnFaq1Q":"KNN に学習は必要ですか？","playgroundKnnFaq1A":"重みの学習はなく、学習データ（train）から最も近い K 個の近傍ラベルの多数決で分類します。クエリ位置が変わると近傍と予測も即座に変わります。","playgroundKnnFaq2Q":"K を大きくするとどうなりますか？","playgroundKnnFaq2A":"K が小さいと境界がギザギザでノイズに敏感です。K が大きいと滑らかになりますが、クラスが混ざる領域では誤分類しやすくなります。","playgroundKnnFaq3Q":"ニューラルネット分類器との違いは？","playgroundKnnFaq3A":"同じ 2D データでも KNN は距離と多数決のみ、NN 分類器は逆伝播で重みを学習します。2つの Playground を並べて古典 ML と DL の違いを体感できます。","communityTitle":"ITニュース","communityDescription":"AI・ITの最新ニュースと開発動向をお届けします。新着記事が続々投稿され、検索からアクセスできます。","communityKeywords":"ITニュース, AIニュース, 人工知能ニュース, 機械学習, ディープラーニング, LLM, AI開発動向, テックニュース","studiesTitle":"スタディ","studiesDescription":"ディープラーニングの勉強会と学習リソース。","curriculumTitle":"読書","curriculumDescription":"書籍ベースの学習ロードマップを作成・共有。","supportTitle":"サポート・お問い合わせ","supportDescription":"みんなのAIの利用方法、Chrome拡張機能、学習・コミュニティに関するお問い合わせとサポート情報です。","privacyTitle":"プライバシーポリシー","privacyDescription":"みんなのAI（学ぶ・読書・コミュニティ・プレイグラウンド等）の個人情報の取扱いについて。","termsTitle":"利用規約","termsDescription":"みんなのAI教育プラットフォームの利用規約です。","refundTitle":"返金ポリシー","refundDescription":"学ぶプレミアム購読（月額4 USD）の決済・返金・解約ポリシーです。","aboutTitle":"みんなのAIとは？","aboutDescription":"AI研究者が作った基礎数学・ディープラーニング教育プラットフォーム。KリーグAIコンペ3位、金融AIチャレンジ22位などの経験を基に、基礎理解の重要性を伝えます。","kimpoPromoTitle":"金浦AI教育提案 | みんなのAI","kimpoPromoDescription":"金浦市の地域データを数学・ディープラーニング・機械学習教育と結び付ける、みんなのAIベースの提案ページです。","kimpoCourseTitle":"金浦AI教育課程紹介 | みんなのAI","kimpoCourseDescription":"16回の授業構成、金浦の地域課題データ、チームプロジェクトの流れをまとめた教育課程紹介ページです。"},"support":{"title":"サポート・お問い合わせ","intro":"みんなのAI（mdooai.com）の利用方法、不具合報告、ご要望は以下をご参照ください。","serviceTitle":"サービス紹介","serviceContent":"みんなのAIはディープラーニング・AIを本質から理解できるよう支援する教育プラットフォームです。学ぶ（チャプター別ビジュアル、一部チャプター有料購読）、読書（書籍ベースのロードマップ）、コミュニティ（学習資料共有）、Chrome拡張機能（新規タブで学習ページを開く）などを提供しています。","extensionTitle":"Chrome拡張機能","extensionContent":"ツールバーアイコンをクリックすると学習ページ（https://mdooai.com/learn）が新しいタブで開きます。インストール・利用に関するお問い合わせはこのサポートページまたはChromeウェブストアの拡張機能ページからご連絡ください。","extensionInstallCta":"Chromeウェブストアでインストール","contactTitle":"お問い合わせ","contactContent":"サービス全般のお問い合わせ・不具合報告・ご要望は、mdooai.comのサイト内お問い合わせ、または運営チームの公開連絡先までお送りください。できる限り早くご返答いたします。","linksTitle":"関連リンク","learnLink":"学ぶ","privacyLink":"プライバシーポリシー","termsLink":"利用規約","refundLink":"返金ポリシー","supportUrlLabel":"サポートURL"},"about":{"title":"みんなのAIとは？","intro1":"こんにちは。みんなのAIです。機械学習とディープラーニングを研究しています。","intro2":"様々なAIコンペティションに参加し、企業で活用される多様なモデルを自ら開発してきた経験があります。その過程で一つの重要な教訓を得ました。テクニックも重要ですが、性能の差を決める核心は基礎への理解だということです。昨今はバイブコーディングでモデルを素早く実装できますが、期待どおりの性能が出ないときに原因を分析し改善するのは依然として容易ではありません。数学的基盤とAIの原理への理解がなければ、ボトルネックがどこで発生しているか構造的に把握するのは難しいです。","intro3":"このサイトは、そうした試行錯誤を減らすために、概念と計算を一緒に学べるように構成しています。","intro4Before":"そこで、勉強しながらまとめた内容を基に、自分で学習プラットフォームを開発して公開しました。講義や教育が必要な方は、お気軽に ","intro4After":" までご連絡ください。ご案内します。","approachTitle":"学習方式","approachContent":"概念まとめを並べるのではなく、演算の流れを段階的に追いながら「なぜこう動くのか」を理解する方式で構成しています。可視化とインタラクションを中心に、直接計算してAIコーチの即時フィードバックで誤解を正せます。","roadmapTitle":"今後の計画","roadmapContent":"機械学習を含め、様々なAI教育コンテンツを継続的に拡張していく予定です。ご興味のある方は ","roadmapContactAfter":" までお気軽にご連絡くださいませ。","feedbackNote":"まだ初期バージョンですが、継続的に改善中です。フィードバックをお寄せいただければ積極的に反映いたします。","ctaLearn":"学びを始める","ctaDeveloper":"開発者プロフィールを見る","chromeExtensionTitle":"Chromeウェブストアに追加","chromeExtensionDesc":"Chrome拡張機能をインストールすると、新規タブで学習ページをすぐに開けます。"},"terms":{"title":"利用規約","effectiveDate":"施行日：2026年5月21日（改定時は当ページで案内します。）","intro":"みんなのAI（mdooai.com）は、ディープラーニング・機械学習・数学を段階的に学べる教育プラットフォームです。本規約はウェブサイトおよび関連サービスの利用条件を定めます。","section1Title":"1. 適用範囲とサービス構成","section1Content":"本規約は https://mdooai.com および次のサービスに適用されます。（1）学ぶ：基礎・中級・上級のDL・数学・MLコース、論文レビュー、プレイグラウンド（ニューラルネット・強化学習・CNN等）、バッジ・プロフィール等（2）読書：書籍ベースの学習ロードマップ（3）コミュニティ・ITニュース：投稿・コメント等（4）Chrome拡張：新規タブで学習ページを開く（5）紹介・サポート・法務ページ。韓国語・英語・日本語・中国語（簡体字）に対応。学ぶの一部チャプターはプレミアム（有料購読）となる場合があり、無料・有料の範囲は各画面の表示に従います。","section2Title":"2. アカウントと利用","section2Content":"多くの機能は会員登録・ログイン（Clerk等の認証連携）後に利用できます。学ぶではチャプター別の可視化・問題演習・AI学習コーチ等を提供し、一部は無料・一部はプレミアム対象です。読書・コミュニティ・プレイグラウンド・論文レビュー等は原則無料です。プレミアムの料金・決済・返金・解約は返金ポリシーに従います。決済が「準備中」と表示される場合でも、開始後は本規約および返金ポリシーが適用されます。","section3Title":"3. コンテンツ・投稿・禁止行為","section3Content":"学ぶ・読書等の学習コンテンツの著作権はみんなのAIまたは正当な権利者に帰属します。個人学習目的での閲覧・利用は可能ですが、無断複製・配布・転売・自動収集（スクレイピング）等は禁止です。コミュニティ投稿・コメントの責任は利用者にあり、運営方針により削除・利用制限される場合があります。アカウント不正利用、サービス妨害、法令違反、他者権利侵害は禁止され、違反時は利用制限となる場合があります。","section4Title":"4. 規約の変更","section4Content":"規約変更時は当ページで告知し、重要な変更は施行日を明示します。変更後も利用を継続した場合、変更後の規約に同意したものとみなします。","section5Title":"5. お問い合わせ","section5Content":"規約・サービスに関するお問い合わせは https://mdooai.com/support またはサイト内サポートをご利用ください。","termsUrlLabel":"利用規約URL"},"refund":{"title":"返金ポリシー","effectiveDate":"施行日：2026年5月21日（改定時は当ページで案内します。）","intro":"学ぶ「プレミアム」購読（月額4 USD・自動更新）の決済・返金・解約に関するポリシーです。読書・コミュニティ・プレイグラウンド・論文レビュー等は無料です。","section1Title":"1. 対象・料金・決済","section1Content":"プレミアムは学ぶ内の一部有料チャプター（例：基礎DL Chapter 04〜12等、画面のプレミアム表示に従う）およびAI学習コーチ等に適用されます。月額4 USDで、初回決済日を基準に毎月自動更新・請求されます。決済はPaddle、PayPal等の決済代行で処理され、カード情報の原文は当社サーバーに保存しません。チェックアウト表示の金額・通貨・周期が優先されます。「決済準備中」表示中は実際の請求が行われない場合があり、開始後は本ポリシーが適用されます。","section2Title":"2. 返金","section2Content":"初回決済日から7日以内にご不満の場合、全額返金を請求できます。7日経過後または2回目以降の決済については、当該課金期間（当月）の返金はいたしません。https://mdooai.com/support または決済代行（Paddle・PayPal等）のサポートへご連絡ください。","section3Title":"3. 解約","section3Content":"いつでも解約できます。解約後も現在の課金期間終了まではプレミアムを利用でき、次回決済日から請求されません。既に請求された当該期間分は返金されません（初回7日以内の返金は第2条に従います）。","section4Title":"4. 適用およびお問い合わせ","section4Content":"手続きは決済時のポリシーおよび決済代行の規約に従います。お問い合わせ：https://mdooai.com/support","refundUrlLabel":"返金ポリシーURL"},"privacy":{"title":"プライバシーポリシー","effectiveDate":"施行日：2026年5月21日（改定時は当ページで案内します。）","section1Title":"1. 適用対象","section1Content":"本ポリシーはみんなのAI（mdooai.com）および関連サービス（学ぶ・読書・コミュニティ・プレイグラウンド・論文レビュー・Chrome拡張・サポートページ等）に適用されます。学ぶの一部はプレミアム（有料）となる場合があります。","section2Title":"2. 収集する情報","section2Intro":"サービス利用時に以下の情報が収集・利用される場合があります。認証・ホスティング・決済は専門事業者が処理し、各事業者のポリシーも適用されます。","section2List1":"アカウント・認証情報：メール、表示名、プロフィール識別子等（Clerk等。パスワードは当社が直接保存しない場合があります）","section2List2":"利用・学習記録：チャプター進捗、バッジ、コミュニティ投稿・コメント・添付、読書（カリキュラム）データ、AI学習コーチの質問・回答等","section2List3":"端末・アクセス情報：ブラウザ、IP、アクセス日時、Cookie・セッション等","section2List4":"決済・購読情報：Paddle、PayPal等で処理。カード番号原文は当社で保存しません。購読状態・決済ID等は有料機能・返金・解約・サポートに利用します。","section2List5":"委託・連携：コミュニティ等のデータはSupabase等に保存される場合があります。AIコーチは質問文脈がAI API（例：Upstage）に送信される場合があります。","section2Extension":"Chrome拡張はデータを収集・送信しません。アイコンで https://mdooai.com/learn を新しいタブで開くのみです。","section3Title":"3. 利用目的","section3Content":"認証、学習・コミュニティ・読書サービス、プレミアム管理、AIコーチ・検索、改善・障害対応、セキュリティ、法令遵守、お問い合わせ対応に利用します。","section4Title":"4. 保管と削除","section4Content":"目的達成後または法定保管期間経過後に削除・匿名化します。退会・削除請求は所定手続および委託先ポリシーに従い処理します。","section5Title":"5. 第三者・委託","section5Content":"個人情報を販売しません。運営のためClerk（認証）、Supabase（保存）、Paddle・PayPal（決済）、AI API提供者（学習コーチ）等に必要な範囲で処理・委託します。法令に基づく開示がある場合があります。","section6Title":"6. ポリシー変更","section6Content":"変更時は当ページを更新し、重要な変更は施行日を明示します。","section7Title":"7. お問い合わせ","section7Content":"お問い合わせ：https://mdooai.com/support","privacyUrlLabel":"プライバシーポリシーURL"},"common":{"appName":"みんなのAI","headerBrand":"みんなのAI","loading":"読み込み中…","close":"閉じる","back":"戻る","backToHome":"← ホーム","chapterSelect":"チャプターを選択","chapterSearchNoResults":"検索結果がありません。","chapterListEmpty":"チャプターがありません。","chapters":"学ぶ","curriculum":"読書","community":"コミュニティ","itNews":"ITニュース","language":"言語","openMenu":"メニューを開く","closeMenu":"メニューを閉じる","menu":"メニュー","communityComingSoon":"コミュニティエリアは準備中です。","searchPlaceholder":"チャプター・概念を検索…","globalSearchPlaceholder":"全チャプターを検索…","globalSearchNoResults":"検索結果がありません。","answer":"答え","wrongAnswerGuideButton":"なぜ間違った？","mcTfFalse":"偽","mcTfTrue":"正","mcCircled1":"①","mcCircled2":"②","mcCircled3":"③","mcCircled4":"④","signIn":"ログイン","signUp":"新規登録","myAccount":"マイアカウント","signOut":"ログアウト","aboutLink":"みんなのAIとは？","myAchievements":"マイ実績","moreServices":"もっと見る","allServices":"全サービス","saving":"保存中…"},"community":{"title":"ITニュース","subtitle":"AI・ITの最新ニュースと開発動向をお届けします。","allPosts":"すべての投稿","viewFullCommunity":"コミュニティ全体を見る","sortNewest":"新しい順","sortOldest":"古い順","newPost":"新規投稿","createPost":"投稿作成","uploadMaterial":"教材をアップロード","uploadTitle":"タイトル","category":"カテゴリ","categoryAll":"すべて","categoryPlaceholder":"カテゴリを選択","category_ai_news":"AIニュース","category_ai_basics":"AI基礎","category_machine_learning":"機械学習","category_deep_learning":"ディープラーニング","category_nlp":"自然言語処理","category_computer_vision":"コンピュータビジョン","category_llm":"大規模言語モデル","category_prompt_engineering":"プロンプトエンジニアリング","category_ai_ethics":"AI倫理","category_ai_tools":"AIツール活用","category_study_material":"学習資料","priceTypeFree":"無料","priceTypePaid":"有料","price":"金額","pricePlaceholder":"例: 1,000円","uploadTitlePlaceholder":"例：内積練習シート","uploadDescription":"説明","uploadDescriptionPlaceholder":"教材の説明と使い方を書いてください。","uploadFile":"ファイル添付（任意）","uploadSubmit":"公開","uploading":"公開中…","download":"ダウンロード","postedAt":"投稿","noPosts":"まだ投稿がありません。最初に共有してみましょう！","searchPlaceholder":"タイトル・説明で検索","prevPage":"前へ","nextPage":"次へ","pageOf":"{current} / {total} ページ","scrollToTop":"一番上へ","signInToPost":"教材をアップロードするにはログインしてください。","errorLoad":"投稿の読み込みに失敗しました。","errorPublish":"公開に失敗しました。もう一度お試しください。","errorPriceRequired":"有料の場合は金額を入力してください。","backToFeed":"フィードに戻る","postedAnUpdate":"投稿しました","postLabel":"投稿","inThisPost":"この投稿に登場","replyPlaceholder":"{name}さんの投稿に返信","replyComingSoon":"返信機能は準備中です。","errorPostNotFound":"投稿が見つかりません。","deletePost":"投稿を削除","deleteConfirm":"この投稿を削除しますか？","errorDelete":"削除に失敗しました。","editPost":"投稿を編集","comments":"コメント","commentPlaceholder":"コメントを入力","commentSubmit":"投稿","commentSubmitting":"投稿中…","commentEdit":"編集","commentDelete":"削除","commentDeleteConfirm":"このコメントを削除しますか？","commentCancel":"キャンセル","commentSave":"保存","noComments":"コメントはまだありません。","errorComment":"コメントの投稿に失敗しました。","errorCommentEdit":"更新に失敗しました。","errorCommentDelete":"削除に失敗しました。","removeFile":"削除","editForbidden":"編集する権限がありません。","backToPost":"投稿へ","currentFile":"現在","removeFileLabel":"添付を削除"},"curriculum":{"title":"読書","listTitle":"読書","listSubtitle":"書籍ベースの学習ロードマップを作成・共有。おすすめを閲覧。","createNew":"新規読書","newTitle":"読書作成","subtitle":"教材を検索し、このトラックに沿って学ぶと目標に到達できる読書を作成できます。","searchBooks":"書籍検索","autocompleteLabel":"自動補完","searchResults":"検索結果から選択","searchResultsEmpty":"書籍を検索するとここに結果が表示されます。","requiredBookTitle":"書籍タイトルを入力してください。（必須）","aiAutoLabel":"AI 自動生成","generateHint":"書籍タイトルを入力してボタンを押すと、AI が学習ロードマップを自動で作成します。","generateWithAI":"AI で読書を自動生成","fillRequiredToGenerate":"書籍タイトルを入力するとボタンが使えます。","resultEmptyHint":"上の「AI で読書を自動生成」を押すとここに内容が入ります。編集して保存できます。","requiredToSave":"保存するには書籍タイトルと読書内容の両方を入力してください。","searchPlaceholder":"タイトル・著者・テーマで検索…","searchButton":"検索","searching":"検索中…","noBooks":"結果がありません。別のキーワードで試してください。","selectBook":"この本で読書を作成","editBookInfo":"書籍情報（編集可）","searchOrManualHint":"書籍を検索して選ぶか、下の欄に直接入力できます。書籍がなくてもタイトルだけで読書を作成できます。","bookTitle":"書籍タイトル","bookTitlePlaceholder":"例：ディープラーニング入門","bookImageUrl":"表紙画像 URL","isbnPubdate":"ISBN / 出版日","bookInfo":"書籍情報","bookDescription":"書籍の紹介","isbn":"ISBN","pubdate":"出版日","generating":"読書生成中…","generateError":"読書の生成に失敗しました。もう一度お試しください。","searchError":"書籍検索に失敗しました。","optionalRequest":"追加リクエスト（任意）","optionalRequestPlaceholder":"例：初級者向け、2週間コース、ML理解に集中…","resultTitle":"生成された学習ロードマップ","shortDescription":"簡単な説明（一覧に表示）","shortDescriptionPlaceholder":"例：基礎から上級までの段階別学習ロードマップ","shortDescriptionHint":"一覧でプレビューとして表示されます。空欄の場合は本文要約で代替。","editCurriculum":"必要に応じて編集してから保存できます。","save":"保存","saving":"保存中…","saveSuccess":"保存しました。","saveError":"保存に失敗しました。","signInToSave":"保存するにはログインしてください。","author":"著者","publisher":"出版社","sortNewest":"新しい順","sortOldest":"古い順","sortPopular":"おすすめ順","curriculaSearchPlaceholder":"タイトル・要約で検索","prevPage":"前へ","nextPage":"次へ","pageOf":"{current} / {total} ページ","scrollToTop":"一番上へ","noCurricula":"保存された読書はまだありません。新しく作成してみましょう！","notFound":"読書が見つかりません。","like":"おすすめ","likes":"おすすめ数","createdBy":"作成者","anonymous":"匿名","edit":"編集","delete":"削除","deleteConfirm":"この読書を削除しますか？","editCurriculumMenu":"メニュー","editTitle":"読書を編集","cancel":"キャンセル","backToCurriculum":"読書に戻る","backToDetail":"詳細に戻る","editForbidden":"投稿者のみ編集できます。"},"auth":{"loading":"読み込み中…","signIn":{"title":"ログイン","subtitle":"メールアドレスまたはユーザー名とパスワードを入力してください。","identifierLabel":"メールアドレスまたはユーザー名","identifierPlaceholder":"メールまたはユーザー名を入力","passwordLabel":"パスワード","passwordPlaceholder":"パスワードを入力","submit":"続ける","submitting":"ログイン中…","noAccount":"アカウントをお持ちでないですか？","signUpLink":"新規登録"},"signUp":{"title":"アカウントを作成","subtitle":"以下の項目を入力して登録を進めてください。","usernameLabel":"ユーザー名","usernamePlaceholder":"4〜64文字、英数字で入力","usernameRules":"4〜64文字、ラテン文字のみ。特殊文字 ^ $ ! . ` # + ~ は使用できません。","emailLabel":"メールアドレス","emailPlaceholder":"メールアドレスを入力","passwordLabel":"パスワード","passwordPlaceholder":"パスワードを入力","submit":"続ける","submitting":"処理中…","hasAccount":"すでにアカウントをお持ちですか？","signInLink":"ログイン"},"verifyEmail":{"title":"メール認証","subtitleSignIn":"メールに送信された認証コードを入力してください。","subtitleSignUp":"登録メールに送信された認証コードを入力してください。","codeLabel":"認証コード","codePlaceholder":"認証コードを入力","submit":"確認","submitting":"確認中…","verifyButton":"認証する","back":"前のステップへ","backSignIn":"別の方法でログイン"},"errors":{"generic":"リクエストを処理できませんでした。もう一度お試しください。","username_length":"ユーザー名は4〜64文字で入力してください。","username_non_number":"ユーザー名に数字以外の文字（英字など）を1文字以上含めてください。","username_latin_only":"ユーザー名は英字（ラテン文字）のみ使用できます。日本語は使えません。登録後、表示名は日本語で設定できます。","password_length":"パスワードの長さ条件をご確認ください。","form_identifier_exists":"このメールアドレスまたはユーザー名はすでに使用されています。","form_identifier_not_found":"一致するアカウントが見つかりません。","form_password_incorrect":"パスワードが正しくありません。","form_code_incorrect":"認証コードが正しくありません。","form_password_compromised":"パスワードのセキュリティ問題が検出されました。メール認証など別の方法でログインしてください。","user_locked":"しばらくログインできません。時間をおいて再度お試しください。","display_name_min_length":"表示名は4文字以上で入力してください。","second_factor_not_supported":"このサービスはID・パスワードでのログインのみです。多要素認証(MFA)が有効な場合は、Clerk管理画面でインスタンスのMFA設定を見直すか、ユーザー側のセキュリティ設定でMFAをオフにしてから再度お試しください。"}},"paperReview":{"title":"AI論文","navTitle":"AI論文","hubTitle":"AI論文","hubDescription":"テーマ別に論文を整理しています。カテゴリを選んでください。","hubFlatListTitle":"公開中のAI論文","hubFlatListLead":"カテゴリ・会議ハブから個別の論文ページへすぐ移動できます。","hubFlatListCount":"全 {count} 本","hubFlatListPaperLabel":"論文","scopeHeading":"分類対象","keywordsHeading":"キーワード","seoTitleSuffix":"CPAL 2026 論文レビュー | みんなのAI","categories":{"theoreticalFoundations":{"sidebarTitle":"理論・数学基盤","headline":"理論と数学的基盤","scope":"AIアルゴリズムの数学的証明、最適化理論、関数解析、線形代数的手法を扱う論文（例: Influence Function 関連）。","keywords":"数学的証明、最適化、アルゴリズム基礎、統計的学習理論"},"modelOptimization":{"sidebarTitle":"最適化・効率化","headline":"モデル最適化と効率化","scope":"低ランク近似、LoRA、量子化、プルーニングなど、モデル圧縮・推論加速に関する論文。","keywords":"軽量化、パラメータ効率、推論速度、メモリ最適化"},"coreArchitecture":{"sidebarTitle":"アーキテクチャ・アルゴリズム","headline":"コアアーキテクチャとアルゴリズム","scope":"Transformer 変形、CNN、GNN など新しいネットワーク構造、損失関数・オプティマイザなど学習手法を提案する論文。","keywords":"モデル構造、ディープラーニングアーキテクチャ、学習アルゴリズム"},"predictiveTabular":{"sidebarTitle":"予測・表形式データ","headline":"予測モデリングと表形式データ","scope":"ツリーモデル、表形式データの分類・回帰、離脱予測、スポーツ指標など、Kaggle やビジネスで頻用の予測モデル論文。","keywords":"機械学習、時系列、表形式データ、予測モデル"},"automatedMl":{"sidebarTitle":"AutoML・MLパイプライン","headline":"AutoML（自動化）とエンドツーエンド ML パイプライン","scope":"AutoML、NAS、ハイパラ・モデル探索、メタ学習、前処理から学習・評価・デプロイまでをつなぐ自動化や自然言語インターフェースを含むパイプライン論文。","keywords":"AutoML, HPO, NAS, メタ学習, MLOps, パイプライン自動化"},"visionMultimodal":{"sidebarTitle":"ビジョン・マルチモーダル","headline":"コンピュータビジョンとマルチモーダル","scope":"顔認識・解析、物体検出、セグメンテーション、画像とテキストを扱うマルチモーダルモデル論文。","keywords":"ビジョン処理、画像解析、マルチモーダル深層学習"},"nlpLlm":{"sidebarTitle":"NLP・LLM","headline":"自然言語処理と LLM","scope":"言語モデル、テキスト分類、翻訳、多言語、プロンプト、RAG などテキスト中心の AI 論文。","keywords":"LLM、自然言語理解・生成、テキストマイニング"},"trustworthyXai":{"sidebarTitle":"信頼性・XAI","headline":"信頼性と説明可能 AI","scope":"ブラックボックスの解釈（XAI）、外れ値の強健性、データ帰属、AI 倫理・安全性。","keywords":"説明可能性、強健性、モデル診断、信頼できる AI"},"dataCentricFeatures":{"sidebarTitle":"データ中心・特徴設計","headline":"データ中心AIと特徴量エンジニアリング","scope":"データ品質、特徴抽出、データ拡張、ノイズラベル処理など、モデル構造以外で性能を上げる研究。","keywords":"前処理、特徴量エンジニアリング、データ拡張"},"edgeWebServices":{"sidebarTitle":"エッジ・ウェブ","headline":"AI サービスとエッジ・ウェブコンピューティング","scope":"TensorFlow.js によるブラウザ推論、モバイル、拡張機能など、ユーザー端末で動く AI やサービス配信。","keywords":"オンデバイス AI、ウェブ AI、デプロイ最適化"},"domainApplications":{"sidebarTitle":"ドメイン応用","headline":"ドメイン特化応用 AI","scope":"教育 AI、コーチング、推薦など、産業・実生活への応用事例中心の論文。","keywords":"教育 AI、推薦システム、ヘルスケア、パーソナライゼーション"}},"papers":{"sidebarYear2025":"2025","sidebarYear2026":"2026","sidebarVenueCpal":"CPAL","sidebarVenueIcml":"ICML","sidebarVenueIclr":"ICLR","cpal2026":{"sidebarLabel":"CPAL2026","hubTitle":"CPAL2026","hubDescription":"理論・数学基盤カテゴリの CPAL 2026 関連論文です。","metaTitle":"CPAL2026","metaDescription":"CPAL 2026 論文ハブ（理論および数学的基盤）。"},"nlpCpal2026":{"hubTitle":"CPAL2026","hubDescription":"NLP・大規模言語モデルカテゴリの CPAL 2026 関連論文です。","metaTitle":"CPAL2026","metaDescription":"CPAL 2026 論文ハブ（NLP および大規模言語モデル）。"},"influenceKernelVonMises":{"sidebarTitle":"影響関数の Kernel von Mises 公式","title":"影響関数の Kernel von Mises 公式","placeholder":"レビュー本文は準備中です。","metaTitle":"Kernel von Mises 影響関数公式論文レビュー | CPAL2026","metaKeywords":"Influence Function, Kernel von Mises, CPAL 2026, 論文レビュー, 統計的影響関数, ロバスト統計","metaDescription":"CPAL 2026 論文レビュー: Kernel von Mises Formula of the Influence Function — 影響関数とカーネル要点の整理。"},"curseDepthLlm":{"sidebarTitle":"大規模言語モデルにおける深さの呪い","title":"大規模言語モデルにおける深さの呪い","placeholder":"レビュー本文は準備中です。","metaTitle":"大規模言語モデルにおける深さの呪い論文レビュー | CPAL2026","metaKeywords":"LLM, curse of depth, LayerNorm Scaling, CPAL 2026, 大規模言語モデル, Transformer","metaDescription":"CPAL 2026 レビュー: The Curse of Depth in LLM — 深さの呪いと LayerNorm Scaling による緩和の要点。"},"polarQuant":{"sidebarTitle":"PolarQuant：極座標変換による KV キャッシュ量子化","title":"PolarQuant：極座標変換による KV キャッシュ量子化","description":"ランダム前処理と極座標変換で KV キャッシュの角度だけを量子化し、正規化オーバーヘッドを消す PolarQuant を数式と直感で整理します。","placeholder":"レビュー本文は準備中です。","viewOriginalPdf":"原論文 PDF を開く","metaTitle":"PolarQuant 論文レビュー | KVキャッシュ量子化（arXiv 2502.02617）","metaKeywords":"PolarQuant, arXiv 2502.02617, KV cache, KVキャッシュ, 量子化, LLM推論, 長文脈, アテンション, VRAM, 極座標, ランダム前処理, 角度量子化, INT4, FP16","metaDescription":"arXiv 2502.02617 PolarQuant 解説: ランダム前処理と極座標で KV キャッシュを 4.2 倍以上圧縮、LLM 推論のメモリ削減と長文脈品質を数式・直感で整理。"},"coreCpal2026":{"hubTitle":"CPAL2026","hubDescription":"コアアーキテクチャ・アルゴリズム分類で扱う CPAL 2026 関連論文です。","metaTitle":"CPAL2026","metaDescription":"CPAL 2026 論文ハブ（コアアーキテクチャおよびアルゴリズム）。"},"alphaFormerEndToEnd":{"sidebarTitle":"AlphaFormer：トランスフォーマによるアルファ因子のエンドツーエンド記号回帰","title":"AlphaFormer：トランスフォーマによるアルファ因子のエンドツーエンド記号回帰","description":"合成時系列での事前学習、線形アルファプール、IC、PPO により解釈可能な記号因子を生成する AlphaFormer を数式と直感で読み解きます。","placeholder":"レビュー本文は準備中です。","viewOriginalPdf":"原論文 PDF を開く","metaTitle":"AlphaFormer 論文レビュー | CPAL2026","metaKeywords":"AlphaFormer, アルファ因子, 記号回帰, Transformer, CPAL 2026, クオンツ, PPO, IC","metaDescription":"CPAL 2026 AlphaFormer レビュー: トランスフォーマによるアルファ因子の E2E 記号回帰、プール・IC・PPO と数式直感。"},"icml2025":{"sidebarLabel":"ICML 2025"},"iclr2025":{"sidebarLabel":"ICLR 2025","hubTitle":"ICLR 2025","hubDescription":"AutoML・ML パイプラインカテゴリにおける ICLR 2025 の論文です。","metaTitle":"ICLR 2025","metaDescription":"自動 ML・ML パイプラインカテゴリの ICLR 2025 論文ハブ。"},"autoMlIcml2025":{"hubTitle":"ICML 2025","hubDescription":"AutoML・ML パイプラインカテゴリにおける ICML 2025 の論文です。","metaTitle":"ICML 2025","metaDescription":"ICML 2025 論文ハブ（AutoML・ML パイプラインカテゴリ）。"},"automlAgent":{"sidebarTitle":"AutoML-Agent：全パイプライン AutoML のためのマルチエージェント LLM フレームワーク","title":"AutoML-Agent：全パイプライン AutoML のためのマルチエージェント LLM フレームワーク","authors":"Patara Trirat, Wonyong Jeong, Sung Ju Hwang","venue":"ICML 2025","abstractHeading":"概要","abstract":"自動化された機械学習（AutoML）は、最適モデル探索やハイパーパラメータチューニングなど、開発パイプライン内のタスクを自動化することでAI開発を加速する。既存のAutoMLシステムは複雑なツールをセットアップするのに技術的な専門知識を必要とし、一般に時間がかかり多大な人的労力を要する。そこで近年は、大規模言語モデル（LLM）を活用してこの負担を軽減し、自然言語インターフェースによりAutoMLフレームワークの使いやすさを高めることで、非専門家でもデータ駆動のソリューションを構築できるようにする試みが進んでいる。しかし、これらの手法は通常、開発パイプラインの特定プロセスにだけ焦点を当てており、LLMが本来持つ能力を効率的に活用できていない。本論文では、データ取得からモデルデプロイまでを含むフルパイプラインAutoMLに特化した、新しいマルチエージェントフレームワークAutoML-Agentを提案する。AutoML-Agentはユーザのタスク記述を受け取り、専門のLLMエージェント間の協調を促し、デプロイ可能なモデルを提供する。従来と異なり単一の計画を立てるのではなく、リトリーバル強化型計画（retrieval-augmented planning）戦略を導入して探索を拡張し、より良い計画を見つけやすくする。さらに、各計画をサブタスク（データ前処理やニューラルネットワーク設計など）に分解し、プロンプトにより構築した専門エージェントがそれぞれを並列に解決することで探索効率を高める。また、実行結果を検証し、コード生成LLMが成功する解を実装できるように導くマルチステージ検証も提案する。14のデータセットを用いた7つの下流タスクに関する広範な実験の結果、AutoML-AgentはフルAutoMLプロセスの自動化において成功率が高く、さまざまな領域にわたって良好な性能を持つシステムを実現することが示された。","placeholder":"レビュー本文は準備中です。","metaTitle":"AutoML-Agent 論文レビュー | ICML 2025","metaKeywords":"AutoML, マルチエージェント, 大規模言語モデル, ICML 2025, フルパイプライン, RAG 計画, AutoML-Agent","metaDescription":"ICML 2025 AutoML-Agent：データ取得からデプロイまでのフルパイプライン AutoML をマルチエージェント LLM で自動化する枠組みのレビュー。"},"sela":{"sidebarTitle":"SELA: Tree-Search Enhanced LLM Agents for Automated Machine Learning","sidebarLabel":"ICLR 2025","title":"SELA: Tree-Search Enhanced LLM Agents for Automated Machine Learning","authors":"Yizhou Chi, Yizhang Lin, Sirui Hong, Duyi Pan, Yaying Fei, Guanghao Mei, Bangbang Liu, Tianqi Pang, Jacky Kwok, Ceyao Zhang, Bang Liu, Chenglin Wu","venue":"ICLR 2025 · arXiv:2410.17238","metaTitle":"SELA: Tree-Search Enhanced LLM Agents for Automated Machine Learning","metaKeywords":"SELA, MCTS, AutoML, LLM agent, UCT-DP, tree search, ICLR 2025, arXiv:2410.17238","metaDescription":"SELA 論文レビュー：MCTS と UCT-DP による LLM AutoML のツリー探索と正規化スコアの整理。"}}},"landing":{"heroTitle":"AIをやさしく学ぶ場所","heroSubtext":"一歩ずつ、しっかり学ぶ場所。","heroTagline":"みんながAIを学ぶ場所。","forEveryone":"概念から計算まで、解いてフィードバックを受けながら成長するAI教育プラットフォーム。","heroCurriculum":"書籍ベースの読書を作成し、他の学習者と共有できます。","heroCommunity":"コミュニティで学習教材を共有・ダウンロードできます。","ctaAbout":"みんなのAIとは？","ctaExplore":"ディープラーニング","ctaMath":"数学","ctaMl":"機械学習","ctaPaperReview":"AI論文","ctaPlayground":"プレイグラウンド","ctaBrowse":"読書を見る","ctaBrowseCommunity":"コミュニティを見る","trendingLabel":"クイックアクセス","recentChaptersSectionLabel":"新着レッスン","recentChaptersTitle":"最近追加された学習・実験","recentChaptersSubtitle":"新着チャプターと Playground 実験をすぐに試せます。","recentChaptersCardCta":"チャプターを開く","recentChaptersPlaygroundTrack":"Playground","recentChaptersPlaygroundKind":"対話型ラボ","recentChaptersPlaygroundCta":"ラボを開く","recentChaptersRecentTooltip":"直近5日以内に公開されたコンテンツです","homeOfTitle":"AI学習のハブ","homeOfSubtitle":"段階的に発見し、自分で解き、AIフィードバックで学びましょう。","featurePlatformTitle":"学びのプラットフォーム","featurePlatformDesc":"基礎数学・ディープラーニング・機械学習をチャプター別に学び、制限なく一緒に学習できます。","featureFasterTitle":"もっと速く成長","featureFasterDesc":"概念整理、練習問題、AI即時フィードバックで理解を深めます。","featureExploreTitle":"基礎から応用まで","featureExploreDesc":"基礎数学・ディープラーニング・機械学習を段階的に学べます。フィードバックを反映しつつ改善中です。","featureBadgeTitle":"実績＆証明書","featureBadgeDesc":"チャプターを修了すると実績を獲得し、修了証明書を発行できます。","featurePortfolioTitle":"一緒に成長","featurePortfolioDesc":"学びを共有し、最新開発ニュースに触れ、仲間とつながりましょう。","signUpCta":"サインアップ","problemTitle":"なぜ計算を直接やってみる必要があるでしょうか？","problemBody":"APIだけ使っていると、モデルがなぜその結果を出したか説明しづらくなります。\n\n内積、行列積、勾配—この計算を自分でやってみないと、性能がなぜ落ちたか、どこで間違ったか、つかみにくいです。\n\n多くの講座は結果と公式を示すだけで、計算の過程を自分で確かめる機会を十分には用意していません。","solutionSectionLabel":"こんな風に学べます","solutionTitle":"概念をやさしく学び、問題を解いてみましょう。詰まったらAIに聞けます","solutionIntro":"内積・行列積・勾配まで、ディープラーニングの核心計算を12チャプターで体系的に学べます。","solutionList":"各チャプターに概念整理と練習問題。間違えたり詰まったらAIに質問できます。","solutionBody":"分からないとき・間違えたときにAIコーチに質問できます。","ctaStartLearning":"ディープラーニングを始める","globalPlatform":"韓・英・日・中対応","learnShortDesc":"内積から勾配まで12チャプター。概念・問題・即時採点で学べます。","heroImageAlt":"AI学習の背景","dlCardTitle":"基礎ディープラーニング","advMathCardTitle":"上級数学","learnAdvMathShortDesc":"SVD・テンソル・マルコフ・MCMC・変分推論・ワッサーシュタイン・SDE・情報幾何など。生成モデルと深い最適化のための上級数学を章ごとに学べます。","ctaAdvMath":"上級数学","advMlCardTitle":"上級機械学習","learnAdvMlShortDesc":"特徴量エンジニアリング・PCA・SVM・ブースティング・XGBoost・不均衡・異常検知・DBSCAN・XAI・SHAP・時系列・推薦など。非線形・複雑データ・解釈可能性を章ごとに学べます。","ctaAdvMl":"上級機械学習","mlCardTitle":"基礎機械学習","learnMlShortDesc":"データと特徴量、KNN、線形・ロジスティック回帰から推薦システムまで。基礎機械学習の核心をチャプター別に学べます。","learnPaperReviewShortDesc":"AI・ディープラーニングの論文をテーマ別にまとめました。理論・アーキテクチャ・NLP・ビジョンなどのカテゴリからレビューを読めます。","midDlCardTitle":"中級ディープラーニング","learnMidDlShortDesc":"重み初期化・Adam・正則化・CNN・ResNet・転移学習・物体検出・トークン化・RNN・LSTM・アテンションまで。安定学習と非構造データを章ごとに学べます。","ctaMidDl":"中級ディープラーニング","advDlCardTitle":"発展ディープラーニング","learnAdvDlShortDesc":"Transformer・BERT・GPT・LoRA・QLoRA・RLHF・RAG・エージェント・GAN・拡散・VLM・知識蒸留・デプロイまで。大規模モデルと生成AIを章ごとに学べます。","ctaAdvDl":"発展ディープラーニング","learnMathShortDesc":"関数・ベクトル・行列から一様・正規分布まで。AI理解の土台を築きます。","mathCardTitle":"基礎数学","midMathCardTitle":"中級数学","learnMidMathShortDesc":"ベクトル・行列・線形変換・固有値・勾配・ヤコビアン・ヘッセ・凸最適化・ベイズ・MLE・エントロピーまで。多変数と不確実性の数学を章ごとに学べます。","ctaMidMath":"中級数学","quickAccessTitle":"数学・ディープラーニング・機械学習・AI論文","curriculumShortDesc":"書籍をベースに自分用の学習ロードマップを設計し、他の学習者と一緒に成長できます。","communityShortDesc":"AI・ディープラーニング教材を共有し、最新開発ニュースが配信され、学習者同士で交流する場です。","itNews":"ITニュース","itNewsShortDesc":"AI・ITの最新ニュースと開発動向をお届けします。","coupangBannerText":"クーパンで様々な商品をお探しください"},"adminPopup":{"title":"セッション紹介","languageNote":"言語は韓国語で進行します。","meetLinkNote":"セミナー前にGoogle Meetのリンクをお送りします。","freeSeminarNote":"無料セミナーです。","seminarDateLabel":"セミナー日時","seminarDateTime":"2026年3月27日（金）20:00～21:00","competitionLinkLabel":"大会リンク","applyCta":"申し込む","speakerTitle":"発表者紹介","speakerPara1":"延世大学で人工知能を専攻する社会人で、AIコンペティションに参加し、データに基づく機械学習の課題解決とモデル改善を経験してきました。","speakerPara2":"大会で求められる問題定義・分析・モデル設計のプロセスを中心に、実際のアプローチと判断基準を共有します。","sessionTitle":"セッション紹介","sessionPara1":"本セッションでは、AIコンペティションのデータに基づき、機械学習の問題をどう解釈・定義したか、分析結果をモデルと戦略の改善にどう活かしたかを扱います。","sessionPara2":"アルゴリズムや手法の羅列ではなく、大会環境で性能が期待どおり出なかった状況で、どの視点でデータを再分析し、その結果をモデル構造と推論戦略にどう反映したかを中心に説明します。","sessionPara3":"AIコンペティションという制約のなかで、現実的に選んだ戦略と思考プロセスを共有することが本セッションの目的です。","mainContentTitle":"主な内容","mainContent1":"大会データに基づく問題定義のプロセス","mainContent2":"分析結果をモデル設計につなげる判断基準","mainContent3":"性能改善が停滞した状況での戦略修正事例","mainContent4":"コンペティション環境における汎化の視点とアプローチ","recommendTitle":"こんな方におすすめ","recommend1":"AIコンペティションの取り組み方が漠然としている方","recommend2":"大会データ分析とモデル設計の流れを知りたい方","recommend3":"性能改善が停滞したときに方向性が欲しい方","recommend4":"コンペでのML活用戦略を体系的に整理したい方","recommend5":"AIコンペティションで実力を伸ばしたい開発者","dismissCheckboxLabel":"3日間表示しない"},"home":{"introButton":"サービス紹介","intro":"AIを初めて学ぶ人が概念や数式でつまずかないようサポートするAI教育プラットフォームです。自分で計算し、AIコーチのフィードバックで誤解を正しながら、AIの学習と判断を段階的に理解できます。","problem":"問題","advDlAskProblemContext":"高度ディープラーニング — {chapterTitle}. 現在の問題:\n{problem}","problemPrompt":"以下のベクトルの内積 __DOT_FORMULA__ を求めなさい。","problemPromptMatrix":"以下の行列積 __MATRIX_AB__ の空欄(?)に入る値を求めなさい。","problemPromptLinearLayer":"線形層 __LINEAR_FORMULA__ の空欄(?)に入る値を求めなさい。","problemPromptActivation":"与えられた活性化関数（Sigmoid, ReLU, Tanh₃）に対し、X に対する Y を求め、空欄(?)を埋めなさい。","problemPromptArtificialNeuron":"人工ニューロン: 指定された活性化（ReLU、Sigmoid、Tanh）を適用して Y を求め、空欄(?)を埋めなさい。","problemPromptBatch":"バッチ演算（重みかけとバイアス足し、足し算、引き算、かけ算、平均引き、合計、平均など）の空欄(?)を埋めなさい。","prev":"前へ","next":"次へ","prevChapter":"前のチャプター","nextChapter":"次のチャプター","inputSectionTitle":"解答入力","askSectionTitle":"質問する","practicePadTitle":"練習帳","tabletInkFabAria":"手書きモードを開く","tabletInkFabLabel":"手書き","learnToolsFabAria":"学習ツールメニューを開く","learnToolsFabLabel":"ツール","pageInkModeTitle":"手書きモード — 画面上に直接書き込みます","pageInkClear":"手書きを消去","pageInkModeExit":"手書きを終了","pageInkCanvasAria":"ページ上の手書きキャンバス","pageInkPaletteAria":"手書きの色パレット","pageInkPaletteToggleAria":"色パレットを開く・閉じる","pageInkScrollMode":"スクロールモード","pageInkDrawMode":"手書きモード","pageInkColorSwatchAria":"色 {color}","fabMenuLabel":"質問メニュー","practicePadSeeMain":"メイン画面で問題を解いてください。","drawMode":"手書きで書く","keyboardMode":"キーボード入力","drawHint":"下の欄に手書きで解答を描いてください。描いたあと「AIに採点」を押すとフィードバックが得られます。","keyboardHint":"下の欄に解答または答えを入力してください。入力後「AIに採点」を押すとフィードバックが得られます。","askDrawHint":"気になることを手書きで書いてください。書いたあと「質問する」を押すと答えが返ってきます。","askKeyboardHint":"気になることを入力してください。「質問する」を押すと答えが返ってきます。","askPlaceholder":"例：この公式はなぜこうなるのですか？","askSubmit":"質問する","asking":"送信中…","askResponseTitle":"答え","drawQuestionLabel":"（絵で質問）","askEmptyAlert":"質問を描くか入力してから「質問する」を押してください。","errorAsk":"質問の送信中にエラーが発生しました。もう一度お試しください。","errorAskRequest":"質問リクエストに失敗しました","askErrorEmptyQuestion":"質問を描くか入力してください。","solutionErrorNoContent":"解説を生成できませんでした。","solutionErrorServer":"解説の生成中にエラーが発生しました。","ariaAskInput":"質問を入力","placeholder":"解答の過程または最終答えを入力。例: a·b = 3×5 = 15","ariaKeyboardInput":"キーボードで解答入力","clear":"消す","grade":"AIに採点","gradeShort":"採点","grading":"採点中…","correctAnswer":"正解です！","wrongAnswer":"不正解です。もう一度お試しください。","wrongAnswerPanelHint":"不正解時に「なぜ間違った？」ヒントが自動で依頼されます。正答は出さず方向のみ案内します。","tryAgain":"もう一度解いてみましょう。","checkAnswer":"答え合わせ","chapterCompleteTitle":"チャプタークリア！","chapterCompleteBadge":"{chapterName} 実績を獲得","chapterCompleteLoginHint":"ログインするとこのチャプターが修了扱いになり、再度問題を解く必要はありません。","chapterCompleteSignInCta":"ログインして修了を保存","chapterCompleteTryAgain":"もう一度挑戦","chapterCompleteNextChapter":"次のチャプター","badgeSaved":"実績を保存しました。","certificateTitle":"修了証明書","certificateSubtitlePrefix":"本証明書は、下記の者がみんなのAI（https://mdooai.com）学びの過程において下記項目を修了したことを ","certificateSubtitleEnd":"証明するものです。","certificateHolder":"受領者","certificateHolderEditHint":"名前を直接入力できます。","certificateHolderModalTitle":"受領者名を入力してください","certificateHolderModalConfirm":"確認","certificateHolderModalPrint":"印刷","certificateHolderEdit":"編集","certificateCompleted":"修了項目","certificateIssuer":"発行元","certificateIssuerName":"みんなのAI","certificateIssuerUrl":"https://mdooai.com","certificateDate":"発行日","certificatePrint":"証明書を印刷","certificateNoBadges":"修了したチャプターがありません。チャプターを修了すると証明書を発行できます。","certificateSignInRequired":"証明書発行にはログインしてください。","certificateIssue":"証明書発行","profileTitle":"マイ学習","profileBadgesSection":"獲得した実績","profileNoBadges":"修了したチャプターがまだありません。","profileCertificateLink":"修了証明書発行","profileMyBadges":"マイ実績","profileBadgesCta":"マイ実績を見る / 証明書発行","badgesPageTitle":"マイ実績＆証明書","badgesPageDesc":"修了したチャプターの実績と修了証明書を確認できます。","badgesAdminMode":"(管理者プレビュー)","badgesAdminModeDesc":"すべての実績が表示され、印刷時に全体が出力されます。","mathFunctionsProblemPrompt":"関数式と入力値を見て、空欄の値を求めなさい。","mathFunctionsProblemPromptInput":"f(?) = value のとき x を求めてください。","mathFunctionsProblemPromptCompare":"大きい方を選んでください。","mlKnnProblemPrompt":"KNNの距離計算と多数決ルールを使って答えを求めなさい。","mlLinearRegressionProblemPrompt":"線形回帰の式から予測値と傾き・切片を計算して答えを求めなさい。","mlLinearRegressionProblemPromptPredict":"線形回帰モデル $\\hat y = w x + b$ で $w={w}$, $b={b}$ のとき、$x={x}$ に対する予測値 $\\hat y$ を整数で求めなさい。","mlLinearRegressionProblemPromptSlope":"2点 ({x1}, {y1}) と ({x2}, {y2}) を通る直線の傾き $w = \\frac{y_2-y_1}{x_2-x_1}$ を整数で求めなさい。","mlLinearRegressionProblemPromptIntercept":"傾き $w={w}$ の直線が点 ({x}, {y}) を通るとき、切片 $b = y - w x$ を整数で求めなさい。","mlLinearRegressionProblemPromptTwoPointPredict":"2点 ({x1}, {y1}) と ({x2}, {y2}) を通る直線がある。$x={x}$ のとき直線上の $y$ 値を整数で求めなさい。","mlLinearRegressionProblemPromptResidual":"直線 $\\hat y={w}x+{b}$ で予測するとき、実測が点 ({x}, {y}) の場合、残差 $y - \\hat y$ を整数で求めなさい。","mlLinearRegressionProblemPromptResidualSum":"点 {points} があり、直線 $\\hat y={w}x+{b}$ で予測するとき、残差の和 $\\sum_i (y_i - \\hat y_i)$ を整数で求めなさい。","mlMseProblemPrompt":"二乗誤差、SSE、MSE、RMSEを計算して答えを求めなさい。","mlMseProblemPromptSquaredError":"実測 $y={y}$、予測 $\\hat y={yHat}$ のとき、誤差の2乗 $(y - \\hat y)^2$ を整数で求めなさい。","mlMseProblemPromptSse":"次の(実測, 予測)の組について、誤差2乗和 $\\sum_i (y_i - \\hat y_i)^2$ を整数で求めなさい。{pairs}","mlMseProblemPromptMse":"次の(実測, 予測)の組について、平均二乗誤差 MSE $= \\frac{1}{n}\\sum_i (y_i - \\hat y_i)^2$ を整数で求めなさい。{pairs}","mlMseProblemPromptMseFromLine":"点 {points} と直線 $\\hat y={w}x+{b}$ があるとき、MSEを整数で求めなさい。","mlMseProblemPromptMissingSquaredError":"MSE $= {mse}$、$n = {n}$ で、$n-1$ 個の誤差2乗が {squaredErrors} のとき、残り1つの誤差2乗を整数で求めなさい。","mlMseProblemPromptRmse":"MSE $= {mse}$ のとき、RMSE $= \\sqrt{\\text{MSE}}$ を整数で求めなさい。","mlMseProblemSolvingTable":"$1e","mlLogisticProblemPrompt":"ロジスティック回帰の線形スコアと決定境界を使って予測値を求めなさい。","mlLogisticProblemPromptLinearScore":"ロジスティック回帰の線形スコア $z = wx + b$ で $w={w}$, $x={x}$, $b={b}$ のとき、$z$ を整数で求めなさい。","mlLogisticProblemPromptMultiScore":"線形スコア $z = w_1 x_1 + w_2 x_2 + b$ で、重みが {weights}、特徴量が {features}、$b={b}$ のとき、$z$ を整数で求めなさい。","mlLogisticProblemPromptClassifyFromZ":"線形スコア $z = {z}$ のとき、決定境界（$z>0 \\Rightarrow \\hat y=1$, $z \\le 0 \\Rightarrow \\hat y=0$）に従い予測クラス $\\hat y$ を求めなさい。","mlLogisticProblemPromptClassifyFromProb":"確率 $p = {p}$、閾値 $= {threshold}$ のとき、$p \\ge$ 閾値なら $\\hat y=1$、そうでなければ $\\hat y=0$ です。予測クラス $\\hat y$ を求めなさい。","mlLogisticProblemPromptCountClassOne":"次の線形スコアについて $z>0$ なら class 1 に分類します。class 1 に分類されるサンプル数を整数で求めなさい。$z$ のリスト: {zList}","mlLogisticProblemPromptCountMisclassified":"真のラベルが {labels}、各サンプルの線形スコア $z$ が {zList} のとき、$\\hat y_i = 1$ if $z_i>0$ else $0$ で予測します。誤分類されたサンプル数を求めなさい。","mlLogisticProblemSolvingTable":"**解法の流れ**\n\n- **線形スコア** — $z = w x + b$ または $z = w_1 x_1 + w_2 x_2 + b$。重みと特徴量を掛けて足した値。\n- **シグモイド** — $\\sigma(z) = \\frac{1}{1+e^{-z}}$。$z$ を 0～1 の確率に変換。\n- **決定境界** — $z>0 \\Rightarrow \\hat y=1$, $z \\le 0 \\Rightarrow \\hat y=0$。（または $\\sigma(z)\\ge 0.5$ なら 1）\n- **確率で分類** — 与えられた確率 $p$ と閾値に従い、$p \\ge$ 閾値なら $\\hat y=1$、そうでなければ 0。\n- **誤分類数** — 各サンプルで予測 $\\hat y_i$ と真のラベル $y_i$ が異なる個数。\n\n---\n\n**例1（線形スコア）**\n\n$z = 2 \\times 3 + (-1) = 5$。→ **答 5**\n\n---\n\n**例2（zで分類）**\n\n$z = -2$ なら $z \\le 0$ なので $\\hat y=0$。→ **答 0**\n\n---\n\n**例3（確率で分類）**\n\n$p=0.7$、閾値 $0.5$ のとき $0.7 \\ge 0.5$ なので $\\hat y=1$。→ **答 1**\n\n---\n\n**例4（class 1 の個数）**\n\n$z$ のリストが $-1, 2, 0, 3$ なら $z>0$ なのは 2 と 3 の2つ。→ **答 2**\n\n---\n\n**例5（誤分類数）**\n\nラベル [1, 0, 1]、$z$ [2, -1, -3]。予測は $z>0$ なら 1 なので [1, 0, 0]。実測 [1,0,1] と比べると3番目だけ違う。→ **答 1**","mlDecisionTreeProblemPrompt":"決定木の分割ルールと不純度指標を計算して答えを求めなさい。","mlDecisionTreeProblemPromptCountNodes":"決定木で内部ノードが {internal} 個、リーフノードが {leaves} 個のとき、ノードの総数を求めなさい。","mlDecisionTreeProblemPromptCountLeaves":"決定木でリーフノードが {leaves} 個のとき、リーフの個数を求めなさい。","mlDecisionTreeProblemPromptTreeDepth":"決定木の最大深さ（ルート=0）が {depth} のとき、深さの値を求めなさい。","mlDecisionTreeProblemPromptFollowPath":"決定木で経路が {path}（0=いいえ/左、1=はい/右）のとき、到達したリーフの予測クラスを求めなさい。","mlDecisionTreeProblemPromptLeafMajority":"あるリーフにクラス 0 が {c0} 個、クラス 1 が {c1} 個あります。多数決で予測クラスを求めなさい。","mlDecisionTreeProblemPromptGini":"クラス別個数が {counts} のとき、ジニ不純度 $G = 1 - \\sum_i p_i^2$ を計算し、$100 \\times G$ の値（整数）を求めなさい。","mlDecisionTreeProblemPromptEntropy":"クラス別個数が {counts} のとき、エントロピー $H = -\\sum_i p_i \\log_2 p_i$ を計算し、$100 \\times H$ の値（整数）を求めなさい。","mlDecisionTreeProblemPromptInformationGain":"親ノードのクラス個数 {parentCounts}、左子 {leftCounts}、右子 {rightCounts} のとき、情報利得(IG)の $100 \\times \\text{IG}$ の値（整数）を求めなさい。","mlDecisionTreeProblemPromptWeightedGini":"分割後の左子クラス個数 {leftCounts}、右子クラス個数 {rightCounts} のとき、重み付きジニ $(n_L/n)G_L + (n_R/n)G_R$ の $100 \\times$ 値（整数）を求めなさい。","mlDecisionTreeProblemSolvingLabel":"問題を解くための説明","mlEnsembleProblemPrompt":"アンサンブルの投票・平均ルールを適用して最終予測を求めなさい。","mlEnsembleProblemSolvingLabel":"問題を解くための説明","mlEnsembleProblemPromptMajorityVote":"ランダムフォレストでクラス 0 に {votes0} 票、クラス 1 に {votes1} 票でした。多数決で最終予測クラスを求めなさい。","mlEnsembleProblemPromptCountVotes":"木が {totalTrees} 本あり、クラス 0 に {votes0} 票、クラス 1 に {votes1} 票です。勝ったクラスに集まった票数を求めなさい。","mlEnsembleProblemPromptRegressionMean":"回帰アンサンブルで {B} 本の木の予測がそれぞれ {predictions} のとき、平均 $\\hat y = \\frac{1}{B}\\sum_{b=1}^B \\hat y_b$ の値（整数）を求めなさい。","mlEnsembleProblemPromptNumTrees":"ランダムフォレストで木が {B} 本のとき、木の本数 $B$ を求めなさい。","mlEnsembleProblemPromptOobCount":"木が {nTrees} 本あり、あるサンプルはこのうち {nInBag} 本のブートストラップにしか含まれていません。このサンプルが学習に使われなかった木の本数（OOB数）を求めなさい。","mlEnsembleProblemPromptFormulaMean":"アンサンブルで {B} 本の木の予測の合計が {sum} のとき、平均 $\\hat y = \\frac{1}{B}\\sum_{b=1}^B \\hat y_b$ の値（整数）を求めなさい。","mlEnsembleProblemPromptDefinition":"次の説明が正しければ 1、誤りなら 0 を求めなさい。{statement}","mlEnsembleProblemPromptFeatureImportance":"特徴量別重要度が {importances} のとき、重要度が最も高い特徴量の番号（1から）を求めなさい。","mlEnsembleProblemPromptWeightedVote":"木が2本あります。1本目はクラス {c1} に重み {w1}、2本目はクラス {c2} に重み {w2} です。重みが大きいクラスを最終予測として求めなさい。","mlEnsembleStatement_0":"バギングでは各基本モデルが独立に学習する。","mlEnsembleStatement_1":"ランダムフォレストはバギングと決定木を組み合わせたアンサンブルである。","mlEnsembleStatement_2":"分類アンサンブルでは最終予測は通常多数決（投票）で決める。","mlEnsembleStatement_3":"ブースティングでは前のモデルが間違えたサンプルに重みを付けて順次学習する。","mlEnsembleStatement_4":"OOB（Out-of-Bag）とは、あるサンプルが学習に使われなかった木だけでそのサンプルを予測することを指す。","mlEnsembleStatement_5":"スタッキングでは複数の基本モデルの予測を入力とするメタモデルを使う。","mlEnsembleStatement_6":"回帰アンサンブルの最終予測は通常、複数の木の予測の平均である。","mlEnsembleStatement_7":"ランダムフォレストでは各分割で全特徴量の一部だけを無作為に選んで分割する。","mlEnsembleStatement_8":"アンサンブルは複数モデルの予測を合わせて一つの予測を得る方法である。","mlEnsembleStatement_9":"単一の決定木よりランダムフォレストの方が分散を減らす傾向がある。","mlEnsembleStatement_10":"ブースティングでは各基本モデルが独立に学習する。","mlEnsembleStatement_11":"回帰アンサンブルでは最終予測を多数決（投票）で決める。","mlEnsembleStatement_12":"OOB評価には別途検証データが必ず必要である。","mlEnsembleStatement_13":"ランダムフォレストでは各木は訓練データ全体を使って学習する。","mlEnsembleStatement_14":"スタッキングのメタモデルは基本モデルの元の入力特徴量だけを使う。","mlEnsembleProblemSolvingTable":"**アンサンブル — 要点**\n\n- **多数決** — クラス0票とクラス1票を比べ、**多い方のクラス**を選ぶ。同数なら0。\n- **票数** — 最終的に勝ったクラスに集まった票数を数える。\n- **回帰平均** — 各木の予測値を全部足して、木の本数 $B$ で割る。\n- **木の数** — 問題に与えられた $B$ をそのまま読む。\n- **OOB数** — 全木数 $-$ このサンプルを含んだ木数。\n- **式の平均** — 合計 $\\div B$ を計算する。\n- **定義** — 説明が正しければ1、誤りなら0。\n- **特徴重要度** — 最も重要度が大きい特徴の**番号（1から）**を選ぶ。\n- **重み付き投票** — 重みが大きいクラスが最終予測。\n\n---\n\n**例1（多数決）**\n\nクラス0が3票、クラス1が5票なら、多い方はクラス1です。→ **答え 1**\n\n---\n\n**例2（票数）**\n\n全7本の木で、クラス0が2票、クラス1が5票なら、最終クラスは1で、その票数は5です。→ **答え 5**\n\n---\n\n**例3（回帰平均）**\n\n3本の木の予測値が 6, 9, 12 なら、合計は27、平均は $27 \\div 3 = 9$ です。→ **答え 9**\n\n---\n\n**例4（OOB数）**\n\n全木数が10本で、そのサンプルが6本のブートストラップに含まれていたなら、OOB数は $10-6=4$ です。→ **答え 4**\n\n---\n\n**例5（式の平均）**\n\n$\\hat y = \\frac{1}{B}\\sum_{b=1}^B \\hat y_b$ で $B=4$、予測値の合計が20なら、平均は $20 \\div 4 = 5$ です。→ **答え 5**\n\n---\n\n**例6（特徴重要度）**\n\n重要度が $[12, 30, 18]$ なら最大値は30で、これは **2番目の特徴**です。→ **答え 2**\n\n---\n\n**例7（重み付き投票）**\n\n1本目の木がクラス0に重み2、2本目の木がクラス1に重み5を与えるなら、より大きい重みはクラス1です。→ **答え 1**","mlKmeansProblemPrompt":"K-Meansの距離、中心更新、SSEを計算して答えを求めなさい。","mlKmeansProblemPromptDistanceSquared":"2点 ({x1}, {y1}) と ({x2}, {y2}) のユークリッド距離の2乗 $(x_2-x_1)^2+(y_2-y_1)^2$ を整数で求めなさい。","mlKmeansProblemPromptAssignCluster":"点 ({px}, {py})、中心がそれぞれ {centers} のとき、最も近い中心のクラスタ番号（1から）を求めなさい。","mlKmeansProblemPromptCenterMeanX":"クラスタに属する点が {points} のとき、新中心の $x$ 座標（平均、整数）を求めなさい。","mlKmeansProblemPromptCenterMeanY":"クラスタに属する点が {points} のとき、新中心の $y$ 座標（平均、整数）を求めなさい。","mlKmeansProblemPromptSse":"クラスタの点が {points}、中心が ({cx}, {cy}) のとき、SSE $\\sum_i \\|\\mathbf{x}_i - \\boldsymbol{\\mu}\\|^2$（距離2乗の和）を整数で求めなさい。","mlKmeansProblemPromptNumClusters":"K-Meansでクラスタ数 $K = {K}$ のとき、$K$ の値を求めなさい。","mlKmeansProblemPromptDefinition":"次の説明が正しければ 1、誤りなら 0 を求めなさい。{statement}","mlKmeansStatement_0":"K-Meansは教師なし学習である。","mlKmeansStatement_1":"K-Meansではクラスタ数Kをユーザーが決める。","mlKmeansStatement_2":"K-Meansの目的はクラスタ内の距離2乗和(SSE)を最小化することである。","mlKmeansStatement_3":"割り当て段階では各点を最も近い中心に割り当てる。","mlKmeansStatement_4":"中心更新段階では各クラスタに属する点の座標平均を新中心とする。","mlKmeansStatement_5":"K-Meansはラベルなしでデータだけでクラスタを形成する。","mlKmeansStatement_6":"K-Meansでは距離比較にユークリッド距離（または距離の2乗）を使う。","mlKmeansStatement_7":"K-Meansは割り当てと中心更新を収束するまで繰り返す。","mlKmeansStatement_10":"K-Meansは教師あり学習である。","mlKmeansStatement_11":"K-MeansではKはアルゴリズムが自動で決める。","mlKmeansStatement_12":"K-Meansの目的はクラスタ数を最大化することである。","mlKmeansStatement_13":"割り当て段階では各点を無作為にクラスタに割り当てる。","mlKmeansStatement_14":"中心更新では各クラスタの中央値(median)を新中心とする。","mlDecisionTreeProblemSolvingTable":"**決定木解法ガイド**\n\n- **ノード数** — 内部ノード数とリーフ数を足します。\n- **リーフ数** — 問題で与えられたリーフ数をそのまま読みます。\n- **深さ** — 最大深さ（ルート=0）を読みます。\n- **経路** — ルートから 0=左、1=右に進み、到達したリーフの予測を読みます。\n- **ジニ** — $p_i$ を求めて $G = 1 - \\sum_i p_i^2$ を計算し、そのあと $100 \\times G$ を求めます。\n- **エントロピー** — $H = -\\sum_i p_i \\log_2 p_i$ を計算し、そのあと $100 \\times H$ を求めます。\n- **重み付きジニ** — $(n_L/n)G_L + (n_R/n)G_R$ を計算し、そのあと $100 \\times$ した値を求めます。\n- **リーフ多数決** — クラス0とクラス1の個数を比べ、多いほうを予測にします。","mathExponentialProblemPrompt":"指数の値を求めてください。","mathExponentialProblemPromptExponent":"指数を求めてください。","mathExponentialProblemPromptCompare":"大きい方を選んでください。","mathExponentialProblemPromptProduct":"同じ底の積：指数の和を求めてください。","mathExponentialProblemPromptQuotient":"同じ底の商：指数の差を求めてください。","mathExponentialProblemPromptPowerOfPower":"累乗の累乗の値を求めなさい。","mathLogProblemPrompt":"対数の値を求めてください。","mathLogProblemPromptInput":"真数を求めてください。","mathLogProblemPromptCompare":"大きい方を選んでください。","mathLogProblemPromptSum":"対数の和: $\\log_a(b) + \\log_a(c) = \\log_a(b \\cdot c)$。","mathLogProblemPromptDiff":"対数の差: $\\log_a(b) - \\log_a(c) = \\log_a(b/c)$。","mathLimitProblemPrompt":"極限値を求めてください。（多項式・定数・x→∞・ε-δ など）","mathLimitProblemPromptDirect":"多項式の極限値を求めてください。","mathLimitProblemPromptConstant":"定数関数の極限値を求めなさい。","mathLimitProblemPromptLinear":"一次式の極限値を求めなさい。","mathLimitProblemPromptAtInfinity":"x → ∞ のときの極限値を求めなさい。","mathLimitProblemPromptEpsilon":"ε-δ の定義で問われている番号を選んでください。","mathLimitProblemEpsilonQuestion":"ε-δ で δ の意味は？","mathLimitProblemEpsilonHint":"(1=距離, 2=誤差)","mathContinuityProblemPrompt":"連続性: 極限値・連続かどうかを求めてください。","mathContinuityProblemPromptLimitPoly":"多項式は連続なので極限値＝関数値。","mathContinuityProblemPromptLimitLinear":"一次式の極限値（連続なので関数値に等しい）を求めてください。","mathContinuityProblemPromptYesNo":"その点で連続なら 1、不連続なら 0 を選んでください。","mathContinuityProblemPromptLimitAtHole":"穴がある点での極限値を求めてください。","mathContinuityProblemAtPoint":" で ","mathContinuityProblemContinuousQ":"で連続ですか？","mathContinuityProblemLimitAtHoleIntro":"穴がある関数が","mathContinuityProblemLimitAtHoleQ":"での極限値は？","mathDerivativeProblemPrompt":"微分: 与えられた点での導関数(接線の傾き)の値を求めてください。","mathDerivativeProblemPromptPower":"べき乗の微分 $(x^n)' = n x^{n-1}$。与えられた点で $f'(x)$ の値を求めてください。","mathDerivativeProblemPromptLinear":"一次式の微分 $(mx+b)' = m$。与えられた点で $f'(x)$ の値を求めてください。","mathDerivativeProblemPromptPoly2":"二次式の微分。与えられた点で $f'(x)$ の値を求めてください。","mathDerivativeProblemPromptConstMul":"定数倍・べき乗の微分 $(c \\cdot x^n)' = c \\cdot n \\cdot x^{n-1}$。与えられた点で $f'(x)$ の値を求めてください。","mathDerivativeProblemAtPoint":" のとき","mathChainRuleProblemPrompt":"連鎖律: 与えられた点で $f'(x)$ の値を求めてください。（累乗・指数・三角・ルート・対数・二次式など）","mathPartialGradientProblemPrompt":"偏微分・勾配: 与えられた関数と点で偏微分または勾配の成分を求めてください。","mlKnnProblemSolvingTable":"**解く手順**\n\n- **入力** — 新データの特徴ベクトル $\\mathbf{x}$\n- **保存データ** — (特徴、ラベル) の組 $(\\mathbf{x}_i, y_i)$\n- **1** — $\\mathbf{x}$ と各 $\\mathbf{x}_i$ との距離 $d(\\mathbf{x}, \\mathbf{x}_i)$ を計算\n- **2** — 距離が小さい順にK個を選択\n- **3（分類）** — K個のラベルの**多数決**で予測\n- **3（回帰）** — K個の値の**平均**を予測\n\n---\n\n**例題（距離の2乗）**\n\n平面上に2点 A(0, 0) と B(3, 4) があります。距離の2乗 $(x_2-x_1)^2 + (y_2-y_1)^2$ の値を求めなさい。\n\n**解説**\n\n$(3-0)^2 + (4-0)^2 = 9 + 16 = 25$ なので **答えは 25** です。","mlLinearRegressionProblemSolvingTable":"$1f","mathIntegralProblemPrompt":"積分: 定積分または原始関数の値を求めてください。","mathIntegralProblemPromptDefiniteConst":"定数関数の定積分を求めましょう。","mathIntegralProblemPromptDefiniteLinear":"1次式の定積分を求めましょう。","mathIntegralProblemPromptAntiderivative":"原始関数に与えられた値を代入した結果を求めましょう。","mathRandomVariableProblemPrompt":"下の指示に従って計算してください。","mathRandomVariableProblemPromptProbSumSix":"3つの確率の和が1になるよう、空欄 c を求めましょう。","mathRandomVariableProblemPromptExpectedValueScale6":"6×E[X] = Σ(値×分子) を求めましょう。","mathRandomVariableProblemPromptVarianceShort":"次の確率分布で分散の36倍を求めましょう。","mathRandomVariableProblemVarianceHowToCalc":"分散 = 値が平均からどれだけばらつくか。分散 = E[X²]−(E[X])²、36×分散 = 6×Σ(nᵢ·xᵢ²) − (Σ nᵢ·xᵢ)²","mathRandomVariableProblemVarianceLabel":"36×分散","mathRandomVariableProblemPromptVarianceScale36":"同じ確率分布で Var(X)=E[X²]-E[X]² です。36×Var(X) を求めましょう。（6×Σ(nᵢ·xᵢ²) − (Σ nᵢ·xᵢ)²）","mathRandomVariableProblemPromptVarianceIntro":"同じ確率分布で ","mathRandomVariableProblemPromptVarianceMid":" です。","mathRandomVariableProblemPromptVarianceEnd":" を求めましょう。（6×Σ(nᵢ·xᵢ²) − (Σ nᵢ·xᵢ)²）","mathRandomVariableProblemPromptVarianceAsk":" を求めましょう。","mathRandomVariableProblemPromptVarianceFormula":"（6×Σ(nᵢ·xᵢ²) − (Σ nᵢ·xᵢ)²）","mathRandomVariableProblemProbSumHint":"c","mathRandomVariableProblemExpectationHint":"値×分子をすべて足した数","mathRandomVariableProblemVarianceHint":"36×Var(X)","mathRandomVariableProblemPromptMode":"確率が最も高いXの値（最頻値）を求めましょう。","mathRandomVariableProblemPromptExpectedValueInt":"平均して期待される値（期待値 E[X]）を求めましょう。","mathRandomVariableProblemPromptCumulativeNumerator":"Xが指定値以下になる確率を分子/6 と書くとき、分子を求めましょう。","mathRandomVariableProblemModeLabel":"確率が最大のX","mathRandomVariableProblemExpectedValueIntLabel":"期待値 E[X]","mathRandomVariableProblemCumulativeLabel1":"P(X≤1) = ?/6 → ?","mathRandomVariableProblemCumulativeLabel2":"P(X≤2) = ?/6 → ?","mathMeanVarianceProblemPrompt":"以下の指示に従って計算してください。","mathMeanVarianceProblemPromptProbSumSix":"三つの確率の和が1になるよう、空欄 c を求めてください。","mathMeanVarianceProblemPromptMeanScale6":"6×E[X] = Σ(値×分子) を求めてください。","mathMeanVarianceProblemPromptVarianceShort":"次の確率分布の分散の36倍を求めてください。","mathMeanVarianceProblemVarianceHowToCalc":"分散 = 平均からのばらつき。36×分散 = 6×Σ(nᵢ·xᵢ²) − (Σ nᵢ·xᵢ)²","mathMeanVarianceProblemVarianceLabel":"36×分散","mathMeanVarianceProblemPromptVarianceScale36":"同じ分布で 36×Var(X) を求めてください。","mathMeanVarianceProblemProbSumHint":"c","mathMeanVarianceProblemMeanScale6Label":"6×平均","mathMeanVarianceProblemMeanIntegerLabel":"平均 E[X]","mathMeanVarianceProblemPromptMeanInteger":"平均（期待値）E[X] を求めてください。","mathMeanVarianceProblemPromptMode":"確率が最大の X の値（最頻値）を求めてください。","mathMeanVarianceProblemPromptCumulativeNumerator":"X が与えられた値以下となる確率を分子/6 と書くとき、分子を求めてください。","mathMeanVarianceProblemModeLabel":"確率が最大の X","mathMeanVarianceProblemCumulativeLabel1":"P(X≤1) = ?/6 → ?","mathMeanVarianceProblemCumulativeLabel2":"P(X≤2) = ?/6 → ?","mathUniformNormalProblemPrompt":"以下の指示に従って計算してください。","mathUniformNormalProblemPromptUniformMean":"区間 [a,b] の一様分布で、平均 (a+b)/2 を求めよ。","mathUniformNormalProblemPromptUniformVar12":"一様分布 U[a,b] で 12×分散 = (b−a)² を求めよ。","mathUniformNormalProblemPromptUniformLength":"区間 [a,b] の長さ b−a を求めよ。","mathUniformNormalProblemPromptNormalPct68":"正規分布で、平均±標準偏差(μ±σ)の範囲に約何%が入るか。整数で答えよ。","mathUniformNormalProblemPromptNormalPct95":"正規分布で、平均±2×標準偏差(μ±2σ)の範囲に約何%が入るか。整数で答えよ。","mathIntegralProblemAntiderivativeIntro":"次が成り立つとき、","mathIntegralProblemAntiderivativeAt":" x = ","mathIntegralProblemAntiderivativeQ":"での値は？","mathPartialGradientProblemAtPoint":"において","mathPartialGradientProblemGradientFirst":"第1成分","mathPartialGradientProblemGradientSecond":"第2成分","wrongAnswerGuideButton":"なぜ間違った？","wrongAnswerGuideTitle":"誤答のヒント","wrongAnswerGuideSubmittedAnswer":"提出した答え:","wrongAnswerGuideHint":"AIがそのように解いた理由を推論し、正解を教えずに正しい方向へ案内します。","wrongAnswerGuideApiQuestion":"ユーザーが問題を解いたところ、提出した答え「{answer}」は不正解でした。そのように解いた理由を推論し、正解を教えずに正しい方向へだけ案内してください。","wrongAnswerGuideAsking":"ヒントを取得中…","wrongAnswerQuestionPrompt":"私は {answer} と答えました。なぜ違いましたか？","getSolution":"解答を見る","loadingSolution":"読み込み中…","feedbackTitle":"AI採点フィードバック","solutionTitle":"解答","alertDrawFirst":"解答を描いてから採点してください。","alertInputFirst":"解答を入力してから採点してください。","errorGrade":"採点中にエラーが発生しました。もう一度お試しください。","errorSolution":"解答の読み込み中にエラーが発生しました。もう一度お試しください。","errorGradeRequest":"採点リクエストに失敗しました","errorSolutionRequest":"解答リクエストに失敗しました","errorStream":"ストリームを読み取れません。","errorDefault":"フィードバックを生成できませんでした。","placeholderChapter":"このチャプターは準備中です。","conceptVisualPlaceholder":"この概念のビジュアルは準備中です。","conceptComingSoon":"この概念の学習コンテンツは今後のアップデートで追加されます。","conceptMatrixMulIntro":"Aの1行 × Bの1列（内積）→ 結果行列の1マス","conceptMatrixMulCell":"そのマス","conceptLinearLayerIntro":"入力Xに重み行列Wをかけ、バイアスbを足すと出力Yになります。__LINEAR_FORMULA__","conceptLinearLayerLegendRow0":"W 1行·X + b[0] → Y[0]","conceptLinearLayerLegendRow1":"W 2行·X + b[1] → Y[1]","conceptArtificialNeuronIntro":"人工ニューロンは重み付き和 __WEIGHTED_SUM_FORMULA__ を計算し、ReLU・Sigmoid・Tanh などの活性化関数をかけて出力 Y を出します。","conceptArtificialNeuronCalcCaption":"計算の順序: (W·X) の積 + b を加算 = Z → ReLU(Z) = Y","conceptBatchIntro":"複数サンプルを行列の列に並べたものがバッチです。同じ W, b で一度に __LINEAR_FORMULA__ を計算します。","conceptBatchCaption":"1列 = 1サンプル。同じ W, b をすべての列に一度に適用。","conceptBatchExampleTitle":"例：1列（サンプル）の計算過程","conceptBatchFormulaRow":"Z{n} = (W {row}行·この列)+b[{bi}] = ({calc})+({b}) = {result}","conceptConnectionIntro":"結合は、ある層のニューロンが次の層のニューロンとどうつながっているかを表します。重みが0でないところだけが実際の結合で、下のグラフはその部分結合だけを線で示しています。","conceptConnectionGraphCaption":"結合の構造（重み0の結合は表示しない）","conceptConnectionCalcCaption":"各出力: (W その行·X) の積 + b を加算 = Y","conceptConnectionFormulaRow1":"Y₁ = (W 1行·X) + b₁ = ({calc}) + {b} = {wx} + {b} = {y}","conceptConnectionFormulaRow2":"Y₂ = (W 2行·X) + b₂ = ({calc}) + {b} = {wx} + {b} = {y}","conceptActivationTitleSigmoid":"Y = Sigmoid(X)","conceptActivationTitleRelu":"Y = ReLU(X)","conceptActivationTitleTanh":"Y = Tanh₃(X)","conceptActivationTableHeader":"X ~ Y","conceptDotProductIntro":"a = [{a1}, {a2}], b = [{b1}, {b2}] → a·b = {samePositionSum}","conceptDotProductSamePositionSum":"同じ位置の成分の積の和","problemPromptConnection":"結合 __LINEAR_FORMULA__ で、空欄(?)に入る値を求めなさい。Wが0の入力はその出力にはつながりません。","conceptHiddenIntro":"隠れ層は、入力を線形変換(__LINEAR_CORE__)とReLUで中間表現Hにし、さらに線形とReLUで最終出力Yにします。","conceptHiddenGraphCaption":"入力 → 隠れ(H) → 出力(Y)","problemPromptHidden":"隠れ層付き順伝播 X → (W₁·X+b₁) → ReLU → H → (W₂·H+b₂) → ReLU → Y で空欄(?)を埋めなさい。","conceptDeepIntro":"深いネットワークは隠れ層が複数積み重なった構造です。各層で Linear(W·入力+b) と ReLU を適用し、中間表現を次の層へ渡します。","conceptDeepFormulaCaption":"各層: Linear & ReLU","conceptDeepFormulaWithSymbols":"線形 = W·(前層の出力) + b → ReLU","conceptDeepGraphCaption":"入力(X) → 隠れ(A,B,C,D) → 出力(Y)","problemPromptDeep":"複数層が連続した順伝播（各層 Linear & ReLU）で空欄(?)を埋めなさい。","conceptWideIntro":"幅は一つの層にあるニューロン数が多いことを指します。層が広いほど多くの特徴を同時に表現し、各層は Linear & ReLU で計算します。","conceptWideFormulaCaption":"各層: Linear & ReLU（層が広くなる）","conceptWideGraphCaption":"入力(X) → 隠れ(A,B) → 出力(Y) — 1→2→4→8 ニューロン","problemPromptWide":"層が広くなる順伝播（各層 Linear & ReLU）で空欄(?)を埋めなさい。","conceptSoftmaxIntro":"ソフトマックスは数を0～1の範囲にし、合計が1になるようにする関数です。__WEIGHTED_SUM_FORMULA__ を計算し、__SOFTMAX_EXP__ を求め、それぞれを合計(__SOFTMAX_SUM__)で割ると確率のように使えます。","conceptSoftmaxFormulaCaption":"Z = W·X + b → e^Z (e≈3) → Y = e^Z / Σ","conceptSoftmaxGraphCaption":"多クラス分類の最後の層でよく使われます。","problemPromptSoftmax":"__SOFTMAX_FLOW__ の順に計算し、空欄(?)を埋めなさい。","conceptSoftmaxEHint":"この問題では e を 3 として計算します。つまり __E_Z_3Z__ です。（例：Z=1 → 3、Z=2 → 9）","conceptGradientIntro":"勾配は関数の変化の向きと大きさを表すベクトルです。損失を減らすには勾配と逆の向きにパラメータを更新します。順伝播 __GRADIENT_FORWARD__、逆伝播 __GRADIENT_BACKWARD__。","conceptGradientForwardLabel":"順伝播","conceptGradientBackwardLabel":"逆伝播","conceptGradientFormulaCaption":"順伝播 Z = W·X → 逆伝播 dZ = dW·X","conceptGradientGraphCaption":"線形層・隠れ層などでも同じ考え方で勾配を計算します。","conceptGradientBlankHint":"問題では空白(?)は**X**の一成分か、**Z**（順伝播）・**dZ**（逆伝播）の一成分として出ます。","conceptGradientForwardDesc":"順伝播: Z = W·X（Wの各行とXの内積）","conceptGradientBackwardDesc":"逆伝播: dZ = dW·X（同じ構造、値は勾配）","conceptInputX":"入力 X","conceptLinear":"線形","conceptLinearReLULayer1":"Linear & ReLU（1層）","conceptLinearReLULayer2":"Linear & ReLU（2層）","conceptSoftmaxFlowCaption":"スコア(__Z__) → __3Z__ → 合計で割る → 確率(__Y__)","conceptSoftmaxZLabel":"Z（スコア）","conceptSoftmaxExpLabel":"3^Z","conceptSoftmaxSumLabel":"合計","conceptSoftmaxProblemFlow":"スコア(__Z__) → __3Z__ → 合計(__SIGMA__)で割る → 確率(__Y__)","conceptSoftmaxProbability":"確率","conceptSoftmaxExampleTitle":"例: 計算の流れ（1通り）","conceptSoftmaxStepZ":"Z{n} = (Wの{row}行目·X)+b[{bi}] = {calc}+{b} = {result}","conceptSoftmaxStepExp":"3^Z{n} = 3^{z} = {result}","conceptSoftmaxStepSum":"Σ = {items} = {result}","conceptSoftmaxStepY":"Y{n} = 3^Z{n}/Σ = {num}/{den} = {result}","conceptWideLinearReLU1":"Linear & ReLU（1層、幅2）","conceptWideLinearReLU2":"Linear & ReLU（2層、幅4）","conceptWideLayer1Formula":"1層（幅2）: H = ReLU(W₁·X + b₁)","conceptWideLayer2Formula":"2層（幅4）: Y = ReLU(W₂·H + b₂)","conceptMatrixMulCellDot":"Aの{row}行 · Bの{col}列（内積1回）","conceptMatrixMulARow":"Aの{row}行","conceptMatrixMulBCol":"Bの{col}列","conceptBatchLinear":"表の数に重みをかけ、バイアスを足して空欄を埋めなさい。","conceptBatchLinearRelu":"重みをかけバイアスを足したあと、負は0にして空欄を埋めなさい。","conceptBatchAdd":"各行に右の数を足して空欄を埋めなさい。","conceptBatchSubtract":"各行から右の数を引いて空欄を埋めなさい。","conceptBatchMultiply":"各行に右の数をかけて空欄を埋めなさい。","conceptBatchCenter":"各行からその行の平均を引いて空欄を埋めなさい。","conceptBatchSum":"各行の数字をすべて足した合計を求め、空欄を埋めなさい。","conceptBatchMean":"各行の数字の平均（整数）を求め、空欄を埋めなさい。","conceptBatchRowMeanHint":"（行平均→0）","conceptBatchRowSumHint":"（行ごとの合計）","conceptBatchRowMeanIntHint":"（行ごとの平均、整数）","conceptRowN":"{n}行","conceptDeepLayer1Title":"1層: A₁, A₂, A₃ (W₁ 各行·X + b₁)","conceptDeepLayer2Title":"2層: B₁, B₂, B₃ (W₂ 各行·A + b₂)","conceptDeepFormulaA":"A{n} = (W₁ {row}·X)+b₁[{bi}] = ({calc})+({b}) = {linear} → ReLU = {result}","conceptDeepFormulaAZero":"A{n} = (W₁ {row}·X)+b₁[{bi}] = ({calc})+({b}) = {linear} → ReLU(-1)=0 → {result}","conceptDeepFormulaB":"B{n} = (W₂ {row}·A)+b₂[{bi}] = ({calc})+({b}) = {linear} → ReLU = {result}","conceptHiddenLayer1Title":"1層: H = ReLU(W₁·X + b₁)","conceptHiddenLayer2Title":"2層: Y = ReLU(W₂·H + b₂)","conceptHiddenLinear1":"線形₁","conceptHiddenLinear2":"線形₂","conceptHiddenFormulaL1":"{linearLabel} = (W₁ {row}·X)+b₁[{bi}] = ({calc}) + ({b}) = {linear} → ReLU = {result}","conceptHiddenFormulaL2":"{linearLabel} = (W₂ {row}·H)+b₂[{bi}] = ({calc}) + ({b}) = {linear} → ReLU = {result}","conceptWideFormulaH1":"H₁ = (W₁ {row}·X)+b₁[0] = {calc} = {linear} → ReLU = {result}","conceptWideFormulaH2":"H₂ = (W₁ {row}·X)+b₁[1] = {calc} = {linear} → ReLU = {result}","conceptWideFormulaY1":"Y₁ = (W₂ {row}·H)+b₂[0] = {calc} = {linear} → ReLU = {result}","conceptWideFormulaY2":"Y₂ = (W₂ {row}·H)+b₂[1] = {calc} = {linear} → ReLU = {result}","conceptWideFormulaY3":"Y₃ = (W₂ {row}·H)+b₂[2] = {calc} = {linear} → ReLU = {result}","conceptWideFormulaY4":"Y₄ = (W₂ {row}·H)+b₂[3] = {calc} = {linear} → ReLU = {result}","conceptGradientZLine":"Z{n} = (W {row})·X = {calc} = {z}","conceptGradientDZLine":"dZ{n} = (dW {row})·X = {calc} = {dz}","problemPromptGradient":"__GRADIENT_FORWARD__ または __GRADIENT_BACKWARD__ の空欄(?)を埋めなさい。","tinyNNTitle":"チャプター別ディープラーニング図","tinyNNDescription":"チャプターを進めるたびに、下の図が少しずつ埋まります。ここまでの構造です。","tinyNNComplete":"最後のチャプターでは「順伝播→損失→逆伝播→更新」まで入った完成図を見られます。","tinyNNAriaLabel":"チャプター別ディープラーニング図の進行","mathDiagramTitle":"チャプター別数学図","mathDiagramDescription":"チャプターを選ぶと、下の図がそのチャプターの内容に切り替わります。基礎数学の流れを一覧で確認できます。","midMathDiagramTitle":"チャプター別数学図","midMathDiagramDescription":"チャプターを選ぶと、下の図がそのチャプターの内容に切り替わります。中級数学の流れを一覧で確認できます。","mathDiagramComplete":"Ch01 関数まで見ると、入力→関数→出力の構造がすべて見られます。","mathDiagramAriaLabel":"チャプター別数学図","mlDiagramTitle":"チャプター別機械学習図","mlDiagramDescription":"チャプターを選ぶと、下の図がそのチャプターの内容に切り替わります。機械学習の流れを一覧で確認できます。","midMlDiagramTitle":"チャプター別中級機械学習図","midMlDiagramDescription":"チャプターを選ぶと、下の図がそのチャプターの内容に切り替わります。中級機械学習の流れを一覧で確認できます。","midMlIntroRoadmapHeading":"Ch01～Ch20で学ぶこと","midMlIntroRoadmapIntro":"中級機械学習では **現実データの前処理** と **モデル・ハイパーパラメータチューニング** を一つの流れにします。スケーリング・エンコーディング・欠損・不均衡の後、SVM・PCA・ブースティング・クラスタリングを学び、**パイプライン**と Grid・Random・Optuna で性能を安定させます。","mlDiagramAriaLabel":"チャプター別機械学習図","linkToPlayground":"この計算がニューラルネットでこう使われます","introRoadmapHeading":"Ch01～Ch12で学ぶこと","mathIntroRoadmapIntro":"ディープラーニング・機械学習を理解するには、**関数**・**指数・対数**・**極限・微分・積分**・**確率・分布**といった基礎数学が必要です。Ch01～Ch12で学ぶ内容がまさにそれです。**関数**は入力→出力の土台で、**微分・勾配**はモデルが学習時にパラメータを**どこをどれだけ**変えるか決めるのに使います。**確率・分布**は予測と不確実性に必要です。","midMathIntroRoadmapHeading":"Ch01～Ch20で学ぶこと","midMathIntroRoadmapIntro":"中級数学は、AIを理解するために使う言語をもう一段深めます。データが**ベクトル**や**行列**として表され、**線形変換**によってどう変換されるかを学びます。その後、内積や射影で「似ている度合い」と「方向」を数値で捉えます。さらに**ヤコビアン**と**ヘッセ**で変化量と曲率（損失地形の“形”）を読み解けるようになります。最後に、**テイラー級数**や**凸最適化**でより安定した学習設計を行い、不確実性は**ベイズ**、**共分散**、**多変量正規分布**で扱います。","premiumBadge":"プレミアム","premiumTitle":"プレミアムチャプターです","premiumDescription":"このチャプターは有料会員限定コンテンツです。購読すると、全チャプターの概念説明・問題演習・AIコーチングを無制限でご利用いただけます。","premiumFeature1":"Chapter 04〜12 すべてアンロック","premiumFeature2":"AI学習コーチへの質問が無制限","premiumFeature3":"新チャプターへの先行アクセス","premiumMonthly":"月","premiumCTA":"プレミアムに登録する","premiumComingSoon":"決済準備中です","premiumLogin":"すでに購読中ですか？","premiumLoginLink":"ログイン","premiumLoginFirst":"ログイン後にプレミアムを購読できます。","freeChaptersNote":"Chapter 01〜03は無料でご利用いただけます。","mlMseProblemPromptBinaryCrossEntropyLog2Y1":"二値分類1サンプルの損失 $\\ell = -\\big( y \\log_2 \\hat p + (1-y) \\log_2(1-\\hat p) \\big)$（底2）。$y=1$, $\\hat p = {pFrac}$ のとき $\\ell$ を整数で求めなさい。参考: {logHint}","mlMseProblemPromptBinaryCrossEntropyLog2Y0":"二値分類1サンプルの損失 $\\ell = -\\big( y \\log_2 \\hat p + (1-y) \\log_2(1-\\hat p) \\big)$（底2）。$y=0$, $1-\\hat p = {pFrac}$ のとき $\\ell$ を整数で求めなさい。参考: {logHint}"},"playground":{"title":"ニューラルネットプレイグラウンド","seoFaqTitle":"よくある質問","relatedLearnLabel":"関連で学ぶ","nav":{"sectionTitle":"プレイグラウンド","sectionSubtitle":"触って学ぶAI実験室","comingSoon":"準備中","categories":{"dl":"ディープラーニング","ml":"機械学習","rl":"強化学習","vision":"コンピュータビジョン","transformer":"Transformer"},"items":{"nnClassifier":"NN分類器","optimizer":"損失地形ラボ","knn":"KNN 近傍分類器","rl":"RLエージェント","cnn":"畳み込みビジョン","transformer":"Attention プレイグラウンド"}},"classifier":{"title":"ニューラルネットプレイグラウンド","subtitle":"ブラウザでニューラルネットを触ってみましょう！","dataTitle":"データ","dataHint":"どのK-データセットで遊びますか？","datasets":{"taegeuk":"太極","danjeong":"タンチョン（丹青）","hallyu":"K-ウェーブ","kpop":"K-Pop ♥"},"trainRatio":"学習/テスト比率","noise":"ノイズ","batchSize":"バッチサイズ","showTest":"テストデータ表示","regenerate":"再生成","featuresTitle":"特徴量","featuresHint":"ネットワークへの入力を選びます","featuresIntro":"特徴量(feature)は、各データ点の座標 (x₁, x₂) をニューラルネットに入れるために加工した入力値です。X₁・X₂のほか、二乗・積・sin などをオンにすると、より複雑な決定境界も学習できます。オンにした特徴量ごとに入力ニューロンが1つ増えます。","featuresIntroToggle":"特徴量の説明","featuresIntroExpand":"開く","featuresIntroCollapse":"閉じる","features":{"x1":"X₁","x1Desc":"横座標そのまま — 縦に分かれた境界向き","x2":"X₂","x2Desc":"縦座標そのまま — 横に分かれた境界向き","x1sq":"X₁²","x1sqDesc":"横座標の二乗 — 円や放物線のような曲線境界","x2sq":"X₂²","x2sqDesc":"縦座標の二乗 — 左右対称の曲線境界","x1x2":"X₁X₂","x1x2Desc":"2座標の積 — 対角線・ねじれた境界","sinX1":"sin(X₁)","sinX1Desc":"横 sin — 波打つ周期的な境界","sinX2":"sin(X₂)","sinX2Desc":"縦 sin — 上下に繰り返す境界"},"networkTitle":"隠れ層","networkHint":"線の太さ=重みの大きさ、色=符号（紫=+、橙=−）","addLayer":"層を追加","removeLayer":"層を削除","outputTitle":"出力","outputHint":"モデルの決定境界とデータ点","outputLegend":"薄い背景 = 実際のデータパターン · 濃い色 = ネットワークの予測","outputLive":"LIVE","testLoss":"テスト損失","trainLoss":"学習損失","epoch":"エポック","colorNegative":"負 (−1)","colorPositive":"正 (+1)","play":"再生","pause":"一時停止","step":"1ステップ","reset":"リセット","controlsIntro":"再生・1ステップのたびに下の設定が使われます。まずは初期値で動かし、変えながら違いを確かめてください。","controlsIntroToggle":"学習設定の説明","learningRate":"学習率","learningRateDesc":"重みを1回でどれだけ大きく直すか。大きすぎると不安定、小さすぎると遅いです。0.01〜0.03あたりから試すのがおすすめです。","activation":"活性化","activationDesc":"ニューロン出力を非線形の曲線に変えます。Tanhはなめらかに−1〜1、ReLUは0未満を0にします。","activationReLU":"ReLU — 0未満は0、それ以上はそのまま（いちばんよく使う）","activationTanh":"Tanh — S字、出力は−1〜1","activationSigmoid":"Sigmoid — 0〜1に押し込む","activationLinear":"Linear — 曲線なし（ほぼ線形）","regularization":"正則化","regularizationDesc":"重みが大きくなりすぎないようペナルティを付けます。訓練データを「丸暗記」する過学習を抑えます。","regNone":"なし","regL1":"L1 — 重みの絶対値の和（まばらにしやすい）","regL2":"L2 — 重みの二乗和（全体的に小さく）","regRate":"正則化の強度","regRateDesc":"正則化ペナルティの強さです。「なし」のときは使われません。","regRateDisabledHint":"正則化でL1またはL2を選ぶと調整できます。","showFormulas":"数式を表示","showFormulasDesc":"逆伝播・活性化など、今の設定に合った数式を下に表示します。","learnChapterTooltip":"学ぶ: {title}","relatedLearn":"関連チャプター","formulasTitle":"数式"},"rl":{"title":"ブランコ強化学習","subtitle":"Q学習がブランコをこぐタイミングを自分で覚えます！","seoIntro":"ブラウザで振り子ブランコに Q学習エージェントを訓練できる無料の強化学習 Playground です。学習率・割引率・探索率を調整し、エピソード報酬の推移で方策の改善を確認できます。","play":"開始","pause":"停止","step":"1ステップ","reset":"リセット","episode":"エピソード","alpha":"学習率 α","alphaDesc":"Q値を1回でどれだけ更新するか。大きいと速いが不安定になりやすい。","gamma":"割引率 γ","gammaDesc":"将来の報酬をどれだけ重視するか。1に近いほど遠い報酬も大きく反映。","epsilon":"探索 ε","epsilonDesc":"ランダムに押す確率。高いと多く試し、低いと慣れたリズムに従います。","speed":"速度","showFormulas":"数式を表示","controlsIntro":"下りで押し、上りは惰性—Q表がこのリズムを学びます。","controlsIntroToggle":"学習設定の説明","envTitle":"ブランコ設定","envHint":"ロープ・摩擦・風で難易度が変わります","swingGoal":"報酬は高さ(1−cos θ)。左右に押して振幅を大きくします。","swingTip1":"下りで運動と逆に押すとエネルギーが増えます","swingTip2":"頂上付近は惰性が有利なことが多いです","presets":{"playground":"標準","playgroundDesc":"標準ロープ・バランス型","longRope":"長いロープ","longRopeDesc":"ゆっくり大きく","shortRope":"短いロープ","shortRopeDesc":"速く往復","heavySeat":"重い座席","heavySeatDesc":"摩擦大・上がりにくい","breezy":"風の日","breezyDesc":"そよ風あり","powerPump":"パワーポンプ","powerPumpDesc":"強く押して一気に"},"presetRope":"ロープ","presetDamping":"摩擦","presetPush":"押し","presetWind":"風","worldTitle":"ブランコシミュレータ","worldHint":"紫ロボット=エージェント · バー=高さ","swingAria":"ブランコ強化学習シミュレータ","swingHeight":"高さ","swingMaxEp":"エピソード最高","swingHighCount":"高くこいだ回数","actions":{"left":"左に押す","coast":"惰性","right":"右に押す"},"metricSteps":"このエピソードのステップ","metricEpReward":"エピソード累積報酬","rewardTitle":"エピソード報酬","rewardHint":"高くこぐほど報酬が増えます","rewardChartEmpty":"学習を始めるとエピソードごとの報酬が表示されます","lastReward":"直近エピソード報酬: {value}","rewardChartSummary":"直近完了: {completed} · 進行中の累積: {current}","rewardChartCurrent":"進行中の累積報酬: {value}","formulasTitle":"振り子 · Q学習","formulaPendulum":"振り子モデル：角度θ、角速度ω、トルクτ。","formulaBellman":"(θ,ω)を離散化し、いつ押すかをQ表で学習。","formulaRewardIntro":"報酬はブランコの高さに比例します。","formulaRewardOutro":"高くこぐほど報酬が増えます。ε-greedyで探索と活用を混ぜます。","relatedLearn":"関連で学ぶ"},"cnn":{"title":"畳み込みビジョン Playground","subtitle":"K-カルチャーパターンにフィルタを当て、feature map の変化をリアルタイムで確認！","seoIntro":"ブラウザで動作する無料の畳み込み(CNN) Playground です。太極・丹青・ハングル・K-Pop など 16×16 K-カルチャーパターンに 3×3 畳み込みカーネルを適用し、feature map・ReLU・2×2 マックスプーリングをリアルタイムで確認できます。Sobel・ブラー・シャープン等 7 プリセットとスライドアニメーションで、コンピュータビジョン入門者が畳み込みの原理を直感的に学べます。","controlsIntro":"▶ でカーネルが入力上をスライドし、畳み込み→ReLU→プーリングが1マスずつ埋まります。1ステップで手動確認もできます。","controlsIntroToggle":"設定の説明","play":"再生","pause":"停止","step":"1ステップ","speed":"速度","animPhase":"フェーズ","animStep":"進捗","animReady":"待機","animDone":"完了","animConvValue":"出力値","animPoolValue":"max","pipelineIntroAnim":"カーネル（紫）が入力を走査し feature map が埋まります。プーリングでは 2×2（橙）から最大値を取ります。","padding":"パディング","paddingValid":"Valid（出力縮小）","paddingSame":"Same（サイズ維持）","useRelu":"ReLU を適用","usePool":"2×2 マックスプーリング","showFormulas":"数式を表示","reset":"リセット","imageTitle":"入力画像","imageHint":"どの K-カルチャーパターンで試しますか？","imageIntro":"16×16 ピクセルパターンをグレースケールに変換して畳み込みに入れます。","patterns":{"taegeuk":"太極","taegeukDesc":"円内の陰陽 S 字境界","danjeong":"丹青","danjeongDesc":"対角ストライプ格子","hangeul":"ハングル ㄱ","hangeulDesc":"画のパターン（縦・横・钩）","kpop":"K-Pop ♥","kpopDesc":"ハート手のハート領域"},"kernelTitle":"3×3 カーネル","kernelHint":"プリセットを選ぶか、セルをクリックして編集","kernelIntro":"カーネルは入力上をスライドし、3×3 近傍の重み付き和で feature map を作ります。","kernelPresets":"プリセット","kernelClickHint":"セルをクリックすると −2〜2 の値が循環します。","customKernel":"カスタム編集カーネル","presets":{"identity":"恒等","blur":"ブラー","sharpen":"シャープン","sobelX":"Sobel X","sobelY":"Sobel Y","edge":"エッジ","emboss":"エンボス"},"presetDesc":{"identity":"中央のみ 1 — 入力をほぼそのまま通します","blur":"9 近傍の平均 — ノイズを減らし画像を滑らかにします","sharpen":"中央強調・周辺減算 — 輪郭とディテールを鮮明にします","sobelX":"水平方向の明るさ変化 — 縦エッジ（垂直境界）を強調","sobelY":"垂直方向の明るさ変化 — 横エッジ（水平境界）を強調","edge":"中央と周辺の差 — 全方向の境界を強調します","emboss":"対角の明るさ勾配 — 浮き彫りのような立体感を出します"},"pipelineTitle":"CNN パイプライン","pipelineHint":"入力 → 畳み込み → (ReLU) → (プーリング)","outputTitle":"出力","outputHint":"各段階の feature map — 再生で畳み込み・ReLU・プーリングが1マスずつ埋まります","pipelineIntro":"入力画像にマウスを乗せると、カーネルが覆う 3×3 領域が表示されます。","stageInput":"入力","stageConv":"畳み込み","stageRelu":"ReLU","stagePool":"プール","stageInputRole":"16×16 原画素 — K-カルチャーパターンをグレースケールで入力","stageConvRole":"3×3 フィルタ走査 — 近傍の重み付き和でエッジ・テクスチャなど空間特徴を抽出","stageReluRole":"max(0, x) — 負の応答を 0 にし、活性化した特徴だけ残す","stagePoolRole":"2×2 最大値 — マップを縮小し、位置ずれに強くする","heatmapLegend":"ヒートマップ：紫=正、橙=負 · 濃いほど強い","formulasTitle":"数式","formulaConv":"畳み込み","formulaPool":"マックスプーリング","relatedLearn":"関連で学ぶ"},"transformer":{"title":"Attention プレイグラウンド","subtitle":"質問を送ると、モデルが質問から答えの手がかりを探して回答します","chatTitle":"質問 → 回答","chatModelBadge":"質問から手がかりを探す","chatEmptyHint":"下の入力欄に質問を入力して送信してください","chatPlaceholder":"質問を入力…","chatCustomAnswer":"「{query}」に最も似ている単語は「{word}」({pct}%)です。","chatSend":"質問を送る","chatTokenizing":"質問をトークンに分解中…","chatEmbedding":"単語＋位置情報を合成中…","chatPipelineTitle":"モデルの処理","chatStepTokenize":"分割","chatStepEmbed":"理解","chatStepCompare":"比較","chatStepWeight":"注目%","chatStepAnswer":"回答","chatStepTokenizeDesc":"文を小さな単語（トークン）に分けます","chatStepEmbedDesc":"各単語に「何番目か」の位置情報を足します","chatStepCompareDesc":"回答位置から、他の単語との関連度を比べます","chatStepWeightDesc":"関連度を％に変換 · 明るさと％が高いほど注目","chatStepAnswerDesc":"最も似た語を見つけ → 情報を混ぜ → 回答を書く","chatAnswerSimilarLead":"「{query}」に最も似ている単語は「{word}」({pct}%)です。","chatAnswerSimilarEmpty":"「{query}」の位置から関連語が見つかりませんでした。","chatAnswerSimilarExplain":"回答位置での注目 % が高いほど、より関連の深い単語です。","chatAnswerBriefTitle":"その後モデルがすること","chatAnswerBriefBody":"注目した語の情報を比率どおり混ぜ、次に書く語を選び、回答を完成させます。ChatGPTはこれを繰り返します。","chatCompareTitle":"単語間の関連度比較","chatCompareHint":"「{word}」の位置から他の単語との近さを計算","chatWeightTitle":"注目比率の計算","chatWeightHint":"関連度を％に変換 — 合計100％","chatPosition":"{n}番目","chatTokenTruncated":"長い入力は先頭 {shown} 個のみ表示（全 {total} 語）","chatSearching":"質問から答えの手がかりを探しています…","chatCluesFound":"手がかりを確認","chatSearchExplain":"回答前に、質問のどの語をどれだけ注目するかをアニメーションで示します","chatQuestionLabel":"質問","chatConnectTitle":"語の接続 → 注目%","chatConnectIntro":"下の{query}基準 · トークンの明るさと％が注目度","chatConnectAria":"質問の語と回答位置の接続グラフ","chatAnswerFlow":"質問を読んだあと","chatAnswerSlot":"ここで回答を書きます","chatAnswerSlotHint":"ChatGPT が回答を始める位置（質問の次の枠）","chatQueryFromToken":"現在「{word}」の位置から注目中 · 下の枠を押すと回答位置に戻ります","chatCalcTitle":"なぜこの割合？","chatCalcIntro":"Q({query}) と各語の K を比べ、softmax で割合にします。","chatCalcQueryLabel":"回答位置","chatCalcStep1":"① Q · K = 類似度スコア（高いほど関連）","chatCalcStep2":"② softmax — スコアを割合に変換（合計100%）","chatCalcStep2Pending":"② softmax 計算中…","chatClueSummary":"注目した手がかり: {words}","chatAnswering":"回答","chatDoneHint":"トークンを押すと注目の変化を確認できます。","chatPickNext":"別の質問をする","chatReadyHint":"新しい質問は下の入力欄に入力してください","chatReadyFooter":"下の入力欄に質問を入力すると新しい会話が始まります","chatFooterNote":"ChatGPT も回答前に、質問の中から関連語を探します","qaQuestions":{"catCafe":"雨の日、カフェの窓際に座っているのは何ですか？","robotPaint":"キャンバスの前で紫の空を描いているのは誰ですか？","moonRamen":"月の出た夜、路地に漂う暖かい匂いは何でしょう？","snowTrain":"雪原を走る列車、次に着くのはどこですか？"},"qaAnswers":{"catCafe":"猫です。雨音を聞きながらカフェの窓際で休んでいます。","robotPaint":"ロボットです。筆を持ち、キャンバスに紫の空をゆっくり描いています。","moonRamen":"ラーメンです。月夜の路地を、温かいスープの香りが包みます。","snowTrain":"小さな町です。白い雪原を越え、列車は町の駅に入ります。"},"qaTokens":{"catCafe":["雨","カフェ","窓際","座っ","何","?"],"robotPaint":["キャンバス","紫","空","描い","誰","?"],"moonRamen":["月","路地","暖かい","匂い","ラーメン","?"],"snowTrain":["雪原","列車","次","着く","する","どこ"]},"setupTitle":"入力","setupHint":"パターン · クエリ","patterns":{"catCafe":"Pattern A","robotPaint":"Pattern B","moonRamen":"Pattern C","snowTrain":"Pattern D"},"metricMaxAttn":"最大注目","outputHint":"注目比率で混ぜた新しい表現","seoIntro":"分類器と同じ構成の Self-Attention Playground。例文・クエリ選択 → 接続グラフ（線の太さ=注目比率）→ 出力パイプラインを即確認。BERT/GPT マスク、√d_k スケール、段階アニメーション対応。","controlsIntro":"▶ 再生でパイプライン段階が強調されます。トークンをクリックすれば再生なしでも即更新されます。","controlsIntroToggle":"設定の説明","play":"再生","pause":"停止","step":"1ステップ","speed":"速度","reset":"リセット","animReady":"待機","animDone":"完了","animPhase":{"label":"段階","scores":"Q·K^T スコア","softmax":"softmax","output":"V 重み付き和"},"maskLabel":"マスク","maskFull":"全体 (BERT)","maskCausal":"因果 (GPT)","scaleDk":"√d_k スケール","showFormulas":"数式を表示","sentenceTitle":"入力文","sentenceHint":"どの例文で試しますか？","sentenceIntro":"例文とクエリ (Q) トークンを選んでください。分類器のデータ・フィーチャ選択のように、グラフと出力がすぐ更新されます。","queryHint":"クエリトークン選択 (Q)","presets":{"catCafe":"猫とカフェ","catCafeDesc":"雨の窓際 — 猫・カフェ・窓が互いに注目します","robotPaint":"ロボットと絵","robotPaintDesc":"キャンバスの紫の空 — ロボット・描く・画布がつながります","moonRamen":"月とラーメン","moonRamenDesc":"月夜の路地 — 夜・月・ラーメンの湯気が重なります","snowTrain":"雪と列車","snowTrainDesc":"雪原を走る列車 — 雪・町・走るがつながります"},"presetTokens":{"catCafe":["猫は","雨","の","日","カフェ","窓際","に"],"robotPaint":["ロボ","が","キャンバス","に","紫","空","描く"],"moonRamen":["月","の","出た","夜","路地","ラーメン","湯気"],"snowTrain":["列車","が","雪原","を","横切","小さな","町"]},"matrixTitle":"注意行列","matrixHint":"行=Query、列=Key — 濃いほどスコア/重みが大きい","storyTitle":"Attention の流れ","storyHint":"棒グラフとスポットライトで「誰が誰を見るか」を追います","storyStep":{"scores":"比べる","softmax":"比率に","output":"混ぜる"},"storyExplainIdle":"▶ で「{query}」が他の語とどれだけ似ているかから始まります。","storyExplainScores":"① Q（質問）と K（名札）を比べてスコア化。「{query}」に近い語ほど高得点。","storyExplainSoftmax":"② スコアを 0〜100% の比率に。合計 1 になるよう正規化されます。","storyExplainOutput":"③ 各語の V（中身）を比率で混ぜ、新しい表現を作ります。","storyExplainPause":"1 周完了！次のクエリへ進むか、別のトークンをクリックしてください。","metaphorQ":"質問","metaphorK":"名札","metaphorV":"中身","metaphorQDesc":"今注目している語","metaphorKDesc":"他の語と比較","metaphorVDesc":"取り込む情報","storySentenceLabel":"文の中の注目","distributionScoresTitle":"「{query}」と各語の類似スコア","distributionTitle":"「{query}」の注目比率","distributionHint":"棒が長いほど多く注目。段階に応じてスコアまたは % を表示。","storyOutputSummary":"「{query}」の新ベクトル = 注目比率 × 各語の V の重み付き和。","showMatrixToggle":"詳細: 全 N×N 行列を表示","networkTitle":"Attention 接続","networkHint":"線の太さ = 注目比率（分類器の重みと同じ）","networkIntro":"クエリ (Q) から各トークンへの線が「どれだけ注目するか」を示します。クリックで即更新。","networkLegend":"線が太く % が大きいほど、より多く注目しています。","networkAria":"クエリからキー・トークンへの Attention 接続グラフ","outputTitle":"出力","outputIntro":"入力文 → 注目（色が濃い） → 出力ベクトルの順にデータが流れます。","outputIntroAnim":"▶ 再生で段階的に鮮明に：ぼやけた線 → 比率確定 → 出力完成。","outputProgressLabel":"鮮明度","outputLive":"ライブ","outputTop1":"1位注目","outputTop2":"2位","outputSelf":"自分","outputLegend":"「{query}」の注目比率が色の濃さで表示されます。","pipelineInput":"入力","pipelineInputRole":"文トークン","pipelineAttend":"注目","pipelineAttendRole":"softmax 比率","pipelineOut":"出力","pipelineOutRole":"V 重み付き和","matrixIntroScores":"softmax 前の Q·K^T 内積スコアです。","matrixIntroWeights":"softmax 後の重み — 各行の合計は 1 です。","matrixAria":"注意行列ヒートマップ","flowTitle":"トークン接続","flowHint":"線の太さ = softmax 重み","flowIntro":"選択したクエリから他トークンへの曲線。太さがどれだけ注目しているかを示します。","flowQueryLabel":"クエリ","flowOutputLabel":"重み付き出力 (d=4)","formulasTitle":"数式","formulaQkv":"Q / K / V","formulaAttention":"Scaled Dot-Product Attention","formulaMask":"因果マスク","formulaScaleNote":"d_k = {dk}","relatedLearn":"関連で学ぶ"},"optimizer":{"title":"損失地形ラボ","subtitle":"SGD・Momentum・Adam が同じ起点からどう違う道で最小値を探すか、2D 損失地形上で直接比較しましょう！","play":"再生","pause":"停止","step":"1ステップ","reset":"リセット","stepLabel":"ステップ","learningRate":"学習率 η","learningRateDesc":"1ステップでパラメータをどれだけ動かすか。大きすぎると発散、小さすぎると遅いです。","momentumBeta":"慣性 β","momentumBetaDesc":"Momentum が前の勾配をどれだけ残すかの係数です。","speed":"速度","showFormulas":"数式を表示","controlsIntro":"▶ 再生で3つのオプティマイザが同時に1ステップずつ進みます。学習率を上げると SGD が先に振動する様子を観察できます。","controlsIntroToggle":"設定の説明","landscapeTitle":"損失地形","landscapeHint":"どの地形で最適化しますか？","landscapes":{"bowl":"ボウル（凸）","bowlDesc":"x²+y² — 最も単純な凸地形","saddle":"サドル点","saddleDesc":"(x²−1)²+y² — 中央が鞍、左右に2つの最小","valley":"Rosenbrock 谷","valleyDesc":"細く曲がった谷 — 実践に近い"},"worldTitle":"最適化経路","worldHint":"紫=SGD · 青=Momentum · 橙=Adam · クリックで開始点変更","canvasAria":"2D 損失地形とオプティマイザ経路","legendStart":"開始点","legendMin":"最小値","legendSaddle":"鞍点","clickHint":"キャンバスをクリックすると開始点が変わり経路がリセットされます","optimizers":{"sgd":"SGD","momentum":"Momentum","adam":"Adam"},"converged":"収束","diverged":"発散","running":"進行中","formulasTitle":"数式","formulaSgdIntro":"最も基本的な勾配降下 — 現在の勾配方向へ1歩:","formulaMomentumIntro":"過去の勾配を慣性として蓄積 — 谷での振動を減らします:","formulaAdamIntro":"勾配の1次・2次モーメントを指数移動平均 — 適応的な学습率:","relatedLearn":"関連で学ぶ"},"knn":{"title":"KNN 近傍分類器","subtitle":"学習なしで近い K 個の近傍の多数決で分類してみましょう！NN 分類器と同じ K-データセットで古典 ML を比較できます。","dataTitle":"データ","dataHint":"どの K-データセットで分類しますか？","trainRatio":"学習/テスト比率","noise":"ノイズ","showTest":"テストデータを表示","regenerate":"再生成","kLabel":"近傍 K","kDesc":"最も近い学習点をいくつ使うか。小さいとギザギザ、大きいと滑らかになります。","metric":"距離","metricEuclidean":"ユークリッド（直線）","metricManhattan":"マンハッタン（格子）","metricDesc":"2点間の距離の測り方。ml03 章の L1・L2 距離と同じ考え方です。","showFormulas":"数式を表示","controlsIntro":"キャンバスをクリックするとクエリ（紫の輪）が移動し、最も近い K 個の近傍に点線が接続されます。","controlsIntroToggle":"設定の説明","outputTitle":"分類結果","outputHint":"背景=KNN 決定領域 · 点線=近傍接続 · クリック=クエリ位置","canvasAria":"KNN 分類キャンバス","clickHint":"キャンバスをクリックしてクエリ位置を変え、近傍を確認してください","testAccuracy":"テスト精度","queryPrediction":"クエリ予測","neighborVotes":"K 票の内訳","labelPos":"正 (+1)","labelNeg":"負 (−1)","neighborRank":"#{rank} · d={dist}","formulasTitle":"数式","formulaDistIntro":"距離 — ユークリッド（L2）とマンハッタン（L1）:","formulaVoteIntro":"多数決 — K 個の近傍ラベルの和の符号で予測:","relatedLearn":"関連で学ぶ"},"configTitle":"モデル設定","inputNodes":"入力ノード数","hiddenNeurons":"隠れ層ニューロン数","activation":"活性化関数","createModel":"モデル生成","inputTarget":"入力とターゲット","runForward":"順伝播実行","forwardSteps":"順伝播のステップ","training":"学習","oneStep":"1ステップ","epochs50":"50エポック","weightsAndGradients":"重みと勾配","linkFromProblem":"この計算がニューラルネットでこう使われます","fromDotBanner":"内積の練習問題と連携中。下のモデルの第1ニューロンが入力と重みの内積を計算します。Forwardを実行してみてください。","inputXLabel":"入力 X（カンマ区切り）","targetLabel":"ターゲット（カンマ区切り）","trainingInProgress":"学習中…","weightsW1":"W₁（隠れ層の重み）","weightsW2":"W₂（出力層の重み）","gradientsDW1":"dW₁（勾配）","gradientsDW2":"dW₂（勾配）","createModelHint":"上で設定を選んでから「モデル生成」を押してください。","lossGraphEmpty":"学習を実行するとエポックごとの損失グラフが表示されます。","lossGraphTitle":"エポック別損失 (Loss)","epochLabel":"エポック","lastLossLabel":"最終損失: {value}（全{count}エポック）"},"tinyNN":{"batchPhase0":"サンプル1・2・3がばらばらです。","batchPhase1":"一つの表にまとめると→同じW,bで一度に計算できます。","batchPhase2":"同じW,bが一度にすべての列(サンプル)に適用されます。","batchPhase3":"だから結果Yも一つの表で一度に出ます。","batchInputSeparate":"入力（サンプルはばらばら）","batchInputTable":"入力表 X","batchSample1":"サンプル 1","batchSample2":"サンプル 2","batchSample3":"サンプル 3","batchOneColOneSample":"1列＝1サンプル","batchMergeHint":"まとめると1つの表に","batchSameWb":"同じ W, b","batchComputeOnce":"一度に計算","batchResultY":"結果 Y","batchResultCaption":"← 同じW,bで一度に出た結果","batchFooter1":"サンプルを一つの行列に並べると、同じW,bで一度に計算できます。","batchFooter2":"入力が一つの表にまとまると、結果Yも一つの表で一度に出ます。","batchFooter3":"1枚の表が同じW,bを通ります。列ごとに違うのは入力だけで、計算のきまり(W,b)は同じです。","connDescription":"層と層の間の各線が重み(w)です。入力に重みをかけて足し、バイアス(b)を足すと次の層Yになります。","connWeightLabel":"重み(w)","connBiasLabel":"+バイアス(b)","connFooter":"丸が値、線が重み(w)です。重み付き和にバイアス(b)を足した値が次の層Yです。","hiddenDescription":"見えるのは入力(X)と出力(Y)だけ。その間の層はネットワーク内だけで使う表現なので隠れ層です。","hiddenVisibleInput":"見える: 入力","hiddenHiddenH":"見えない: 隠れ(H)","hiddenVisibleOutput":"見える: 出力","hiddenBoxLabel":"隠れ層（外からは見えない）","hiddenFooter":"値は入力→隠れ層→出力と流れます。隠れ層は見えない内部表現です。","deepDescription":"深い＝隠れ層(中間段階)が多い。ディープラーニングの「ディープ」がこの深さです。","deepLayerN":"{n}層","deepFooter":"段階が多いほど深いネットワーク。深いほどより細かいパターンを学べます。","wideWidthN":"幅 {count}","wideNeuronsN":"ニューロン {count}個","wideFooter":"一つの層のニューロン数が幅です。幅が広いほどその段階でより多くの特徴を同時に扱えます。","softmaxScoreToProb":"スコア→確率","softmaxExample":"（例: eを3とする）","softmaxScore":"スコア","softmaxMid":"中間","softmaxPowerOf3":"3のべき乗","softmaxProb":"確率","softmaxDivideBySum":"合計で割る","softmaxRaise":"をかけると","softmaxPowerLabel":"(3の{n}乗)","activationDescription":"入力Xに応じて出力Yが非線形に変わる代表的な活性化関数です。（3段階量子化版）","activationSigmoid":"Sigmoid(X)","activationRelu":"ReLU(X)","activationTanh":"Tanh₃(X)","hiddenLayer1Formula":"W₁·X+b₁ → ReLU","hiddenLayer2Formula":"W₂·H+b₂ → ReLU","captionDotProduct":"左のX1,X2,X3と右のY1,Y2,Y3が線でつながっています。右の1ノードは左との重みの内積です。","captionMatrixMul":"左は行列Aの1行、右Y1～Y3は行列Bの列との内積結果。これが集まってA·Bの行列積になります。","captionLinearLayer":"この区間が線形層です。Y=W·X+bで入力が次の層に一度に計算されます。","captionActivation":"ノード値がReLUやσを通ると曲線的に変わります。最後の層Y1,Y2,Y3がその結果です。","captionArtificialNeuron":"点線の円の中が人工ニューロン1つ。入力(X)に重みをかけて足し(w·x+b)、ReLUを通って出力(Y)になります。","captionBatch":"表の1列＝1サンプル。同じW,bをすべての列に一度に適用してY=W·X+bを計算します。","captionConnection":"層と層の間の線が重み(w)。ノードの値がこの線で次の層に伝わります。","captionHidden":"入力(X)と出力(Y)だけ見え、その間の層Hはネットワーク内だけで使う表現なので隠れ層。データは入力→隠れ→出力の順に流れます。","captionDeep":"深い＝隠れ層(中間)が多いこと。X→A→B→C→…→Yのように段階が多いほど深く、深いほど細かいパターンを学べます。","captionWide":"一つの層のニューロン数が幅。1個なら特徴1つ、256個なら256を同時に表現。層ごとに違ってよい(例: 1→2→4→8 や 256→128→64)。","captionSoftmax":"最後の層Y1,Y2,Y3を足して1になるよう割るのがソフトマックス。確率のように使えます。","captionGradient":"右から左へ勾配(∇)が流れ、損失を減らすように各層を少しずつ更新します。","captionSummary":"Ch01～Ch12の内容を一つのネットワークにまとめた図。順伝播・逆伝播・重み・活性化・勾配がすべて入っています。","labelWeightedSum":"重み付き和","labelWeightBias":"重み·入力+バイアス","labelWeight":"重み","labelProbSum":"（確率、和=1）","labelResult":"結果","labelMatrixResult":"行列積の結果","labelNeuron":"ニューロン"},"categories":{"math":{"title":"基礎数学","navTitle":"数学"},"midMath":{"title":"中級数学"},"advMath":{"title":"上級数学"},"dl":{"title":"基礎ディープラーニング","navTitle":"ディープラーニング"},"midDl":{"title":"中級ディープラーニング"},"advDl":{"title":"発展ディープラーニング"},"ml":{"title":"基礎機械学習","navTitle":"機械学習"},"midMl":{"title":"中級機械学習"},"advMl":{"title":"上級機械学習"},"comingSoon":"準備中","completed":"修了","preparing":"（準備中）"},"concepts":{"sectionLabels":{"whatIs":"どのような概念か","whyImportant":"ディープラーニングでなぜ重要か","howUsed":"どのように使われるか","problemSolving":"問題を解くための説明"},"dl00":{"sectionTitle":"ディープラーニングとは？","whatIs":["**ディープラーニングは自分で学ぶ賢い計算機** — 人が一つ一つルールを決めてあげるのではなく、コンピュータがたくさんのデータを見て自分でルールを見つける方法です。脳の中の**ニューロン**が互いに信号をやり取りする様子からヒントを得て、小さな計算単位を**多くの層（レイヤー）**に厚く積み上げたので**ディープ（Deep）ラーニング**と呼びます。","**私たちの生活のあらゆる所にディープラーニングがあります** — 毎日使う**ChatGPT**や**Gemini**のような対話型AIから、カメラで道を読む**自動運転車**、自分より自分の好みをよく知る**NetflixやYouTubeの推薦システム**まで、すべてディープラーニングの成果物です。複雑な画像や声を**数字**に変え、その数字を足し、掛けながら正解を見つけるのが核心原理です。","**基礎を知れば、より強力なAIを作れます** — 作られたモデルをそのまま使うだけでなく、そのモデルを自分の目的に合わせて直し、活用するには、内部で起きている**基礎数学**を知ることが重要です。数字がどうまとまって計算されるか理解すれば、AIがなぜそんな判断をしたか明確に把握し、より良い性能を出せるようチューニングできます。","**ディープラーニングの一層がする仕事** — それぞれの層は入ってきた数字に**重み**という重要度をかけ足して次の層に渡します。層が深くなるほど、AIはデータから点と線を超えて、目・鼻・口、そして最終的には犬や猫のような**大きな特徴**を区別するようになります。このとき正解に近づくよう重みを精密に調整する指針が**勾配（グラディエント）**です。","**このコースの学習ロードマップ** — ディープラーニングは結局、効率的なかけ算と足し算の繰り返しです。**Ch01 内積**と**Ch02 行列の積**でデータが移動する基本原理を学び、**Ch03～05 人工ニューロンと活性化関数**を経て、**Ch06～10 深く広いニューラルネットの構造**を把握します。最後に**Ch11～12**で、AIが自分で学習する核心原理である勾配まで一歩ずつ習得していきます。","下の**ロードマップ**に沿って各チャプターの目標を確認してください。一歩ずつついてきていただければ、最先端のAIシステムが内部でどんな数学的言語を使っているか、自分で解釈する力が身につきます。"],"whyImportant":[],"howUsed":[],"problemSolving":[]},"dl01":{"sectionTitle":"ディープラーニングで見る内積","whatIs":["**内積**は二つのベクトルの**同じ位置の成分**を掛けてすべて足した値です。例えば [2, 3] · [4, 1] = 2×4 + 3×1 = 11 になります。","内積は二つのベクトルが**どれだけ同じ方向を向いているか**も表します。値が大きいほど**方向が近い（似ている）**、ゼロなら**直交（無関係）**、負なら**逆方向**です。類似度を一つの数で測れるのが内積の強みです。","式で書くと **a · b = a₁×b₁ + a₂×b₂ + … + aₙ×bₙ** です。内積を計算するには二つのベクトルの**要素数（次元）が同じ**でなければなりません。","実際のAIでは**数百〜数千次元**のベクトル同士の内積を計算します。コンピュータは瞬時に処理できるため、「二つの文がどれだけ似ているか」「画像とキャプションがどれだけ合うか」を**一つの数**で比較できます。"],"whyImportant":["ディープラーニングでは**一つのニューロンの出力が内積**で計算されます。重みベクトルと入力ベクトルの同じ位置を掛けて足す──これがそのニューロンの「入力への反応スコア」です。","内積はディープラーニングの**最も基本的な演算**です。**行列の積は内積を束ねたもの**であり、線形層・アテンション・埋め込み比較など、すべてが内積の繰り返しで成り立っています。","内積は**類似度の指標**としても使われます。例えばNetflixではユーザーベクトルと映画ベクトルの内積で「マッチ度」を計算します。この考え方は**コサイン類似度**とも呼ばれます。"],"howUsed":["**レコメンドシステム（Netflix・YouTube）**: ユーザーベクトルとコンテンツベクトルの内積で「このユーザーがこのコンテンツを好む度合い」を算出します。スコアが高いほどおすすめ上位に表示されます。","**検索エンジン・チャットボット**: クエリと文書をベクトルに変換し、内積（類似度）で順位をつけます。ChatGPTも質問に最も関連する情報を探すとき、同じ仕組みを使っています。","**アテンション機構**: 翻訳やチャットボットで、単語ベクトル同士の内積で「関連度スコア」を計算し、スコアが高い単語により注目して処理します。","**翻訳・要約**: 現在のトークンと他のトークンを内積で比較し関連度を得て、**文脈でどの語に注目するか**を決めます。"],"problemSolving":["**計算方法**: **同じ位置の成分**を掛けて、すべて足します。例: [1, 2, 3] · [4, 5, 6] = 1×4 + 2×5 + 3×6 = 4 + 10 + 18 = 32。","**空白の求め方**: 内積の合計と他の積が与えられている場合、分かっている積をまず合計し、全体から引いて足りない積を出します。その積を既知の要素で割れば空白が分かります。","**注意点**: 二つのベクトルの**要素数は必ず同じ**にします。また、すべてのペアを漏れなく掛けたか、一つずつチェックするとミスを防げます。","**検算**: 一つでも積を欠くと和が変わります。すべての積を出したら**もう一度足し直す**か、決まった順序で加えるとミスに気づきやすいです。"],"paragraphs":["**内積**は二つのベクトルの**同じ位置の成分**を掛けてすべて足した値です。式では a·b = a₁b₁ + a₂b₂ + … です。","ディープラーニングでは、**重みベクトル**と**入力ベクトル**の内積が**ニューロン**一つの出力になります。複数ニューロンなら**重み行列**と入力の積（**行列の積**）で一括計算でき、その各要素が内積一つに対応します。","また、内積が大きいほど二つのベクトルは**向きが近い**と解釈できるため、**アテンション**・**類似度**・**埋め込み比較**など「どれだけ似ているか」を一つの数で測るときによく使われます。"]},"dl02":{"sectionTitle":"ディープラーニングで見る行列の積","whatIs":["**行列の積**は二つの数の表（行列）を組み合わせて新しい行列を作る演算です。前の行列の**一つの行**と後の行列の**一つの列**の**内積**が、結果の**一つのマス**に入ります。","すべての**行と列の組み合わせ**について内積を求めると結果の行列が完成します。たとえば 2×3 行列と 3×2 行列の積は 2×2 の結果になります。","積が成り立つ条件は、前の行列の**列数**と後の行列の**行数**が同じであることです。この条件さえ覚えれば、掛けられるかどうかすぐ判断できます。","**なぜ行列でまとめるのか**: 複数の入力を行列に並べ、**一つの行列積**でGPUが同時に処理するためです。画像や文を**バッチ**で扱うときの基本です。"],"whyImportant":["ディープラーニングの**線形層**は入力に重み行列を掛ける演算──つまり行列の積です。ニューロンが10個なら内積10回ですが、行列の積なら**まとめて一度に**計算できます。","**GPU**は**大量の行列の積を並列処理**するよう設計されています。数百万回の掛け算が一瞬で終わるからこそ、リアルタイムの画像認識やチャットボットが実現できるのです。","ディープラーニングの**ほぼすべての演算**は行列の積に帰着します──アテンション、畳み込み、再帰ネットワークなど。行列の積を理解すればディープラーニングの骨格が分かります。"],"howUsed":["**画像認識**: 画像のピクセル値を行列に並べ、重み行列と掛けて「犬か猫か」などの特徴を抽出します。これを何層も繰り返します。","**チャットボット・翻訳**: ChatGPTやGoogle翻訳は文を数値の行列に変換し、巨大な重み行列と数十〜数百回掛け算して回答を生成します。計算の大部分が行列の積です。","**レコメンド・自動運転**: Netflixが数千ユーザーのおすすめスコアを一括計算するのも、自動運転車がカメラ映像から障害物を認識するのも、内部では大規模な行列の積が動いています。","**バッチ推論**: ユーザー–アイテムやクエリ–文書のベクトルを並べ、**一度の行列積**で多数のスコアを出します。"],"problemSolving":["**一つの要素を求める**: 結果の **(i, j)** 要素は **Aのi行**と**Bのj列**の内積です。同じ位置の成分を掛けて足します。","**空白の戦略**: 空白が結果にあれば、その行と列の内積を計算するだけです。空白がAやBにある場合は、既知の結果と他の値から逆算します。","**次元の確認**: 掛ける前にAの**列数**とBの**行数**が一致しているか確認しましょう。結果の大きさは（Aの行数）×（Bの列数）です。","**検算**: 一つの要素を誤ると行・列全体に影響します。**一行または一列**を先に全部求め、それに合わせて残りを確認するとミスに気づきやすいです。"],"paragraphs":["**行列の積**は、前の行列の**各行**と後の行列の**各列**の**内積**で結果の一要素を埋める演算です。","ディープラーニングでは**線形層**は入力ベクトルに**重み行列**を掛け、**バイアス**を足します。その掛け算が**行列の積**です。（m個のニューロン、n次元入力なら、m×n行列とn次元入力の積でm個の出力。）","**GPU**はこうした**行列の積**を大量に**並列計算**するよう最適化されているため、ディープラーニングの演算の多くが**行列の積**です。"]},"dl03":{"sectionTitle":"ディープラーニングで見る線形層","whatIs":["**線形層**は入力に**重み (W)** を掛け、**バイアス (b)** を足して出力を作ります。式は **Y = W·X + b** です。W·X の部分が行列の積、bが基準値の調整です。","成績の計算式に例えると「数学×0.3 + 理科×0.5 + 英語×0.2 + 10点」のようなものです。0.3, 0.5, 0.2 が**重み (W)**、10 が**バイアス (b)**、各教科の点数が**入力 (X)** に当たります。","一つの線形層は「各入力をどれだけ拡大・縮小し、どれだけ足すか」を決めます。出力が複数あれば、それぞれ異なる重みとバイアスで**同時に複数のスコアを計算**します。","**なぜ線形か**: 入力を定数倍すると出力もほぼ比例する関係（活性化の前）です。線形だけでは任意の曲線は描けないので、**必ず非線形の活性化**と組み合わせます。"],"whyImportant":["**ほぼすべてのディープラーニングモデル**が線形層を基本部品に使っています。ChatGPTも翻訳も画像分類も「W·X + b」を数百〜数千回繰り返します。線形層はディープラーニングの**レンガ**です。","**モデルの大きさ（パラメータ数）**は各線形層の「入力数→出力数」で決まります。大きさがモデルの**学習能力（容量）**と**過学習（訓練データの丸暗記）**のリスクを左右します。","しかし線形層だけを重ねても**一つの線形変換（直線）**と同じになります。だから線形層の後には必ず**活性化関数（曲げる関数）**を入れて、**曲線や複雑なパターン**を表現できるようにします。"],"howUsed":["**ChatGPT・翻訳**: 文を数値ベクトルに変換した後、数十〜数百の線形層を通して W·X + b と活性化を繰り返し、文脈を理解して回答を生成します。","**画像認識**: 写真から抽出した特徴ベクトルを線形層に入れて「犬スコア」「猫スコア」「鳥スコア」を同時に計算します。最後の線形層の出力がクラスごとのスコアになります。","**レコメンドシステム**: ユーザー情報と商品情報をベクトルに結合し、線形層を通して「このユーザーがこの商品を好む度合い」を算出します。層を増やすほど細やかなおすすめが可能になります。","**端末向けモデル**: パラメータを抑えるため**幅の狭い**線形層にすることがありますが、形は同じ W·X + b です。"],"problemSolving":["**式の意味**: 入力 **X** に**重み行列 W** を掛け、**バイアス b** を足すと**出力 Y**になります。**Y = W·X + b**です。下の紫の枠のように **X, W, b** が与えられ **Y** を求めるのが線形層の問題です。","**数値例**: X = [2, 1]、W = [[1,0],[1,1]]、b = [1, -1] のとき、W·X = (2, 3)。ここにバイアス b を足すと **Y = (2+1, 3-1) = [3, 2]** です。バイアスは各出力の**基準を上げたり下げたりする**はたらきをします。**Yの一要素**は **Wのその行**と **X** の内積に **bのその要素**を足した値です。","**空白の戦略**: 空白が **Y** にあればその行の W·X+b を計算。空白が **Wやb** にあれば、Y と X は分かっているので式を変形して空白を求めます。最後に **Y = W·X + b に代入して検算**しましょう。"],"paragraphs":["**線形層**は入力ベクトル x に**重み行列** W を掛け、**バイアス**ベクトル b を足して y = Wx + b を出力します。","各出力**ニューロン**は、自分の重み行と入力全体の**内積**一つで計算されます。だから**内積**・**行列の積**が線形層の基本単位です。","線形だけでは**非線形**関数を十分表現できないため、通常は線形層の後に**活性化関数**を置いて非線形性を加えます。"]},"dl04":{"sectionTitle":"ディープラーニングで見る活性化関数","whatIs":["**活性化関数**はニューロンの生の出力（重み付き和）を**特定の範囲や形**に変換する関数です。代表的なものは **ReLU**（負→0、正→そのまま）、**Sigmoid**（0〜1に圧縮）、**Tanh**（−1〜1に圧縮）です。","蛇口に例えると、水（信号）が入ってきたとき「一定以上だけ通す（ReLU）」や「強すぎれば弱める（Sigmoid・Tanh）」ように流量を調整します。この変換によって次の層に渡す出力が適切になります。","**ReLU**はシンプルで計算が速い（正ならそのまま、負なら0）ため最も人気です。**Sigmoid**は確率のような0〜1の出力が必要なとき、**Tanh**はゼロ中心の出力が欲しいときに使います。","**GELU / SiLU** は ReLU より滑らかな変形で、近年の Transformer や生成モデルでよく使われます。活性化の選び方は**学習の進み方**や精度に影響します。"],"whyImportant":["**掛けて足す（線形）操作をどれだけ重ねても、結果は掛けて足す一回と同じ**です。直線をつなげても直線にしかならないように、線形演算だけでは**曲線や複雑なパターンは絶対に表現できません**。","活性化関数が**曲がり（非線形性）**を加えます。この曲がりがあるからこそ、層を重ねて**曲線や複雑な境界**を作り出し、画像・音声・テキストのパターンを学習できるのです。","活性化関数がなければ、ネットワークがどんなに深くても**一本の直線でできることしかできません**。活性化関数はディープラーニングを「ディープ」にするための**不可欠な材料**です。"],"howUsed":["**画像認識**: 各層で W·X + b を計算した後、**ReLU**が不要な特徴（負の値）をゼロにし、有用な特徴（正の値）だけを次の層に渡して「目」「耳」「車輪」などを段階的に抽出します。","**チャットボット・翻訳**: 隠れ層で**ReLU**や**GELU**（滑らかな改良版）を非線形に使い、最終層で**Sigmoid**（はい/いいえ判定）や**Softmax**（複数候補から選択）を使って答えを出します。","**音声認識・自動運転**: 音波やカメラ映像を数値に変換し、線形＋活性化の層を何度も通して「この単語は何か」「この物体は何か」を判定します。活性化関数なしでは、このような複雑な判断は不可能です。","**画像生成**: ノイズ除去ネットワークでは各層で線形層のあと **ReLU / SiLU** などを通し、ピクセル更新を予測します。"],"problemSolving":["表でXの区間が分かればYが決まります。","関数 | 規則","ReLU | 0以下なら0、正ならXのまま","Sigmoid | 小→0、中間→0.5、大→1","Tanh₃ | 小→-1、中間→0、大→1","注意 | 区間の境界は問題の表で確認"],"paragraphs":["**活性化関数**はニューロンの線形出力（**重み付き和**）を**非線形**に変える関数です。**ReLU**、**sigmoid**、**tanh** などが代表的です。","**線形層**だけを重ねると結局一つの大きな線形変換と同じになるため、層の間に**非線形**な活性化を入れて、**深いネットワーク**が複雑なパターンを学習できるようにします。","どこにどの**活性化**を置くかは、**モデル設計**の重要な選択の一つです。"],"problemDiagramCaption":"ノードの値はReLUやσを通ると曲線的に変わります。最終層のY1, Y2, Y3がそのように出力されます。","solutionIntro":"活性化関数の問題は、Xがどの区間に入るかでYが決まります。以下はReLU、Sigmoid、Tanh₃それぞれの解き方です。","solutionRelu":"**ReLU**：X ≤ 0 → Y = 0、X > 0 → Y = X。Yが空白ならXの符号だけ見ればOK。","solutionSigmoid":"**Sigmoid**：X < -1.5 → 0、-1.5～1.5 → 0.5、X > 1.5 → 1。表・グラフでXの区間を探してそのYを書く。境界は問題の表を先に確認。","solutionTanh":"**Tanh₃**：X ≤ -1 → -1、-1 < X < 1 → 0、X ≥ 1 → 1。表でXの区間を見てY（-1, 0, 1）を入れる。境界値は問題のどちら側に含めるか確認。","solutionCaption":"問題ごとに区間の境界が異なることがあるので、必ず問題に与えられた表（またはグラフ）を先に確認してください。"},"dl05":{"sectionTitle":"ディープラーニングで見る人工ニューロン","whatIs":["**人工ニューロン**はディープラーニングの**最小の計算単位**です。やることは二つだけ: ① **重み付き和** Z = W·X + b を計算、② **活性化関数** Y = ReLU(Z) や Sigmoid(Z) を適用。","生物の神経細胞がモデルです。本物のニューロンは複数の信号を受け取り、それぞれに異なる重みをかけて合計し、一定以上なら発火します。人工ニューロンはこの仕組みを**数式で簡略化**したものです。","まとめると: **入力 (X)** → **重みとバイアス (Z = W·X + b)** → **活性化 (Y = f(Z))** → **出力 (Y)**。これが人工ニューロンのすべてです。","**一つのニューロンの出力**は次の層の**多数のニューロン**に入力され、画像や言語の大規模モデルでは**数十億個**の単位がこの連鎖を成します。"],"whyImportant":["ChatGPTや画像認識、レコメンドシステムなどのAIモデルは、こうした**ニューロンを数千〜数十億個つないで**作られています。一つのニューロンを理解すれば、**モデル全体の動きが読める**ようになります。","**学習（トレーニング）**とは各ニューロンの**重み (W) とバイアス (b)** を少しずつ調整して、出力を正解に近づけることです。WとbがYにどう影響するかを知ることが、学習の理解の鍵です。","一つのニューロンは**内積＋バイアス＋活性化**を組み合わせたもので、これまでのチャプターの**内積・行列の積・線形層・活性化関数**がすべてここに集約されます。"],"howUsed":["**日常の例え──試験合否予測**: 「数学×0.4 + 理科×0.4 + 英語×0.2 + 5 = 75」（重み付き和）を計算し、「60以上→合格(1)、未満→不合格(0)」（活性化）と判定する──これがまさに一つのニューロンの動作です。","**画像認識での一ニューロン**: 画像の特定領域のピクセルを受け取り、重み付き和＋バイアスを計算し、ReLUを通して「ここに横線があるか？」のスコアを出します。こうしたニューロンが何千個も集まって「犬か猫か」を判定します。","**チャットボット・翻訳・音声認識**: 文や音の各部分が数値に変換され、ニューロンが「どんなパターンがあるか」をスコアリングし、次の層のニューロンに渡してより複雑な意味を段階的に把握します。"],"problemSolving":["**ステップ1──重み付き和 (Z)**: Z = W·X + b を計算します。Wの行とXの内積を求めてbを足します。空白がZにあればこのステップで埋めます。","**ステップ2──活性化 (Y)**: 指定された活性化関数をZに適用します。**ReLU**: Z > 0 なら Y = Z、Z ≤ 0 なら Y = 0。**Sigmoid**: 表を見てZがどの区間に入るか確認します。","**WやbにAある空白**: YとXが分かっている場合、まず活性化を逆に戻してZを求め、そこから Z = W·X + b の式で空白を解きます。**一歩ずつ逆算する**のがコツです。"],"paragraphs":["**人工ニューロン**は入力に**重み**を掛けて足し（**重み付き和**）、**活性化関数**を適用して一つの出力を出します。","重み付き和の部分が**内積**（入力ベクトルと重みベクトルの内積）で、そのあとに**非線形**な活性化が続く構造です。","**ディープラーニングモデル**はこうした**ニューロン**を多数つなぎ、入力を出力まで複数段階で変換します。"]},"dl06":{"sectionTitle":"ディープラーニングで見るバッチ","whatIs":["**バッチ**とは**複数の入力（サンプル）を一つの表（行列）にまとめて、同じ重みで一括計算する**方式です。表の**各列が一つのサンプル**に対応します。","先生がテストを**一枚ずつ採点する**のと、**30枚を採点機に一度に入れる**のを比べてみてください。採点機の方がずっと速いですよね。バッチも同じで、GPUが多数の入力を**同時に**処理します。","ポイントは、**同じ W（重み）と b（バイアス）**がすべてのサンプルに適用されることです。サンプルごとに違うのは**入力 X** だけ。だから一回の行列の積で全サンプルの結果が出ます。","**ミニバッチ**: 学習ではデータを32〜128件などの塊に分け、順伝播・逆伝播を塊ごとに行い重みを更新します。**メモリ・速度・勾配のノイズ**のバランスを取るためです。"],"whyImportant":["**速度**: GPUは一つずつ処理するより**数千の数値を同時処理**する方が得意です。バッチにすることでGPUの性能をフルに活かし、一つずつ計算するより**数十〜数百倍速く**なります。","**学習の安定性**: サンプル1個だけで重みを更新すると**ノイズが大きい**です。**ミニバッチ**（例: 32個や64個）で勾配を平均すると、はるかに**安定して**学習が進みます。バッチサイズは学習の重要な設定です。","**メモリ管理**: 100万件のデータを一度にGPUに載せるのは不可能です（メモリが足りません！）。そこで**ミニバッチ**（例: 64個ずつ）に分けて処理し、各バッチで重みを更新する方式をとります。"],"howUsed":["**Netflix・YouTubeのレコメンド**: ユーザー一人ずつ計算する代わりに、**数千人分のデータをバッチ化**して同時にスコアを算出します。これでリアルタイム配信が可能になります。","**ChatGPT・翻訳**: 多くのユーザーが同時に質問を送ると、クエリが**バッチにまとめられて**GPU一回のパスで処理されます。数百万ユーザーに素早く回答できるのはバッチのおかげです。","**画像学習**: 10万枚の画像で学習するとき、32枚ずつのミニバッチに分けて3,125回繰り返します。各ミニバッチで Z = W·X + b を計算し、誤差（損失）を測り、重みを少し調整します。","**並列推論**: 多数の入力（画像・トークン・ユーザー）をまとめてバッチ評価し、スループットを上げます。"],"problemSolving":["**Xが複数列を持つ**: 各列が一つのサンプルです。**同じ W と b** を各列に使います。空白がある行と列を確認し、**その列の数値だけ**で計算します。","**加減算・乗算・平均の操作**: **同じ位置（同じ行・同じ列）**同士で計算します。平均（例: ゼロ中心化）は**列ごとに**平均を求めます。空白のある列の値だけを使いましょう。","**検算のコツ**: 各列は独立で、ある列の結果が別の列に影響しません。**列ごとに別々に確認**するとミスを見つけやすいです。"],"paragraphs":["**バッチ**は複数**サンプル**（入力）をまとめて**行列**として一度に渡し、同じ**重み**で一括計算する方式です。","一サンプルずつ計算するより、**行列演算**一回で複数サンプルを処理する方が**GPU**を効率よく使え、ずっと速くなります。","学習では**ミニバッチ**単位で**勾配**を求め、重みを**更新**する方式が一般的です。"]},"dl07":{"sectionTitle":"ディープラーニングで見る結合","whatIs":["**結合**とは**ある層のニューロンが次の層のニューロンにどうつながっているか**を表す構造です。各結合には**重み（数値）**があり、「この入力がこの出力にどれだけ影響するか」を決めます。","**全結合**: 前の層の**すべての**ニューロンが次の層の**すべての**ニューロンとつながります。これまで学んだ線形層（Y = W·X + b）がまさに全結合層で、Wのすべてのマスに数値があります。","**部分結合**: Wの一部が**0**、つまり「つながっていない」状態です。その入力はその出力に**影響しません**。CNNのように近くのピクセルだけをつなぐのが部分結合の典型例です。","**結合が多いほど**表現力は上がりますが**計算量・メモリ**も増えます。モバイル向けモデルは**剪枝や量子化**で結合を減らします。"],"whyImportant":["**結合の構造がモデルの性格を決めます。** 全結合はすべての入力を考慮し（情報量は多いがパラメータも多い）、部分結合は必要なものだけ見る（効率的で速いが見落としもありうる）という違いがあります。","**AIの学習とは結合の強さ（重み）を調整すること**です。「この結合を強く、あの結合を弱く」と少しずつ調整して正しい出力に近づけます。大規模モデルではこうした結合が数十億個にもなります。","**Wが0の場所**を見るとモデルが何を無視しているか分かります。学習後に0に近い重みは「重要でない情報」を示し、これを利用した**プルーニング（枝刈り）**でモデルを軽量化できます。"],"howUsed":["**画像認識（CNN）**: **部分結合**を使い、近くのピクセルだけをつなぎます。遠いピクセルは関連が薄いので、パラメータを減らして効率よく高速に処理します。","**チャットボット・翻訳（Transformer）**: **アテンション**が「どの単語がどの単語に関連するか」を判断し、データから**動的に**結合の強さを学習します。","**レコメンド・音声認識**: ユーザー特徴と商品特徴をつなぐ重みがそのままおすすめスコアになります。音声認識では各周波数帯が次の層のどの特徴とつながるかをモデルが学習します。"],"problemSolving":["**W = 0 はつながっていない**: 例えば W(2,1) = 0 なら、1番目の入力は2番目の出力に**まったく影響しません**。計算では**飛ばしてOK**です。","**一つの出力を求める**: その出力に**つながっている（W ≠ 0）**入力だけを見つけ、W × X を掛けて足し、bを加えます。0のところは掛けても0なので飛ばして同じ結果です。","**空白の戦略**: まず**Wの0の位置を確認**します。次に0でない結合だけで方程式を立てます。空白がWにあれば Y と X から逆算、空白がYにあれば W と X から順に計算します。"],"paragraphs":["**結合**は、一つの**層**の**ニューロン**が次の層のニューロンと**どのようにつながっているか**を表す構造です。","神経網では**全結合**（Fully connected）、**部分結合**（Partially connected）、**再帰・循環結合**（Recurrent）などに分類されます。全結合では層の全ニューロンが次の層の全ニューロンとつながり、通常**Linear layer**のように表されます。部分結合では一部のニューロンだけが次の層とつながります（例：CNNではフィルタごとに一部入力だけが次の層へ）。再帰結合は出力が自分自身や前のステップの入力に戻る場合を指します。","各結合には**重み（Weight）**が割り当てられ、入力信号の**影響力**を調節できます。重み行列 W の (i, j) 要素は j 番目入力から i 番目出力ニューロンへの結合の強さで、**学習**で調整されます。","ディープラーニングではこうした結合重みが数百万〜数十億個になります。Y = W·X + b で W が 0 の位置は、その入力がその出力に寄与しない**部分結合**を表します。"]},"dl08":{"sectionTitle":"ディープラーニングで見る隠れ層","whatIs":["**隠れ層**は**入力と出力の間にある中間ステージ**です。ユーザーには入力（例: 写真）と出力（例:「犬」）しか見えませんが、その間で隠れ層が**「隠れた特徴」**を作り出します。","流れは **X → Linear(W₁·X+b₁) → ReLU → H（隠れ表現）→ Linear(W₂·H+b₂) → ReLU → Y（出力）** です。Hが隠れ層の結果で、入力の「重要な特徴」が圧縮されています。","**例え**: 写真を見て「犬」と言うとき、脳の中では「色→輪郭→目・鼻・耳→犬！」という**中間的な思考ステップ**を経ています。この中間ステップが隠れ層です。隠れ層のニューロン数（幅）が多いほど、より多くの異なる特徴を捉えられます。","隠れ層が**広い**ほどその段階でより**多様な特徴**を保持でき、**深く**積み重ねるほど**より抽象**的な概念まで学べます。"],"whyImportant":["隠れ層は入力データを**段階的に要約・変換**します。**浅い層**は明るさや輪郭など単純な特徴を、**深い層**は目・車輪・文字など複雑な特徴を捉えます。","**隠れ層がなければ**、入力から直接出力への非常に単純な（線形の）関係しか表現できません。**隠れ層があるからこそ**、曲線や複数条件の組み合わせなど複雑な関係を学習できます。","**ニューロン数（幅）**と**層数（深さ）**がモデルの**表現力**を決めます。小さすぎると情報のボトルネックで性能が出ず、大きすぎると**過学習**（学習データの丸暗記）のリスクがあります。"],"howUsed":["**画像認識**: 「ピクセル→輪郭→テクスチャ→物体の部品（目・車輪）→物体全体（犬・車）」というステージがすべて隠れ層です。深い層ほど抽象的な特徴を抽出します。","**チャットボット・翻訳**: テキストを数値に変換した後、複数の隠れ層で「単語の意味→文脈→回答の方向」を段階的に精製します。ChatGPTは数十層の隠れ層（Transformerブロック）を通して回答を生成します。","**音声認識**: 「音波→周波数特徴→音素→単語→文」という変換の各ステージに隠れ層があります。"],"problemSolving":["**順番に計算**: X → (W₁·X+b₁) → ReLU → H → (W₂·H+b₂) → ReLU → Y の各ステップを**順番に**計算します。空白がHにあれば1段目の線形＋ReLUまで、空白がYにあればHを先に求めてから2段目を計算します。","**ReLUに注意**: 線形の結果（W·入力+b）が**負ならReLUで0**になります。次の層ではその値は0なので**まったく影響しません**──計算で無視できます。隠れ層の問題で頻出のポイントです。","**Wやbの空白**: 隠れ層の問題は**2段階**（線形＋活性化が2回）あります。まず空白がどの段階にあるか特定しましょう。その段階の入力と出力が分かっていれば、その段階の式だけで空白を求められます。"],"paragraphs":["**隠れ層**は**入力層**と**出力層**の間にある層です。入出力に直接現れない「隠れた」**表現**を学習します。","隠れ層の役割は入力を次第に**高レベルな特徴**（表現）に変えることです。**低い層**は単純なパターン、**高い層**はより抽象的なパターンを持ちます。","隠れ層の**ニューロン数**と**層数**がモデルの**表現力**と**容量**を決める要因です。"]},"dl09":{"sectionTitle":"ディープラーニングで見る深さ","whatIs":["**深い**とは**隠れ層（中間ステージ）がたくさんある**ことです。**ディープラーニング**の「ディープ」がまさにこの深さ！各層で線形 (W·入力+b) と活性化 (ReLU) を行い、結果を次の層に渡します。","**X → A → B → C → … → Y** とステージが多いほど深くなります。例えると: **1段階**なら「線を描く」だけ、**10段階**なら「簡単な形」、**100段階**なら「人の顔」が描けるようになります。深いほど**精密で複雑なパターン**を表現できます。","ただし深ければ良いとは限りません。層が多すぎると**勾配消失**（学習の信号が初期の層まで届かない）や**過学習**（訓練データを丸暗記してしまう）のリスクがあります。","**画像生成**モデルもノイズ除去のステージが増えるほど**深い**構造になります。**翻訳・チャット**は多数のブロックを積み**深い**アーキテクチャになります。"],"whyImportant":["**層を重ねるほど複雑な関数を表現できます。** 各層の活性化が「曲がり」を加え、何層も重ねることで**多数の曲がりを組み合わせた**非常に複雑な曲線や判断境界を作り出します。","画像認識では: **1〜2層目**で「線・輪郭」、**3〜5層目**で「目・鼻・車輪」、**6層目以降**で「犬・車」を学習します。これが可能なのは**深さ**があるからです。","**ResNet**や**Transformer**のような有名アーキテクチャは**数十〜数百層**の深さでも安定して学習できます。秘密は**スキップ接続（残差接続）**──勾配が層を飛び越えて直接初期の層に流れるため、「深さの限界」を克服できます。"],"howUsed":["**ChatGPT**: GPT-4は**数十〜数百**のTransformerブロックで構成されています。各ブロックが文脈をより深く理解し、最後の層で回答を生成します。","**自動運転**: カメラ映像が**深いネットワーク**（例: ResNet-152、152層！）を通り、多くのステージを経て障害物・車線・標識を正確に識別します。深さがあるから複雑な道路状況にも対応できます。","**音声認識・翻訳**: 音声をテキストに変換する処理や、日本語を英語に翻訳する処理も**深いネットワーク**を通して「音素→単語→文脈→意味」を段階的に捉えます。","**音声・翻訳（補足）**: 深いネットワークが低レベルから**意味**まで**段階的**に積み上げる典型例です。"],"problemSolving":["**例題**: 入力 X = [3, 1, 2]。1層目: W₁·X+b₁ = [4, -1, 2]（線形）、ReLU 後 A = [4, 0, 2]。2層目: W₂·A+b₂ = [2, 1, 5]、ReLU 後 B = [2, 1, 5]。ここで**A₂が空白**なら？","**解法**: 1層目の線形出力の2番目が -1 なので、ReLU(-1) = 0。よって**A₂ = 0**。中間層の空白は、その層の**線形 (W·入力+b)** を先に求め、**ReLU（負→0）** を適用すればよいです。","**一般に**: 空白がどの層の何番目のニューロンでも、**その層の入力**までは前から順に計算し、その層の**Wのその行**と入力の内積に**bのその要素**を足して線形値を求め、ReLU を適用すれば答えになります。"],"paragraphs":["**深い**とは**隠れ層**が多い、つまり**層数**が多い**ネットワーク**を指します。「**ディープラーニング**」の「ディープ」がこの**深さ**です。","深いほど複数段の**非線形変換**を経て**複雑な関数**を表現できますが、**学習の難しさ**・**過学習**・**計算コスト**も増えます。","**ResNet**や**Transformer**などは、深いネットワークを**安定して学習**するための**構造的な工夫**を含みます。"]},"dl10":{"sectionTitle":"ディープラーニングで見る幅","whatIs":["**幅**とは**一つの層にあるニューロンの数**のことです。ニューロンが多い（広い）ほど、その層で**より多くの特徴を同時に**表現できます。例えばニューロン1個 = 特徴1個、256個 = 256の特徴を一度に扱えます。","試験に例えると: **問題が1つだけ**なら一つの能力しか測れませんが、**100問あれば**様々な能力を一度に評価できます。広い層も同じで、**一つのステップでより多様な情報**を処理します。","層ごとに幅は異なります。例えば「1→2→4→8」と広がる構造や「256→128→64」と狭まる構造など、目的に応じて設計されます。","**大規模サーバ**向けの翻訳・チャットでは一層あたり**数千**単位の幅があることもあります。**モバイル**向けは計算・メモリ節約のため幅を狭めます。"],"whyImportant":["**深さ（層数）**と**幅（層あたりのニューロン数）**の組み合わせでモデルの**全体サイズ（パラメータ数）**が決まります。同じパラメータ数で「**深く狭い**」か「**浅く広い**」かを選べ、この選択が性能に大きく影響します。","幅が大きいほど一層で**同時に処理できる特徴が増えます**が、**計算量とメモリ**も増えます。広すぎると**過学習**（訓練データの丸暗記）のリスクもあります。","実際のモデルでは**ボトルネック**設計が人気です。入出力は狭く、中間を広くすることで**広い層で重要な特徴を抽出**し、それ以外は圧縮します。ResNetもTransformerもこの手法を使っています。"],"howUsed":["**画像認識（CNN）**: 各層の**チャネル数**（特徴マップの枚数）が幅に相当します。RGB 3チャネルから始まり、深い層では 64→128→256→512 チャネルと増え、**より多様な特徴**を抽出します。","**チャットボット・翻訳（Transformer）**: **隠れ次元**（例: 768, 1024, 4096）が各層で一度に処理する数値の数、つまり幅です。GPT-4のような大規模モデルは隠れ次元が数千と非常に広いです。","**レコメンドシステム**: 「ユーザーベクトル256次元」は幅256を意味し、年齢・好み・視聴履歴などが256の特徴に変換されて、より細やかなおすすめが可能になります。"],"problemSolving":["**層が広がっても各層の計算式は同じ**: Linear (W·入力+b) → ReLU。空白がある**層とニューロン位置**を特定し、**その層の入力**と**Wの該当行・bの該当要素**で計算します。","**Wの次元に注意**: 層の間で幅が変わると**Wのサイズも変わります**。Wは（現在の幅 × 前の層の幅）なので、空白のニューロンに対応する**行**を見つけ、前の層の出力と内積を取ってbを足します。","**層ごとに順番に**: 深さの問題と同様、**前の層の出力を先に計算**してから次の層に進みます。各層でReLU（負→0）を忘れずに適用しましょう。"],"paragraphs":["**幅**は一層にある**ニューロン**（または**チャネル**）の数です。**幅が広い層**は同じ段階でより多くの**特徴**を同時に表現できます。","**深さ**（層数）と**幅**（層あたりのニューロン数）のバランスでモデルの**容量**と**効率**が決まります。同じ**パラメータ**数でも深くするか幅を広くするか選べます。","実際のモデルでは層ごとに**幅**を変え、必要な分だけ**表現力**を増やすことが多いです。"]},"dl11":{"sectionTitle":"ディープラーニングで見るソフトマックス","whatIs":["**ソフトマックス**は**複数のスコア（数値）を確率に変換する**関数です。すべての値が**0から1の間**になり、**合計がちょうど1**になるので、確率として読めます。","式は __SOFTMAX_FORMULA__ です。**eの累乗（e ≈ 2.718）**を使うため、最も大きいスコアが**大幅に強調**され、他は相対的に小さくなります。1位と2位の差がはっきりします。","例: スコア [3, 1, 0] → e³≈20, e¹≈2.7, e⁰=1 → 合計 ≈ 23.7 → 確率 ≈ [0.84, 0.11, 0.04]。スコア3は1の3倍でしたが、確率では約8倍になります！","**なぜ指数にしてから割るのか**: スコア差を**はっきり**させ、最もありそうな選択が目立つようにするためです。"],"whyImportant":["ソフトマックスは**ほぼすべての分類モデルの最終層**で使われます。「この写真は70%犬、25%猫、5%鳥」のように**クラスごとの確率**と**モデルの確信度**が分かります。","学習時に**交差エントロピー損失**と組み合わせると、勾配が**きれいに安定して**計算されます。「正解クラスの確率を上げ、他を下げる」ようにモデルが自然に学習します。","ソフトマックスの「すべて正で合計1」という性質は**確率分布**の定義そのものです。スコアを確率に変換する**最も自然な方法**として、統計的にも理論的にも正当化されています。"],"howUsed":["**画像分類**: モデルの最終層がスコア（ロジット）[5.2, 2.1, 0.8, …] を出力し、ソフトマックスで [0.70, 0.25, 0.05, …] の**クラスごとの確率**に変換します。最も高い確率のクラスが最終回答です。","**チャットボット・翻訳**: ChatGPTが次の単語を選ぶとき、語彙（数万語！）のすべてにスコアをつけ、ソフトマックスで確率に変換し、その確率に基づいて単語をサンプリングします。高確率の単語が多く選ばれますが、時に低確率の単語も選ばれて多様性が出ます。","**アテンション機構**: 翻訳で「どの入力単語に注目するか」の関連度スコアをソフトマックスに通して確率（重み）にします。この重みで入力の**重み付き平均**を取り、最も関連する部分を強調します。","**スパムフィルタ**: スパム・非スパムの確率をソフトマックスで出し、高い方で分類します。"],"problemSolving":["**計算の順番**: ① __WEIGHTED_SUM_FORMULA__（ロジット）を求める → ② __SOFTMAX_EXP__ を計算（問題では __E_APPROX_3__）→ ③ __SOFTMAX_SUM__（合計）= すべての__SOFTMAX_EXP__を足す → ④ __SOFTMAX_Y_DIV__（各値を合計で割る）。この順番で進めます。","**空白の求め方**: Yが空白なら「その__SOFTMAX_EXP_DIV_SUM__」を計算。__SOFTMAX_EXP__が空白なら「__Y_TIMES_SUM__」。Zが空白なら__SOFTMAX_EXP__から逆算。__SOFTMAX_SUM__が空白ならすべての__SOFTMAX_EXP__を足すだけです。","**検算**: 計算後、すべてのYが**0から1の間**で**合計が1**になっているか確認しましょう。なっていなければ計算ミスです。また、問題が __E_APPROX_3__ を使うのか __E_APPROX_2718__ を使うのかも確認してください。"],"paragraphs":{"0":"**ソフトマックス**は実数ベクトルを**0〜1**の値にし、**合計が1**になるようにする関数です。**確率分布**として解釈します。","1":"**分類**では最後の層の出力にソフトマックスをかけると**クラス**ごとの**確率**になり、通常は**交差エントロピー損失**と組み合わせます。","2":"式は __SOFTMAX_FORMULA__ で、**指数**により最大値が**強調**されます。"}},"dl12":{"sectionTitle":"ディープラーニングで見る勾配","whatIs":["**勾配**は「**重み（パラメータ）を少し変えたとき、損失（誤差）がどれだけ・どの方向に変わるか**」を教えてくれます。「誤差を減らすにはどちらに進めばいいか」を指す**コンパス**だと考えてください。","**例え**: 目隠しをして山を下ることを想像してください。足元の**傾き（勾配）**を感じて、下り坂の方向に一歩踏み出します。**勾配の逆方向**に進むと谷底（損失の最小値）にたどり着けます。これが**勾配降下法**です。","**誤差逆伝播**は勾配を**出力から入力に向かって一層ずつ逆に**伝えていく手法です。微分の**連鎖律**を使い、すべての層のすべての重みの勾配を**一回のパスで**効率的に計算します。","**順伝播**は入力から出力へ、**逆伝播**は損失からの勾配を入力側へ返します。学習はこの二つを交互に繰り返します。"],"whyImportant":["**AIの学習 = 勾配を見て重みを更新すること**です。勾配がなければ「どの方向に調整すればいいか」が分からず、**学習そのものが不可能**です。勾配はディープラーニングの学習の**心臓部**です。","**学習率**は「一歩でどれだけ進むか」を制御します。大きすぎると谷を飛び越え（発散）、小さすぎると到達に時間がかかります。**Adam**などのオプティマイザは勾配の大きさに応じて**ステップ幅を自動調整**します。","勾配が**大きすぎる（勾配爆発）**と学習が不安定になり、**小さすぎる（勾配消失）**と初期の層がほとんど学習しません。**勾配クリッピング**・**バッチ正規化**・**スキップ接続**などの技術でこれを防ぎます。"],"howUsed":["**すべてのAIモデル**: ChatGPT、画像認識、レコメンドシステム──**すべてのモデル**が勾配を計算して重みを更新します。順伝播→損失計算→逆伝播で勾配→重み更新。この4ステップを数百万回繰り返すのが学習です。","**順伝播と逆伝播**: 順伝播は Z = W·X を**前方向**に計算し、逆伝播は勾配 dW, dX を**逆方向**に伝えます。常にペアで動作します。","**ファインチューニング**: ChatGPTを特定の用途に適応させるとき、新しいデータで勾配を計算して重みを少し調整します。勾配のおかげで**事前学習済みモデル**を素早く新しい目的に適応させられます。"],"problemSolving":["**問題の形**: 式は**順伝播 Z = W·X**か**逆伝播 dZ = dW·X**のどちらかです。空白(?)は**Xの一成分**か**Z（またはdZ）の一成分**のどれか一つだけです。WとdWはすべて与えられています。","**順伝播(Z = W·X)**: Zの一成分 = **Wのその行**と**X**の内積です。空白が**Z**なら、その行のWとXを掛けて足します。空白が**X**なら、他のZとWの行から式を立ててそのX成分を求めます。","**逆伝播(dZ = dW·X)**: **順伝播と同じ計算**です。dZの一成分 = **dWのその行**と**X**の内積。空白が**dZ**ならdWのその行とXの内積、空白が**X**なら式からそのX成分を求めます。"],"paragraphs":["**勾配**は**損失関数**を各**パラメータ**で**偏微分**したベクトルです。「パラメータを少し変えたとき損失がどれだけ・どの**方向**に変わるか」を表します。","ディープラーニングの**学習**は通常「勾配の**逆方向**にパラメータを少しずつ動かして**損失**を減らす」方式（**勾配降下法**）です。勾配は**逆伝播**で効率的に計算します。","**学習率**・**オプティマイザ**・**勾配クリッピング**などは、この勾配の使い方を決める**重要な設定**です。"]},"dl13":{"sectionTitle":"全体のまとめ","whatIs":["下の図は**Ch01〜Ch12**の内容を**一つのネットワーク**にまとめたものです。入力 X → 隠れ層(A,B,C,D) → 出力 Y、その間に**重み(W)**・**活性化(ReLU等)**・**バッチ**・**勾配(∇)**がどう付くかが分かります。","実際の学習は**順伝播**（計算）→**損失**→**逆伝播**（勾配）→**重み更新**の繰り返しです。このコースを終えると、その流れを計算で追えるようになります。"],"whyImportant":[],"howUsed":[],"problemSolving":[]}},"kimpoMdooai":{"layoutEyebrow":"金浦市・延世大学 AI・SW 教育課程アイデア公募展","layoutTitle":"金浦「AIで金浦を読む」教育ページ","layoutLearnCta":"みんなのAIへ","layoutNavAria":"金浦プログラムページの移動","navPromo":"プラットフォーム紹介","navCourse":"教育課程紹介","promoMetaTitle":"金浦AI教育提案","promoMetaDescription":"みんなのAIを活用し、金浦市の地域データを数学・ディープラーニング・機械学習教育へつなぐ紹介ページです。","promoPosterAlt":"金浦市・延世大学 AI・SW 教育課程アイデア公募展ポスター","promoBadge":"みんなのAI活用教育提案","promoTitle":"金浦の実際の課題をデータで読み、AIで解いてみる授業","promoDescription":"みんなのAIは基礎数学、ディープラーニング、機械学習を一つの流れとして学べるように設計されています。この提案では、金浦の人口・交通・環境・商圏データを用いて、生徒が地域課題を自分で定義し、AIで分析する経験を作ります。","promoFormulaTitle":"グローバルAI学習プラットフォーム紹介","promoFormulaDescription":"みんなのAIは、世界の多様な国のAI研究者・開発者が活用するグローバル学習プラットフォームです。","promoPlatformGeneralDescription":"アクティブユーザーは500人以上で、基礎学習から実務活用まで広いAI学習コミュニティを形成しています。","promoPrimaryCta":"16回の教育課程を見る","promoSecondaryCta":"みんなのAIを開く","overviewAudienceLabel":"対象","overviewSessionsLabel":"授業規模","overviewFormatLabel":"授業形式","overviewRegionLabel":"地域連携","overviewPlatformLabel":"中核プラットフォーム","overviewEnrollmentLabel":"推奨人数","strengthsEyebrow":"Why Everyone's AI","strengthsTitle":"なぜみんなのAI を中心プラットフォームにするのか","strengthsDescription":"単なる体験型ツールではなく、数学的理解とデータに基づく問題解決を同時に育てる教育の流れが必要でした。","bestChoiceEyebrow":"Best Choice Evidence","bestChoiceTitle":"なぜみんなのAI が AI・SW 教育の最適解なのか","bestChoiceDescription":"教育効果と学校現場での運用適合性の両面から、mdooaiを選ぶ理由を整理しています。","bestWhyLabel":"選定理由","bestSchoolFitLabel":"学校現場適合","bestQuoteLabel":"原文キーフレーズ","flowEyebrow":"Learning Flow","flowTitle":"生徒がたどる学習の流れ","outcomesEyebrow":"Learning Outcomes","outcomesTitle":"この授業で得られる変化","toolsEyebrow":"Platform Stack","toolsTitle":"学校現場ですぐ使えるツール構成","toolsDescription":"ブラウザ学習、公開データ、Colab 実習を組み合わせ、インストールなしで授業からプロジェクトまで運営できます。","toolsCta":"教育課程の詳細を見る","courseMetaTitle":"金浦AI教育課程紹介","courseMetaDescription":"みんなのAIベースの16回授業と金浦地域課題データ連携をまとめた教育課程紹介ページです。","courseBadge":"Course Overview","courseTitle":"金浦データで完成する16回の AI・SW 教育課程","courseDescription":"基礎数学、基礎ディープラーニング、基礎機械学習、チームプロジェクトを一つにつなぎ、生徒が都市課題をデータ課題に変換して説明できるように設計しました。下の詳細カリキュラム本文は原案に合わせて韓国語のまま掲載しています。","coursePosterAlt":"金浦AI教育公募展ポスター","coursePosterEyebrow":"Contest Context","coursePosterDescription":"このページは公募提出用のWeb教材として構成し、ポスターと同じトーンで発表資料のように読めるよう設計しています。","goalsTitle":"授業目標","materialsTitle":"運営準備と使用ツール","materialsLabel":"準備物","toolsLabel":"主要プラットフォーム","quickStartEyebrow":"Quick Start","quickStartTitle":"すぐに学習を始める","quickStartDescription":"授業をすぐ開始できるよう、みんなのAI主要チャプターへの直リンクを用意しました。","quickMath":"基礎数学を始める","quickDl":"基礎ディープラーニングを始める","quickMl":"基礎機械学習を始める","quickMidMath":"中級数学","quickMidDl":"中級ディープラーニング","quickMidMl":"中級機械学習","quickAdvMath":"上級数学","quickAdvDl":"上級ディープラーニング","quickAdvMl":"上級機械学習","phaseEyebrow":"4 Learning Stages","phaseTitle":"16回運営ロードマップ","phaseDescription":"基礎理解 → ディープラーニング構造化 → 機械学習適用 → 地域課題解決の4段階で学習が積み上がる設計です。","phaseOutputLabel":"成果物","assessmentEyebrow":"Assessment Design","assessmentTitle":"評価計画と方法","assessmentDescription":"正答率だけでなく、学習プロセス、説明力、倫理認識、協働態度まで評価に反映します。","curriculumEyebrow":"16 Sessions","curriculumTitle":"回ごとの授業構成","curriculumDescription":"各回の学習テーマ、使用ツール、到達目標、金浦との接続をひと目で見られるよう整理しました。","tableSession":"回","tableTopic":"テーマ","tableSummary":"主な内容","tableMaterials":"資料・ツール","tableAchievement":"到達目標","tableKimpoConnection":"金浦との接続","courseChapterCta":"該当チャプターへ移動","track":{"math":"基礎数学","dl":"基礎ディープラーニング","ml":"基礎機械学習","project":"プロジェクト"},"issueEyebrow":"Kimpo Issues","issueTitle":"金浦の地域課題とデータ連携","issueDescription":"抽象的なAI体験ではなく、金浦の実際の課題を公開データで読み解く授業として設計しています。","issueTableArea":"課題分野","issueTableDetail":"内容","issueTableDataSource":"データ出典","issueTableLinkedSessions":"関連回","finalOutcomeTitle":"最終成果物と期待効果","courseBackCta":"プラットフォーム紹介へ戻る","courseLearnCta":"みんなのAIを開く"},"locale":{"ko":"韓国語","ja":"日本語","en":"英語","zh":"中国語"},"chapters":{"dl00":{"chapter":"Chapter 00","title":"ディープラーニングの第一歩：AIはどう考える？","description":"ディープラーニングとは何か、Ch01〜Ch12で何を学ぶか、ひと目で把握します。"},"dl01":{"chapter":"Chapter 01","title":"ベクトル内積：データの似ているところを見つける","description":"二つのベクトルの向きと大きさを掛け合わせ、一つの値で表す最も基本的な演算。"},"dl02":{"chapter":"Chapter 02","title":"行列の積：一度に計算する魔法","description":"二つの行列の積は、前の行列の行と後の行列の列の内積で埋まった新しい行列。"},"dl03":{"chapter":"Chapter 03","title":"線形層：重要度を決める重み","description":"線形層（線形変換層）。入力に重み行列を掛け、バイアスを足す層。"},"dl04":{"chapter":"Chapter 04","title":"活性化関数：AIに判断力を足す","description":"活性化関数。ニューロンの出力を非線形にする関数。"},"dl05":{"chapter":"Chapter 05","title":"人工ニューロン：情報を集め信号を送る単位","description":"人工ニューロン。入力を受け、重み付き和を計算し、活性化関数を適用する単位。"},"dl06":{"chapter":"Chapter 06","title":"バッチ処理：まとめて一度に学習","description":"バッチ。複数サンプルをまとめて一度に計算する単位。"},"dl07":{"chapter":"Chapter 07","title":"重み付き結合：知性を作る無数の鎖","description":"結合。層と層、ニューロンとニューロン間の重み付き接続。"},"dl08":{"chapter":"Chapter 08","title":"隠れ層：見えない思考の深さ","description":"隠れ。入出力層の間にある層。"},"dl09":{"chapter":"Chapter 09","title":"深いネットワーク：より複雑な問題を解く力","description":"深さ。隠れ層が多いネットワークを深いネットワークという。"},"dl10":{"chapter":"Chapter 10","title":"幅とニューロン：一度に多くの特徴を見つける","description":"幅。一層のニューロン数が多いことを幅の広い層という。"},"dl11":{"chapter":"Chapter 11","title":"ソフトマックス：結果を確信に変える","description":"ソフトマックス（確率分布化）。出力を0〜1にし、和が1になるようにする。"},"dl12":{"chapter":"Chapter 12","title":"勾配と逆伝播：失敗から学ぶ","description":"勾配。損失を減らすためパラメータをどの方向に動かすか示す。"},"dl13":{"chapter":"Chapter 13","title":"総まとめ：ひと目で見るAIマップ","description":"Ch01〜Ch12で学んだ内容を一つのネットワーク図にまとめて確認できます。"}},"midMathChapters":{"midMath00":{"chapter":"Chapter 00","title":"中級数学とAI：多変数空間と不確実性の拡張"},"midMath01":{"chapter":"Chapter 01","title":"ベクトルとベクトル空間：スカラーを超えた大きさと向き"},"midMath02":{"chapter":"Chapter 02","title":"ベクトルの内積と射影：データ間の角度と類似度"},"midMath03":{"chapter":"Chapter 03","title":"行列とデータのまとめ：複数ベクトルの構造的表現"},"midMath04":{"chapter":"Chapter 04","title":"行列の積と線形変換：空間を操作する数学"},"midMath05":{"chapter":"Chapter 05","title":"逆行列と行列式：変換の逆演算と空間の体積変化"},"midMath06":{"chapter":"Chapter 06","title":"線形独立とランク：データの重複と実質的な次元"},"midMath07":{"chapter":"Chapter 07","title":"固有値と固有ベクトル：変換で変わらない中心軸"},"midMath08":{"chapter":"Chapter 08","title":"方向微分と勾配：多次元空間で最も急な傾き"},"midMath09":{"chapter":"Chapter 09","title":"ヤコビ行列：多変数ベクトル関数の1次微分"},"midMath10":{"chapter":"Chapter 10","title":"ヘッセ行列：2次微分と曲面の曲率"},"midMath11":{"chapter":"Chapter 11","title":"テイラー級数：多項式による複雑な関数の近似"},"midMath12":{"chapter":"Chapter 12","title":"凸最適化：最小値探索の条件"},"midMath13":{"chapter":"Chapter 13","title":"条件付き確率と従属性：変数間の確率的関係"},"midMath14":{"chapter":"Chapter 14","title":"ベイズの定理：観測データによる確率の更新"},"midMath15":{"chapter":"Chapter 15","title":"共分散と相関係数：2変数間の線形関連の測定"},"midMath16":{"chapter":"Chapter 16","title":"多変量正規分布：多変数の結合確率モデル"},"midMath17":{"chapter":"Chapter 17","title":"最尤推定（MLE）：観測結果からパラメータを逆推定"},"midMath18":{"chapter":"Chapter 18","title":"エントロピー：情報理論に基づく不確実性の定量化"},"midMath19":{"chapter":"Chapter 19","title":"クロスエントロピーとKLダイバージェンス：2つの確率分布の差"},"midMath20":{"chapter":"Chapter 20","title":"中級数学総まとめ：線形代数と確率論の結合"}},"midMathCh00":{"chapter":"Chapter 00","title":"中級数学とAI：もう一歩深く理解する","description":"中級数学は、AIが計算するときに使う「言語」をより正確にする学びです。データを単なる数として扱うのではなく、**ベクトル**や**行列**として捉え、それらの間をつなぐ**線形変換**のルールを学びます。さらに、学習の振る舞いを**ヤコビアン**（多変数の変化の大きさ）と**ヘッセ**（曲率情報）で読み解き、学習が速くなったり遅くなったりする理由を理解できるようにします。","sectionTitle":"ベクトル・行列・感度：中級数学がAIを説明する方法","sectionLabels":{"whatIs":"どんな概念か","whyImportant":"なぜ重要か","howUsed":"どう使うか","problemSolving":"問題の読み方"},"whatIs":{"0":"**ベクトル空間**は、データを「**方向**と**大きさ**」で表すための枠組みです。たとえば画像は、学習された特徴の座標として表せます。","1":"**行列**はベクトルをまとめて変換する道具で、特に**線形変換**は座標の変化が一貫した規則として表せます。だからこそニューラルネットの各層が数学的に説明できます。","2":"**ヤコビアン**と**ヘッセ**は「感度」を数値で示す地図です。ヤコビアンは「入力が変わると出力はどれくらい変わるか」を、ヘッセは損失の地形がどれくらい曲がっているかを表します。"},"whyImportant":{"0":"学習は本質的に反復計算で誤差を減らします。その理由を理解するには、多変数の変化（勾配・感度）が必要で、中級数学がその土台になります。","1":"線形代数は表現（表せる形）を読み解く力をくれます。埋め込み（embedding）や成分分析など多くの考えが「ベクトルをどう並べ替えるか」に帰着します。","2":"**ヘッセ**を理解すると、なぜある場所で学習が遅くなり、別の場所では速くなるのかが見えてきます。さらに2階情報は、ニュートン法や信頼領域など最適化の考え方の核です。"},"howUsed":{"0":"**順伝播**では、入力ベクトルが行列の積や線形規則を通じて変換されます。どの特徴が強調され、どれが抑えられるかが数学として見えます。","1":"**逆伝播**では、変化の伝わり方を追う必要があり、その役割をヤコビアンが担います。連鎖律は、微小な変化が出力にどう届くかを整理する言語です。","2":"最適化では曲率情報（ヘッセ）で更新の安定性を高められます。ヘッセは損失の地形が「平らか」「急か」を教えてくれます。"},"problemSolving":{"0":"| 分類 | AIでの役割 | 中級数学の概念 |\n| --- | --- | --- |\n| **類似度と方向** | 似た特徴を近づけ、違う特徴を遠ざける | 内積、射影 |\n| **層の働き** | 1つの層がベクトルをどう変えるか | 行列、線形変換 |\n| **感度（変化量）** | 入力が変わると出力はどう変わるか | ヤコビアン、勾配 |\n| **学習の曲率** | 最適化の進み方の速さ | ヘッセ、固有値 |\n| **不確実性の言語** | 複数変数の一緒の動き | 共分散、多変量正規 |"}},"midMathCh01":{"chapter":"Chapter 01","title":"ベクトルとベクトル空間: 大きさと向きを一度に","description":"ベクトルは「数の束」であると同時に、**大きさと向き**を一度に表す対象です。機械学習では1サンプルが特徴ベクトル $\\mathbf x$ になり、深層学習では埋め込みや重みもベクトルです。本章では $\\mathbb R^n$ でベクトルを扱う共通語を身につけ、次章の**内積**へつなげます。","sectionTitle":"ベクトルとベクトル空間: 大きさと向きを一度に","sectionLabels":{"whatIs":"どんな概念か","whyImportant":"なぜ重要か","howUsed":"どう使うか","problemSolving":"解法の手引き"},"visualShort":"ベクトル: 成分 · 大きさ · 向き · $\\mathbb R^n$","visualIntro":"入力は成分 $(v_x,v_y)$。スカラー倍 $k\\mathbf v$ と和 $\\mathbf u+\\mathbf v$ は**成分ごと**に計算します。$\\mathbb R^n$ は実成分が $n$ 個あるすべてのベクトルの空間で、次元は $n$ です。","visualStep1":"データ·パラメータ → ベクトル $\\mathbf v\\in\\mathbb R^n$","visualStep2":"スカラー倍 $k\\mathbf v$、和 $\\mathbf u+\\mathbf v$（成分ごと）","visualStep3":"空間 $\\mathbb R^n$: 次元 $n$、成分 $n$ 個","visualStepsLabel":"見る順番","whatIs":{"intro":"**ベクトルとは？** 順序付きの数の列 $\\mathbf v=(v_1,\\ldots,v_n)$ であり、幾何的には大きさと向きを持つ矢印として描けます。関数の入力が複数の実数のとき、それを一つのベクトルにまとめると表記が簡潔になります。","plain":"「東に3 km、北に4 km」のように、向きと距離が同時に現れます。座標平面では一本の矢印—これが2次元ベクトルの直感です。成分 $(3,4)$、長さは $\\sqrt{3^2+4^2}$。","definition":"より正確には、**実ベクトル空間** $\\mathbb R^n$ の元は $n$ 個の実成分を持つベクトルです。**和**は成分ごと、**スカラー倍**は各成分に実数を掛けます。**零ベクトル** $\\mathbf 0$ は成分がすべて0。**ノルム**は通常 $\\|\\mathbf v\\|=\\sqrt{\\sum_i v_i^2}$。演習では $\\|\\mathbf v\\|^2$ を整数で扱うことがあります。","inAI":"教師あり学習では特徴が $\\mathbf x\\in\\mathbb R^d$、線形モデルの重みも $\\mathbf w\\in\\mathbb R^d$ です。深層ネットでは内積と行列が積み重なる第一歩が本章です。**Ch.10 ヘッセ**では同じベクトル空間上の**2階微分（曲率）**を読みます。"},"whyImportant":{"bridge":"基礎の「関数·連続」はここで**複数入力を一つのベクトルにまとめる習慣**へつながります。MLの特徴·距離·分類、DLの内積·行列積はすべて**ベクトル言語**の上にあります。","language":"「同じ次元同士だけ足す」「スカラー倍は各成分に同じ規則」—これが**ベクトル空間の構造**です。慣れておくと、独立性·基底·ランク·固有値が楽になります。"},"howUsed":{"features":"**特徴ベクトル**: 表の1行を $\\mathbf x$ にすると前処理·正規化·距離がベクトル演算になります。**kNN·クラスタリング**では差のノルムがよく使われます。","dlWeights":"**深層学習**: 1ニューロンは入力と重みベクトルの内積（次章）+バイアス+活性化。埋め込みも「意味空間」のベクトルです。**ベクトル=AIが世界を読む最小の束**。"},"summary":"**まとめると**、ベクトルは幾何（向き·大きさ）と代数（成分）を同時に与え、$\\mathbb R^n$ は $n$ 次元実ベクトル全体の空間です。和·スカラー倍は成分ごと。その上に内積·行列·微分が載ります。**Ch.02** では「似ている度合い」を数にします。","problemSolving":{"focus":"表は**式と記号**の要約、続く**項目ごとの補足**で定義の理由を示します。**例題**では代表的な型の手順を示します。","examplesHeading":"例題","examplesTable":"$20"},"problemSolvingLabel":"解法の手引き","problemSolvingTable":"$21","visualFlowTitle":"学習の流れ","visualFlowStep0":"概念: ベクトル·成分·$\\mathbb R^n$","visualFlowStep1":"直感: 矢印（向き·長さ）","visualFlowStep2":"式: 和·スカラー倍·ノルム·内積","visualFlowStep3":"応用: 特徴·埋め込み·重み","visualArrowTitle":"ベクトル = 向き + 大きさ","visualComponentTitle":"同じ向き · 長さ k 倍","visualAriaLabel":"ベクトルの和とスカラー倍の図。左は u, v と和 u+v。右は同じ直線上の基準 u と k 倍の u。","visualLegendGray":"基準 u","visualLegendBlue":"k·u","visualRnLabel":"$$\\mathbb R^2$ で閉じる","problemPromptIntro":"問題を読み、ベクトル演算の結果を整数で入力してください。","promptDefinition":"説明が**正しい**ときは**1**、**誤り**のときは**0**を選んでください。","promptDefinitionChoice":"下の（ア）（イ）（ウ）のうち正しいものを選んでください。","promptMagnitudeSquared2D":"$$\\mathbf v=({vx},{vy})$ のとき $\\|\\mathbf v\\|^2$（整数）は？","promptDotProduct2D":"$$\\mathbf u=({ux},{uy})$, $\\mathbf v=({vx},{vy})$ のとき $\\mathbf u\\cdot\\mathbf v$（整数）は？","promptSumComponent2D":"$$\\mathbf u=({ux},{uy})$, $\\mathbf v=({vx},{vy})$ のとき $(\\mathbf u+\\mathbf v)_{axis}$ の値（整数）は？（成分: {axis}）","promptScalarMultComponent2D":"$$\\mathbf u=({ux},{uy})$ のとき $({k}\\mathbf u)_{axis}$ の値（整数）は？（成分: {axis}）","promptDimensionRn":"$$\\mathbb R^{n}$ の次元（整数）は？ ($n={n}$)","promptNumComponentsRn":"$$\\mathbb R^{n}$ ベクトルの成分の個数（整数）は？ ($n={n}$)","promptCrossZ2D":"$$\\mathbf u=({ux},{uy})$, $\\mathbf v=({vx},{vy})$ のとき $u_x v_y - u_y v_x$（整数）は？","promptNormMinusSquared2D":"$$\\mathbf u=({ux},{uy})$, $\\mathbf v=({vx},{vy})$ のとき $\\|\\mathbf u\\|^2-\\|\\mathbf v\\|^2$（整数）は？","promptDefault":"下の選択肢から正解を選んでください。","mcDefChoice1":"（ア）","mcDefChoice2":"（イ）","mcDefChoice3":"（ウ）","mcDefChoice4":"（エ）(ア)〜(ウ)のどれも正しくない","definitionStatements":{"0":"ベクトルは大きさと向きを持ち、成分で表せる。","1":"$$\\mathbb R^n$ のベクトルは $n$ 個の実成分を持つ。","2":"同じ次元の二つのベクトルの和は成分ごとに定義される。","3":"スカラー倍 $k\\mathbf v$ は $\\mathbf v$ の各成分に $k$ を掛けたものである。","4":"零ベクトルはすべての成分が 0 である。","5":"ベクトル空間は和とスカラー倍について閉じている必要がある。","6":"$$\\mathbb R^2$ は実数体上で次元 2 のベクトル空間である。","7":"一方のベクトルが他方の実数倍なら、二つのベクトルは原点を通る同一直線上にある。","10":"ユークリッドノルム $\\|\\mathbf v\\|$ は負になりうる。","11":"$$\\mathbb R^3$ の次元は 2 である。","12":"異なる次元の二つのベクトルに対して和 $\\mathbf u+\\mathbf v$ を定義できる。","13":"ベクトルの和は結合律 $(\\mathbf u+\\mathbf v)+\\mathbf w=\\mathbf u+(\\mathbf v+\\mathbf w)$ を満たさない。","14":"実ベクトルの内積 $\\mathbf u\\cdot\\mathbf v$ の結果は常にベクトルである。"},"definitionChoiceQuestions":{"0":"(ア) $4$\n(イ) $5$\n(ウ) $6$\n\n問：$\\mathbb R^5$ の次元は？","1":"(ア) $2$\n(イ) $3$\n(ウ) $1$\n\n問：$\\mathbb R^2$ の次元は？","2":"(ア) $16$\n(イ) $25$\n(ウ) $9$\n\n問：$\\mathbf v=(3,4)$ のとき $\\|\\mathbf v\\|^2$ は？","3":"(ア) $3$\n(イ) $2$\n(ウ) $5$\n\n問：$(2\\mathbf e_1+3\\mathbf e_2)$ の $y$ 成分は？ ($\\mathbf e_1=(1,0),\\mathbf e_2=(0,1)$)","4":"(ア) 常に $\\mathbf v$\n(イ) 常に零ベクトル\n(ウ) 定義できない\n\n問：$k=0$ のとき $k\\mathbf v$ は？","5":"(ア) 平行\n(イ) 直交\n(ウ) 等しい\n\n問：$\\mathbf u\\cdot\\mathbf v=0$ のとき、よく言う関係は？","6":"(ア) $n-1$\n(イ) $n$\n(ウ) $2n$\n\n問：$\\mathbb R^n$ ベクトルの成分の個数は？","7":"(ア) $5$\n(イ) $4$\n(ウ) $3$\n\n問：$(1,2)+(3,4)$ の $x$ 成分は？"}},"midMathCh02":{"chapter":"Chapter 02","title":"ベクトルの内積と正射影：似ている度合いを数値で測る","description":"**内積（ドット積）**は、2つのベクトルが「どれだけ同じ向きを向いているか」を**ひとつの数**にまとめます。**正射影**は、あるベクトルを別のベクトルが張る直線（または部分空間）へ**影のように**移した結果です。Ch.01の $\\mathbb{R}^n$ を土台に、**類似・角度・距離**を内積の言葉で読む訓練をし、機械学習・深層学習の**類似度・アテンション・線形層**へつなげます。","sectionTitle":"ベクトルの内積と正射影：似ている度合いを数値で測る","sectionLabels":{"whatIs":"概念の説明","whyImportant":"なぜ重要か","howUsed":"どう使うか","problemSolving":"問題の解き方"},"visualShort":"内積 · 角度 · 正射影 · コサイン類似度","visualIntro":"2つの矢印 $\\mathbf{u},\\mathbf{v}$ について、内積 $\\mathbf{u}\\cdot\\mathbf{v}$ は長さと角を同時に反映します。$\\mathbf{v}$ を $\\mathbf{u}$ の上に落とした「影」が正射影 $\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$ で、残差 $\\mathbf{v}-\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$ は $\\mathbf{u}$ と**直交**します。","visualStep1":"概念：$\\mathbf{u}\\cdot\\mathbf{v}=\\sum_i u_i v_i=\\|\\mathbf{u}\\|\\|\\mathbf{v}\\|\\cos\\theta$","visualStep2":"直感：同じ向きなら正、直交なら0、逆向きなら負","visualStep3":"正射影：$\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}=\\frac{\\mathbf{u}\\cdot\\mathbf{v}}{\\mathbf{u}\\cdot\\mathbf{u}}\\mathbf{u}$","visualStep4":"応用：埋め込み類似度、線形層、最小二乗の射影解釈","visualStepsLabel":"見る順番","visualFlowTitle":"学習の流れ","visualFlowStep0":"概念：内積・角・直交","visualFlowStep1":"直感：影（正射影）・残差","visualFlowStep2":"式：射影・コサイン・ピタゴラス","visualFlowStep3":"応用：推薦・深層の層・次元削減","dotVisualAriaLabel":"内積・正射影・コサイン類似度：回転するベクトルと数値パネル","dotVisualMainTitle":"v が回ると似度スコアが変わる","dotVisualPlotTitle":"座標平面：u, v, 正射影","dotVisualMetricsTitle":"方向・類似度・数値","dotVisualHudDot":"内積 u·v","dotVisualHudCos":"cos θ（方向）","dotVisualHudProj":"|proj| / |v|","dotVisualLegendU":"基準 u","dotVisualLegendV":"回転 v","dotVisualLegendProj":"影","dotVisualLegendRes":"残差 ⊥ u","dotVisualInsetLabel":"方向","dotVisualCaption":"**緑のベクトル** $v$ が一周すると **$\\theta$** が変わり、**琥珀色の影（正射影）**の長さと **内積**・$\\cos\\theta$ が連動します。**同じ向き**に近いほど **内積**は大きく、**直交**で $0$、**反対向き**で **負**になります。小さい円は $v$ の **方向**だけを切り出した図です。","whatIs":{"intro":"**内積**は「同じ位置の成分どうしを掛けて足す」という **Ch.01 の成分表現**をひとつの値にまとめたものです。幾何的には長さ2つと角 $\\theta$ を含む $\\|\\mathbf{u}\\|\\|\\mathbf{v}\\|\\cos\\theta$ で、**正射影**は内積を基準方向の長さで割って得る**影のベクトル**です。","plain":"直感的には、**どれだけ同じ向きか**を数で表したものが内積です。同じ向きなら大きな正、直交なら0、反対向きなら負になります。正射影は懐中電灯で壁にできる**影**を想像してください。","definition":"次の式が中心です。\n\n1. **内積**：$\\mathbf{u} \\cdot \\mathbf{v} = \\|\\mathbf{u}\\|\\|\\mathbf{v}\\|\\cos\\theta$（2つのベクトルの長さと、その間の角 $\\theta$ を使う表し方）\n2. **コサイン類似度**：$\\cos\\theta = \\frac{\\mathbf{u} \\cdot \\mathbf{v}}{\\|\\mathbf{u}\\|\\|\\mathbf{v}\\|}$（大きさが違っても**向きの似かた**だけを比べたいとき）\n3. **正射影**：$\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$（基準ベクトル $\\mathbf{u}$ の向きへ、$\\mathbf{v}$ を落とした**影**）\n4. **単位ベクトル**：$\\mathbf{\\hat{u}}$ の**ハット（^）**は「**向き**を強調する」記号としてよく使われます。**単位ベクトル**は**長さが 1** の矢印（$\\|\\mathbf{\\hat{u}}\\|=1$）なので、**長さは決まりきっていて、どちらを向くか**だけが残ります。そこで $\\mathbf{v}$ を $\\mathbf{\\hat{u}}$ 上に落とした影（正射影）は、$(\\mathbf{v}\\cdot\\mathbf{\\hat{u}})\\,\\mathbf{\\hat{u}}$ と**一気に**書けます。$\\mathbf{v}\\cdot\\mathbf{\\hat{u}}$ は「$\\mathbf{v}$ がその向きに**どれだけそろっているか**」を一つの数で表すスコアで、影の**実際の長さ**はその大きさ、すなわち $|\\mathbf{v}\\cdot\\mathbf{\\hat{u}}|$ です。（負なら逆向きの意味で、長さだけ見るときは絶対値を使います。）\n\nここで $\\|\\mathbf{u}\\|$ と $\\|\\mathbf{v}\\|$ はそれぞれのベクトルの**ノルム**（長さ）です。コサイン類似度はこの長さの積で割るので、**大きさの影響が消えて向きだけ**が残ります。\n\n式はたくさんに見えますが、結局はコンピュータが「どれだけ似ているか」を数にするためのルールです。","inAI":"**深層学習**では各層の線形変換が行ベクトルと入力の内積の積み重ねです。**アテンション**はクエリ・キー内積（または同等のスコア）で注目を決めます。**推薦**ではユーザー・アイテム埋め込みの内積／コサインで好みを表します。"},"whyImportant":{"bridge":"Ch.01でベクトルを「数の箱」と見たなら、本章は箱同士を**対にして1つのスコア**を作る規則です。そのスコアが**距離・角・類似度**の共通語になり、行列・固有値・最適化へ続きます。","similarity":"「似ている」をコンピュータに伝えるには**測定**が必要です。内積とコサインは高次元でも**方向と大きさ**を分けて解釈でき、前処理（正規化）とも密接です。"},"howUsed":{"ml":"**機械学習**：特徴ベクトル間の類似度で kNN、カーネルの出発点、線形／ロジスティックの線形項 $\\mathbf{w}\\cdot\\mathbf{x}$ などに使います。","geometry":"**幾何**：最小二乗解は列空間への**射影**として解釈できます。PCA の主成分、Gram–Schmidt の「射影を引く」も同じ絵です。"},"summary":"**まとめ：** 内積は成分積の和であり長さと角を結びつけ、正射影はある方向への**影のベクトル**です。コサインは方向重視、射影は直交分解と相性が良いです。次の **Ch.03 行列**では多くの内積を一度に扱います。","problemSolving":{"focus":"下の表に、問題解決に必要な**数式と記号の意味**をまとめ、その直後の**項目別の詳しい説明**で定義の意図まで述べます。**解説例**では代表的な型の手順を示します。","examplesHeading":"解説例","examplesTable":"**例1 — 内積**\n\n問題: $\\mathbf{u}=(2,-1)$, $\\mathbf{v}=(3,4)$ のとき $\\mathbf{u}\\cdot\\mathbf{v}$ は？\n\n解答: $2\\cdot3+(-1)\\cdot4=2$.\n\n→ 選択肢のうち **$2$** に対応する番号を選ぶ。\n\n---\n\n**例2 — 正射影**\n\n問題: $\\mathbf{u}=(1,0)$, $\\mathbf{v}=(5,5)$ のとき $\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$ は？\n\n解答: $\\dfrac{\\mathbf{u}\\cdot\\mathbf{v}}{\\mathbf{u}\\cdot\\mathbf{u}}\\mathbf{u}=(5,0)$, 長さ $5$.\n\n---\n\n**例3 — 直交**\n\n問題: $\\mathbf{u}=(1,0)$, $\\mathbf{v}=(0,3)$ のとき内積は？\n\n解答: $0$ → **直交**の代表例。\n\n---\n\n**例4 — コサイン類似度**\n\n問題: $\\dfrac{\\mathbf{u}\\cdot\\mathbf{v}}{\\|\\mathbf{u}\\|\\|\\mathbf{v}\\|}$ の意味は？（分母 $\\neq 0$）\n\n解答: なす角 $\\theta$ の $\\cos\\theta$ で、**方向の似度**として使われる。\n\n---\n\n**例5 — 残差**\n\n問題: $\\mathbf{r}=\\mathbf{v}-\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$ のとき $\\mathbf{r}\\cdot\\mathbf{u}$ は？（$\\mathbf{u}\\neq\\mathbf{0}$）\n\n解答: 残差は $\\mathbf{u}$ と直交するので **$0$**。\n\n---\n\n**例6 — 単位ベクトル**\n\n問題: 単位ベクトル $\\mathbf{\\hat{u}}$ に対する正射影の長さは？\n\n解答: $|\\mathbf{v}\\cdot\\mathbf{\\hat{u}}|$。"},"problemSolvingLabel":"解法のヒント","problemSolvingTable":"$22","practiceProblemsTitle":"練習問題","practiceProblemsIntro":"以下は**60問バンク**から無作為に選んだ**10問**です（易4・中3・難3、提示順は易→中→難）。各問は**選択式**です。番号を選んでください。","practiceProblemsInstruction":"問題を読み、最も適切な選択肢を選んでください。","problems":{"definition_0":"$$\\mathbb{R}^n$ において、内積 $\\mathbf{u}\\cdot\\mathbf{v}$ を成分で書くと最も適切なのはどれか？\n\n① $\\sum_i u_i v_i$（同じ位置の成分どうしを掛けて足す）\n② $\\sum_i u_i + v_i$\n③ $\\max_i u_i v_i$\n④ $\\prod_i u_i v_i$","definition_1":"2つのベクトルが**直交**するとき、内積 $\\mathbf{u}\\cdot\\mathbf{v}$ の値は？\n\n① 常に $0$\n② 常に $1$\n③ 常に正\n④ 常にベクトル","definition_2":"$$\\|\\mathbf{u}\\|\\|\\mathbf{v}\\|\\cos\\theta$ において $\\theta$ が表すものは？\n\n① 2つのベクトルの**なす角**（小さい方）\n② ベクトルの次元\n③ ノルムだけ\n④ 行列の階数","definition_3":"$$\\mathbf{u}\\neq\\mathbf{0}$ のとき、$\\mathbf{v}$ の $\\mathbf{u}$ 上への**正射影ベクトル** $\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$ はどれか？\n\n① $\\dfrac{\\mathbf{u}\\cdot\\mathbf{v}}{\\mathbf{u}\\cdot\\mathbf{u}}\\,\\mathbf{u}$\n② $\\mathbf{v}-\\mathbf{u}$\n③ $\\dfrac{\\mathbf{v}}{\\|\\mathbf{u}\\|}$\n④ $\\mathbf{u}\\times\\mathbf{v}$","definition_4":"**コサイン類似度** $\\dfrac{\\mathbf{u}\\cdot\\mathbf{v}}{\\|\\mathbf{u}\\|\\|\\mathbf{v}\\|}$ の値の範囲は？（実ベクトル、一般に）\n\n① $[-1,1]$\n② $[0,\\infty)$\n③ $(-\\infty,\\infty)$ のみ\n④ 常に $0$ または $1$ のみ","definition_5":"内積 $\\mathbf{u}\\cdot\\mathbf{v}$ の結果の型として正しいのは？\n\n① **スカラー**（実数1つ）\n② 常にベクトル\n③ 常に行列\n④ 常にブール","definition_6":"$$\\|\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}\\|$ と $\\|\\mathbf{v}\\|$ の関係として常に成り立つものは？\n\n① $\\|\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}\\|\\le \\|\\mathbf{v}\\|$\n② 常に $\\|\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}\\|> \\|\\mathbf{v}\\|$\n③ 常に等しい\n④ 比較不能","definition_7":"ロジスティック回帰で $z=\\mathbf{w}\\cdot\\mathbf{x}+b$ のとき、$\\mathbf{w}\\cdot\\mathbf{x}$ は何に対応するか？\n\n① 重みベクトルと特徴ベクトルの**類似度・整合**を数値化した項\n② 外積\n③ 行列式\n④ 確率そのもの","definition_8":"次のうち**内積の性質**として正しいものは？（$\\mathbf{a},\\mathbf{b},\\mathbf{c}$ は同じ次元、$c$ はスカラー）\n\n① $(c\\mathbf{a})\\cdot\\mathbf{b}=c(\\mathbf{a}\\cdot\\mathbf{b})$\n② $(\\mathbf{a}\\cdot\\mathbf{b})\\cdot\\mathbf{c}$ は常に定義される\n③ $\\mathbf{a}\\cdot\\mathbf{b}=\\mathbf{a}+\\mathbf{b}$\n④ 内積は交換しない","definition_9":"Ch.01 の $\\mathbb{R}^n$ とつなげるとき、内積が定義されるには $\\mathbf{u}$ と $\\mathbf{v}$ はどうあるべきか？\n\n① 同じ $n$ で**同じ次元**\n② 次元が違ってもよい\n③ 両方単位ベクトル\n④ 片方は零ベクトル","trueFalse_0":"次の文が**正しい**ときは ①、**誤り**のときは ② を選びなさい。\n\n$\\mathbf{u}\\cdot\\mathbf{v}=0$ ならば、2つのベクトルは常に零ベクトルである。\n\n① 正しい\n② 誤り\n③ どちらでもない\n④ 文が空","trueFalse_1":"次の文が**正しい**ときは ①、**誤り**のときは ② を選びなさい。\n\n任意の $\\mathbf{v}$ に対して $\\mathbf{0}\\cdot\\mathbf{v}=0$ である。\n\n① 正しい\n② 誤り\n③ どちらでもない\n④ 文が空","trueFalse_2":"次の文が**正しい**ときは ①、**誤り**のときは ② を選びなさい。\n\n（定義されるとき）$\\mathbf{u}\\cdot\\mathbf{v}=\\mathbf{v}\\cdot\\mathbf{u}$ は常に成り立つ。\n\n① 正しい\n② 誤り\n③ どちらでもない\n④ 文が空","trueFalse_3":"次の文が**正しい**ときは ①、**誤り**のときは ② を選びなさい。\n\n正射影 $\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$ は常に $\\mathbf{u}$ に平行である（$\\mathbf{u}\\neq\\mathbf{0}$）。\n\n① 正しい\n② 誤り\n③ どちらでもない\n④ 文が空","trueFalse_4":"次の文が**正しい**ときは ①、**誤り**のときは ② を選びなさい。\n\nコサイン類似度は常に非負である。\n\n① 正しい\n② 誤り\n③ どちらでもない\n④ 文が空","trueFalse_5":"次の文が**正しい**ときは ①、**誤り**のときは ② を選びなさい。\n\n$\\|\\mathbf{u}+\\mathbf{v}\\|^2=\\|\\mathbf{u}\\|^2+\\|\\mathbf{v}\\|^2$ は常に成り立つ。\n\n① 正しい\n② 誤り\n③ どちらでもない\n④ 文が空","trueFalse_6":"次の文が**正しい**ときは ①、**誤り**のときは ② を選びなさい。\n\n内積は線形性を持つ：$\\mathbf{u}\\cdot(\\mathbf{v}+\\mathbf{w})=\\mathbf{u}\\cdot\\mathbf{v}+\\mathbf{u}\\cdot\\mathbf{w}$。\n\n① 正しい\n② 誤り\n③ どちらでもない\n④ 文が空","trueFalse_7":"次の文が**正しい**ときは ①、**誤り**のときは ② を選びなさい。\n\n$\\mathbf{u}\\cdot\\mathbf{u}=\\|\\mathbf{u}\\|^2$ である。\n\n① 正しい\n② 誤り\n③ どちらでもない\n④ 文が空","trueFalse_8":"次の文が**正しい**ときは ①、**誤り**のときは ② を選びなさい。\n\n推薦システムでは、ユーザーとアイテムの埋め込みの類似度に内積／コサインを使える。\n\n① 正しい\n② 誤り\n③ どちらでもない\n④ 文が空","trueFalse_9":"次の文が**正しい**ときは ①、**誤り**のときは ② を選びなさい。\n\n残差 $\\mathbf{v}-\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$ は $\\mathbf{u}$ と直交する（$\\mathbf{u}\\neq\\mathbf{0}$）。\n\n① 正しい\n② 誤り\n③ どちらでもない\n④ 文が空","calc_0":"$$\\mathbf{u}=(2,3)$, $\\mathbf{v}=(4,-1)$ のとき $\\mathbf{u}\\cdot\\mathbf{v}$ は？\n\n① $5$\n② $11$\n③ $-5$\n④ $14$","calc_1":"$$\\mathbf{a}=(1,1,1)$, $\\mathbf{b}=(2,-3,1)$ のとき $\\mathbf{a}\\cdot\\mathbf{b}$ は？\n\n① $0$\n② $3$\n③ $6$\n④ $-1$","calc_2":"$$\\|\\mathbf{u}\\|=5$, $\\|\\mathbf{v}\\|=4$ で同じ向きのとき $\\mathbf{u}\\cdot\\mathbf{v}$ は？\n\n① $20$\n② $9$\n③ $1$\n④ $0$","calc_3":"$$\\mathbf{u}=(3,4)$ のとき $\\mathbf{u}\\cdot\\mathbf{u}$ は？\n\n① $25$\n② $5$\n③ $12$\n④ $7$","calc_4":"$$\\mathbf{u}=(2,0)$, $\\mathbf{v}=(1,\\sqrt{3})$ のときコサイン類似度 $\\dfrac{\\mathbf{u}\\cdot\\mathbf{v}}{\\|\\mathbf{u}\\|\\|\\mathbf{v}\\|}$ は？\n\n① $\\dfrac{1}{2}$\n② $1$\n③ $0$\n④ $\\dfrac{\\sqrt{3}}{2}$","calc_5":"$$\\mathbf{u}=(1,2)$, $\\mathbf{v}=(2,4)$, $\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}=\\alpha\\mathbf{u}$ のとき $\\alpha$ は？\n\n① $2$\n② $1$\n③ $0$\n④ $4$","calc_6":"$$\\mathbf{e}_1=(1,0,0)$, $\\mathbf{v}=(3,-2,6)$ のとき $\\mathrm{proj}_{\\mathbf{e}_1}\\mathbf{v}$ の第1成分（$x$ 座標）は？\n\n① $3$\n② $6$\n③ $-2$\n④ $0$","calc_7":"$$\\mathbf{u}=(1,0)$, $\\mathbf{v}=(0,5)$ のとき $\\|\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}\\|$ は？\n\n① $0$\n② $1$\n③ $5$\n④ $25$","calc_8":"$$\\mathbf{a}=(1,2,2)$ のノルム $\\|\\mathbf{a}\\|$ は？\n\n① $3$\n② $9$\n③ $\\sqrt{5}$\n④ $5$","calc_9":"$$\\mathbf{u}=(-1,2)$, $\\mathbf{v}=(4,2)$ のとき $\\mathbf{u}\\cdot\\mathbf{v}$ は？\n\n① $0$\n② $10$\n③ $-4$\n④ $6$","concept_0":"ディープラーニングで注意スコアを内積で書く直感に最も近いのは？\n\n① クエリとキーベクトルの**整合（似度）**をスコアにする\n② 常にノルムだけ\n③ 逆伝播を止める\n④ 活性化だけ","concept_1":"最小二乗で設計行列の列が直交（正規直交基底）のとき、解釈が楽になるのは？\n\n① 各係数を**独立に**解釈しやすい\n② 常に発散\n③ 学習率が 0\n④ 内積が常に 0","concept_2":"特徴のスケールがバラバラなとき、ユークリッド距離よりコサイン類似度が有利なことが多いのはなぜか？\n\n① **大きさ**より**方向**を見たいとき\n② 長さを大きくするため\n③ 微分不能のため\n④ 常に遅いため","concept_3":"Gram–Schmidt の中心操作に最も近いのは？\n\n① 直交しないベクトルから**他方向成分を引いて**直交化\n② 行列式\n③ 固有値だけ\n④ 確率積分","concept_4":"PCA で主成分方向に共分散行列の固有ベクトルが出ることとつながる基礎観念は？\n\n① 二次形式と**直交**軸上の分散最大化\n② 内積が常に 0\n③ 外積だけ\n④ 確率だけ","concept_5":"損失 $L(\\mathbf{w})=\\|\\mathbf{y}-X\\mathbf{w}\\|^2$ において $X\\mathbf{w}$ は？\n\n① $\\mathbf{y}$ を $X$ の列空間へ**射影**した値（LS の意味）に近づける構造\n② 乱雑ノイズ\n③ 常に零ベクトル\n④ 活性化関数","concept_6":"ReLU 前の線形層 $\\mathbf{z}=W\\mathbf{x}$ の行 $\\mathbf{w}_i^{\\mathsf T}\\mathbf{x}$ は何か？\n\n① **重み行ベクトル**と入力の内積（線形特徴1つ）\n② 外積\n③ ソフトマックス\n④ バッチ正規化のみ","concept_7":"$$\\|\\mathbf{u}\\|$ が非常に小さいときコサイン類似度が不安定になる理由は？\n\n① 分母 $\\|\\mathbf{u}\\|\\|\\mathbf{v}\\|$ が**0 に近づき**スケールが暴れる\n② 内積が常に 0\n③ コサインが常に 1\n④ 直交のため","concept_8":"単語埋め込みを**単位ベクトルに正規化**してからコサインで見ると？\n\n① コサイン $\\approx$ **純粋な内積**で方向だけ比較\n② 常に誤り\n③ 内積未定義\n④ 次元が変わる","concept_9":"**正射影**が**線形変換**だとすぐ思い出せる説明は？\n\n① 和とスカラー倍を**保つ**射影（行列 $P$ で表せる）\n② 常に非線形\n③ 常に回転だけ\n④ 確率だけ変える","projection_0":"$$\\mathbf{u}=(1,1)$, $\\mathbf{v}=(3,0)$ で $\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}=(a,a)$ とおくとき $a$ は？\n\n① $\\dfrac{3}{2}$\n② $3$\n③ $\\dfrac{1}{2}$\n④ $0$","projection_1":"$$\\mathbf{u}=(2,1)$, $\\mathbf{v}=(1,2)$ のとき $\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$ の $x$ 成分は？\n\n① $\\dfrac{8}{5}$\n② $2$\n③ $1$\n④ $0$","projection_2":"$$\\mathbf{v}=(6,8)$ を $\\mathbf{e}_1=(1,0)$ に射影したベクトルのノルムは？\n\n① $6$\n② $8$\n③ $10$\n④ $0$","projection_3":"単位ベクトル $\\mathbf{\\hat{u}}$ への正射影はどの形に簡単になるか？\n\n① $(\\mathbf{v}\\cdot\\mathbf{\\hat{u}})\\,\\mathbf{\\hat{u}}$\n② $\\mathbf{v}-\\mathbf{\\hat{u}}$\n③ $\\|\\mathbf{v}\\|\\mathbf{\\hat{u}}$ のみ\n④ $\\mathbf{\\hat{u}}/\\|\\mathbf{v}\\|$","projection_4":"$$\\mathbf{a}=(1,1,1)$, $\\mathbf{b}=(1,0,0)$ のとき $\\mathrm{proj}_{\\mathbf{a}}\\mathbf{b}$ の3成分の和は？\n\n① $1$\n② $3$\n③ $0$\n④ $\\dfrac{1}{3}$","projection_5":"$$\\mathbf{r}=\\mathbf{v}-\\mathrm{proj}_{\\mathbf{u}}\\mathbf{v}$ のとき $\\mathbf{r}\\cdot\\mathbf{u}$ は？（$\\mathbf{u}\\neq\\mathbf{0}$）\n\n① $0$\n② $\\|\\mathbf{u}\\|^2$\n③ $\\|\\mathbf{v}\\|^2$\n④ $1$","projection_6":"$$\\mathbf{u}=(4,3)$ 方向の単位ベクトルを $\\mathbf{\\hat{u}}$ とする。$\\mathbf{v}=(1,0)$ の $\\|\\mathrm{proj}_{\\mathbf{\\hat{u}}}\\mathbf{v}\\|$ は？（内積のみ）\n\n① $\\dfrac{4}{5}$\n② $1$\n③ $\\dfrac{3}{5}$\n④ $5$","projection_7":"平面上2ベクトルが張る平行四辺形の面積は $\\|\\mathbf{u}\\|\\|\\mathbf{v}\\||\\sin\\theta|$。3次元では $\\|\\mathbf{u}\\times\\mathbf{v}\\|$ と等しい。内積とのつながりは？\n\n① $\\sin^2\\theta=1-\\cos^2\\theta$ で**直交成分**と関連\n② 内積と無関係\n③ 常に 0\n④ ノルムは常に 1","projection_8":"$$\\mathbf{v}=\\mathbf{p}+\\mathbf{r}$ を $\\mathbf{u}$ への射影 $\\mathbf{p}$ と残差 $\\mathbf{r}$ の直交分解とすると、$\\|\\mathbf{v}\\|^2$ と $\\|\\mathbf{p}\\|^2+\\|\\mathbf{r}\\|^2$ の関係（ピタゴラス）は？\n\n① 常に $\\|\\mathbf{v}\\|^2=\\|\\mathbf{p}\\|^2+\\|\\mathbf{r}\\|^2$\n② 常に $\\|\\mathbf{v}\\|^2=\\|\\mathbf{p}\\|^2-\\|\\mathbf{r}\\|^2$\n③ 成り立たない\n④ $\\|\\mathbf{p}\\|=\\|\\mathbf{r}\\|$","projection_9":"行列 $A$ の行 $\\mathbf{a}_i^{\\mathsf T}$ と $y_i=\\mathbf{a}_i\\cdot\\mathbf{x}$ は何の視点か？\n\n① 線形変換 $A\\mathbf{x}$ の各座標（行と内積）\n② 外積の大きさ\n③ 行列式\n④ 分散","scenario_0":"2つの文書埋め込みのコサイン類似度が 0.92。推薦の文脈で読みやすい解釈は？\n\n① トピック方向が**かなり近い**（スケール正規化後）\n② 確率が 92%\n③ 文書長が等しい\n④ 同じ単語だけ","scenario_1":"画像特徴とテキスト特徴の次元が違う。コサイン類似度を直接使うには？\n\n① まず**同じ次元**に写す埋め込み設計が必要\n② 次元が違っても常に可\n③ 内積は次元無関係\n④ 確率だけ合わせればよい","scenario_2":"ミニバッチ SGD で損失が荒い。勾配 $\\mathbf{g}$ と更新の直感で正しいのは？\n\n① 1ステップは主に $-\\mathbf{g}$ 方向（**最急降下**）\n② 常に $\\mathbf{g}$ と同向き\n③ $\\mathbf{g}$ と無関係\n④ 内積は常に 0","scenario_3":"協調フィルタで $\\hat{r}=\\mathbf{u}\\cdot\\mathbf{v}$ とする。内積が大きいとモデル上は？\n\n① 嗜好と特徴の**噛み合い**が大きい（仮定のもと）\n② 常に嫌い\n③ 学習不能\n④ 確率 1","scenario_4":"Transformer のスケールド dot-product 注意で $\\sqrt{d_k}$ で割る理由に最も近いのは？\n\n① 内積分散が大きくソフトマックスが**飽和**するのを抑える\n② 内積を消すため\n③ 逆伝播停止\n④ 常に直交化","scenario_5":"特徴を標準化したあと線形 SVM のマージンとつながるのは？\n\n① **内積空間**での距離・角度による分離（カーネル）\n② 確率のみ\n③ クラスタのみ\n④ 教師なしのみ","scenario_6":"オートエンコーダ潜在ベクトル間でユークリッドよりコサインが良いのはいつ？\n\n① **長さ**より**方向（パターン）**が重要なとき\n② 距離が常に正しいときだけ\n③ 画像がないときだけ\n④ 決してない","scenario_7":"ML パイプラインでの**射影**の例に最も近いのは？\n\n① 高次元を**低次元部分空間**に合わせ可視化（PCA など）\n② 確率推定のみ\n③ 常にデータ削除\n④ バッチサイズ調整のみ","scenario_8":"正規化後に内積が大きくても意味的類似が保証されないのはなぜ？\n\n① 埋め込みは**学習データと目的関数**に依存\n② 内積は常に誤り\n③ コサインは常に 0\n④ 直交のため","scenario_9":"行列・ベクトル積 $A\\mathbf{x}$ を内積の視点で見ると？\n\n① $A$ の**各行**と $\\mathbf{x}$ の内積の並び\n② 行列式のみ\n③ 常にスカラー\n④ 外積のみ"},"problemAnswers":{"definition_0":1,"definition_1":1,"definition_2":1,"definition_3":1,"definition_4":1,"definition_5":1,"definition_6":1,"definition_7":1,"definition_8":1,"definition_9":1,"trueFalse_0":2,"trueFalse_1":1,"trueFalse_2":1,"trueFalse_3":1,"trueFalse_4":2,"trueFalse_5":2,"trueFalse_6":1,"trueFalse_7":1,"trueFalse_8":1,"trueFalse_9":1,"calc_0":1,"calc_1":1,"calc_2":1,"calc_3":1,"calc_4":1,"calc_5":1,"calc_6":1,"calc_7":1,"calc_8":1,"calc_9":1,"concept_0":1,"concept_1":1,"concept_2":1,"concept_3":1,"concept_4":1,"concept_5":1,"concept_6":1,"concept_7":1,"concept_8":1,"concept_9":1,"projection_0":1,"projection_1":1,"projection_2":1,"projection_3":1,"projection_4":1,"projection_5":1,"projection_6":1,"projection_7":1,"projection_8":1,"projection_9":1,"scenario_0":1,"scenario_1":1,"scenario_2":1,"scenario_3":1,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1},"problemSolutions":{"definition_0":"**(1) 要点:** 同じ添字の成分どうしを掛けて足す。 **(2) 例:** $\\mathbf{u}=(1,2)$, $\\mathbf{v}=(3,-1)$ なら $1\\cdot3+2\\cdot(-1)=1$。 **(3) 正解 ①**","definition_1":"**(1) 要点:** 直交なら角 $90^\\circ$ で $\\cos\\theta=0$、内積 $0$。 **(2) 例:** $(1,0)\\cdot(0,1)=0$。 **(3) 正解 ①**","definition_2":"**(1) 要点:** $\\mathbf{u}\\cdot\\mathbf{v}=\\|\\mathbf{u}\\|\\|\\mathbf{v}\\|\\cos\\theta$ の $\\theta$ はなす角。 **(2) 例:** 同向きなら $\\theta=0$。 **(3) 正解 ①**","definition_3":"**(1) 要点:** $\\mathbf{u}$ 方向だけ残す射影；係数は $\\dfrac{\\mathbf{u}\\cdot\\mathbf{v}}{\\|\\mathbf{u}\\|^2}$。 **(2) 例:** $\\mathbf{u}=(1,0)$, $\\mathbf{v}=(3,4)$ なら射影 $(3,0)$。 **(3) 正解 ①**","definition_4":"**(1) 要点:** コサインは $[-1,1]$。 **(2) 例:** 同向き $\\approx1$、反対 $\\approx-1$、直交 $0$。 **(3) 正解 ①**","definition_5":"**(1) 要点:** 内積は実数1つの**スカラー**。 **(2) 例:** $(1,2)\\cdot(3,1)=5$。 **(3) 正解 ①**","definition_6":"**(1) 要点:** 射影は元ベクトルより長くならない（直角三角形）。 **(2) 例:** すでに平行なら等号。 **(3) 正解 ①**","definition_7":"**(1) 要点:** 線形モデルは特徴と重みの整合を内積で見る。 **(2) 例:** テキスト類似も同系統。 **(3) 正解 ①**","definition_8":"**(1) 要点:** スカラー倍は片側にだけ掛けても外に出せる。 **(2) 例:** $(2\\mathbf{a})\\cdot\\mathbf{b}=2(\\mathbf{a}\\cdot\\mathbf{b})$。 **(3) 正解 ①**","definition_9":"**(1) 要点:** 成分の長さが揃う必要がある。 **(2) 例:** $\\mathbb{R}^2$ と $\\mathbb{R}^3$ はペアにできない。 **(3) 正解 ①**","trueFalse_0":"**(1) 反例:** $(1,0)\\cdot(0,1)=0$ だが両方零ではない（直交）。 **(2) 正解 ②**","trueFalse_1":"**(1) 要点:** 零ベクトルの成分はすべて 0。 **(2) 正解 ①**","trueFalse_2":"**(1) 要点:** 交換法則。 **(2) 正解 ①**","trueFalse_3":"**(1) 要点:** 射影は $\\mathbf{u}$ が張る直線上にある。 **(2) 正解 ①**","trueFalse_4":"**(1) 反例:** 反対向きならコサインは負になり得る。 **(2) 正解 ②**","trueFalse_5":"**(1) 要点:** $\\|\\mathbf{u}+\\mathbf{v}\\|^2=\\|\\mathbf{u}\\|^2+\\|\\mathbf{v}\\|^2+2\\mathbf{u}\\cdot\\mathbf{v}$。 **(2) 正解 ②**","trueFalse_6":"**(1) 要点:** 分配性（線形性）。 **(2) 正解 ①**","trueFalse_7":"**(1) 例:** $(3,4)\\cdot(3,4)=25=\\|\\mathbf{u}\\|^2$。 **(2) 正解 ①**","trueFalse_8":"**(1) 実務:** 類似度スコア化。 **(2) 正解 ①**","trueFalse_9":"**(1) 要点:** 残差は $\\mathbf{u}$ と直交。 **(2) 正解 ①**","calc_0":"**(1) 計算:** $2\\cdot4+3\\cdot(-1)=5$。 **(2) 正解 ①**","calc_1":"**(1) 計算:** $2-3+1=0$。 **(2) 正解 ①**","calc_2":"**(1) 要点:** 同向きなら $\\cos\\theta=1$、内積 $=20$。 **(2) 正解 ①**","calc_3":"**(1) 計算:** $9+16=25=\\|\\mathbf{u}\\|^2$。 **(2) 正解 ①**","calc_4":"**(1) 計算:** 内積 $2$、ノルム $2,2$ $\\Rightarrow$ $1/2$。 **(2) 正解 ①**","calc_5":"**(1) 計算:** $\\mathbf{u}\\cdot\\mathbf{v}=10$, $\\mathbf{u}\\cdot\\mathbf{u}=5$ $\\Rightarrow$ $\\alpha=2$。 **(2) 正解 ①**","calc_6":"**(1) 要点:** $\\mathbf{e}_1$ への射影は $x$ 成分だけ残す $\\Rightarrow$ $3$。 **(2) 正解 ①**","calc_7":"**(1) 計算:** $\\mathbf{v}$ が $\\mathbf{u}$ と直交 $\\Rightarrow$ 射影長 $0$。 **(2) 正解 ①**","calc_8":"**(1) 計算:** $\\sqrt{1+4+4}=3$。 **(2) 正解 ①**","calc_9":"**(1) 計算:** $-4+4=0$（直交）。 **(2) 正解 ①**","concept_0":"**(1) 実務:** 内積が大きいほど注意が集まる。 **(2) 正解 ①**","concept_1":"**(1) 要点:** 直交列なら係数が混ざりにくい。 **(2) 正解 ①**","concept_2":"**(1) 直感:** 文書長ではなく方向を見る。 **(2) 正解 ①**","concept_3":"**(1) 要点:** 射影を引いて直交化。 **(2) 正解 ①**","concept_4":"**(1) 橋渡し:** PCA は内積・直交・射影の言語。 **(2) 正解 ①**","concept_5":"**(1) 実務:** 最小二乗は列空間への射影。 **(2) 正解 ①**","concept_6":"**(1) 実務:** 深層は内積の積み重ね。 **(2) 正解 ①**","concept_7":"**(1) 実務:** 正則化・クリップで安定化。 **(2) 正解 ①**","concept_8":"**(1) 要点:** 単位球面上で $\\mathbf{u}\\cdot\\mathbf{v}=\\cos\\theta$。 **(2) 正解 ①**","concept_9":"**(1) 要点:** 射影行列 $P=\\dfrac{\\mathbf{u}\\mathbf{u}^{\\mathsf T}}{\\mathbf{u}^{\\mathsf T}\\mathbf{u}}$。 **(2) 正解 ①**","projection_0":"**(1) 計算:** $\\mathbf{u}\\cdot\\mathbf{v}=3$, $\\mathbf{u}\\cdot\\mathbf{u}=2$ $\\Rightarrow$ 係数 $3/2$。 **(2) 正解 ①**","projection_1":"**(1) 計算:** 内積 $4$, $\\|\\mathbf{u}\\|^2=5$ $\\Rightarrow$ $x=8/5$。 **(2) 正解 ①**","projection_2":"**(1) 要点:** $x$ 軸射影 $(6,0)$、ノルム $6$。 **(2) 正解 ①**","projection_3":"**(1) 要点:** $\\|\\mathbf{\\hat{u}}\\|=1$ なら係数は $\\mathbf{v}\\cdot\\mathbf{\\hat{u}}$。 **(2) 正解 ①**","projection_4":"**(1) 計算:** $\\mathbf{a}\\cdot\\mathbf{b}=1$, $\\mathbf{a}\\cdot\\mathbf{a}=3$ $\\Rightarrow$ $\\dfrac{1}{3}(1,1,1)$、和 $1$。 **(2) 正解 ①**","projection_5":"**(1) 要点:** 残差は $\\mathbf{u}$ と直交。 **(2) 正解 ①**","projection_6":"**(1) 計算:** $\\mathbf{\\hat{u}}=(4/5,3/5)$、内積 $4/5$、長さ $=|\\mathbf{v}\\cdot\\mathbf{\\hat{u}}|=4/5$。 **(2) 正解 ①**","projection_7":"**(1) 橋渡し:** $\\cos$ は内積、$\\sin$ は外積／面積。 **(2) 正解 ①**","projection_8":"**(1) 要点:** $\\mathbf{p}\\perp\\mathbf{r}$ ならピタゴラス。 **(2) 正解 ①**","projection_9":"**(1) 実務:** $A\\mathbf{x}$ は行と内積の並び（Ch.03 予告）。 **(2) 正解 ①**","scenario_0":"**(1) 実務:** 埋め込みは近似類似度。 **(2) 正解 ①**","scenario_1":"**(1) 実務:** 同じ $\\mathbb{R}^n$ が必要。 **(2) 正解 ①**","scenario_2":"**(1) 橋渡し:** 最適化（勾配降下）の直感。 **(2) 正解 ①**","scenario_3":"**(1) 実務:** 行列分解型モデルの基本形。 **(2) 正解 ①**","scenario_4":"**(1) 実務:** スケールして softmax を安定化。 **(2) 正解 ①**","scenario_5":"**(1) 橋渡し:** 内積からカーネルへ。 **(2) 正解 ①**","scenario_6":"**(1) 実務:** 大きさより方向のときコサイン。 **(2) 正解 ①**","scenario_7":"**(1) 実務:** PCA は部分空間への射影。 **(2) 正解 ①**","scenario_8":"**(1) 実務:** 学習前提に依存。 **(2) 正解 ①**","scenario_9":"**(1) 予告:** 行・内積は深層の基本。 **(2) 正解 ①**"},"problemTestCodes":{"definition_0":"answer = 1\nassert answer == 1","definition_1":"answer = 1\nassert answer == 1","definition_2":"answer = 1\nassert answer == 1","definition_3":"answer = 1\nassert answer == 1","definition_4":"answer = 1\nassert answer == 1","definition_5":"answer = 1\nassert answer == 1","definition_6":"answer = 1\nassert answer == 1","definition_7":"answer = 1\nassert answer == 1","definition_8":"answer = 1\nassert answer == 1","definition_9":"answer = 1\nassert answer == 1","trueFalse_0":"answer = 2\nassert answer == 2","trueFalse_1":"answer = 1\nassert answer == 1","trueFalse_2":"answer = 1\nassert answer == 1","trueFalse_3":"answer = 1\nassert answer == 1","trueFalse_4":"answer = 2\nassert answer == 2","trueFalse_5":"answer = 2\nassert answer == 2","trueFalse_6":"answer = 1\nassert answer == 1","trueFalse_7":"answer = 1\nassert answer == 1","trueFalse_8":"answer = 1\nassert answer == 1","trueFalse_9":"answer = 1\nassert answer == 1","calc_0":"answer = 1\nassert answer == 1","calc_1":"answer = 1\nassert answer == 1","calc_2":"answer = 1\nassert answer == 1","calc_3":"answer = 1\nassert answer == 1","calc_4":"answer = 1\nassert answer == 1","calc_5":"answer = 1\nassert answer == 1","calc_6":"answer = 1\nassert answer == 1","calc_7":"answer = 1\nassert answer == 1","calc_8":"answer = 1\nassert answer == 1","calc_9":"answer = 1\nassert answer == 1","concept_0":"answer = 1\nassert answer == 1","concept_1":"answer = 1\nassert answer == 1","concept_2":"answer = 1\nassert answer == 1","concept_3":"answer = 1\nassert answer == 1","concept_4":"answer = 1\nassert answer == 1","concept_5":"answer = 1\nassert answer == 1","concept_6":"answer = 1\nassert answer == 1","concept_7":"answer = 1\nassert answer == 1","concept_8":"answer = 1\nassert answer == 1","concept_9":"answer = 1\nassert answer == 1","projection_0":"answer = 1\nassert answer == 1","projection_1":"answer = 1\nassert answer == 1","projection_2":"answer = 1\nassert answer == 1","projection_3":"answer = 1\nassert answer == 1","projection_4":"answer = 1\nassert answer == 1","projection_5":"answer = 1\nassert answer == 1","projection_6":"answer = 1\nassert answer == 1","projection_7":"answer = 1\nassert answer == 1","projection_8":"answer = 1\nassert answer == 1","projection_9":"answer = 1\nassert answer == 1","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 1\nassert answer == 1","scenario_3":"answer = 1\nassert answer == 1","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1"}},"midMathCh03":{"chapter":"Chapter 03","title":"行列とデータの束：複数のベクトルを一枚の表に","description":"**行列**は数を縦横に並べた**一枚の表**です。機械学習では、**行**がしばしば**サンプル（一人・一枚の画像）**、**列**が**特徴**を表します。本章ではベクトル（Ch.01）と内積（Ch.02）が行列の中で**一度に何度も**現れる様子をつなぎ、**行列積と線形層（Ch.04）**への準備をします。","sectionTitle":"行列とデータの束：複数のベクトルを一枚の表に","sectionLabels":{"whatIs":"どんな概念か","whyImportant":"なぜ重要か","howUsed":"どう使うか","problemSolving":"問題を解くためのメモ"},"visualShort":"行列 · 行/列 · 転置 · データ行列","visualIntro":"$$m\\times n$ 行列 $A$ は **$m$ 本の行** と **$n$ 本の列** を持ちます。**列**を横に並べると「複数のベクトルを一枚に束ねた形」になり、**行**は「1つの式の行（または1サンプル）」として読めます。**転置** $A^{\\mathsf T}$ は行と列を入れ替える操作です。","visualStep1":"概念: $A\\in\\mathbb{R}^{m\\times n}$, 要素 $a_{ij}$","visualStep2":"直感: 列=特徴ベクトルの束 / 行=サンプル1行","visualStep3":"演算: 和・スカラー倍・転置（積は次章）","visualStep4":"応用: 設計行列、ミニバッチ、重み表","visualStepsLabel":"見る順番","visualFlowTitle":"学習フロー","visualFlowStep0":"概念: 格子表としての行列","visualFlowStep1":"直感: 列ベクトル・行ベクトルの読み分け","visualFlowStep2":"数式: 次元合わせ・転置","visualFlowStep3":"接続: 行の内積と $A\\mathbf{u}$","visualFlowStep4":"適用: データ行列・バッチテンソル","dotVisualAriaLabel":"行列と列ハイライト: アニメーション強調と次元パネル","dotVisualMainTitle":"列が変わると見え方が変わる","dotVisualPlotTitle":"格子: 3x3 で列ハイライト","dotVisualMetricsTitle":"形状 · ハイライト · 要約","dotVisualHudDot":"行数 m","dotVisualHudCos":"列数 n","dotVisualHudProj":"強調列番号","dotVisualLegendU":"格子","dotVisualLegendV":"強調列","dotVisualLegendProj":"軸","dotVisualLegendRes":"ラベル","dotVisualInsetLabel":"列インデックス","dotVisualCaption":"**紫の列**が順番に強調されます。各列は**同じ長さのベクトル**で、3本の列を横に並べると**1つの行列**になります。右側パネルでは **$m\\times n$** の意味と **どの列を見ているか** を示します。**行**で読むと **1行=1サンプル** という、データでよく使う読み方になります。","whatIs":{"intro":"**ベクトル**が数を1列に並べたものだとすれば、**行列**はその列を複数本並べた長方形です。サイズ $m\\times n$ は **$m$ 行** と **$n$ 列** を意味します。表記は文脈で変わるので（行=サンプルの場合も列=サンプルの場合もある）、**まず形状を確認**するのが大切です。","plain":"行列は **1枚のスプレッドシート** と考えると分かりやすいです。各セルは数値、**列全体**は1つの**特徴ベクトル**、**行全体**は1つの**レコード**になります。同じ表でも、**どの方向で読むか**で意味が変わります。","definition":"基本事項:\n\n1. **形状**: $m\\times n$ は実数要素を持つ $m$ 行 $n$ 列。\n2. **要素**: $i$ 行 $j$ 列の値は $a_{ij}$。\n3. **転置**: $A^{\\mathsf T}$ は $n\\times m$ で $(A^{\\mathsf T})_{ji}=a_{ij}$。\n4. **列をベクトルとして読む**: 列 $\\mathbf{a}_j\\in\\mathbb{R}^m$ を使って $A=[\\mathbf{a}_1\\ \\cdots\\ \\mathbf{a}_n]$ と書ける。\n5. **和/スカラー倍**: 同じ形状なら $(A+B)_{ij}=a_{ij}+b_{ij}$, $(cA)_{ij}=c\\,a_{ij}$。\n\n本章では、行列積に入る前に **ベクトル束の読み方** と **次元合わせ** を確実にします。","inAI":"**深層学習**では重みはしばしば**行列**（またはテンソルの2次元スライス）です。1層の線形変換は「多数の内積を同時に計算」する形になり、**バッチ化**ではサンプルを行/列方向に積みます。**機械学習**でも **設計行列** が特徴ベクトルを1枚の表に束ねます。"},"whyImportant":{"bridge":"Ch.01 でベクトル、Ch.02 で内積を学びました。Ch.03 ではその計算を **表全体** に拡張します。行列は **損失・勾配・重み更新** を記述する共通言語です。","similarity":"実データは通常 **多数サンプル × 多数特徴** です。**形状 $m\\times n$** を明示すると構造を正しく把握でき、形状ミスによる不具合を減らせます。"},"howUsed":{"ml":"学習データはしばしば **設計行列** として扱います。線形モデルは行列・ベクトル積で書かれ、ロジスティック/softmax、線形SVM、行列分解型推薦でも **バッチ化したベクトル演算** が使われます。","geometry":"列ベクトルは部分空間（列空間）を **張る** という見方ができます。高次元データを低次元へ写す操作は部分空間への **射影** として理解できます（後続章）。"},"summary":"**一行要約:** 行列は **複数ベクトルを1枚に束ねる道具** です。**行/列のどちらをサンプルとみなすか** は文脈依存です。**転置**で軸を入れ替えて次元を合わせます。Ch.02 の行内積を並べると $A\\mathbf{u}$ の各成分になります。次章で行列積と線形変換へ進みます。","problemSolving":{"focus":"下の表に、解くときに必要な **記号と次元ルール** をまとめています。続く **例題** で典型手順を確認します。","examplesHeading":"解法例","examplesTable":"**例 1 — 要素数を数える**\n\n問題: $A$ が $4\\times 7$ のとき、要素数は？\n\n解法: $4\\times 7=28$。\n\n→ **$28$** に対応する選択肢を選ぶ。\n\n---\n\n**例 2 — 転置の形状**\n\n問題: $A$ が $3\\times 5$ のとき、$A^{\\mathsf T}$ の形状は？\n\n解法: $5\\times 3$。\n\n---\n\n**例 3 — 和**\n\n問題: $A,B$ がどちらも $2\\times 2$ のとき、$(A+B)_{11}$ は？\n\n解法: $a_{11}+b_{11}$。\n\n---\n\n**例 4 — 列ベクトル**\n\n問題: $A=[\\mathbf{a}_1\\ \\mathbf{a}_2]$ で $\\mathbf{a}_1\\in\\mathbb{R}^m$ のとき、$A$ の行数は？\n\n解法: 各列の長さが $m$ なので **$m$ 行**。\n\n---\n\n**例 5 — Ch.02 との接続**\n\n問題: $A\\mathbf{u}$ の $i$ 番目成分は？\n\n解法: $A$ の **$i$ 行目** と $\\mathbf{u}$ の **内積**。"},"problemSolvingLabel":"問題を解くための説明","problemSolvingTable":"| 記号 | 意味 |\n| :--- | :--- |\n| $m\\times n$ | $m$ 行 $n$ 列 |\n| $a_{ij}$ | $i$ 行 $j$ 列の要素 |\n| $A^{\\mathsf T}$ | 転置: $(A^{\\mathsf T})_{ji}=a_{ij}$ |\n| 列ベクトル $\\mathbf{a}_j$ | $A$ の $j$ 列をベクトルとして見たもの |\n| 同じ形状 | $A+B$ は形状が一致するときのみ定義 |\n| $A\\mathbf{u}$（予告） | 各行と $\\mathbf{u}$ の内積を並べたベクトル |\n\n**項目別の詳しい説明**\n\n**① 形状** 加算・乗算の前に必ず次元（形状）を確認します。\n\n**② 転置** 必要に応じてサンプル軸と特徴軸を入れ替えます。\n\n**③ 行/列の見方** 同じ $A$ でも、問題設定によって意味づけが変わります。\n\n**④ Ch.02 との接続** 行ベクトルと $\\mathbf{u}$ の内積が $A\\mathbf{u}$ の1成分になります。","practiceProblemsTitle":"練習問題","practiceProblemsIntro":"以下は**60問バンク**から無作為に選んだ**10問**です（易しめ4・中3・難3、順序は易→中→難）。各問は**選択式**で、番号を選んでください。","practiceProblemsInstruction":"問題を読み、最も適切な選択肢を選んでください。","problems":{"definition_0":"$$m\\times n$ 行列の**要素数**はいくつですか？\n\n① $m+n$\n② $m\\times n$\n③ $\\max(m,n)$\n④ $m-n$","definition_1":"行列 $A$ の $(i,j)$ 要素を表す一般的な記号はどれですか？\n\n① $a_{ij}$\n② $a_{ji}$ のみ\n③ $A_i$\n④ $\\det(A)$","definition_2":"$$A$ が $m\\times n$ のとき、各**列ベクトル**の長さ（次元）はどれですか？\n\n① $m$\n② $n$\n③ $m+n$\n④ $mn$","definition_3":"$$A$ が $m\\times n$ のとき、$A^{\\mathsf T}$ の形状はどれですか？\n\n① $n\\times m$\n② $m\\times n$\n③ $m\\times m$\n④ $n\\times n$","definition_4":"**正方行列**の意味として正しいものはどれですか？\n\n① 行数と列数が等しい\n② すべての要素が 1\n③ 常に可逆である\n④ 常に零行列である","definition_5":"**零行列**の性質として正しいものはどれですか？\n\n① すべての要素が 0\n② 対角成分だけが 0\n③ 行列式が常に 1\n④ 転置できない","definition_6":"単位行列 $I_n$ のサイズはどれですか？\n\n① $n\\times n$\n② $n\\times 1$\n③ $1\\times n$\n④ $2n\\times 2n$","definition_7":"$$\\mathbb{R}^{m\\times n}$ は何を表しますか？\n\n① 実数成分を持つ $m\\times n$ 行列全体\n② $(m+n)$ 次元ベクトル空間のみ\n③ 行列式の集合\n④ 正方行列のみ","definition_8":"$$A=[\\mathbf{a}_1\\ \\cdots\\ \\mathbf{a}_n]$ かつ $\\mathbf{a}_j\\in\\mathbb{R}^m$ のとき、$A$ の形状はどれですか？\n\n① $m\\times n$\n② $n\\times m$\n③ $m\\times 1$\n④ $1\\times n$","definition_9":"形状が $1\\times n$ の**行ベクトル**の要素数はいくつですか？\n\n① $n$\n② $1$\n③ $n+1$\n④ $0$","trueFalse_0":"次の文が**真**なら①、**偽**なら②を選んでください。\n\n行列の加法 $A+B$ は、$A$ と $B$ の形状が同じときのみ定義される。\n\n① 真\n② 偽","trueFalse_1":"次の文が**真**なら①、**偽**なら②を選んでください。\n\n$(A^{\\mathsf T})^{\\mathsf T}=A$ が成り立つ。\n\n① 真\n② 偽","trueFalse_2":"次の文が**真**なら①、**偽**なら②を選んでください。\n\n$2\\times 3$ 行列と $3\\times 2$ 行列は要素数が同じになりうる。\n\n① 真\n② 偽","trueFalse_3":"次の文が**真**なら①、**偽**なら②を選んでください。\n\nすべての正方行列は可逆である。\n\n① 真\n② 偽","trueFalse_4":"次の文が**真**なら①、**偽**なら②を選んでください。\n\n$A$ が $m\\times n$ なら、$A^{\\mathsf T}$ は $n\\times m$ である。\n\n① 真\n② 偽","trueFalse_5":"次の文が**真**なら①、**偽**なら②を選んでください。\n\nデータの一般的な慣例では「1 行 = 1 サンプル」である。\n\n① 真\n② 偽","trueFalse_6":"次の文が**真**なら①、**偽**なら②を選んでください。\n\n加法が定義されるとき $A+B=B+A$ が成り立つ。\n\n① 真\n② 偽","trueFalse_7":"次の文が**真**なら①、**偽**なら②を選んでください。\n\n$(cA)^{\\mathsf T}=cA^{\\mathsf T}$ が成り立つ。\n\n① 真\n② 偽","trueFalse_8":"次の文が**真**なら①、**偽**なら②を選んでください。\n\n$I_nA=A$ が成り立つには、$A$ は必ず $n\\times n$ でなければならない。\n\n① 真\n② 偽","trueFalse_9":"次の文が**真**なら①、**偽**なら②を選んでください。\n\nCh.02 の内積は行列・ベクトル積の 1 行とつながっている。\n\n① 真\n② 偽","calc_0":"$$A=\\begin{pmatrix}1&2\\\\3&4\\end{pmatrix}$ のとき、$\\mathrm{tr}(A)=a_{11}+a_{22}$ はいくつですか？\n\n① $5$\n② $4$\n③ $6$\n④ $7$","calc_1":"$$A=\\begin{pmatrix}1&0\\\\2&-1\\end{pmatrix}$、$B=\\begin{pmatrix}0&1\\\\1&1\\end{pmatrix}$ のとき、$(A+B)_{12}$ はどれですか？\n\n① $1$\n② $0$\n③ $2$\n④ $-1$","calc_2":"$$A=\\begin{pmatrix}2&-1\\end{pmatrix}$、$c=3$ のとき、$(cA)_{11}$ はどれですか？\n\n① $6$\n② $2$\n③ $-3$\n④ $9$","calc_3":"$$A$ が $2\\times 3$ のとき、$A^{\\mathsf T}$ の要素数はいくつですか？\n\n① $5$\n② $6$\n③ $8$\n④ $9$","calc_4":"$$A=\\begin{pmatrix}1&2\\\\3&4\\end{pmatrix}$ のとき、$A^{\\mathsf T}$ の $(2,1)$ 要素はどれですか？\n\n① $2$\n② $3$\n③ $4$\n④ $1$","calc_5":"$$A=\\begin{pmatrix}0&1\\\\2&3\\end{pmatrix}$、$B=\\begin{pmatrix}1&-1\\\\0&2\\end{pmatrix}$ のとき、$(A+B)_{21}$ はどれですか？\n\n① $2$\n② $3$\n③ $1$\n④ $0$","calc_6":"$$A=\\begin{pmatrix}1&2&3\\end{pmatrix}$ は $1\\times 3$。$A^{\\mathsf T}$ の形状はどれですか？\n\n① $3\\times 1$\n② $1\\times 3$\n③ $3\\times 3$\n④ $1\\times 1$","calc_7":"$$A=\\begin{pmatrix}5\\end{pmatrix}$ のとき、（行列式は考えずに）$A^{\\mathsf T}$ の形状はどれですか？\n\n① $1\\times 1$\n② $0\\times 0$\n③ $1\\times 0$\n④ 未定義","calc_8":"$$A=\\begin{pmatrix}1&2\\\\3&4\\\\5&6\\end{pmatrix}$ の形状はどれですか？\n\n① $3\\times 2$\n② $2\\times 3$\n③ $6\\times 1$\n④ $1\\times 6$","calc_9":"$$\\begin{pmatrix}1&2\\\\3&4\\end{pmatrix}$ の第 1 列を $\\mathbf{a}_1$ とすると、$\\mathbf{a}_1$ の**第 2 成分**はどれですか？\n\n① $3$\n② $1$\n③ $2$\n④ $4$","concept_0":"線形回帰で、**サンプルを行に置く**一般的な慣例（例: scikit-learn）は何を意味しますか？\n\n① 各行が 1 つの観測（サンプル）\n② 各列が 1 つの観測\n③ $1\\times n$ しか使えない\n④ 行列は使わない","concept_1":"深層学習でよく使う **2 次元バッチ** の形はどれですか？\n\n① （バッチサイズ）$\\times$（特徴次元）のような形\n② スカラーのみ\n③ バッチサイズは常に 0\n④ 行列は使わない","concept_2":"Ch.02（内積）とつなげると、$A\\mathbf{u}$ の $i$ 番目成分は何ですか？\n\n① $A$ の $i$ 行目と $\\mathbf{u}$ の内積\n② 常に $i$ 列との内積のみ\n③ 常に 0\n④ トレース（対角和）","concept_3":"行列を**列ベクトルの束**として読むのが適切なのはどんなときですか？\n\n① 各列が同じ種類の特徴ベクトルを表すとき\n② 列がサンプルのときだけ\n③ 行が特徴のときだけ\n④ 転置ができないとき","concept_4":"線形層の前に画像をベクトルへ **flatten** する主な理由は何ですか？\n\n① FC 層が期待する入力次元（ベクトル）に合わせるため\n② 画像は常に 1 ピクセルだから\n③ 行列の利用が禁止されているから\n④ softmax のためだけ","concept_5":"表形式データで**列ごとに標準化**するとは、通常どういう意味ですか？\n\n① 同じ特徴（同じ列）の中でスケールをそろえる\n② 行方向だけでそろえる\n③ 常に定数を足す\n④ 行列サイズを変える","concept_6":"協調フィルタリングでのユーザー-アイテム**評価行列**の典型的な解釈はどれですか？\n\n① 行がユーザー、列がアイテム（またはその逆）という軸の意味づけをする\n② 常に $1\\times 1$\n③ 常に零行列\n④ 内積とは無関係","concept_7":"直感的に **ランク** は何と関係しますか？（詳細は後続章）\n\n① 独立な列方向（または行方向）の数\n② 常に行列式と等しい\n③ 常に 0\n④ 転置すると常に増える","concept_8":"行列で **broadcasting** を誤用しやすい理由はどれですか？\n\n① 形状確認なしで加算すると静かに誤ることがある\n② 形状確認は不要\n③ 行列は常に $1\\times 1$\n④ 転置は常に恒等","concept_9":"行列積 $AB$（Ch.04 予告）で必要な条件はどれですか？\n\n① $A$ の列数 = $B$ の行数\n② $A,B$ は必ず正方行列\n③ 常に $AB=BA$\n④ 積は常にスカラー","projection_0":"$$A\\in\\mathbb{R}^{m\\times n}$、$\\mathbf{u}\\in\\mathbb{R}^n$ のとき、$A\\mathbf{u}$ の次元はどれですか？\n\n① $m$\n② $n$\n③ $m+n$\n④ $mn$","projection_1":"$$A$ の $i$ 行目を $\\mathbf{r}_i^{\\mathsf T}$ とすると、$(A\\mathbf{u})_i$ はどれですか？\n\n① $\\mathbf{r}_i\\cdot\\mathbf{u}$\n② $\\mathbf{r}_i+\\mathbf{u}$\n③ $\\|\\mathbf{r}_i\\|$\n④ $\\det(A)$","projection_2":"すべての $\\mathbf{u}$ に対して $A\\mathbf{u}=\\mathbf{0}$ となるとき、$A$ の列について最も妥当な推測はどれですか？\n\n① 列が線形従属になりうる\n② 常に $A=I$\n③ 常に可逆\n④ 列ノルムが常に 1","projection_3":"$$\\mathbf{u}\\mathbf{v}^{\\mathsf T}$（外積形式）のランクに関する直感として正しいものはどれですか？\n\n① 非零ベクトルなら高々 1\n② 常に $n$\n③ 常に 0\n④ 常に可逆","projection_4":"列空間 $\\mathrm{Col}(A)$ の説明として最も適切なのはどれですか？\n\n① $A$ の列ベクトルの線形結合で作れるベクトル全体\n② 常に全空間\n③ 常に $\\{\\mathbf{0}\\}$ のみ\n④ 行列式の集合","projection_5":"$$A\\mathbf{x}=\\mathbf{b}$ が解を持つなら、$\\mathbf{b}$ はどこに属する必要がありますか？\n\n① $\\mathrm{Col}(A)$\n② 単位球のみ\n③ 零ベクトルのみ\n④ $\\mathbb{R}$","projection_6":"行列 $A$ を行で見たとき、各行ベクトルはどの空間の元ですか？（要素数の観点）\n\n① $\\mathbb{R}^n$\n② $\\mathbb{R}^m$\n③ $\\mathbb{R}^{mn}$\n④ $\\mathbb{R}$","projection_7":"$$A\\in\\mathbb{R}^{m\\times n}$、標準基底 $\\mathbf{e}_j\\in\\mathbb{R}^n$ のとき、$A\\mathbf{e}_j$ はどれですか？\n\n① $A$ の第 $j$ 列\n② $A$ の第 $j$ 行\n③ 常に 0\n④ $(j,j)$ 要素のみ","projection_8":"データ行列 $X$ で**サンプルを行**に置くとき、$X^{\\mathsf T}$ は何を入れ替えますか？\n\n① サンプル軸と特徴軸\n② 何も変わらない\n③ 常に正方行列になる\n④ 常に零行列になる","projection_9":"線形写像の観点で $A\\mathbf{u}$ は何を表しますか？\n\n① $\\mathbb{R}^n\\to\\mathbb{R}^m$ という写像での $\\mathbf{u}$ の像\n② 常に長さ保存\n③ 常に回転のみ\n④ 常に確率ベクトル","scenario_0":"scikit-learn で **X** を「サンプルを行」に置くとき、一般的な形状はどれですか？\n\n① (サンプル数)$\\times$(特徴数)\n② (特徴数)$\\times$(サンプル数) のみ\n③ 常に $1\\times 1$\n④ (クラス数)$\\times$(バッチ)","scenario_1":"バッチサイズ 32・特徴次元 128 の 2 次元テンソルは、行列としてどの形で読むのが一般的ですか？\n\n① $32\\times 128$\n② $128\\times 32$ のみ\n③ $32\\times 32$\n④ $128\\times 128$","scenario_2":"畳み込み後に全結合層へ入れる前、**flatten** する理由はどれですか？\n\n① FC 層がベクトル入力を期待するため\n② softmax のためだけ\n③ 画像が常に 1 次元だから\n④ 逆伝播を止めるため","scenario_3":"欠損値を**列平均**で埋めるとき、平均は通常どの方向で計算しますか？\n\n① 同じ列（同じ特徴）内\n② 行方向のみ\n③ 対角成分のみ\n④ 全体を 1 つのスカラーで","scenario_4":"協調フィルタリングで評価行列 $R$ が非常に**疎**であるとはどういう意味ですか？\n\n① 観測されていない要素が大半\n② すべての要素が 1\n③ 常に可逆\n④ 行列を使わない","scenario_5":"文埋め込みを**行として積む**表現が示す直感として適切なのはどれですか？\n\n① 各行が 1 文（またはプーリング後ベクトル）\n② 列が常に文\n③ 常に $1\\times 1$\n④ softmax のみ","scenario_6":"GPU 上での性能に強く関係する基本概念はどれですか？\n\n① メモリレイアウト/stride とテンソル形状\n② 行列は常にスカラー\n③ 転置は常に無料\n④ ランクは常に 0","scenario_7":"Ch.03 だけで言うと**言い過ぎ**になりやすい主張はどれですか？\n\n① 「行列があれば深層学習が常に最適」\n② データは表形式になることが多い\n③ 形状合わせは重要\n④ 転置は軸を入れ替える","scenario_8":"$$H\\times W$ のグレースケール画像を flatten したときのベクトル長はどれですか？\n\n① $H\\times W$\n② $H+W$\n③ $\\max(H,W)$\n④ $1$","scenario_9":"Ch.04 予告: $\\mathbf{y}=W\\mathbf{x}+\\mathbf{b}$ において、$W$ は何を表しますか？\n\n① 特徴を混ぜる線形変換\n② 常に 1 回のスカラー積\n③ 常に softmax\n④ 常に損失関数"},"problemAnswers":{"definition_0":2,"definition_1":1,"definition_2":1,"definition_3":1,"definition_4":1,"definition_5":1,"definition_6":1,"definition_7":1,"definition_8":1,"definition_9":1,"trueFalse_0":1,"trueFalse_1":1,"trueFalse_2":1,"trueFalse_3":2,"trueFalse_4":1,"trueFalse_5":1,"trueFalse_6":1,"trueFalse_7":1,"trueFalse_8":2,"trueFalse_9":1,"calc_0":1,"calc_1":1,"calc_2":1,"calc_3":2,"calc_4":1,"calc_5":1,"calc_6":1,"calc_7":1,"calc_8":1,"calc_9":1,"concept_0":1,"concept_1":1,"concept_2":1,"concept_3":1,"concept_4":1,"concept_5":1,"concept_6":1,"concept_7":1,"concept_8":1,"concept_9":1,"projection_0":1,"projection_1":1,"projection_2":1,"projection_3":1,"projection_4":1,"projection_5":1,"projection_6":1,"projection_7":1,"projection_8":1,"projection_9":1,"scenario_0":1,"scenario_1":1,"scenario_2":1,"scenario_3":1,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1},"problemSolutions":{"definition_0":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ②**","definition_1":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","definition_2":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","definition_3":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","definition_4":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","definition_5":"**1) ポイント:** 零行列は全成分が 0 です。 **2) 例:** $\\begin{pmatrix}0&0\\\\0&0\\end{pmatrix}$ は零行列。 **3) 正答 ①**","definition_6":"**1) ポイント:** 単位行列 $I_n$ は対角が 1 の正方行列です。 **2) 例:** $I_3$ は $3\\times 3$。 **3) 正答 ①**","definition_7":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","definition_8":"**1) ポイント:** 列が $n$ 本あり、各列の長さが $m$ なら形状は $m\\times n$。 **2) 例:** 2 本の列で各列 4 要素なら $4\\times 2$。 **3) 正答 ①**","definition_9":"**1) ポイント:** $1\\times n$ の行ベクトルは要素数が $n$。 **2) 例:** $1\\times 4$ なら 4 要素。 **3) 正答 ①**","trueFalse_0":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","trueFalse_1":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","trueFalse_2":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","trueFalse_3":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ②**","trueFalse_4":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","trueFalse_5":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","trueFalse_6":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","trueFalse_7":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","trueFalse_8":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ②**","trueFalse_9":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","calc_0":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","calc_1":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","calc_2":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","calc_3":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ②**","calc_4":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","calc_5":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","calc_6":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","calc_7":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","calc_8":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","calc_9":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","concept_0":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","concept_1":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","concept_2":"**1) ポイント:** $A\\mathbf{u}$ の各成分は行ベクトルとの内積で決まります。 **2) 例:** $(A\\mathbf{u})_i=\\mathbf{r}_i\\cdot\\mathbf{u}$。 **3) 正答 ①**","concept_3":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","concept_4":"**1) ポイント:** 全結合層は通常ベクトル入力を前提にします。 **2) 例:** 画像を平坦化して次元を一致させる。 **3) 正答 ①**","concept_5":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","concept_6":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","concept_7":"**1) ポイント:** ランクは独立な方向の数に対応します。 **2) 例:** 同一直線上の列だけならランクは 1。 **3) 正答 ①**","concept_8":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","concept_9":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","projection_0":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","projection_1":"**1) ポイント:** 行列ベクトル積の $i$ 成分は $i$ 行との内積です。 **2) 例:** $(A\\mathbf{u})_i=\\mathbf{r}_i\\cdot\\mathbf{u}$。 **3) 正答 ①**","projection_2":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","projection_3":"**1) ポイント:** 外積 $\\mathbf{u}\\mathbf{v}^{\\mathsf T}$ は基本的に 1 方向しか作らないためランクは高々 1。 **2) 例:** 非零ベクトル同士なら通常ランク 1。 **3) 正答 ①**","projection_4":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","projection_5":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","projection_6":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","projection_7":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","projection_8":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","projection_9":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","scenario_0":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","scenario_1":"**1) ポイント:** バッチ×特徴の表現では $32\\times 128$ が一般的です。 **2) 例:** 32 サンプル、それぞれ 128 次元特徴。 **3) 正答 ①**","scenario_2":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","scenario_3":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","scenario_4":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","scenario_5":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","scenario_6":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","scenario_7":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","scenario_8":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**","scenario_9":"**1) 手順:** 問題が定義・計算・応用のどれかを先に判定します。 **2) 例:** 形状ミスを防ぐため、小さな \\times 2$ の例で確認します。 **3) 正答 ①**"},"problemTestCodes":{"definition_0":"answer = 2\nassert answer == 2","definition_1":"answer = 1\nassert answer == 1","definition_2":"answer = 1\nassert answer == 1","definition_3":"answer = 1\nassert answer == 1","definition_4":"answer = 1\nassert answer == 1","definition_5":"answer = 1\nassert answer == 1","definition_6":"answer = 1\nassert answer == 1","definition_7":"answer = 1\nassert answer == 1","definition_8":"answer = 1\nassert answer == 1","definition_9":"answer = 1\nassert answer == 1","trueFalse_0":"answer = 1\nassert answer == 1","trueFalse_1":"answer = 1\nassert answer == 1","trueFalse_2":"answer = 1\nassert answer == 1","trueFalse_3":"answer = 2\nassert answer == 2","trueFalse_4":"answer = 1\nassert answer == 1","trueFalse_5":"answer = 1\nassert answer == 1","trueFalse_6":"answer = 1\nassert answer == 1","trueFalse_7":"answer = 1\nassert answer == 1","trueFalse_8":"answer = 2\nassert answer == 2","trueFalse_9":"answer = 1\nassert answer == 1","calc_0":"answer = 1\nassert answer == 1","calc_1":"answer = 1\nassert answer == 1","calc_2":"answer = 1\nassert answer == 1","calc_3":"answer = 2\nassert answer == 2","calc_4":"answer = 1\nassert answer == 1","calc_5":"answer = 1\nassert answer == 1","calc_6":"answer = 1\nassert answer == 1","calc_7":"answer = 1\nassert answer == 1","calc_8":"answer = 1\nassert answer == 1","calc_9":"answer = 1\nassert answer == 1","concept_0":"answer = 1\nassert answer == 1","concept_1":"answer = 1\nassert answer == 1","concept_2":"answer = 1\nassert answer == 1","concept_3":"answer = 1\nassert answer == 1","concept_4":"answer = 1\nassert answer == 1","concept_5":"answer = 1\nassert answer == 1","concept_6":"answer = 1\nassert answer == 1","concept_7":"answer = 1\nassert answer == 1","concept_8":"answer = 1\nassert answer == 1","concept_9":"answer = 1\nassert answer == 1","projection_0":"answer = 1\nassert answer == 1","projection_1":"answer = 1\nassert answer == 1","projection_2":"answer = 1\nassert answer == 1","projection_3":"answer = 1\nassert answer == 1","projection_4":"answer = 1\nassert answer == 1","projection_5":"answer = 1\nassert answer == 1","projection_6":"answer = 1\nassert answer == 1","projection_7":"answer = 1\nassert answer == 1","projection_8":"answer = 1\nassert answer == 1","projection_9":"answer = 1\nassert answer == 1","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 1\nassert answer == 1","scenario_3":"answer = 1\nassert answer == 1","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1"}},"midMathCh04":{"chapter":"Chapter 04","title":"行列の積と線形変換: データをデザインするスマートフィルター","description":"行列の積は、ただ数字をたくさん足し掛ける退屈な計算ではありません。行列は元データを回し、ねじり、圧縮する**デジタル写真編集ソフトのスマートフィルター**と同じ役割を果たします。本章では、ひとつのデータ（ベクトル）を編集ツール（行列）に通し、まったく別の次元へ写す**線形変換（Linear Transformation）**を掘り下げます。深層学習モデルの根幹 $\\mathbf{y} = W\\mathbf{x} + \\mathbf{b}$ が、どんな数学的意味で動くのかを丁寧に見ていきます。","sectionTitle":"行列の積と線形変換: 空間を自在に編集する","sectionLabels":{"whatIs":"概念とは","whyImportant":"なぜ重要か","howUsed":"どう使うか","problemSolving":"解法のヒント"},"visualShort":"行列×ベクトル = 一度に座標を動かす · 積 = 変換をつなぐ","visualIntro":"行列 $A$ を掛けるとは、**成分を混ぜて新しいベクトルを作る**こと。**$AB$** は「$B$ のあと $A$」を**一つの積**にまとめたもの。格子が傾くイメージで十分です。","visualStep1":"概念: $A\\in\\mathbb{R}^{m\\times n}$ は $\\mathbb{R}^n\\to\\mathbb{R}^m$ の線形写像","visualStep2":"直感: 格子とベクトルが傾き・伸びる（原点は固定）","visualStep3":"式: $(AB)_{ij}$ は $i$ 行と $j$ 列の内積、$(AB)\\mathbf{x}=A(B\\mathbf{x})$","visualStep4":"応用: 全結合層、バッチ行列積、アテンションのスコア","visualStepsLabel":"見る順番","visualFlowTitle":"学習の流れ","visualFlowStep0":"概念: 線形変換 = 行列 × ベクトル","visualFlowStep1":"直感: 平面格子の変形と合成","visualFlowStep2":"式: 積の規則・転置・合成","visualFlowStep3":"つなぎ: Ch.02 の内積 = 行列積の 1 行","visualFlowStep4":"応用: FC 層・バッチ・スコア行列","mapVisualStep1":"① 入力 x","mapVisualStep2":"② A を掛ける","mapVisualStep3":"③ Ax は青い面の上","mapVisualPanelLeft":"入力","mapVisualPanelRight":"出力","dotVisualAnimateHint":"同じ平面上で正方格子が A により平行四辺形になり、x が Ax に移ります。","dotVisualPhaseHint0":"**1/4** $x_1$ だけ動かし $x_2$ は固定。出力は **第1列の方向**（橙の最初の区間）だけに沿います。","dotVisualPhaseHint1":"**2/4** $x_2$ だけ動かし $x_1$ は固定。出力は **第2列の方向**（青緑の後半）だけに動きます。","dotVisualPhaseHint2":"**3/4** $x_1=x_2$ で同じように動かします。出力は **二列の和の方向**に沿います。","dotVisualPhaseHint3":"**4/4** $(x_1,x_2)$ が円を描きます。出力は **青い面**の上を一周します。","dotVisualHudCoeffLine":"$$x_1={x1}$, $x_2={x2}$","dotVisualDecompKey":"","dotVisualEasyHook":"**一行:** $A\\mathbf{x}$ は **入力 $\\mathbf{x}$ を一度に新しい位置へ**。右の**大きい緑の箱**は「出てきてよい値の枠」、**青い面**は「実際に届く床」（$A$ の列が張る空間）です。","dotVisualAriaLabel":"単位正方形の格子が行列 A で平行四辺形に写り、点 x が Ax に移ります","dotVisualMainTitle":"正方格子 → $A$ → 傾いた格子","dotVisualPlotTitle":"左の**同じ座標**の点が、右へ**一気に**移ります。格子全体が一緒に伸びます。","dotVisualMetricsTitle":"この図だけ覚えよう","dotVisualHudDot":"","dotVisualHudCos":"$$T(\\mathbf{x})=A\\mathbf{x}$。**$T$** は「行列 $A$ を掛ける**線形変換**」に付けた**名前（関数記号）**です。**$T(\\mathbf{x})$** は「$\\mathbf{x}$ に $T$ を適用した結果」で、計算上は **$A\\mathbf{x}$** と同じ意味です。","dotVisualHudPlain":"**青い領域** = $A$ の**二つの列ベクトル**が張る平行四辺形。**$T(\\mathbf{x})=A\\mathbf{x}$** は常にその**内側**（列の線形結合で届く範囲）にあります。","dotVisualHudProj":"列空間","dotVisualLegendU":"入力 / 枠","dotVisualLegendV":"$$A$","dotVisualLegendProj":"届く面","dotVisualLegendRes":"$$\\mathbf{x} \\mapsto A\\mathbf{x}$","dotVisualInsetLabel":"t","mapVisualDomainCaption":"入力","mapVisualCodomainCaption":"出てよい範囲","mapVisualRangeCaption":"実際に届く面","mapVisualRnLabel":"ℝ²","mapVisualRnSubLabel":"実数座標平面 · 入力","mapVisualRnSvgTitle":"ℝ²: 入力の2次元実数空間（座標の組）。回帰の決定係数 R² とは別です。","mapVisualRnA11y":"ℝ²: 入力の2次元実数空間（座標の組）。回帰の決定係数 R² とは別です。","mapVisualRmLabel":"ℝ²","mapVisualRmSubLabel":"実数座標平面 · 出力","mapVisualRmSvgTitle":"ℝ²: 変換後の点を描く2次元実数空間。この図では入力と同じ次元です。","mapVisualRmA11y":"ℝ²: 変換後の点を描く2次元実数空間。この図では入力と同じ次元です。","mapVisualLabelX":"x","mapVisualLabelTx":"Ax","mapVisualLabelMap":"A","mapVisualMapHint":"**オレンジの A：** この図の **行列 $A$**（線形変換）。左の座標 $\\mathbf{x}$ に掛けて、右の点 $A\\mathbf{x}$ を作ります。","mapVisualCol1Tag":"a₁","mapVisualCol2Tag":"a₂","mapVisualGhostHint":"灰点線 = A=I のときの正方形","dotVisualCaption":"**$A\\mathbf{x}$** は「$\\mathbf{x}$ の成分を $A$ で混ぜる」規則です。左で **入力** が動くと、右では **青い面の上** にだけ答えが乗ります。**$AB$** は変換を **つなぐ**（先に $B$、次に $A$）と考えましょう。","whatIs":{"0":"**1. 線形変換（Linear Transformation）：画像編集の「自由変形」ツール**\n\n**概念:** 透明なグリッドの上に描いた画像を Photoshop で開いたと想像してください。角を掴んで斜めに伸ばしたり、45°回転したり、せん断して潰したり——幾何学でいう**線形変換**は、まさにそういう操作です。\n\n**厳格なルール:** このツールには壊してはいけないルールが二つあります。第一に、画像の中心にある**原点 $(0,0)$ は変形後も同じ位置**に留まります。第二に、**もともと直線だった線は曲がらず直線のまま**、互いに平行だった線は平行のままです。","1":"**2. 行列×ベクトル ($A\\mathbf{x}$)：原画像にフィルターをかける**\n\n**概念:** **ベクトル $\\mathbf{x}$** はまだ何も加工していない「元データ（点の位置）」、**行列 $A$** は角度と比率で歪ませる**スマートフィルター（変換ルール）**です。フィルターをかける操作を $A\\mathbf{x}$（行列 $A$ が $\\mathbf{x}$ に作用する）と書きます。\n\n**深層学習での使い方:** ニューラルネットの1層は、**$\\mathbf{y} = W\\mathbf{x} + \\mathbf{b}$** を作るためにこれを使います。\n* $W$（重み行列）：データを解析しやすい角度・比率へ歪める（線形変換）。\n* $\\mathbf{b}$（バイアスベクトル）：レイヤーをまるごと横に動かすような平行移動。\n「歪めてから動かす」結果が $\\mathbf{y}$ となり、次の層へ渡ります。","2":"**3. 行列×行列 ($AB$)：フィルターを順に重ねる**\n\n**概念:** $A$ と $B$ の積は、二つの編集フィルターを**連続で適用する**ことです。式は右から左へ読むので、**まず $B$、その結果に $A$ を重ねる**意味になります。\n\n**要点（$AB \\neq BA$）：** 「横に2倍に伸ばしてから90°回転」は**縦に細長い**画像になり、「90°回転してから横に2倍」は**横に広い**画像になります。順序を変えると結果が変わるので、**$AB \\neq BA$（交換法則は成り立たない）**が重要です。","3":"**4. 積の次元合わせ：規格の合うケーブルをつなぐ**\n\n**概念:** フィルターを重ねるには、左行列の**列数**と右行列の**行数**がぴったり一致している必要があります。\n\n**要点:** $(m\\times n)$ と $(n\\times p)$ を掛けると、接する $n$ は計算の中で吸収され、**$(m\\times p)$** が出力されます。実装ではデータ $X$ と重み $W$ の形を合わせるため**転置**を使い、**$Y = XW^{\\mathsf{T}}$** の形できれいに積みます。","4":"**5. 変換の具体例：3次元を平面に「押しつぶす」**\n\n**例1** 点 $(x_1,x_2,x_3)$ を $z=0$ の $xy$ 平面に落とす（第3座標を捨てる）線形写像は、次のように書けます。\n\n$$A=\\begin{pmatrix}1&0&0\\\\0&1&0\\\\0&0&0\\end{pmatrix}$$\n\n**規則:** $\\mathbf{x}\\mapsto A\\mathbf{x}$。同じ積を **行ごとの内積** に分けて書くと次のとおりです。\n\n**ステップ1 — 式を立てる** $\\mathbf{x}=(x_1,x_2,x_3)^{\\mathsf T}$ に対して\n\n$$A\\mathbf{x}=\\begin{pmatrix}1&0&0\\\\0&1&0\\\\0&0&0\\end{pmatrix}\\begin{pmatrix}x_1\\\\x_2\\\\x_3\\end{pmatrix}$$\n\n**ステップ2 — 各行と $\\mathbf{x}$ の内積**（$i$ 番目の成分 = $A$ の $i$ 行目 · $\\mathbf{x}$）\n\n$$\\begin{aligned}\ny_1 &= 1\\cdot x_1+0\\cdot x_2+0\\cdot x_3 = x_1,\\\\\ny_2 &= 0\\cdot x_1+1\\cdot x_2+0\\cdot x_3 = x_2,\\\\\ny_3 &= 0\\cdot x_1+0\\cdot x_2+0\\cdot x_3 = 0.\n\\end{aligned}$$\n\n**ステップ3 — 結果ベクトル**\n\n$$A\\mathbf{x}=\\begin{pmatrix}y_1\\\\y_2\\\\y_3\\end{pmatrix}=\\begin{pmatrix}x_1\\\\x_2\\\\0\\end{pmatrix}$$\n\nつまり **$x_1,x_2$ はそのまま、$x_3$ だけ 0** になります。幾何的には原点を通る $xy$ 平面への**正射影（orthogonal projection）**であり、「1本の軸の情報を消す」フィルターを**行列の一度の積**で表した例です。Ch.02 の内積・射影の直感ともつながります。"},"whyImportant":{"bridge":"**数十万ピクセルを一度に処理する並列の魔法**\n\n高解像度の写真一枚でもピクセルは数百万あり、一つずつ for 文で回すと1日かかっても足りません。行列の積は、それらを**巨大な表（行列）**にまとめ、変換ルールも**別の行列**として表します。だから「フィルターをかける」直感が**一度の行列積**にそのまま落ちます。\n\nGPU はこの積を**数千コアで同時**に処理するよう設計されています。TensorFlow・PyTorch でよく見る**バッチ GEMM**は、サンプルを行に積んだ $X$ に $W$ を一度に掛け、**$Y = XW^{\\mathsf{T}}$** でミニバッチ全体を流し込みます。深層学習が大量データを速く学べるのは、**行列という共通フォーマット**でハードウェアの並列性を引き出せるからです。","similarity":"**あらゆるAIモデルを貫く共通言語**\n\nNetflix の推薦、テスラの車線認識、ChatGPT の対話——見かけは違っても、底流ではいつも **$Y = XW^{\\mathsf{T}}$** という行列積が動いています。全結合層・埋め込み・アテンションのスコアまで、名前は違っても根は**行列×行列**です。\n\nこの感覚があれば **Shape mismatch** のとき、**どのブロックのサイズが合っていないか**を早く特定できます。前列の列と後列の行が揃わなければ積が定義されないのは、**ケーブル規格を合わせる**のと同じです。この「共通言語」に慣れると、分野が違っても論文・コード・ログが同じ地図で読めます。"},"howUsed":{"ml":"**1) トランスフォーマーとアテンション：単語間の「注目マップ」を行列で**\n\nChatGPT 系モデルの心臓である**アテンション**は、文中の単語同士がどれだけ関係するかを**スコア行列**で一括計算します。**$QK^{\\mathsf{T}}$** は「この単語があの単語をどれだけ見るか」の素スコアを高速に埋めます。ソフトマックスと $V$ の重み付き和が載って**スケール付き内積アテンション**が完成。一行で言えば、**行列積で関係グラフを作り、同じ代数で重み付き和を取る**構造です。\n\n**2) 線形層・バッチ学習：ミニバッチを一括で**\n\n全結合層は $\\mathbf{y} = W\\mathbf{x} + \\mathbf{b}$ の繰り返しです。学習では $N$ サンプルを行に積んだ $X$ に対し **$Y = XW^{\\mathsf{T}} + \\mathbf{1}\\mathbf{b}^{\\mathsf{T}}$** のように一度に処理します。畳み込みもチャネルと空間を展開すれば**大きな行列積**として見られ、フレームワークが内部で **GEMM** を使う理由につながります。\n\n**3) 埋め込み・推薦：意味ベクトルを突き合わせる**\n\n単語・ユーザー・アイテムをベクトル化し、**内積や行列積**で類似度・スコアを出すと推薦・検索・ランキングが回ります。「誰が誰に近いか」を**一枚の行列**にまとめるイメージです。","geometry":"**1) PCA・次元削減：千次元を「影」に落とす**\n\n人間は3次元以上を直感的に描きにくいですが、データは数百・数千次元になりがちです。**PCA** は共分散を行列にし、**固有ベクトル方向**（分散の大きい軸）を選んでデータを**射影**します。線形変換として書けば「不要な方向を潰して本質の軸だけ残す」ことになります。可視化用の2次元散布図は、高次元の雲を行列で押しつぶした**影**だと考えられます。\n\n**2) 幾何の予習：後に出る固有値・行列式**\n\n同じ線形変換でも**方向によって伸び縮み**は違います。その特別な方向が固有ベクトル、伸び率が固有値です。列が作る平行四辺形や合成 $AB$ の感覚があれば、Ch.05 以降の**可逆性・行列式・スペクトル**がつかみやすくなります。\n\n**3) CG：画面に映すまでも行列**\n\nゲームや CAD でも回転・平行移動・遠近法に**同次座標**と**行列積**を使います。「3D を 2D に映す」も**座標を行列で一括で動かす**話です。深層学習と CG は別分野に見えても、**空間を行列で扱う**点では同じ道具箱を共有します。"},"summary":"**実務者向け要点:** 行列の積は、データをただの数の列ではなく、多次元空間で潰したり回したりする**動的な空間変換ツール（$\\mathbf{y} = W\\mathbf{x} + \\mathbf{b}$）**です。層を積むときは**規格（$(m \\times n) \\times (n \\times p)$）**を合わせることが最優先で、変換の順序（$AB \\neq BA$）が結果を根本から変えることを忘れないでください。","problemSolving":{"focus":"下の表は**次元のルール**と**よく使う公式**をまとめたものです。解説例は代表的な型ごとに段階を示しています。","examplesHeading":"解説例","examplesTable":"**例1 — 積の形**\n\n問: $A$ が $4\\times 7$、$B$ が $7\\times 3$ のとき $AB$ は？\n\n答: $4\\times 3$。\n\n---\n\n**例2 — 合成の順序**\n\n問: $\\mathbf{x}$ に「$B$ のあと $A$」を対応する行列は？\n\n答: $AB$。\n\n---\n\n**例3 — 転置**\n\n問: $(AB)^{\\mathsf T}$ は？\n\n答: $B^{\\mathsf T}A^{\\mathsf T}$。\n\n---\n\n**例4 — 列の見方**\n\n問: $A\\mathbf{e}_2$ は？\n\n答: $A$ の第2**列**。\n\n---\n\n**例5 — バッチ**\n\n問: 行がサンプルである $X$ に線形層を一度に？\n\n答: よく $XW^{\\mathsf T}$ の形を使います。"},"problemSolvingLabel":"解法のための説明","problemSolvingTable":"| 記号 | 意味 |\n| :--- | :--- |\n| $AB$ | $A$ の列数 = $B$ の行数のとき定義される |\n| $(AB)_{ij}$ | $A$ の $i$ 行目と $B$ の $j$ 列目の内積 |\n| $A\\mathbf{x}$ | $A$ の各行と $\\mathbf{x}$ の内積からなるベクトル |\n| $(AB)^{\\mathsf T}$ | $B^{\\mathsf T}A^{\\mathsf T}$ |\n| 合成 | $\\mathbf{x}\\mapsto A(B\\mathbf{x})=(AB)\\mathbf{x}$ |\n| 線形層 | $\\mathbf{y}=W\\mathbf{x}+\\mathbf{b}$（重み $W$、バイアス $\\mathbf{b}$） |\n\n**① 次元** 掛ける前に**内側の二つの数**が一致している必要があります。\n\n**② バッチ** 行がサンプルなら各行に同じ $W$ を掛け、`GEMM` で処理します。","practiceProblemsTitle":"練習問題","practiceProblemsIntro":"","practiceProblemsInstruction":"最も適切な選択肢を選んでください。","problems":{"definition_0":"$$A\\in\\mathbb{R}^{m\\times n}$, $B\\in\\mathbb{R}^{p\\times q}$ のとき、積 $AB$ が**定義される**ために必要な条件は？\n\n① $m=p$\n② $n=p$\n③ $m=q$\n④ $n=m$","definition_1":"$$(AB)_{ij}$ の定義として正しいものは？（$A$ の $i$ 番目の**行**、$B$ の $j$ 番目の**列**）\n\n① $a_{ij}b_{ij}$\n② $A$ の $i$ 行と $B$ の $j$ 列の**内積**\n③ $a_{ij}+b_{ij}$\n④ $a_{ji}b_{ji}$","definition_2":"$$A\\in\\mathbb{R}^{m\\times n}$, $B\\in\\mathbb{R}^{n\\times p}$ のとき $AB$ の形は？\n\n① $m\\times p$\n② $n\\times n$\n③ $m\\times n$\n④ $p\\times m$","definition_3":"$$A\\in\\mathbb{R}^{m\\times n}$ のとき $AI_n=A$ となる単位行列 $I_n$ の大きさは？\n\n① $n\\times n$\n② $m\\times m$\n③ $m\\times n$\n④ $n\\times m$","definition_4":"$$A\\in\\mathbb{R}^{m\\times n}$ のとき $I_m A=A$ となる $I_m$ の大きさは？\n\n① $m\\times m$\n② $n\\times n$\n③ $m\\times n$\n④ $n\\times m$","definition_5":"$$(AB)^{\\mathsf T}$ に関する転置の規則として正しいものは？\n\n① $A^{\\mathsf T}B^{\\mathsf T}$\n② $B^{\\mathsf T}A^{\\mathsf T}$\n③ $(A^{\\mathsf T})^{\\mathsf T}B$\n④ $AB^{\\mathsf T}$","definition_6":"$$A\\in\\mathbb{R}^{m\\times n}$, 列ベクトル $\\mathbf{u}\\in\\mathbb{R}^n$ のとき $A\\mathbf{u}$ はどの空間のベクトルか？\n\n① $\\mathbb{R}^m$\n② $\\mathbb{R}^n$\n③ $\\mathbb{R}^{mn}$\n④ $\\mathbb{R}^{m+n}$","definition_7":"線形写像 $T(\\mathbf{x})=A\\mathbf{x}$ が満たすべき性質として**常に**正しいものは？\n\n① $T(\\mathbf{0})=\\mathbf{0}$\n② $T(\\mathbf{x})=\\mathbf{x}$\n③ $\\|T(\\mathbf{x})\\|=\\|\\mathbf{x}\\|$\n④ $T(\\mathbf{x}+\\mathbf{y})=T(\\mathbf{x})T(\\mathbf{y})$","definition_8":"$$\\mathrm{rank}(AB)$ と $\\mathrm{rank}(A)$, $\\mathrm{rank}(B)$ の間に**常に**成り立つ不等式は？\n\n① $\\mathrm{rank}(AB)\\ge \\mathrm{rank}(A)$\n② $\\mathrm{rank}(AB)\\le \\min(\\mathrm{rank}(A),\\mathrm{rank}(B))$\n③ $\\mathrm{rank}(AB)=\\mathrm{rank}(A)+\\mathrm{rank}(B)$\n④ $\\mathrm{rank}(AB)=mn$","definition_9":"ユークリッド空間で「まず $B$、次に $A$」という合成の行列表示（列ベクトル規約）は？\n\n① $AB$\n② $BA$\n③ $A+B$\n④ $A^{\\mathsf T}B^{\\mathsf T}$","trueFalse_0":"次が**真**なら ①、**偽**なら ② を選ぶ。\n\nすべての正方行列 $A,B$ に対して $AB=BA$ である。\n\n① 真\n② 偽","trueFalse_1":"積が定義されるとき、$(AB)C=A(BC)$ である。\n\n① 真\n② 偽","trueFalse_2":"積と和が定義されるとき、$A(B+C)=AB+AC$ である。\n\n① 真\n② 偽","trueFalse_3":"$$AB=O$ なら必ず $A=O$ または $B=O$ である。\n\n① 真\n② 偽","trueFalse_4":"正方行列に対して常に $(A+B)^2=A^2+2AB+B^2$ である。\n\n① 真\n② 偽","trueFalse_5":"同じ大きさの正方行列 $A,B$ に対して $\\det(AB)=\\det(A)\\det(B)$ である。\n\n① 真\n② 偽","trueFalse_6":"線形写像 $T(\\mathbf{x})=A\\mathbf{x}$ は常に $T(\\mathbf{0})=\\mathbf{0}$ である。\n\n① 真\n② 偽","trueFalse_7":"直交行列 $Q$ に対して $Q^{\\mathsf T}Q=I$ である。\n\n① 真\n② 偽","trueFalse_8":"すべてのベクトルにスカラー $c$ を掛ける変換は行列 $cI$ で書ける。\n\n① 真\n② 偽","trueFalse_9":"バッチ行列 $X$ の**各行**がサンプルベクトルのとき、行ごとに $\\mathbf{y}^{\\mathsf T}=\\mathbf{x}^{\\mathsf T}W^{\\mathsf T}$ を適用することは、各サンプルに**同じ** $W^{\\mathsf T}$ を掛けることと等しい。\n\n① 真\n② 偽","calc_0":"$$A=\\begin{pmatrix}1&2\\\\3&4\\end{pmatrix}$, $B=\\begin{pmatrix}0&1\\\\1&0\\end{pmatrix}$ のとき $(AB)_{11}$ は？\n\n① $2$\n② $1$\n③ $3$\n④ $0$","calc_1":"$$A=\\begin{pmatrix}1&0\\\\0&2\\end{pmatrix}$, $\\mathbf{x}=\\begin{pmatrix}3\\\\4\\end{pmatrix}$ のとき $A\\mathbf{x}$ の第1成分は？\n\n① $3$\n② $4$\n③ $7$\n④ $12$","calc_2":"$$R=\\begin{pmatrix}0&-1\\\\1&0\\end{pmatrix}$（反時計回り $90^\\circ$ 回転）のとき $R\\begin{pmatrix}1\\\\0\\end{pmatrix}$ は？\n\n① $\\begin{pmatrix}0\\\\1\\end{pmatrix}$\n② $\\begin{pmatrix}1\\\\0\\end{pmatrix}$\n③ $\\begin{pmatrix}-1\\\\0\\end{pmatrix}$\n④ $\\begin{pmatrix}0\\\\-1\\end{pmatrix}$","calc_3":"$$\\begin{pmatrix}2&1\\\\0&3\\end{pmatrix}\\begin{pmatrix}1&1\\\\0&1\\end{pmatrix}$ の $(2,2)$ 成分は？\n\n① $3$\n② $4$\n③ $6$\n④ $0$","calc_4":"$$\\begin{pmatrix}1&2&3\\end{pmatrix}\\begin{pmatrix}4\\\\5\\\\6\\end{pmatrix}$ の値は？\n\n① $32$\n② $21$\n③ $18$\n④ $720$","calc_5":"$$A=\\begin{pmatrix}1&1\\\\0&1\\end{pmatrix}^2$ のとき $A$ の $(1,2)$ 成分は？\n\n① $2$\n② $1$\n③ $0$\n④ $3$","calc_6":"$$\\begin{pmatrix}1&2\\\\3&4\\end{pmatrix}\\begin{pmatrix}1&0\\\\0&0\\end{pmatrix}$ の $(2,1)$ 成分は？\n\n① $3$\n② $1$\n③ $0$\n④ $4$","calc_7":"$$B=\\begin{pmatrix}1&2\\\\3&4\\end{pmatrix}$ のとき $B\\mathbf{e}_1$（第1標準基底）は？\n\n① $B$ の第1**列**\n② $B$ の第1**行**\n③ 零ベクトル\n④ $(1,0)^{\\mathsf T}$","calc_8":"$$A=\\begin{pmatrix}1&0\\\\0&0\\end{pmatrix}$, $B=\\begin{pmatrix}0&0\\\\0&1\\end{pmatrix}$ のとき $AB$ は？\n\n① 零行列\n② $I_2$\n③ $\\begin{pmatrix}1&0\\\\0&1\\end{pmatrix}$\n④ $\\begin{pmatrix}0&1\\\\1&0\\end{pmatrix}$","calc_9":"$$\\begin{pmatrix}3\\end{pmatrix}\\begin{pmatrix}2\\end{pmatrix}$（どちらも $1\\times 1$）の積は？\n\n① $\\begin{pmatrix}6\\end{pmatrix}$\n② $5$\n③ 定義されない\n④ $13$","concept_0":"全結合層で $\\mathbf{y}=W\\mathbf{x}+\\mathbf{b}$ の $W$ の役割に最も近いものは？\n\n① 入力特徴を**線形結合**して混ぜ新しい特徴を作る\n② 常に確率を出す\n③ 常に画像を回転させる\n④ 損失を直接最小化する","concept_1":"バッチサイズ $B$、入力次元 $d_{in}$、出力次元 $d_{out}$ のとき、線形層のパラメータ $W\\in\\mathbb{R}^{d_{out}\\times d_{in}}$ の**要素数**は？\n\n① $d_{out}\\times d_{in}$\n② $B\\times d_{in}$\n③ $d_{in}+d_{out}$\n④ $B\\times d_{out}$","concept_2":"行列・ベクトル積 $A\\mathbf{u}$ の第 $i$ 座標は Ch.02 のどの演算に相当するか？\n\n① $A$ の第 $i$ 行と $\\mathbf{u}$ の内積\n② $A$ の第 $i$ 列と $\\mathbf{u}$ の外積のみ\n③ $\\mathbf{u}$ のノルム\n④ 行列式","concept_3":"深層学習で「層を深くする」が線形層だけのとき、数学的には何の繰り返しか？\n\n① 行列積（とバイアス）の合成\n② 常に同じ行列を足す\n③ 行列式だけを計算\n④ 転置だけを繰り返す","concept_4":"ミニバッチ入力 $X\\in\\mathbb{R}^{B\\times d_{in}}$ と重み $W\\in\\mathbb{R}^{d_{out}\\times d_{in}}$ のとき、行（サンプル）ごとに同じ線形変換を一度に書く式は？\n\n① $XW^{\\mathsf T}$\n② $WX$（常に定義される）\n③ $X+X$\n④ $W^{\\mathsf T}X^{\\mathsf T}$ のみ","concept_5":"活性化 $\\sigma$ の**前**の線形部分だけを見ると、1層は何に相当するか？\n\n① 線形写像（行列）\n② 常に非線形のみ\n③ 常に softmax\n④ 損失関数","concept_6":"Ch.03 の「サンプルが行」のデータ行列 $X$ に線形層を適用するとき、**次元**の観点で最初にすることは？\n\n① $X$ と $W$ の形を合わせ積を定義する\n② 常に転置を禁止する\n③ 行列をスカラーに潰す\n④ サンプル数を 1 にする","concept_7":"行列積が**交換法則**を満たさない直感的理由は？\n\n① 「後で適用する変換」と「先に適用する変換」の順序を入れ替えると結果が変わることがあるから\n② 行列は常に対称だから\n③ 内積がないから\n④ 逆行列がないから","concept_8":"線形回帰の予測 $\\hat{\\mathbf{y}}=X\\boldsymbol{\\beta}$ において $X\\boldsymbol{\\beta}$ を線形代数で見ると？\n\n① 設計行列の列の線形結合（係数 $\\boldsymbol{\\beta}$）\n② 常にベクトルのノルム\n③ 行列式\n④ 固有値分解のみ","concept_9":"行列 $A$ が表す線形変換の「出力が到達しうる範囲」を直感的に指す言葉として最も近いものは？\n\n① 列空間（Column space）\n② 単位球\n③ スカラー1つ\n④ 常に全空間","projection_0":"標準基底ベクトル $\\mathbf{e}_j\\in\\mathbb{R}^n$ に対して $A\\mathbf{e}_j$ は？\n\n① $A$ の第 $j$ **列**\n② $A$ の第 $j$ **行**\n③ 常に零ベクトル\n④ $j$ 行 $j$ 列だけ残るベクトル","projection_1":"すべての $\\mathbf{x}$ に対して $A\\mathbf{x}=\\mathbf{0}$ なら $\\mathrm{rank}(A)$ は？\n\n① $0$\n② 常に $n$\n③ 常に $m$\n④ 常に $\\min(m,n)$","projection_2":"$$A\\in\\mathbb{R}^{m\\times n}$ のとき $\\{A\\mathbf{x}: \\mathbf{x}\\in\\mathbb{R}^n\\}$ は何か？\n\n① $A$ の**列空間**\n② 常に $\\mathbb{R}^m$\n③ 常に $\\{\\mathbf{0}\\}$\n④ 行空間と常に一致","projection_3":"合成 $A(B\\mathbf{x})=(AB)\\mathbf{x}$ が意味することは？\n\n① 線形変換の**合成**が行列積に対応する\n② 常に $AB=BA$\n③ 行列積は可換\n④ 内積と無関係","projection_4":"$$P$ が射影行列（$P^2=P$）のとき、$P\\mathbf{x}$ は $\\mathbf{x}$ をどこへ送る変換か（直感）？\n\n① ある部分空間への射影\n② 常に回転のみ\n③ 常に全空間への可逆変換\n④ 常にスカラー倍のみ","projection_5":"$$A\\in\\mathbb{R}^{m\\times n}$, $m0$ の $2\\times2$ 実行列 $A$ の線形写像の向き(orientation)は？\n\n① 保たれる（鏡映しない）\n② 常に対称\n③ 回転のみ\n④ 常に対角化可能","concept_9":"$$\\mathbb{R}^3$ で $A$ の三列が張る**平行六面体の体積**は？\n\n① $\\lvert\\det([\\mathbf{a}_1\\ \\mathbf{a}_2\\ \\mathbf{a}_3])\\rvert$\n② ノルムの和\n③ $\\mathrm{tr}(A)$\n④ 常に $1$","projection_0":"ある行/列に沿った $\\det(A)$ のラプラス（余因子）展開は？\n\n① 標準的で常に有効な方法の一つ\n② $3\\times3$ にのみ定義\n③ 対称行列のみ\n④ 転置すると常に $0$","projection_1":"随伴（adjugate）行列について正しいのは？\n\n① $A\\,\\mathrm{adj}(A)=\\det(A)\\,I$\n② $A\\,\\mathrm{adj}(A)=I$\n③ $\\mathrm{adj}(A)=A^{-1}$\n④ $\\det(\\mathrm{adj}(A))=0$","projection_2":"可逆行列 $A$ に対し $\\det(A^{-1}BA)$ は？\n\n① $\\det(B)$\n② $\\det(A)$\n③ $\\det(A^{-1})$\n④ $\\det(A)+\\det(B)$","projection_3":"$$\\lambda$ が $A$ の固有値なら必ず成り立つのは？\n\n① $\\det(A-\\lambda I)=0$\n② $\\det(A-\\lambda I)=1$\n③ $\\det(A)=\\lambda$\n④ $A=\\lambda I$","projection_4":"$$3\\times3$ 系の三成分すべてにクラメルを使うと、一般に行列式はいくつ要るか？\n\n① $4$\n② $1$\n③ $9$\n④ $3$ のみ","projection_5":"正方ブロックのブロック対角 $\\begin{pmatrix}A&0\\\\0&D\\end{pmatrix}$ の $\\det$ は？\n\n① $\\det(A)\\det(D)$\n② $\\det(A)+\\det(D)$\n③ $\\det(AD)$\n④ $0$","projection_6":"行列の**二行を入れ替える**と行列式は？\n\n① 符号が反転\n② 不変\n③ 必ず $0$\n④ 二倍","projection_7":"**他行の倍数を一行に足す**基本操作は行列式を？\n\n① 不変\n② 符号のみ反転\n③ 必ず $0$\n④ 二倍","projection_8":"$$n\\times n$ 実行列で $AB$ が可逆なら？\n\n① $A,B$ とも可逆\n② $A$ だけ可逆でよい\n③ $B$ だけ可逆でよい\n④ どちらかは零行列","projection_9":"$$\\mathbb{R}^n$ で可逆線形写像 $A$ は体積 $V$ の領域を体積いくつにするか？\n\n① $\\lvert\\det(A)\\rvert\\cdot V$\n② $V/\\lvert\\det(A)\\rvert$\n③ 常に $V$\n④ $\\mathrm{tr}(A)\\cdot V$","scenario_0":"PyTorch の `torch.linalg.det(A)` はバッチ次元を保ち最後の二軸の行列式を返す。これは何を意味するか？\n\n① 多数の小行列を一度に処理できる\n② 常にスカラー一つだけ\n③ 逆行列も返す\n④ GPU のみで定義","scenario_1":"`torch.linalg.solve(A, b)` が `inv(A)@b` より推奨されがちな理由に最も近いのは？\n\n① より安定で速い直接解法が多い\n② 行列式が計算できないから\n③ 逆が存在しないから\n④ `b` がベクトルでないから","scenario_2":"学習中にヘッセ（または GN 近似）がほぼ特異だとよく起きるのは？\n\n① ステップ方向が爆発/不安定\n② 直ちに収束保証\n③ 損失がちょうど $0$\n④ 勾配が完全に消える","scenario_3":"リッジ回帰で $X^{\\mathsf T}X+\\lambda I$（$\\lambda>0$）を使う主な理由の一つは？\n\n① 条件を良くし可逆（正定）にしやすい\n② 行列式を $0$ にする\n③ 逆行列を禁じる\n④ バッチサイズを縮める","scenario_4":"多変量正規密度の $\\det(\\Sigma)^{-1/2}$ は何と直結するか？\n\n① 線形変換後の体積スケール（ヤコビアン）\n② softmax 温度\n③ ReLU の傾き\n④ dropout 率","scenario_5":"超定 $A\\mathbf{x}=\\mathbf{b}$ で Moore–Penrose `pinv` に最も近いのは？\n\n① 不可逆時に意味のある最小ノルム最小二乗解などを与える\n② 常に $\\det(A)=1$ にする\n③ 常に厳密解\n④ softmax を計算","scenario_6":"損失曲面でヘッセが多方向ほぼ特異であることはしばしば何を示すか？\n\n① 平坦な谷/曖昧な曲率\n② 大域最小のみ\n③ 勾配は常に $0$\n④ 学習率が無意味","scenario_7":"`det(A)` が $0$ に極めて近いことだけから確実に言えるのは？\n\n① 数値的に逆が不安定**になり得る**\n② 学習は不可能\n③ パラメータは最適\n④ softmax が発散","scenario_8":"$$A=Q\\Lambda Q^{-1}$ が対角化可能なら $\\det(A)$ は？\n\n① 固有値の積\n② 固有値の和\n③ $\\mathrm{tr}(Q)$\n④ 常に $0$","scenario_9":"ミニバッチ共分散 $S$ がほぼ特異なとき、対数尤度の $\\log\\det S$ を安定化する常用手段は？\n\n① Cholesky / 小さな $\\varepsilon I$ 正則化\n② 行列式を $0$ に固定\n③ $S$ を零行列に置換\n④ $S$ に softmax"},"problemAnswers":{"definition_0":2,"definition_1":1,"definition_2":2,"definition_3":3,"definition_4":1,"definition_5":1,"definition_6":2,"definition_7":1,"definition_8":1,"definition_9":2,"trueFalse_0":2,"trueFalse_1":1,"trueFalse_2":2,"trueFalse_3":1,"trueFalse_4":1,"trueFalse_5":1,"trueFalse_6":2,"trueFalse_7":1,"trueFalse_8":2,"trueFalse_9":1,"calc_0":1,"calc_1":1,"calc_2":3,"calc_3":1,"calc_4":1,"calc_5":1,"calc_6":1,"calc_7":1,"calc_8":1,"calc_9":1,"concept_0":1,"concept_1":1,"concept_2":2,"concept_3":2,"concept_4":1,"concept_5":1,"concept_6":1,"concept_7":1,"concept_8":1,"concept_9":1,"projection_0":1,"projection_1":1,"projection_2":1,"projection_3":1,"projection_4":1,"projection_5":1,"projection_6":1,"projection_7":1,"projection_8":1,"projection_9":1,"scenario_0":1,"scenario_1":1,"scenario_2":1,"scenario_3":1,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1},"problemSolutions":{"definition_0":"**1) 定義：** $\\det(A)=ad-bc$。**2) 例：** $\\begin{pmatrix}2&1\\\\0&3\\end{pmatrix}$ なら $2\\cdot3-1\\cdot0=6$。**3) 正解 ②**","definition_1":"**1) 事実：** 正方行列は $\\det(A)\\neq0$ のとき可逆。**2) 例：** $\\det\\begin{pmatrix}1&1\\\\0&1\\end{pmatrix}=1$。**3) 正解 ①**","definition_2":"**1) 規則：** 合成の巻き戻しは逆順：$(AB)^{-1}=B^{-1}A^{-1}$。**2) 例：** 二回回転の巻き戻し順。**3) 正解 ②**","definition_3":"**1) 定義：** 単位行列は体積を変えないので $\\det(I_n)=1$。**2) 例：** $I_2$ の対角積 $1\\cdot1=1$。**3) 正解 ③**","definition_4":"**1) 性質：** 転置は行列式を変えない。**2) 例：** $2\\times2$ で確認。**3) 正解 ①**","definition_5":"**1) 計算：** 対角行列の逆は対角成分の逆数。**2) 例：** $\\det A=6\\neq0$。**3) 正解 ①**","definition_6":"**1) 規則：** 各行から $2$ を提出すると行列式に $2\\cdot2=4$ が掛かる。**2) 例：** $A=I_2$ なら $\\det(2I_2)=4$。**3) 正解 ②**","definition_7":"**1) 幾何：** 単位正方形の像の面積は $\\lvert\\det(A)\\rvert$。**2) 例：** $2I_2$ は面積を $4$ 倍。**3) 正解 ①**","definition_8":"**1) 接続：** 可逆なら列は独立でランク $n$。**2) 例：** $\\det(A)\\neq0$ で満秩。**3) 正解 ①**","definition_9":"**1) 定理：** $\\det(AB)=\\det(A)\\det(B)$。**2) 例：** $2\\times2$ で検算。**3) 正解 ②**","trueFalse_0":"**1) 用語：** 特異は $\\det(A)=0$。**2) 例：** $\\begin{pmatrix}1&2\\\\2&4\\end{pmatrix}$ は $\\det=0$。**3) 正解 ②**","trueFalse_1":"**1) 定理：** 積の行列式は行列式の積。**2) 例：** $2\\times2$ で検算。**3) 正解 ①**","trueFalse_2":"**1) 反例：** 零行列は $\\det=0$。**2) 結論：** 偽。**3) 正解 ②**","trueFalse_3":"**1) 導出：** $AA^{-1}=I$ より $\\det(A)\\det(A^{-1})=1$。**2) 例：** $\\det(A)=2$ なら $\\det(A^{-1})=1/2$。**3) 正解 ①**","trueFalse_4":"**1) 例：** $A=\\begin{pmatrix}1&0\\\\0&0\\end{pmatrix}$, $B=\\begin{pmatrix}0&0\\\\0&1\\end{pmatrix}$ なら $A+B=I_2$。**2) 結論：** 真。**3) 正解 ①**","trueFalse_5":"**1) 定理：** $Q^{\\mathsf T}Q=I$ なら $\\det(Q)^2=1$。**2) 例：** 回転行列。**3) 正解 ①**","trueFalse_6":"**1) 反例：** $A=B=I$ で左右が異なる。**2) 結論：** 偽。**3) 正解 ②**","trueFalse_7":"**1) 定理：** 三角行列の行列式は対角積。**2) 例：** $\\begin{pmatrix}2&5\\\\0&3\\end{pmatrix}$ は $6$。**3) 正解 ①**","trueFalse_8":"**1) 接続：** $\\det=0$ なら列は従属。**2) 例：** 一列が他列の倍数。**3) 正解 ②**","trueFalse_9":"**1) 導出：** $\\det(A^2)=\\det(AA)=\\det(A)^2$。**2) 例：** $\\det(A)=-1$ なら $\\det(A^2)=1$。**3) 正解 ①**","calc_0":"**1) 計算：** $1\\cdot4-2\\cdot3=-2$。**2) 例：** 負号は向き反転。**3) 正解 ①**","calc_1":"**1) 計算：** 対角積 $2\\cdot3=6$。**3) 正解 ①**","calc_2":"**1) 計算：** 二列同一 $\\Rightarrow\\det=0$。**3) 正解 ③**","calc_3":"**1) 計算：** $A^{-1}=\\mathrm{diag}(1,1/2)$。**3) 正解 ①**","calc_4":"**1) 計算：** $3\\cdot1-1\\cdot2=1$。**3) 正解 ①**","calc_5":"**1) 計算：** $0\\cdot0-1\\cdot(-1)=1$。**3) 正解 ①**","calc_6":"**1) 計算：** $A^{-1}=\\frac12 I$、トレース $1/2+1/2=1$。**3) 正解 ①**","calc_7":"**1) 計算：** 二行目が一行の $2$ 倍 $\\Rightarrow\\det=0$。**3) 正解 ①**","calc_8":"**1) 計算：** 逆は $\\begin{pmatrix}1&-1\\\\0&1\\end{pmatrix}$。**3) 正解 ①**","calc_9":"**1) 計算：** $\\cos^2 t+\\sin^2 t=1$（回転は面積保存）。**3) 正解 ①**","concept_0":"**1) 接続：** 可逆でないと方向 $\\mathbf{s}$ が安定しにくい。**2) 例：** $H$ 特異なら数値不安定。**3) 正解 ①**","concept_1":"**1) 実務：** `solve` 系は `inv` より有利なことが多い。**3) 正解 ①**","concept_2":"**1) 順序：** 先に $B$ を戻し次に $A$ を戻すので $B^{-1}A^{-1}$。**3) 正解 ②**","concept_3":"**1) 直感：** 列が一直線上に潰れる。**3) 正解 ②**","concept_4":"**1) 接続：** $X^{\\mathsf T}X$ 可逆 $\\Leftrightarrow$ 列フルランク。**3) 正解 ①**","concept_5":"**1) 数値：** ほぼ特異に近いと逆が暴れる。**3) 正解 ①**","concept_6":"**1) 接続：** SVD では体積倍率は特異値の積。**3) 正解 ①**","concept_7":"**1) 公式：** 分母は $\\det(A)$。**3) 正解 ①**","concept_8":"**1) 幾何：** $\\det>0$ で向き保存。**3) 正解 ①**","concept_9":"**1) 幾何：** 行列式の絶対値が体積。**3) 正解 ①**","projection_0":"**1) 定理：** 余因子展開は一般的。**3) 正解 ①**","projection_1":"**1) 定義：** 古典的随伴の恒等式。**3) 正解 ①**","projection_2":"**1) 計算：** $\\det(A^{-1})\\det(B)\\det(A)=\\det(B)$。**3) 正解 ①**","projection_3":"**1) 接続：** 固有値は特性多項式の根。**3) 正解 ①**","projection_4":"**1) 説明：** $\\det(A)$ と三列を $\\mathbf{b}$ に置換した行列式で計 $4$ 個。**3) 正解 ①**","projection_5":"**1) 定理：** ブロック対角の行列式は積。**3) 正解 ①**","projection_6":"**1) 性質：** 行交換で $\\det\\mapsto-\\det$。**3) 正解 ①**","projection_7":"**1) 性質：** 行の倍加は $\\det$ 不変。**3) 正解 ①**","projection_8":"**1) 定理：** $(AB)^{-1}$ 存在 $\\Rightarrow\\det(A)\\det(B)\\neq0$ で両方可逆。**3) 正解 ①**","projection_9":"**1) 幾何：** $\\lvert\\det(A)\\rvert$ が体積倍率。**3) 正解 ①**","scenario_0":"**1) 実務：** バッチ行列式はミニバッチ共分散など。**3) 正解 ①**","scenario_1":"**1) 実務：** 明示逆は条件数を悪化させやすい。**3) 正解 ①**","scenario_2":"**1) 接続：** 逆（疑似逆）が敏感。**3) 正解 ①**","scenario_3":"**1) 統計/ML：** 多重共線性緩和と安定な逆。**3) 正解 ①**","scenario_4":"**1) 接続：** 共分散 $\\Sigma$ の「枠」が体積を変える。**3) 正解 ①**","scenario_5":"**1) 実務：** SVD 疑似逆。**3) 正解 ①**","scenario_6":"**1) 最適化：** 曲面の条件が悪い。**3) 正解 ①**","scenario_7":"**1) 注意：** 浮動小数と条件数。**3) 正解 ①**","scenario_8":"**1) 定理：** $\\det(A)=\\prod\\lambda_i$。**3) 正解 ①**","scenario_9":"**1) 実務：** 対称半正定値では Cholesky や小さな $\\varepsilon I$ が一般的。**3) 正解 ①**"},"problemTestCodes":{"definition_0":"answer = 2\nassert answer == 2","definition_1":"answer = 1\nassert answer == 1","definition_2":"answer = 2\nassert answer == 2","definition_3":"answer = 3\nassert answer == 3","definition_4":"answer = 1\nassert answer == 1","definition_5":"answer = 1\nassert answer == 1","definition_6":"answer = 2\nassert answer == 2","definition_7":"answer = 1\nassert answer == 1","definition_8":"answer = 1\nassert answer == 1","definition_9":"answer = 2\nassert answer == 2","trueFalse_0":"answer = 2\nassert answer == 2","trueFalse_1":"answer = 1\nassert answer == 1","trueFalse_2":"answer = 2\nassert answer == 2","trueFalse_3":"answer = 1\nassert answer == 1","trueFalse_4":"answer = 1\nassert answer == 1","trueFalse_5":"answer = 1\nassert answer == 1","trueFalse_6":"answer = 2\nassert answer == 2","trueFalse_7":"answer = 1\nassert answer == 1","trueFalse_8":"answer = 2\nassert answer == 2","trueFalse_9":"answer = 1\nassert answer == 1","calc_0":"answer = 1\nassert answer == 1","calc_1":"answer = 1\nassert answer == 1","calc_2":"answer = 3\nassert answer == 3","calc_3":"answer = 1\nassert answer == 1","calc_4":"answer = 1\nassert answer == 1","calc_5":"answer = 1\nassert answer == 1","calc_6":"answer = 1\nassert answer == 1","calc_7":"answer = 1\nassert answer == 1","calc_8":"answer = 1\nassert answer == 1","calc_9":"answer = 1\nassert answer == 1","concept_0":"answer = 1\nassert answer == 1","concept_1":"answer = 1\nassert answer == 1","concept_2":"answer = 2\nassert answer == 2","concept_3":"answer = 2\nassert answer == 2","concept_4":"answer = 1\nassert answer == 1","concept_5":"answer = 1\nassert answer == 1","concept_6":"answer = 1\nassert answer == 1","concept_7":"answer = 1\nassert answer == 1","concept_8":"answer = 1\nassert answer == 1","concept_9":"answer = 1\nassert answer == 1","projection_0":"answer = 1\nassert answer == 1","projection_1":"answer = 1\nassert answer == 1","projection_2":"answer = 1\nassert answer == 1","projection_3":"answer = 1\nassert answer == 1","projection_4":"answer = 1\nassert answer == 1","projection_5":"answer = 1\nassert answer == 1","projection_6":"answer = 1\nassert answer == 1","projection_7":"answer = 1\nassert answer == 1","projection_8":"answer = 1\nassert answer == 1","projection_9":"answer = 1\nassert answer == 1","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 1\nassert answer == 1","scenario_3":"answer = 1\nassert answer == 1","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1"}},"midMathCh06":{"chapter":"Chapter 06","title":"線形独立性とランク: 本当の次元はいくつ?","description":"従業員100名のスタートアップを想像してください。名簿は100名でも、実態は20名が動き、80名は同じ稟議をコピーしているだけかもしれません。**本当の業務次元**は100か20か。\n\n前章では行列が空間を変形する装置でした。本章ではデータの矢印の中から**本物と冗長**を見極めます。**線形独立**(誰にも置き換えられない向き)と**従属**(他人の線形結合で済む乗り物)。重なりを剥がしたあとに残る**ランク**が、見かけの列数ではない**真の次元**です。","sectionTitle":"線形独立性とランク：本当の次元はいくつ？","sectionLabels":{"whatIs":"概念","whyImportant":"重要性","howUsed":"使い方","problemSolving":"解法のコツ"},"visualShort":"同一直線 vs はずれる · ランク1↔2","visualIntro":"**点線**が第1方向。**オレンジ**がその上を走り、**外れる**と**ランク1/2**が入れ替わります。","visualStep1":"定義: $\\sum c_i\\mathbf{v}_i=\\mathbf{0}\\Rightarrow$ すべて $c_i=0$ ⇔ 線形独立","visualStep2":"直感: **同一直線**なら従属に近く、**外れる**と独立·ランク","visualStep3":"数式: $\\mathrm{rank}(A)$ = 列空間の次元 = ピボットの個数","visualStep4":"応用: 多重共線性、リッジ、層の**情報ボトルネック**","visualStepsLabel":"読み順","visualFlowTitle":"学習の流れ","visualFlowStep0":"概念: 独立·従属·基底·ランク","visualFlowStep1":"直感: 同一直線·独立·ランク","visualFlowStep2":"幾何↔代数","visualFlowStep3":"接続: Ch.05 可逆性と$\\det$","visualFlowStep4":"応用: 回帰と深層ネット","rankVisualAriaLabel":"第1方向を示す点線と原点からの二本のベクトル。オレンジのベクトルが動くにつれ角のバッジがランク1と2の間で切り替わります。","rankVisualMainTitle":"線形独立性とランク: 本当の次元はいくつ?","rankVisualSubtitle":"**独立**なら二つの向きが**重ならない**。**ランク**は、冗長を除いた**向きの本数**(この図では1か2)です。","rankVisualCaption":"**オレンジ**のベクトルが**点線（第1方向の張り）**の上にあり、新しい軸を増やさないときは**線形従属**に近く、この図では**ランク1**と読めます。\n\n**線から外れる**と二つの向きが異なり**線形独立**になり、この図では**ランク2**です。","whatIs":{"0":"**1. 線形独立——「RGB原色」**\n\n光や絵の具では **赤・緑・青** は**根本**で、片方だけでは他を作れません。ベクトルが**線形独立**とは、どれも他の**線形結合**で表せず、$c_1\\mathbf{v}_1+\\cdots+c_k\\mathbf{v}_k=\\mathbf{0}$ なら**必ず**すべて $c_i=0$ ということです。独立なベクトルが増えるたびに、情報の**新しい軸**が開きます。","1":"**2. 線形従属——反響と「ただ乗り」**\n\n赤と緑の灯りがあるのに「**黄**(赤+緑)」の電球を足しても、表現できる色域は**広がりません**(冗長)。$\\mathbf{v}_3=2\\mathbf{v}_1+3\\mathbf{v}_2$ のように書けるとき**従属**です。データが増えたように見えても、実は**反響**で新情報はありません。","2":"**3. ランク——泡を除いた「情報の純度」**\n\n$\\mathrm{rank}(A)$ は列が100本でも1000本でも、**独立な列の最大本数**です。100本の矢印がすべて同一**平面**に乗るなら、ランクは依然**2**——**真の有効次元**です。","3":"**4. 基底——最小の鉄骨**\n\n**基底**は部分空間全体を**張り**、かつ**最小**の独立集合です。壁は多くても形を決めるのは**鉄骨**の本数。その本数が**次元**です。","4":"**5. Ch.05との接続——行列式$\\det$とは何か、ランクとも**\n\n**行列式 $\\det(A)$** は、$n\\times n$ 行列が線形変換で**単位体積**(2次元なら単位正方形の**面積**)を**何倍**にするかを表す**ただ一つの数**です。$\\det(A)=0$ なら空間が潰れて体積が消え**逆行列なし**、$\\det(A)\\neq 0$ なら **$A^{-1}$** で変換を戻せます(Ch.05)。\n\n$\\mathrm{rank}(A)=n$ なら**満ランク**で列は独立、上のように完全には潰れず **$\\det(A)\\neq 0$**、**$A^{-1}$** があります。ランク不足なら潰れ **$\\det(A)=0$**、逆行列は使えません。"},"whyImportant":{"bridge":"目撃者5人でも、全員が**同じ窓**から見ていたら(従属)、手がかりは**1つを5回聞いた**だけ(ランク1)。街路·屋上·CCTVの3人(独立、ランク3)の方がはるかに価値があります。\n\nMLでも「㎡」と「坪」のように**同じ向き**の特徴を並べると**多重共線性**になり、モデルは重みを不安定にします。","similarity":"**ランク**は「このデータ束に**本当に栄養のある向き**はいくつ?」という鋭い問いです。冗長な混合を剥がすのは、安定学習と高速計算の土台です。"},"howUsed":{"ml":"**1. 線形回帰を救う(リッジ)**\n最小二乗は $(X^{\\mathsf T}X)^{-1}$ が要ります。ほぼ重複列で特異になります。**リッジ**は微小な対角を足し、数値的に「厚み」を戻して逆行列を可能にします。","geometry":"**2. 深層ネットのボトルネック**\n100車線の高速道路が、ある層で**実効ランク10**に狭まれば**情報ボトルネック**——細部の多くが失われます。設計では幅とランク様の挙動を見ます。"},"summary":"**一行:** 独立=**代替不可**の向き、従属=**混合**、ランク=泡を除いた**真の次元**。","problemSolving":{"focus":"下の表に**記号とコツ**、**例**には演習の**代表パターン**(定義選択·正偽·数値ランク·次元·性質·短文)を**問題 / 解答**で短くまとめました。","examplesHeading":"例","examplesTable":"**例1 — 定義·概念を選ぶ**\n\n問題: $\\mathrm{rank}(A)$の定義として正しいのは?\n\n解答: **列空間の次元**に相当する選択肢を選ぶ。\n\n---\n\n**例2 — 正·偽**\n\n問題: $\\mathbb{R}^2$で異なる二つのベクトルは常に線形独立か?\n\n解答: **常に**は偽。**同一直線**(共線)なら従属。\n\n---\n\n**例3 — 数値ランク**\n\n問題: $\\begin{pmatrix}1&2\\\\2&4\\end{pmatrix}$のランクは?\n\n解答: 列が比例するので**1**。不明なら**行約簡**でピボットを数える。\n\n---\n\n**例4 — 次元·核**\n\n問題: $A\\mathbf{x}=\\mathbf{0}$の解空間の次元が$k$で列が$n$本のとき、$\\mathrm{rank}(A)$は?\n\n解答: $\\mathrm{rank}(A)=n-k$。\n\n---\n\n**例5 — ランクの性質**\n\n問題: 可逆行列$P,Q$に対し$\\mathrm{rank}(PAQ)$は?\n\n解答: $\\mathrm{rank}(PAQ)=\\mathrm{rank}(A)$。\n\n---\n\n**例6 — 短文の状況**\n\n問題: $\\mathbf{a}_3=2\\mathbf{a}_1-\\mathbf{a}_2$のとき、三列のランクは?\n\n解答: **従属**なので$\\mathrm{rank}\\le 2$。"},"problemSolvingLabel":"解法のコツ","problemSolvingTable":"| 記号 | 意味 |\n| :--- | :--- |\n| 線形独立 | $\\sum c_i\\mathbf{v}_i=\\mathbf{0}\\Rightarrow c_i=0$ |\n| 線形従属 | 少なくとも1列が他列の線形結合 |\n| $\\mathrm{rank}(A)$ | 列空間の次元(=行約簡のピボット数) |\n| 基底 | 独立かつ張る最小集合 |\n| $\\mathrm{rank}(AB)$ | $\\le\\min\\{\\mathrm{rank}A,\\mathrm{rank}B\\}$ |\n| $\\det(A)$ | 単位体積·面積の倍率(Ch.05)；$\\det(A)=0$ なら逆行列なし |","practiceProblemsTitle":"演習","practiceProblemsIntro":"60問から**無作為10問**。","practiceProblemsInstruction":"問題文を読み、最も適切な選択肢を選んでください。","problems":{"definition_0":"$$\\mathbf{v}_1,\\mathbf{v}_2$が線形独立である条件に最も近いのは?\n\n① 常にノルムが等しい\n② $c_1\\mathbf{v}_1+c_2\\mathbf{v}_2=\\mathbf{0}\\Rightarrow c_1=c_2=0$\n③ 内積が0\n④ 単位ベクトル","definition_1":"$$\\mathrm{rank}(A)$の定義は?\n\n① 行数\n② 列空間の次元\n③ 成分の和\n④ トレース","definition_2":"部分空間の基底の個数は?\n\n① 同じ部分空間で変わる\n② 同じ部分空間で不変\n③ 常に行数\n④ 常に1","definition_3":"$$\\mathbb{R}^3$で独立なベクトルは最大いくつ?\n\n① 2\n② 3\n③ 4\n④ 無限","definition_4":"列が従属なら?\n\n① ランク=列数\n② ランク<列数\n③ det=1\n④ 正方必須","definition_5":"$$A\\in\\mathbb{R}^{m\\times n}$で $\\mathrm{rank}(A)\\le$?\n\n① $\\min(m,n)$\n② $m+n$\n③ $\\max(m,n)$\n④ $mn$","definition_6":"$$\\{\\mathbf{0}\\}$は?\n\n① 常に独立\n② 独立でない\n③ $n\\ge2$で独立\n④ 基底","definition_7":"$$\\mathrm{rank}(A^{\\mathsf T})$と$\\mathrm{rank}(A)$は?\n\n① 常に等しい\n② 常に異なる\n③ 転置で1減少\n④ 常に0","definition_8":"$$\\dim(W)$は?\n\n① 基底の個数\n② ベクトル全個数\n③ 常に0\n④ 常に全次元","definition_9":"独立な$k$本のランクは?\n\n① $k$未満\n② $k$\n③ 0\n④ 無関係","trueFalse_0":"ベクトルが多いほど常に独立。\n\n① 正\n② 偽","trueFalse_1":"$$\\mathrm{rank}(A+B)\\le \\mathrm{rank}(A)+\\mathrm{rank}(B)$。\n\n① 正\n② 偽","trueFalse_2":"可逆な$n\\times n$なら$\\mathrm{rank}(A)=n$。\n\n① 正\n② 偽","trueFalse_3":"列独立なら必ず正方。\n\n① 正\n② 偽","trueFalse_4":"実数で$\\mathrm{rank}(A^{\\mathsf T}A)=\\mathrm{rank}(A)$。\n\n① 正\n② 偽","trueFalse_5":"$$\\mathbb{R}^2$で異なる二ベクトルは常に独立。\n\n① 正\n② 偽","trueFalse_6":"ランクは列数を超えない。\n\n① 正\n② 偽","trueFalse_7":"ランクはピボット数に等しい。\n\n① 正\n② 偽","trueFalse_8":"行ランク=列ランク。\n\n① 正\n② 偽","trueFalse_9":"独立集合の部分集合は独立。\n\n① 正\n② 偽","calc_0":"$$\\mathrm{rank}\\begin{pmatrix}1&2\\\\2&4\\end{pmatrix}$は?\n\n① 0\n② 1\n③ 2\n④ 3","calc_1":"$$\\mathrm{rank}\\begin{pmatrix}2&1\\\\4&2\\end{pmatrix}$は?\n\n① 0\n② 1\n③ 2\n④ 3","calc_2":"$$\\mathrm{rank}\\begin{pmatrix}1&1&0\\\\0&1&1\\end{pmatrix}$は?\n\n① 1\n② 2\n③ 3\n④ 0","calc_3":"$$\\mathbb{R}^4$で独立なベクトルは最大?\n\n① 3\n② 4\n③ 5\n④ 2","calc_4":"$$\\mathrm{rank}\\begin{pmatrix}1&3\\\\2&6\\end{pmatrix}$は?\n\n① 2\n② 1\n③ 0\n④ 3","calc_5":"$$\\mathrm{rank}\\begin{pmatrix}1&2&3\\\\2&4&6\\end{pmatrix}$は?\n\n① 0\n② 1\n③ 2\n④ 3","calc_6":"$$\\mathrm{rank}\\begin{pmatrix}1&2&3\\\\0&1&1\\end{pmatrix}$は?\n\n① 0\n② 1\n③ 2\n④ 3","calc_7":"$$3\\times5$の最大ランクは?\n\n① 5\n② 4\n③ 3\n④ 8","calc_8":"$$\\mathrm{rank}\\begin{pmatrix}1&0&1\\\\0&1&1\\end{pmatrix}$は?\n\n① 3\n② 2\n③ 1\n④ 0","calc_9":"$$\\mathrm{rank}\\begin{pmatrix}1&1&2\\\\0&1&1\\\\1&2&3\\end{pmatrix}$は? (3行目=1行目+2行目)\n\n① 0\n② 1\n③ 2\n④ 3","concept_0":"$$m\\times n$行列$A$の列が3本すべて独立なら$\\mathrm{rank}(A)$は?\n\n① 3\n② 最大2\n③ 0\n④ 列数と無関係","concept_1":"有限個のベクトルが従属なら常に成り立つのは?\n\n① 全部零\n② 少なくとも1本は他の線形結合で書ける\n③ 全部単位\n④ 全部直交","concept_2":"RREF後のピボット個数と列ランクは?\n\n① 等しい\n② 常に異なる\n③ 常に行数\n④ 常に0","concept_3":"$$\\mathbb{R}^5$の部分空間$W$で$\\dim(W)=3$のとき、$W$内で独立なベクトルは最大?\n\n① 2\n② 3\n③ 5\n④ 無限","concept_4":"$$\\mathbf{v}_1,\\mathbf{v}_2,\\mathbf{v}_3$が独立なら$\\mathbf{v}_1,\\mathbf{v}_2$は?\n\n① 常に従属\n② 常に独立\n③ 常に直交\n④ 不明","concept_5":"実$m\\times n$行列$A$の列が独立であるために必要なのは?\n\n① $m\\ge n$\n② $m\\le n$\n③ $m=n$のみ\n④ $n>m$","concept_6":"$$A\\mathbf{x}=\\mathbf{0}$の解空間の次元が$k$なら$\\mathrm{rank}(A)$は?\n\n① $n-k$\n② $m-k$\n③ $k$\n④ $m+n$","concept_7":"ある列が他列の線形結合なら列ランクは?\n\n① 列数と等しい\n② 列数より小さい\n③ 常に0\n④ 無限","concept_8":"実$2\\times2$行列が可逆であることの必要十分は?\n\n① ランク0\n② ランク1\n③ ランク2\n④ 無関係","concept_9":"常に成り立つものは?\n\n① $\\mathrm{rank}(AB)\\ge \\mathrm{rank}(A)$\n② $\\mathrm{rank}(AB)\\le \\mathrm{rank}(A)$\n③ $\\mathrm{rank}(AB)=\\mathrm{rank}(A)$\n④ $AB$は常に満ランク","projection_0":"$$\\mathrm{rank}(A^{\\mathsf T})$は?\n\n① $\\mathrm{rank}(A)$\n② +1\n③ 0\n④ det","projection_1":"$$\\mathrm{rank}(AB)$の上界は?\n\n① $\\min\\{\\mathrm{rank}A,\\mathrm{rank}B\\}$\n② 和\n③ $mn$\n④ 常にrankA","projection_2":"可逆$P,Q$で$\\mathrm{rank}(PAQ)$は?\n\n① $\\mathrm{rank}(A)$\n② 0\n③ rankP\n④ detA","projection_3":"零行列のランクは?\n\n① 0\n② 1\n③ 列数\n④ 行数","projection_4":"対角非零の三角行列のランクは?\n\n① 0\n② 非零対角の個数\n③ 常に1\n④ 常にフル","projection_5":"$$5\\times3$の最大ランクは?\n\n① 5\n② 4\n③ 3\n④ 15","projection_6":"列交換はランクを?\n\n① 不変\n② +1\n③ 0\n④ 2倍","projection_7":"列の倍数加算は?\n\n① 不変\n② -1\n③ 0\n④ 2倍","projection_8":"$$P=\\begin{pmatrix}1&0\\\\0&0\\end{pmatrix}$のランクは?\n\n① 0\n② 1\n③ 2\n④ 3","projection_9":"$$\\mathrm{rank}(A)$と$\\mathrm{rank}(A^{\\mathsf T}A)$は実数で?\n\n① 等しい\n② 異なる\n③ Aが大\n④ 0","scenario_0":"行列で異なる二つの列が完全に等しいなら?\n\n① 列は従属で列ランクは列数未満になり得る\n② 常に満列ランク\n③ ランク常に0\n④ 列ランクは常に列数","scenario_1":"$$\\mathbf{a}_3=2\\mathbf{a}_1-\\mathbf{a}_2$なら$[\\mathbf{a}_1\\ \\mathbf{a}_2\\ \\mathbf{a}_3]$のランクは?\n\n① 常に3\n② 最大2\n③ 常に0\n④ 常に4","scenario_2":"$$4\\times4$行列で$\\mathrm{rank}(A)=3$なら$\\dim(\\mathrm{Col}(A))$は?\n\n① 4\n② 3\n③ 2\n④ 0","scenario_3":"$$m\\times n$行列$A$の行が$\\mathbb{R}^n$で独立なら行ランクは?\n\n① $m$\n② 常に0\n③ $n$\n④ 常に1","scenario_4":"実$m\\times n$行列$A$で$\\mathrm{rank}(A)$と$\\mathrm{rank}(A^{\\mathsf T})$は?\n\n① 常に等しい\n② 常に異なる\n③ 常にAが大\n④ 常に0","scenario_5":"$$m\\times n$行列の$n$列すべて独立なら必ず?\n\n① $m\\ge n$\n② $m\\le n$\n③ $m=n$のみ\n④ $n>m$","scenario_6":"$$\\mathrm{rank}(A)=r$なら$\\dim(\\mathrm{Col}(A))$は?\n\n① $r$\n② $mn$\n③ $n-r$\n④ $m$","scenario_7":"二行が比例なら、その二行だけ見た行ランク寄与は最大?\n\n① 1\n② 常に2\n③ 常に0\n④ 行数","scenario_8":"$$T(\\mathbf{x})=A\\mathbf{x}$ ($A\\in\\mathbb{R}^{m\\times n}$)の像の次元は?\n\n① $\\mathrm{rank}(A)$\n② 常に$n$\n③ 常に$m$\n④ 常に0","scenario_9":"実$n\\times n$で$\\mathrm{rank}(A)0$ に対し $S+\\mu I$ の固有値（重複込み）は？\n\n① $S$ と同じ多重集合\n② **$S$ の各固有値に $\\mu$ を足したもの**\n③ すべて $\\mu$\n④ すべて $0$","hscn_5":"$$A=Q\\Lambda Q^{\\mathsf T}$（$Q$ 直交、$\\Lambda$ 対角）のとき $A^5=Q\\Lambda_1 Q^{\\mathsf T}$ と書ける。このとき $\\Lambda_1$ は？\n\n① **$\\Lambda$ の各対角成分を 5 乗した対角行列**\n② $5\\Lambda$\n③ $\\Lambda^{-1}$\n④ $I$"},"problemAnswers":{"edef_0":2,"edef_1":2,"edef_2":2,"edef_3":2,"edef_4":1,"edef_5":2,"etf_0":2,"etf_1":1,"etf_2":2,"etf_3":1,"etf_4":1,"etf_5":1,"ecalc_0":1,"ecalc_1":1,"ecalc_2":1,"ecalc_3":1,"ecalc_4":3,"ecalc_5":2,"eprop_0":1,"eprop_1":1,"eprop_2":1,"eprop_3":1,"eprop_4":2,"eprop_5":1,"mcon_0":1,"mcon_1":2,"mcon_2":2,"mcon_3":2,"mcon_4":1,"mcon_5":1,"mcmp_0":2,"mcmp_1":2,"mcmp_2":1,"mcmp_3":2,"mcmp_4":1,"mcmp_5":2,"mdiag_0":1,"mdiag_1":3,"mdiag_2":1,"mdiag_3":1,"mdiag_4":1,"mdiag_5":1,"hproj_0":1,"hproj_1":1,"hproj_2":3,"hproj_3":3,"hproj_4":1,"hproj_5":1,"hpca_0":1,"hpca_1":2,"hpca_2":2,"hpca_3":2,"hpca_4":1,"hpca_5":1,"hscn_0":2,"hscn_1":2,"hscn_2":2,"hscn_3":2,"hscn_4":2,"hscn_5":1},"problemSolutions":{"edef_0":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","edef_1":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","edef_2":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","edef_3":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","edef_4":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","edef_5":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","etf_0":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","etf_1":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","etf_2":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","etf_3":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","etf_4":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","etf_5":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","ecalc_0":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","ecalc_1":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","ecalc_2":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","ecalc_3":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","ecalc_4":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ③","ecalc_5":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","eprop_0":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","eprop_1":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","eprop_2":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","eprop_3":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","eprop_4":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","eprop_5":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","mcon_0":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","mcon_1":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","mcon_2":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","mcon_3":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","mcon_4":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","mcon_5":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","mcmp_0":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","mcmp_1":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","mcmp_2":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","mcmp_3":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","mcmp_4":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","mcmp_5":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","mdiag_0":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","mdiag_1":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ③","mdiag_2":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","mdiag_3":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","mdiag_4":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","mdiag_5":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","hproj_0":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","hproj_1":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","hproj_2":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ③","hproj_3":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ③","hproj_4":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","hproj_5":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","hpca_0":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","hpca_1":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","hpca_2":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","hpca_3":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","hpca_4":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","hpca_5":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①","hscn_0":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","hscn_1":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","hscn_2":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","hscn_3":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","hscn_4":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ②","hscn_5":"**1)** 固有値・固有ベクトルの定義に立ち返り、小さな具体例で検算します。 **2)** 問題と同じサイズの小さな行列に一度数値を入れて確認します。 **3)** 正解 ①"},"problemTestCodes":{"edef_0":"answer = 2\nassert answer == 2","edef_1":"answer = 2\nassert answer == 2","edef_2":"answer = 2\nassert answer == 2","edef_3":"answer = 2\nassert answer == 2","edef_4":"answer = 1\nassert answer == 1","edef_5":"answer = 2\nassert answer == 2","etf_0":"answer = 2\nassert answer == 2","etf_1":"answer = 1\nassert answer == 1","etf_2":"answer = 2\nassert answer == 2","etf_3":"answer = 1\nassert answer == 1","etf_4":"answer = 1\nassert answer == 1","etf_5":"answer = 1\nassert answer == 1","ecalc_0":"answer = 1\nassert answer == 1","ecalc_1":"answer = 1\nassert answer == 1","ecalc_2":"answer = 1\nassert answer == 1","ecalc_3":"answer = 1\nassert answer == 1","ecalc_4":"answer = 3\nassert answer == 3","ecalc_5":"answer = 2\nassert answer == 2","eprop_0":"answer = 1\nassert answer == 1","eprop_1":"answer = 1\nassert answer == 1","eprop_2":"answer = 1\nassert answer == 1","eprop_3":"answer = 1\nassert answer == 1","eprop_4":"answer = 2\nassert answer == 2","eprop_5":"answer = 1\nassert answer == 1","mcon_0":"answer = 1\nassert answer == 1","mcon_1":"answer = 2\nassert answer == 2","mcon_2":"answer = 2\nassert answer == 2","mcon_3":"answer = 2\nassert answer == 2","mcon_4":"answer = 1\nassert answer == 1","mcon_5":"answer = 1\nassert answer == 1","mcmp_0":"answer = 2\nassert answer == 2","mcmp_1":"answer = 2\nassert answer == 2","mcmp_2":"answer = 1\nassert answer == 1","mcmp_3":"answer = 2\nassert answer == 2","mcmp_4":"answer = 1\nassert answer == 1","mcmp_5":"answer = 2\nassert answer == 2","mdiag_0":"answer = 1\nassert answer == 1","mdiag_1":"answer = 3\nassert answer == 3","mdiag_2":"answer = 1\nassert answer == 1","mdiag_3":"answer = 1\nassert answer == 1","mdiag_4":"answer = 1\nassert answer == 1","mdiag_5":"answer = 1\nassert answer == 1","hproj_0":"answer = 1\nassert answer == 1","hproj_1":"answer = 1\nassert answer == 1","hproj_2":"answer = 3\nassert answer == 3","hproj_3":"answer = 3\nassert answer == 3","hproj_4":"answer = 1\nassert answer == 1","hproj_5":"answer = 1\nassert answer == 1","hpca_0":"answer = 1\nassert answer == 1","hpca_1":"answer = 2\nassert answer == 2","hpca_2":"answer = 2\nassert answer == 2","hpca_3":"answer = 2\nassert answer == 2","hpca_4":"answer = 1\nassert answer == 1","hpca_5":"answer = 1\nassert answer == 1","hscn_0":"answer = 2\nassert answer == 2","hscn_1":"answer = 2\nassert answer == 2","hscn_2":"answer = 2\nassert answer == 2","hscn_3":"answer = 2\nassert answer == 2","hscn_4":"answer = 2\nassert answer == 2","hscn_5":"answer = 1\nassert answer == 1"}},"midMathCh08":{"chapter":"Chapter 08","title":"方向微分と勾配: 登るべき道を見つける","description":"濃い霧で一歩先も見えない探検家が、険しい山脈のいちばん深い谷—誤差が最小の最適な場所—を目指す姿を想像してください。地形は目に見えず、足裏で感じる**傾き**だけを頼りに下らなければなりません。AIが大量のデータで賢くなる学習は、この危うい登山とまったく同じです。予測を外すたびに生じる誤差（損失）は巨大な三次元の山脈を形づくります。\n\nその場で「今いる所から東へ行くとどれだけ急か？」を教える指標が**方向微分**です。周囲360度のあいだで「いちばん急な上り坂はどちらか？」を誤りなく指し示す奇跡のコンパスが**勾配** $\\nabla f$ です。本章では微積分の花と呼ばれる勾配が、いかにAIの道しるべとなり複雑な誤差の山を無事に下らせるかを、地形図の比喩で深く案内します。","sectionTitle":"方向微分と勾配: 登るべき道を見つける","sectionLabels":{"whatIs":"概念","whyImportant":"重要性","howUsed":"使い方","problemSolving":"解法のコツ"},"visualShort":"3D 損失曲面 + 等高線 + 勾配降下経路","visualIntro":"色が濃いほど誤差の大きい峰、薄いほど谷。黒い線は誤差を減らす下りの道です。","visualStep1":"曲面: パラメータごとに損失の高低","visualStep2":"等高線: 同じ高さ; $\\nabla f$ は直角","visualStep3":"向いている方向への傾き","visualStep4":"紫矢印=上り($\\nabla f$)、黒線=下り","visualStepsLabel":"読み順","visualFlowTitle":"学習の流れ","visualFlowStep0":"概念: 偏微分 → 方向微分 → 勾配","visualFlowStep1":"直感: 等高線地図・損失曲面","visualFlowStep2":"代数: $D_{\\mathbf{u}} f = \\nabla f \\cdot \\mathbf{u}$","visualFlowStep3":"接続: Ch.02 内積、基礎数学の偏微分","visualFlowStep4":"応用: 勾配降下 → Ch.09 ヤコビアン、Ch.10 ヘッシアン","gradVisualAriaLabel":"3次元損失曲面、床の等高線、降下経路、一点での勾配矢印が段階的に現れます。","gradVisualMainTitle":"方向微分と勾配: 登るべき道を見つける","gradVisualSubtitle":"等高線地図では **勾配** $\\nabla f$ は等高線と**直角**で、**いちばん急な上り坂**を指します。**方向微分** $D_{\\mathbf{u}} f$ は「$\\mathbf{u}$ 方向に一歩進むとどれだけ登るか」で、$\\nabla f$ と $\\mathbf{u}$ の**内積** $\\nabla f \\cdot \\mathbf{u}$ 一行で求めます。","gradVisualCaption":"図の見方: **赤・黄**=誤差の大きい**峰**、**青・紫**=誤差の小さい**谷**。**黒い線**=誤差を減らす**下り**（勾配降下）、**紫矢印**=その場で**いちばん急な上り**($\\nabla f$)。","gradDiagramLabelSurface":"損失曲面 / Loss surface","gradDiagramLabelContour":"等高線 / Contour","gradDiagramLabelPath":"勾配降下経路 / Descent path","gradDiagramLabelGradient":"勾配 / Gradient","whatIs":{"0":"**1. 多変数関数と等高線: 三次元の地形を二次元で読む**\n\n平らな二次元地図でも、うねる**等高線**があれば峰と窪んだ谷が分かります。線がぎゅっと詰まれば汗をかく急崖、広がれば歩きやすいなだらかな平地です。AIが学習で計算する誤差（損失）も変数が多く、同様の巨大で険しい多次元の山脈になります。数学のレンズでその見えない等高線を読み、誤差が急に盛り上がっているか安定して下がっているかを直感できます。","1":"**2. 偏微分: 東西南北のうち一方向だけ掘る傾き**\n\n険しい山の中腹で立ち止まります。「他の方向はすべて無視し、ただ真東（$x$軸方向）に一歩だけ進んだら傾きは？」「真北（$y$軸方向）だけ歩けば上りか下りか？」—一つの軸方向だけ選び、その傾きだけを取り出すのが**偏微分**です。$\\frac{\\partial f}{\\partial x}$ のように丸い記号で書き、一方向だけの狭いがら測定ですが、すべての計算の基礎です。","2":"**3. 方向微分: 顔を向けたまさにその道の傾き**\n\n探検家は必ずしも東西南北だけ歩く必要はありません。北東30度、南西へ斜めに—360度自由に向きを決められます。選んだ方向へわずかに一歩進んだとき、地形がどれだけ急に高低するかの瞬間的な変化率が**方向微分** $D_{\\mathbf{u}} f$ です。今立っている所で、自由に顔を向けた小道の体感の傾きと考えてください。","3":"**4. 勾配: いちばん恐ろしい上り坂を指す奇跡のコンパス**\n\n周囲360度のうち、頂上へ向かういちばん恐ろしく急な上り坂の方向は一つだけです。$x$方向と$y$方向の傾きをまとめ一つの矢印（ベクトル）にしたものが**勾配** $\\nabla f$ です。この矢印は常に等高線をいちばん短く横切る直角方向へ伸びます。向きは最も急な上り坂、長さはその坂がどれだけ急か（最大傾き）を数値で示します。","4":"**5. 内積と勾配の不思議な関係**\n\n見ている任意の方向の傾きを求めるたびに重い計算をやり直す必要はありません。最高のコンパスである勾配と、進みたい方向ベクトルを**内積**するだけで、その方向の傾きが出ます。核心は **$D_{\\mathbf{u}} f = \\nabla f \\cdot \\mathbf{u}$** です。勾配とまったく同じ方向を向いて歩けば、そこで世界一急な上り坂を正面に歩いていることになります。"},"whyImportant":{"bridge":"AIを賢くする訓練（最適化）は、巨大な山脈のいちばん深く穏やかな谷の底—誤差が最小の状態—を目指す険しい旅です。データと重みが数十万に増えると、山脈は数百万次元の想像を超える地形になります。こんな濃霧の中、目隠しで無闇に歩けば一生谷を見つけられません。","similarity":"そのとき**勾配** $\\nabla L$ は一筋の光のような奇跡のナビです。今いる所で誤差が最も爆発的に増える恐ろしい上り坂を正確に指すからです。AIはその指の**真逆**に向きを変え、一歩ずつ静かに下るだけでよいのです。この数学的コンパスがなければ深層学習の学習自体が不可能で、無数の重みはどう変えるべきか道を失い永遠にさまようでしょう。"},"howUsed":{"ml":"**1. 深層学習の止まらない心臓、勾配降下法**\n\n方向と傾きの概念は、AIを完成させる唯一の偉大なアルゴリズム・勾配降下法に集約されます。$\\mathbf{w}_{k+1} = \\mathbf{w}_k - \\eta \\nabla L(\\mathbf{w}_k)$ という核心式は、AIが歩を進める生きた原理です。$\\nabla L$ は「いちばん急な上り坂」、マイナス記号は「上りの真逆の下り坂へ慎重に下る」という意志です。\n\n**学習率** $\\eta$ は探検家の**歩幅**です。大きすぎると谷を飛び越え反対の峰へ落ち、蟻のように小さすぎると底に着く前に学習時間が終わります。実戦ではこの歩幅を環境に合わせ細かく調整することが成功を左右します。","geometry":"**2. 目で確かめる損失曲面の可視化**\n\n最新のデータサイエンスや論文では、色鮮やかな3Dの山や濃淡の等高線ヒートマップがよく登場します。億単位を超える未知の重みを、目で見える2〜3次元に圧縮して誤差の曲面を描き、学習がどれだけ滑らかかを確かめます。勾配コンパスに従う下りの道がヒートマップ上でジグザグに不安定か、そりのように滑らかに下るかを目で診断します。"},"summary":"**一行要約:** 損失の山脈を等高線地図のように読み、任意方向の傾きは **$D_{\\mathbf{u}} f = \\nabla f \\cdot \\mathbf{u}$**、最大上りは **$\\nabla f$**、一歩の下りは **$\\mathbf{w}_{k+1}=\\mathbf{w}_k-\\eta\\nabla L$**。","problemSolving":{"focus":"**三つの式**: ① $D_{\\mathbf{u}} f = \\nabla f \\cdot \\mathbf{u}$（$\\mathbf{u}$ は単位）。② $\\nabla f$ は等高線に直角・最大上り。③ $\\mathbf{w}_{k+1}=\\mathbf{w}_k-\\eta\\nabla L$（マイナスと $\\eta$）。手順は **$\\nabla f$ → $\\mathbf{u}$ 正規化 → 内積**。","examplesHeading":"解き方の例","examplesTable":"**例1 — 定義** $f=x^2+y^2$、$(1,1)$ の $\\nabla f$ と大きさは? → $(2,2)$、$2\\sqrt{2}$。\n\n---\n\n**例2 — 方向** 単位 $\\mathbf{u}=(1/\\sqrt{2},0)$ の $D_{\\mathbf{u}} f$? → $\\sqrt{2}$（内積公式）。\n\n---\n\n**例3 — 最大** 単位 $\\mathbf{u}$ で $D_{\\mathbf{u}} f$ 最大は? → 方向は $\\nabla f$、値は $\\|\\nabla f\\|$。\n\n---\n\n**例4 — 等高線** 等高線の**接線**で $D_{\\mathbf{u}} f$? $\\nabla f$? → 接線で **0**、$\\nabla f$ は等高線に**垂直**。\n\n---\n\n**例5 — 勾配降下** $L=w_1^2+w_2^2$、$\\mathbf{w}=(2,1)$、$\\eta=0.25$ の次の $\\mathbf{w}$? → $(1,0.5)$。\n\n---\n\n**例6 — 学習停滞** 損失が下がらないとき? → **$\\nabla L\\approx\\mathbf{0}$** の平坦部（極値·鞍点**候補**）の可能性。"},"problemSolvingLabel":"解法のコツ","problemSolvingTable":"| 用語 | 意味 |\n| :--- | :--- |\n| **方向微分** | $\\mathbf{u}$ 方向の傾き |\n| **勾配** | 最大**上り** $\\nabla f$ |\n| **核心式** | $D_{\\mathbf{u}} f = \\nabla f \\cdot \\mathbf{u}$ |\n| **等高線** | $\\nabla f$ は直角；接線では傾き0 |\n| **勾配降下** | $\\mathbf{w}_{k+1}=\\mathbf{w}_k-\\eta\\nabla L$ |\n| **平坦** | $\\nabla f\\approx\\mathbf{0}$ → 候補点 |\n\n**①** $\\nabla f$ から。**②** $\\mathbf{u}$ は単位か。**③** $D_{\\mathbf{u}} f>0$ は上り。**④** $\\eta$ 大きすぎ/小さすぎ注意。","practiceProblemsTitle":"演習","practiceProblemsIntro":"","practiceProblemsInstruction":"問題を読み、最も適切な選択肢を選んでください。","problems":{"gdef_0":"単位ベクトル $\\mathbf{u}$ の方向に微小移動したときの $f$ の変化率を何と呼ぶか？\n\n① 偏微分\n② 方向微分 $D_{\\mathbf{u}} f$\n③ ヤコビアン\n④ ヘッシアン","gdef_1":"$$\\nabla f$（勾配）の最も近い意味は？\n\n① 常に最小値への方向\n② 各偏微分を並べたベクトルで、最も急な上りの方向\n③ 等値線に接する方向\n④ 常に零ベクトル","gdef_2":"$$\\|\\mathbf{u}\\|=1$ のとき $D_{\\mathbf{u}} f$ と $\\nabla f$ の関係として正しいのは？\n\n① 常に $0$\n② $D_{\\mathbf{u}} f=\\nabla f\\cdot\\mathbf{u}$\n③ $D_{\\mathbf{u}} f=\\|\\nabla f\\|^2$\n④ 関係なし","gdef_3":"単位ベクトル $\\mathbf{u}$ で $D_{\\mathbf{u}} f$ が最大になるのは通常いつか？\n\n① $\\mathbf{u}$ が $\\nabla f$ に垂直\n② $\\mathbf{u}$ が $\\nabla f$ と同じ方向\n③ $\\nabla f=\\mathbf{0}$ のみ\n④ 常に東向き","gdef_4":"$$\\nabla f(\\mathbf{x})=\\mathbf{0}$ の点で正しいのは？\n\n① 必ず鞍点\n② すべての方向で変化率 $0$（臨界点）\n③ 必ず最大\n④ 勾配は無限","gdef_5":"$$\\partial f/\\partial x$ はどの方向微分の特別な場合か？\n\n① $\\mathbf{u}=(0,1)$\n② $\\mathbf{u}=(1,0)$（$x$ 軸方向）\n③ 対角方向\n④ どれでもない","gtf_0":"勾配 $\\nabla f$ は等値線に垂直である。\n\n① 正\n② 誤","gtf_1":"$$\\|\\mathbf{u}\\|=1$ なら常に $D_{\\mathbf{u}} f\\le \\|\\nabla f\\|$。\n\n① 正\n② 誤","gtf_2":"勾配は常に関数の最小値の方向を指す。\n\n① 正\n② 誤","gtf_3":"$$\\nabla f=\\mathbf{0}$ なら任意の単位 $\\mathbf{u}$ で $D_{\\mathbf{u}} f=0$。\n\n① 正\n② 誤","gtf_4":"$$\\|\\mathbf{u}\\|=1$ のとき $D_{\\mathbf{u}} f>\\|\\nabla f\\|$ となりうる。\n\n① 正\n② 誤","gtf_5":"偏微分は特定の座標方向の方向微分である。\n\n① 正\n② 誤","gcalc_0":"$$f(x,y)=x^2+y^2$ の $(1,1)$ における $\\nabla f$ は？\n\n① $(0,0)$\n② $(2,2)$\n③ $(1,1)$\n④ $(-2,-2)$","gcalc_1":"$$f(x,y)=x^2+xy+y^2$ の原点における $\\nabla f$ は？\n\n① $(0,0)$\n② $(1,1)$\n③ $(2,2)$\n④ 存在しない","gcalc_2":"$$f(x,y)=3x+2y$ の $\\nabla f$ は？\n\n① $(2,3)$\n② $(3,2)$\n③ $(0,0)$\n④ $(5,5)$","gcalc_3":"$$f=x^2+y^2$、$(1,1)$、$\\mathbf{u}=\\frac{1}{\\sqrt{2}}(1,0)$ の $D_{\\mathbf{u}} f$ は？\n\n① $2$\n② $\\sqrt{2}$\n③ $2\\sqrt{2}$\n④ $0$","gcalc_4":"$$f(x,y)=xy$ の $(2,3)$ における $\\nabla f$ は？\n\n① $(2,3)$\n② $(3,2)$\n③ $(0,0)$\n④ $(6,6)$","gcalc_5":"$$f(x,y)=x^2-y^2$ の $(1,0)$ における $\\nabla f$ は？\n\n① $(2,0)$\n② $(0,2)$\n③ $(2,2)$\n④ $(0,0)$","gprop_0":"$$\\|\\mathbf{u}\\|=1$ のとき $D_{\\mathbf{u}} f$ の最大値は？\n\n① $0$\n② $\\|\\nabla f\\|$\n③ $\\|\\nabla f\\|^2$\n④ 常に $1$","gprop_1":"$$\\nabla f\\neq\\mathbf{0}$ で $\\|\\mathbf{u}\\|=1$、$D_{\\mathbf{u}} f=0$ なら $\\mathbf{u}$ は？\n\n① $\\nabla f$ と平行\n② $\\nabla f$ に垂直（等値線接線方向）\n③ 零ベクトル\n④ 任意","gprop_2":"最も急な上りの方向は？\n\n① 任意の $\\mathbf{u}$\n② $\\nabla f$ の方向\n③ $-\\nabla f$\n④ 等値線接線","gprop_3":"勾配降下の更新 $\\mathbf{w}_{k+1}=\\mathbf{w}_k-\\eta\\nabla L$ で $\\eta>0$ のとき移動方向は？\n\n① $\\nabla L$ と同じ\n② $-\\nabla L$（降下）\n③ ランダム\n④ 零","gprop_4":"$$\\nabla f$ が点で一定なら $f$ は？\n\n① 二次関数のみ\n② その近傍で一次（平面）\n③ 常に $0$\n④ 周期関数","gprop_5":"等値線 $f=c$ 上の $\\nabla f$ は等値線に対して？\n\n① 接線\n② 垂直（法線）\n③ 平行でないことはない\n④ 常に零","mcon_0":"偏微分と方向微分の関係で正しいのは？\n\n① 無関係\n② 偏微分は特定方向の方向微分\n③ 方向微分は常に $0$\n④ 勾配はスカラー","mcon_1":"$$\\nabla f=\\mathbf{0}$ の点を何と呼ぶことが多いか？\n\n① 固有値\n② 臨界点\n③ ランク落ち\n④ 特異点のみ","mcon_2":"$$f(x,y)=x^2+y^2$ の原点の $\\nabla f$ は？\n\n① $(2,2)$\n② $(0,0)$\n③ 未定義\n④ $(1,1)$","mcon_3":"2変数で $\\nabla f=\\mathbf{0}$ なら必ず？\n\n① 最大\n② 極値の候補（最大・最小・鞍の可能性）\n③ 最小のみ\n④ 線形","mcon_4":"$$D_{\\mathbf{u}} f=\\nabla f\\cdot\\mathbf{u}$ が $\\|\\mathbf{u}\\|=1$ で成り立つ理由は？\n\n① 内積の定義\n② 方向微分は勾配を方向に射影したもの\n③ テイラー級数\n④ 行列式","mcon_5":"損失 $L(\\mathbf{w})$ 学習で勾配の符号が示すのは？\n\n① データ個数\n② $L$ を増やす方向（降下は負勾配）\n③ 学習率\n④ バッチサイズ","mgeo_0":"等値線上を進むと $f$ は通常？\n\n① 最大に増える\n② （その線上では）高さが一定\n③ 必ず $0$\n④ 勾配と同じ","mgeo_1":"勾配が等値線に垂直な幾何的理由は？\n\n① 偶然\n② 垂直方向が最も高さが変わるから\n③ 勾配は接線\n④ 常に水平","mgeo_2":"平坦な領域（$\\nabla f\\approx\\mathbf{0}$）では？\n\n① 急な上りのみ\n② どの方向もあまり変わらない\n③ 必ず谷\n④ 勾配は無限","mgeo_3":"$$f(x,y)=x^2+y^2$ の等値線の形は？\n\n① 直線\n② 同心円\n③ 双曲線\n④ 点のみ","mgeo_4":"ヒートマップで赤い領域は通常？\n\n① 低い値\n② 高い値（山）\n③ 勾配零のみ\n④ ランダム","mgeo_5":"鞍点近傍の $\\nabla f$ は？\n\n① 常に零\n② 方向によって上り下りが混在（零だが曲率は混合）\n③ 常に最大\n④ 定義不可","mcmp_0":"$$(1,1)$ で $\\mathbf{u}_1=(1,0)$、$\\mathbf{u}_2=(1/\\sqrt{2},1/\\sqrt{2})$（単位）、$f=x^2+y^2$。より急な上りは？\n\n① $\\mathbf{u}_1$\n② $\\mathbf{u}_2$（$\\nabla f$ 方向）\n③ 同じ\n④ 比較不可","mcmp_1":"$$\\nabla f=(4,0)$、単位 $\\mathbf{u}=(0,1)$ の $D_{\\mathbf{u}} f$ は？\n\n① $4$\n② $0$\n③ $-4$\n④ $16$","mcmp_2":"$$\\nabla f=(3,4)$ の大きさは？\n\n① $7$\n② $5$\n③ $12$\n④ $1$","mcmp_3":"同一点で $D_{\\mathbf{u}_1} f=2$、$D_{\\mathbf{u}_2} f=5$（いずれも単位）なら？\n\n① $\\mathbf{u}_1$ が $\\nabla f$ 方向\n② $\\mathbf{u}_2$ の方が $\\nabla f$ に近い\n③ 両方垂直\n④ 勾配零","mcmp_4":"$$f=x+y$、$\\nabla f$ は？\n\n① $(0,0)$\n② $(1,1)$（どこでも同じ）\n③ $(1,-1)$\n④ 点依存で変わる","mcmp_5":"$$\\nabla f=(2,-1)$、単位 $\\mathbf{u}=(1,0)$ の $D_{\\mathbf{u}} f$ は？\n\n① $-1$\n② $2$\n③ $0$\n④ $\\sqrt{5}$","hopt_0":"$$\\mathbf{w}=(2,1)$、$L=w_1^2+w_2^2$、$\\eta=0.25$ の勾配降下 1 ステップ後は？\n\n① $(0,0)$\n② $(1,0.5)$\n③ $(3,1.5)$\n④ $(2,1)$","hopt_1":"$$\\eta<0$ で $-\\eta\\nabla L$ を踏むと？\n\n① 必ず最小\n② 上り（悪化）方向\n③ 変化なし\n④ 零勾配のみ","hopt_2":"$$\\nabla L=\\mathbf{0}$ のとき 1 ステップは？\n\n① 必ず発散\n② 位置不変\n③ ランダム\n④ 必ず最小","hopt_3":"$$L(w)=(w-3)^2$、$w=1$、$\\eta=0.125$ の次の $w$ は？\n\n① $1$\n② $1.5$\n③ $3$\n④ $0$","hopt_4":"学習率が大きすぎると典型的に？\n\n① 必ず収束\n② 発振・発散しうる\n③ 勾配消失のみ\n④ 損失ゼロ","hopt_5":"ミニバッチ勾配は完全勾配に比べ？\n\n① 常に同じ\n② ノイズあり（期待値は勾配方向）\n③ 常に零\n④ 使えない","hloss_0":"1変数 $L(w)=w^2$ の $\\frac{dL}{dw}$ は？\n\n① $w$\n② $2w$\n③ $w^2$\n④ $0$","hloss_1":"MSE $L=\\frac{1}{n}\\sum(y_i-\\hat{y}_i)^2$ で $\\hat{y}_i=wx_i$ の $\\partial L/\\partial w$ は誤差と？\n\n① 無関係\n② $x_i$ を掛けた形で現れる（連鎖律）\n③ 常に $0$\n④ 行列式のみ","hloss_2":"損失曲面の谷に向かう更新方向は？\n\n① $\\nabla L$\n② $-\\nabla L$\n③ ランダム\n④ 等値線接線","hloss_3":"$$L(\\mathbf{w})=\\|\\mathbf{w}\\|^2$ の $\\nabla L$ は？\n\n① $\\mathbf{0}$\n② $2\\mathbf{w}$\n③ $-\\mathbf{w}$\n④ 単位ベクトルのみ","hloss_4":"損失 $L(w_1,w_2)=w_1^2+4w_2^2$ で $(1,1)$ の $\\nabla L$ は？\n\n① $(1,4)$\n② $(2,8)$\n③ $(0,0)$\n④ $(8,2)$","hloss_5":"平坦な谷（絡み合った等値線）では勾配は？\n\n① 常に大きい\n② 小さく、進みにくい\n③ 無限\n④ 常に零","hscn_0":"ニューラルネット学習で各層重みを更新する主な手がかりは？\n\n① 行列式\n② 損失の勾配\n③ 固有値のみ\n④ ランダムのみ","hscn_1":"画像分類で損失が下がらない（勾配ほぼ零）の一因は？\n\n① 学習率大\n② すでに平坦領域・飽和付近\n③ 勾配爆発のみ\n④ データなし","hscn_2":"3D 損失曲面で等高線が密な領域は通常？\n\n① $\\|\\nabla L\\|$ が大きい（急）\n② $\\|\\nabla L\\|$ が常に $0$\n③ 学習率 $\\eta=0$\n④ 勾配と無関係","hscn_3":"多変数 $f(x_1,\\ldots,x_n)$ で座標 $x_i$ だけを少し動かしたときの変化率は？\n\n① 行列式\n② 偏微分 $\\frac{\\partial f}{\\partial x_i}$（その軸方向の方向微分）\n③ すべての固有値\n④ ヘッシアンのみ","hscn_4":"勾配降下が局所最小に止まる理由は？\n\n① 勾配が増える\n② $\\nabla L\\approx\\mathbf{0}$ になるから\n③ 学習率無限\n④ 損失一定増加","hscn_5":"正則化 $L+\\lambda\\|\\mathbf{w}\\|^2$ の効果の一つは？\n\n① 勾配を零に\n② パラメータを小さく保つ方向の勾配項を加える\n③ 等値線消去\n④ 学習禁止"},"problemAnswers":{"gdef_0":2,"gdef_1":2,"gdef_2":2,"gdef_3":2,"gdef_4":2,"gdef_5":2,"gtf_0":1,"gtf_1":1,"gtf_2":2,"gtf_3":1,"gtf_4":2,"gtf_5":1,"gcalc_0":2,"gcalc_1":1,"gcalc_2":2,"gcalc_3":2,"gcalc_4":2,"gcalc_5":1,"gprop_0":2,"gprop_1":2,"gprop_2":2,"gprop_3":2,"gprop_4":2,"gprop_5":2,"mcon_0":2,"mcon_1":2,"mcon_2":2,"mcon_3":2,"mcon_4":2,"mcon_5":2,"mgeo_0":2,"mgeo_1":2,"mgeo_2":2,"mgeo_3":2,"mgeo_4":2,"mgeo_5":2,"mcmp_0":2,"mcmp_1":2,"mcmp_2":2,"mcmp_3":2,"mcmp_4":2,"mcmp_5":2,"hopt_0":2,"hopt_1":2,"hopt_2":2,"hopt_3":2,"hopt_4":2,"hopt_5":2,"hloss_0":2,"hloss_1":2,"hloss_2":2,"hloss_3":2,"hloss_4":2,"hloss_5":2,"hscn_0":2,"hscn_1":2,"hscn_2":1,"hscn_3":2,"hscn_4":2,"hscn_5":2},"problemSolutions":{"gdef_0":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gdef_1":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gdef_2":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gdef_3":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gdef_4":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gdef_5":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gtf_0":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ①","gtf_1":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ①","gtf_2":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gtf_3":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ①","gtf_4":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gtf_5":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ①","gcalc_0":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gcalc_1":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ①","gcalc_2":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gcalc_3":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gcalc_4":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gcalc_5":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ①","gprop_0":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gprop_1":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gprop_2":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gprop_3":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gprop_4":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","gprop_5":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mcon_0":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mcon_1":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mcon_2":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mcon_3":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mcon_4":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mcon_5":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mgeo_0":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mgeo_1":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mgeo_2":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mgeo_3":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mgeo_4":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mgeo_5":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mcmp_0":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mcmp_1":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mcmp_2":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mcmp_3":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mcmp_4":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","mcmp_5":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hopt_0":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hopt_1":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hopt_2":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hopt_3":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hopt_4":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hopt_5":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hloss_0":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hloss_1":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hloss_2":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hloss_3":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hloss_4":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hloss_5":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hscn_0":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hscn_1":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hscn_2":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ①","hscn_3":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hscn_4":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","hscn_5":"**1)** 勾配・方向微分の定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②"},"problemTestCodes":{"gdef_0":"answer = 2\nassert answer == 2","gdef_1":"answer = 2\nassert answer == 2","gdef_2":"answer = 2\nassert answer == 2","gdef_3":"answer = 2\nassert answer == 2","gdef_4":"answer = 2\nassert answer == 2","gdef_5":"answer = 2\nassert answer == 2","gtf_0":"answer = 1\nassert answer == 1","gtf_1":"answer = 1\nassert answer == 1","gtf_2":"answer = 2\nassert answer == 2","gtf_3":"answer = 1\nassert answer == 1","gtf_4":"answer = 2\nassert answer == 2","gtf_5":"answer = 1\nassert answer == 1","gcalc_0":"answer = 2\nassert answer == 2","gcalc_1":"answer = 1\nassert answer == 1","gcalc_2":"answer = 2\nassert answer == 2","gcalc_3":"answer = 2\nassert answer == 2","gcalc_4":"answer = 2\nassert answer == 2","gcalc_5":"answer = 1\nassert answer == 1","gprop_0":"answer = 2\nassert answer == 2","gprop_1":"answer = 2\nassert answer == 2","gprop_2":"answer = 2\nassert answer == 2","gprop_3":"answer = 2\nassert answer == 2","gprop_4":"answer = 2\nassert answer == 2","gprop_5":"answer = 2\nassert answer == 2","mcon_0":"answer = 2\nassert answer == 2","mcon_1":"answer = 2\nassert answer == 2","mcon_2":"answer = 2\nassert answer == 2","mcon_3":"answer = 2\nassert answer == 2","mcon_4":"answer = 2\nassert answer == 2","mcon_5":"answer = 2\nassert answer == 2","mgeo_0":"answer = 2\nassert answer == 2","mgeo_1":"answer = 2\nassert answer == 2","mgeo_2":"answer = 2\nassert answer == 2","mgeo_3":"answer = 2\nassert answer == 2","mgeo_4":"answer = 2\nassert answer == 2","mgeo_5":"answer = 2\nassert answer == 2","mcmp_0":"answer = 2\nassert answer == 2","mcmp_1":"answer = 2\nassert answer == 2","mcmp_2":"answer = 2\nassert answer == 2","mcmp_3":"answer = 2\nassert answer == 2","mcmp_4":"answer = 2\nassert answer == 2","mcmp_5":"answer = 2\nassert answer == 2","hopt_0":"answer = 2\nassert answer == 2","hopt_1":"answer = 2\nassert answer == 2","hopt_2":"answer = 2\nassert answer == 2","hopt_3":"answer = 2\nassert answer == 2","hopt_4":"answer = 2\nassert answer == 2","hopt_5":"answer = 2\nassert answer == 2","hloss_0":"answer = 2\nassert answer == 2","hloss_1":"answer = 2\nassert answer == 2","hloss_2":"answer = 2\nassert answer == 2","hloss_3":"answer = 2\nassert answer == 2","hloss_4":"answer = 2\nassert answer == 2","hloss_5":"answer = 2\nassert answer == 2","hscn_0":"answer = 2\nassert answer == 2","hscn_1":"answer = 2\nassert answer == 2","hscn_2":"answer = 1\nassert answer == 1","hscn_3":"answer = 2\nassert answer == 2","hscn_4":"answer = 2\nassert answer == 2","hscn_5":"answer = 2\nassert answer == 2"}},"midMathCh09":{"chapter":"Chapter 09","title":"ヤコビアン行列: 複数の入力が動くと出力は?","description":"巨大な工場の機械を想像してください。ダイヤル(入力)が複数あり、計器盤(出力)の針も複数あります。1番と2番のダイヤルを同時にほんの少し回すと、3番と4番の針はそれぞれどれだけ動くでしょうか?\n\n前章の **勾配(Gradient)** が、結果(誤差)が1つだけのとき「最も急な上り坂」を示す **単独のコンパス** だったとすれば、今回の **ヤコビアン行列(Jacobian Matrix, $J$)** は、結果が複数あるとき、すべての入力とすべての出力の微細な相互作用を1枚の大きな表にまとめた **「究極の感度総合ダッシュボード」** です。\n\n私たちが扱う世界や深層学習モデルは、遠くから見るとくねくねと予測しにくい非線形曲面($\\mathbf{f}$)です。しかしどんなに複雑な曲面でも、一点を拡大してその近傍だけ見れば、まるで真っ直ぐな直線や平面のように見えます。ヤコビアン行列はこの一瞬を平行四辺形格子(局所線形近似)で再現し、巨大なニューラルネットが誤差を追跡し自分自身を調整できる **奇跡の数学的道具** です。","sectionTitle":"ヤコビアン行列: 複数の入力が動くと出力は?","sectionLabels":{"easyExplain":"やさしい言葉でもう一度","whatIs":"概念","whyImportant":"重要性","howUsed":"使い方","problemSolving":"解法のコツ"},"visualShort":"入力→出力: f(曲がる) vs J(直線近似)","visualIntro":"左 **入力** 格子が右 **出力** に。遠くでは **曲がる**($f$)、近くでは **直線に傾く**($J$)。橙·紫の **▱** が似ていれば近似が合います。","visualStep1":"入力格子","visualStep2":"f: 曲がる","visualStep3":"小さな ▱","visualStep4":"J: 直線近似","visualStepsLabel":"読み順","visualFlowTitle":"学習の流れ","visualFlowStep0":"概念: ベクトル値 $\\mathbf{f}(\\mathbf{x})$","visualFlowStep1":"直感: 入力格子 → 出力歪み(上 f)","visualFlowStep2":"代数: $J_{ij}$, $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$","visualFlowStep3":"接続: Ch.08 勾配, Ch.05 det J","visualFlowStep4":"応用: 逆伝播, Ch.10 ヘッシアン","jacVisualAriaLabel":"入力格子が出力に変わり、非線形 f の曲がりと線形 J の傾きが順に現れます。","jacVisualMainTitle":"ヤコビアン: 入力が動くと出力は?","jacVisualSubtitle":"Ch.08 **勾配**は結果 **1つ**、Ch.09 **ヤコビアン $J$** は **複数**。左入力→右出力。まず **曲がる**($f$)、次に **直線近似**($J$)。","jacVisualCaption":"**赤格子**=座標、**緑矢印**=変換、**橙 ▱**=$f$ の小領域、**紫 ▱**=$J$ の近似。▱ が似ていれば $f\\approx J\\Delta\\mathbf{x}$。","jacVisualHintFar":"→ 遠く: 格子が曲がる (非線形 f)","jacVisualHintNear":"→ 近く: 直線のように傾く (線形 J)","jacDiagramLabelInput":"入力 / Input","jacDiagramLabelOutput":"出力 / Output","jacDiagramLabelNonlinear":"非線形 f","jacDiagramLabelLinear":"局所線形 J","whatIs":{"0":"**1. ベクトル値関数: 複数の入力スティックと複数の出力スクリーン**\n\nこれまでの関数は、ダイヤルをいくつ回しても結果(誤差)が1つだけ出る機械(スカラー関数)でした。しかしカメラのピクセル座標や、深層学習の中間層にある数百のニューロン値のように、結果そのものが **ベクトル** として出てくる場合の方がはるかに多いです。$n$ 個の入力から $m$ 個の出力が一斉に出る機械を **ベクトル値関数** $\\mathbf{f}:\\mathbb{R}^n\\to\\mathbb{R}^m$ と呼びます。入力スティックを少し触ると、数十の出力スクリーンが同時に揺れます。","1":"**2. 局所線形化: 拡大すれば丸い地球も平ら**\n\n上段ビジュアルのように、現実の変化は格子が曲がりくねる複雑な曲線(非線形)です。しかしある一点の近くを数万倍ズームインすると、曲線は短い直線のように、曲面は平面のように扱えます。微積分学の核心はこの狭い **局所** 領域にあり、ヤコビアンはその平らに広げた写像の **傾き総合表** です。","2":"**3. ヤコビアン行列の定義: 究極の変化量要約**\n\n$J_{ij}=\\frac{\\partial f_i}{\\partial x_j}$ は複雑に見えますが、意味は単純です。**「$j$ 番目のダイヤルを1目盛り回すと、$i$ 番目の針は何目盛り動くか?」** を $i$ 行 $j$ 列に書いた表です。多くのダイヤルを同時に少し回した $\\Delta\\mathbf{x}$ に対し、出力の変化 $\\Delta\\mathbf{y}$ を **$\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$** という一行の行列積で予測できます。","3":"**4. 勾配(Ch.08)との関係: コンパスを積み上げた塔**\n\n出力が1つなら表は1行の **勾配** コンパス。出力が3つなら、各出力の勾配を3行積み上げた表になります。ヤコビアンは **各出力が持つ勾配を行として並べた巨大なコンパス集** と理解すれば完璧です。","4":"**5. 幾何学的魔法: つぶれた面積の倍率 ($\\det J$)**\n\n小さな正方形の入力データがヤコビアン変換を通ると、傾いた平行四辺形に変形します。面積が元の何倍になった(または縮んだ)かを示すのが行列式 **$\\det J$** です。$|\\det J|=6$ なら、粘土のように伸びて単位面積が **6倍** になったことを意味します(Ch.05)。"},"easyExplain":{"0":"**① 勾配 vs ヤコビアン — 答えが1つと複数**\n\nCh.08 **勾配**は答えが **1つ** のとき。「勉強を10分増やすと点数は何点上がる?」 **ヤコビアン**は答えが **複数** のとき。例: ロボット腕で肩·肘を少し動かすと、手の **X** と **Y** が **それぞれ** どれだけ変わるかを **1枚の表** にまとめたもの。Ch.08=コンパス1個、Ch.09=ダイヤルと計器をつなぐ **大きな表**。","1":"**② 表の1マス $J_{ij}$ — 「ダイヤル j → 針 i」**\n\n$J_{ij}$ は難しく見えても、**「$j$ 番目の入力を少し回すと、$i$ 番目の出力はどれだけ動く?」** だけ。**行=出力、列=入力**。2×2 なら1行目は「1番目の結果が x, y にどう反応するか」。","2":"**③ $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$ — 「少し動かすとだいたいこんなに」**\n\n入力を **ほんの少し** 動かす($\\Delta\\mathbf{x}$)と、出力も **ほんの少し** 変わる($\\Delta\\mathbf{y}$)。**出力の変化 ≈ ヤコビアン × 入力の変化**。遠くでは曲がった道でも、**一点の近く** では **短い直線** のように見える——上の図(曲線)と下の図(直線)の違いです。","3":"**④ 逆伝播 — 誤差を逆方向に送るとき表を掛ける**\n\n層が何段も重なっています。最後に「間違い」と出たら、**前の層へ逆流** させて直す場所を探します。各層に小さな **ヤコビアン表** があり、**掛け合わせ** ます($J_{\\text{total}}=J_L\\cdots J_1$)。**表×表×表** と覚えれば十分です。","4":"**⑤ $\\det J$ — 面積が何倍になったか · ロボット腕の警告灯**\n\n小さな **正方形** が **平行四辺形** に変形したとき、**面積が何倍** かを示すのが $\\det J$(Ch.05)。$|\\det J|=6$ → **6倍**。腕が **完全に伸びる** と $\\det J=0$ — ある方向には **1mmも動けない** **特異点(マヒ)** の **警告** です。"},"whyImportant":{"bridge":"**深層学習は、数多くのヤコビアン行列が蜘蛛の巣のように絡み合った巨大工場** です。ReLU や Sigmoid などでデータが曲がっても、逆伝播(Backpropagation)は **局所線形化** の魔法で各層の **ヤコビアン行列** を求めます。Ch.08 勾配が最終誤差だけのコンパスだったなら、層と層の間では数千のニューロンが互いに与える影響を表す巨大なヤコビアンが不可欠です。","similarity":"結局、ネットワークの学習とは連鎖律(Chain Rule)に従いヤコビアン行列を次々と掛け合わせていく数学的過程にすぎません。人間の顔のような画像を生む GAN 生成器や、データを圧縮するオートエンコーダも「入力した潜在ノイズをほんの少しねじると、目の前の画像はどう歪んで変わるか?」をヤコビアン $J$ で読み取り、学習の方向を決めます。"},"howUsed":{"ml":"**1. 逆伝播(Backpropagation): 誤差が逆流する川**\n\n誤差を減らすには、最終層の誤差を入力層まで逆流させる必要があります。数十層(Layer)が積み上がっていても、各層の **局所ヤコビアンを踏み石のように掛ける** ($J_{\\text{total}}=J_L\\cdots J_1$) だけで、巨大なモデルでも全体の感度を一度に計算し重みを更新できます。\n\n**2. 確率密度の伸縮(正規化フロー / Normalizing Flows)**\n\n生成型 AI では、単純な粘土(正規分布)をこね伸ばして精緻な彫刻(複雑なデータ分布)にする技法があります。空間を2倍に広げれば密度は半分に。体積変化に伴う確率密度の歪みを **$\\log|\\det J|$** で精密補正します(Ch.05 行列式)。","geometry":"**3. ロボット腕の微細制御と特異点(マヒ状態)**\n\n肩と肘の関節を持つロボット腕を想像してください。ヤコビアンは「関節モーターを1°回すと、手先の X, Y 座標はそれぞれどれだけ動くか?」に答えます。腕が完全に伸びると **$\\det J=0$** — 特定方向に **1mmも動けない** 数学的 **特異点(マヒ)** を警告する、実戦で重要な信号です。"},"summary":"**一行:** ヤコビアン $J$ は複数ダイヤルと複数計器の変化を完璧にまとめた **究極の感度表** です。狭い領域では $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$ で複雑な変化を直線化し、深層学習が巨大な層を越えて誤差を逆流追跡(逆伝播)できる **最も重要な数学的心臓部** です。","problemSolving":{"focus":"**解くときはこの順番だけ**\n\n**① 表のサイズ — 出力はいくつ? 入力はいくつ?**\n出力 $m$ 個・入力 $n$ 個なら $J$ は **$m$ 行 × $n$ 列** の表。**行=出力、列=入力** (計器番号 / ダイヤル番号)。\n\n**② マスを埋める — 「ダイヤル j → 針 i」**\n$(i,j)$ マスには **「$j$ 番入力を少し動かすと、$i$ 番出力はどれだけ動く?」** を入れます。正式名称は偏微分($J_{ij}$)ですが、**反応の大きさ1つ** と考えれば十分です。\n\n**③ 小さな動き — 入力を少し → 出力も少し**\n入力を **ほんの少し** 変える($\\Delta\\mathbf{x}$)とき、出力の変化($\\Delta\\mathbf{y}$)はだいたい **$J$ × 入力の変化**: $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$。\n\n**④ 出力1個なら Ch.08 勾配**\n結果が1つ($m=1$)だけなら、$J$ は Ch.08 **勾配** $\\nabla f$ を横に寝かせたもの($\\nabla f^\\mathsf{T}$)と同じです。\n\n**手順3ステップ:** ① サイズ確認 → ② 偏微分を埋める → ③ 合成なら $J_g J_f$ を掛ける","examplesHeading":"解き方の例","examplesTable":"**例1 — 2×2 J**\n\n問題: $\\mathbf{f}(x,y)=(x+y,\\;x-y)$ の $J$ は?\n\n解: $f_1=x+y\\Rightarrow(1,1)$, $f_2=x-y\\Rightarrow(1,-1)$. $J=\\begin{pmatrix}1&1\\\\1&-1\\end{pmatrix}$.\n\n---\n\n**例2 — 一点で**\n\n問題: $\\mathbf{f}(x,y)=(x^2,\\;y)$, $(1,0)$ の $J$?\n\n解: $\\partial f_1/\\partial x=2x=2$, 他は0; $\\partial f_2/\\partial y=1$. $J=\\begin{pmatrix}2&0\\\\0&1\\end{pmatrix}$.\n\n---\n\n**例3 — 線形**\n\n問題: $\\mathbf{f}(\\mathbf{x})=A\\mathbf{x}$ の $J$?\n\n解: **$A$** (どこでも同じ).\n\n---\n\n**例4 — 連鎖**\n\n問題: $f(x)=x$, $g(u)=2u$ の $J_{g\\circ f}$ (1×1)?\n\n解: $J_f=1$, $J_g=2$, $J_{g\\circ f}=J_g J_f=2$.\n\n---\n\n**例5 — det J**\n\n問題: $J=\\begin{pmatrix}2&0\\\\0&3\\end{pmatrix}$ の単位正方形面積?\n\n解: $|\\det J|=|6|=6$ → **6倍**.\n\n---\n\n**例6 — 線形層**\n\n問題: $\\mathbf{z}=W\\mathbf{x}+\\mathbf{b}$ の $J$?\n\n解: 線形変換なので **$W$**. "},"problemSolvingLabel":"解法のコツ","problemSolvingTable":"| 言葉 | 意味 |\n| :--- | :--- |\n| **ヤコビアン** | $J_{ij}=\\partial f_i/\\partial x_j$, $m\\times n$ |\n| **局所近似** | $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$ |\n| **勾配** | $m=1$ のとき $J=\\nabla f^\\mathsf{T}$ |\n| **連鎖** | $J_{g\\circ f}=J_g J_f$ |\n| **det J** | 面積·体積倍率 (Ch.05) |\n| **逆伝播** | $\\partial L/\\partial\\mathbf{x}=J^\\mathsf{T}(\\partial L/\\partial\\mathbf{f})$ |\n\n**①** 行=出力、列=入力. **②** 線形 $f=Ax$ なら $J=A$. **③** 小さな $\\Delta\\mathbf{x}$. **④** 特異(det$=0$)は一方向に潰れる.","practiceProblemsTitle":"演習","practiceProblemsIntro":"","practiceProblemsInstruction":"問題を読み、最も適切な選択肢を選んでください。","problems":{"jdef_0":"入力 $\\mathbf{x}$ を少し動かしたときベクトル出力 $\\mathbf{f}(\\mathbf{x})$ の変化を表にまとめたものは?\n\n① 勾配\n② ヤコビアン行列 $J$\n③ ヘッシアン\n④ 行列式","jdef_1":"$$J_{ij}=\\dfrac{\\partial f_i}{\\partial x_j}$ における $J_{ij}$ の意味は?\n\n① $j$ 番目の出力 / $i$ 番目の入力\n② $i$ 番目の出力 / $j$ 番目の入力の偏微分\n③ $i=j$ のときだけ定義\n④ 常に $0$","jdef_2":"$$f:\\mathbb{R}^2\\to\\mathbb{R}^3$ のときヤコビアン $J$ のサイズ(行×列)は?\n\n① $2\\times 2$\n② $2\\times 3$\n③ $3\\times 2$\n④ $3\\times 3$","jdef_3":"スカラー関数 $f:\\mathbb{R}^n\\to\\mathbb{R}$ のヤコビアンは通常?\n\n① $n\\times n$ 行列\n② $1\\times n$ (勾配を行に)\n③ $n\\times 1$ のみ\n④ 定義不可","jdef_4":"局所線形近似 $\\Delta\\mathbf{y}\\approx J\\,\\Delta\\mathbf{x}$ の $J$ は?\n\n① 常に対称\n② その点でのヤコビアン\n③ ヘッシアン\n④ 単位行列のみ","jdef_5":"線形変換 $\\mathbf{f}(\\mathbf{x})=A\\mathbf{x}$ のヤコビアン $J$ は?\n\n① $A^{-1}$\n② $A$ (どこでも同じ)\n③ $A^\\mathsf{T}A$\n④ 零行列","jtf_0":"入力変化が小さいとき $\\Delta\\mathbf{y}\\approx J\\,\\Delta\\mathbf{x}$ は 1次近似として使える。\n\n① 真\n② 偽","jtf_1":"ヤコビアンは常に正方($n\\times n$) 行列である。\n\n① 真\n② 偽","jtf_2":"$$m=1$ のときヤコビアン $J$ は勾配 $\\nabla f$ を行ベクトルにしたものと同じ。\n\n① 真\n② 偽","jtf_3":"$$\\det J$ は (2Dで) 小さな面積が変換後何倍になるかと関係する。\n\n① 真\n② 偽","jtf_4":"ヤコビアンの行は出力1つに対するすべての入力偏微分である。\n\n① 真\n② 偽","jtf_5":"合成 $h=g\\circ f$ のヤコビアンは $J_h=J_g\\,J_f$ (連鎖律)である。\n\n① 真\n② 偽","jcalc_0":"$$\\mathbf{f}(x,y)=(x+y,\\; x-y)$ の $J$ は?\n\n① $\\begin{pmatrix}1&-1\\\\1&1\\end{pmatrix}$\n② $\\begin{pmatrix}1&1\\\\1&-1\\end{pmatrix}$\n③ $\\begin{pmatrix}0&1\\\\1&0\\end{pmatrix}$\n④ $\\begin{pmatrix}2&0\\\\0&2\\end{pmatrix}$","jcalc_1":"$$\\mathbf{f}(x,y)=(2x,\\; 3y)$ の $J$ は?\n\n① $\\begin{pmatrix}2&3\\\\0&0\\end{pmatrix}$\n② $\\begin{pmatrix}2&0\\\\0&3\\end{pmatrix}$\n③ $\\begin{pmatrix}3&2\\\\0&0\\end{pmatrix}$\n④ $\\begin{pmatrix}1&1\\\\1&1\\end{pmatrix}$","jcalc_2":"$$\\mathbf{f}(x,y)=(x,\\; y)$ の $J$ は?\n\n① 零行列\n② 単位行列 $I$\n③ $\\begin{pmatrix}0&1\\\\1&0\\end{pmatrix}$\n④ $\\begin{pmatrix}2&0\\\\0&2\\end{pmatrix}$","jcalc_3":"$$\\mathbf{f}(x,y)=(3x,\\; y)$ の $J$ は?\n\n① $\\begin{pmatrix}1&0\\\\0&3\\end{pmatrix}$\n② $\\begin{pmatrix}3&0\\\\0&1\\end{pmatrix}$\n③ $\\begin{pmatrix}3&1\\\\0&0\\end{pmatrix}$\n④ $\\begin{pmatrix}0&3\\\\1&0\\end{pmatrix}$","jcalc_4":"$$\\mathbf{f}(x,y)=(x,\\; 2y)$ の $J$ は?\n\n① $\\begin{pmatrix}2&0\\\\0&1\\end{pmatrix}$\n② $\\begin{pmatrix}1&0\\\\0&2\\end{pmatrix}$\n③ $\\begin{pmatrix}1&2\\\\0&1\\end{pmatrix}$\n④ $\\begin{pmatrix}0&1\\\\2&0\\end{pmatrix}$","jcalc_5":"$$\\mathbf{f}(x,y)=(x^2,\\; y)$ で $(1,0)$ の $J$ は?\n\n① $\\begin{pmatrix}1&0\\\\0&1\\end{pmatrix}$\n② $\\begin{pmatrix}2&0\\\\0&1\\end{pmatrix}$\n③ $\\begin{pmatrix}2&0\\\\0&0\\end{pmatrix}$\n④ $\\begin{pmatrix}0&2\\\\1&0\\end{pmatrix}$","jprop_0":"$$f:\\mathbb{R}^n\\to\\mathbb{R}^m$ のとき $J$ の行数は?\n\n① $n$\n② $m$ (出力数)\n③ $m+n$\n④ 常に $1$","jprop_1":"$$f:\\mathbb{R}^n\\to\\mathbb{R}^m$ のとき $J$ の列数は?\n\n① $m$\n② $n$ (入力数)\n③ $m-n$\n④ $1$","jprop_2":"$$J$ の成分がすべて $0$ ならその点近くで $\\mathbf{f}$ は?\n\n① 必ず非線形\n② ほぼ定数(変化なし)\n③ 必ず発散\n④ 定義不可","jprop_3":"$$\\mathbf{f}(\\mathbf{x})=A\\mathbf{x}+\\mathbf{b}$ のとき $J$ は?\n\n① $\\mathbf{b}$\n② $A$\n③ $A\\mathbf{b}$\n④ $A^{-1}$","jprop_4":"$$\\Delta\\mathbf{x}$ が小さいほど $\\Delta\\mathbf{y}\\approx J\\Delta\\mathbf{x}$ 近似は?\n\n① 常に悪化\n② より正確\n③ 変わらない\n④ 常に誤り","jprop_5":"2入力2出力で $J$ の総成分数は?\n\n① $2$\n② $4$\n③ $8$\n④ $1$","jcon_0":"Ch.08 勾配と Ch.09 ヤコビアンの関係で正しいのは?\n\n① 無関係\n② スカラー $f$ の $J$ は $\\nabla f^\\mathsf{T}$; ベクトル $f$ は行ごとに出力1つ\n③ ヤコビアンは常にスカラー\n④ 勾配の方が大きい","jcon_1":"ベクトル値 $\\mathbf{f}:\\mathbb{R}^2\\to\\mathbb{R}^2$ で $J$ の 1行は?\n\n① 入力1つの偏微分\n② 出力1つに対する $(\\partial/\\partial x,\\;\\partial/\\partial y)$\n③ ヘッシアンの1行\n④ 行列式","jcon_2":"$$\\mathbf{f}(x,y)=(x^2,\\; y^2)$ は?\n\n① 線形\n② 非線形 (積・二乗)\n③ 定数\n④ $1\\to 1$ のみ","jcon_3":"局所線形化 $\\mathbf{f}(\\mathbf{x}_0+\\Delta\\mathbf{x})\\approx\\mathbf{f}(\\mathbf{x}_0)+J\\Delta\\mathbf{x}$ の $J$ は?\n\n① $\\mathbf{x}_0$ で定義不可\n② $\\mathbf{x}_0$ で計算したヤコビアン\n③ ヘッシアン\n④ 任意の行列","jcon_4":"層 $\\mathbf{z}=W\\mathbf{x}+\\mathbf{b}$ の $J$ は?\n\n① $W\\mathbf{b}$\n② $W$\n③ $W^\\mathsf{T}W$\n④ $\\mathbf{b}$ のみ","jcon_5":"出力が 1つ($m=1$) のときヤコビアンのサイズは?\n\n① $n\\times n$\n② $1\\times n$\n③ $n\\times 1$ のみ\n④ $1\\times 1$ のみ","jgeo_0":"2Dで小さな正方形が $J$ で変換されると通常?\n\n① 常に円\n② 平行四辺形\n③ 点\n④ 直線","jgeo_1":"$$\\det J>0$ なら (小領域) 通常?\n\n① 面積拡大のみ\n② 面積倍率 $|\\det J|$ (Ch.05 行列式)\n③ 面積と無関係\n④ det 無関係","jgeo_2":"$$J=\\begin{pmatrix}2&0\\\\0&3\\end{pmatrix}$ のとき単位正方形の面積は?\n\n① $1$\n② $6$ ($2\\times 3$)\n③ $5$\n④ $0$","jgeo_3":"非線形 $f$ は遠くでは複雑でも、一点近くでは?\n\n① 常に定数\n② $J$ で直線・平面のように近似\n③ ヘッシアンのみ\n④ ヤコビアン不要","jgeo_4":"$$J$ が特異(det$=0$) なら小領域は?\n\n① 面積そのまま\n② 1次元に潰れる (面積0)\n③ 必ず拡大\n④ 回転のみ","jgeo_5":"ロボット関節 $(\\theta_1,\\theta_2)\\mapsto 手 $(x,y)$ の $J$ は?\n\n① 手の位置のみ\n② 関節を少し動かしたとき手がどう動くか\n③ 質量\n④ バッテリー","jcmp_0":"$$f:\\mathbb{R}^2\\to\\mathbb{R}$ の $\\nabla f$ と $J$ のサイズは?\n\n① $\\nabla f$ が $2\\times 2$\n② $\\nabla f$ は2成分ベクトル、$J$ は $1\\times 2$\n③ 同じ\n④ $J$ が $2\\times 2$","jcmp_1":"$$f:\\mathbb{R}^2\\to\\mathbb{R}^2$ の $J$ vs Ch.10 ヘッシアン $H$?\n\n① $H$ が1次\n② $J$ は 1次、$H$ は 2次\n③ 同じ\n④ $J$ のみ対称","jcmp_2":"$$\\mathbf{f}(x,y)=(x,y)$ の $J$ は?\n\n① 零行列\n② $I$ (単位)\n③ $\\begin{pmatrix}0&1\\\\1&0\\end{pmatrix}$\n④ $\\begin{pmatrix}2&0\\\\0&2\\end{pmatrix}$","jcmp_3":"$$\\mathbf{f}(x,y)=(x+y,\\;0)$ の $J$ は?\n\n① $\\begin{pmatrix}1&1\\\\1&1\\end{pmatrix}$\n② $\\begin{pmatrix}1&1\\\\0&0\\end{pmatrix}$\n③ $\\begin{pmatrix}0&0\\\\1&1\\end{pmatrix}$\n④ $\\begin{pmatrix}1&0\\\\1&0\\end{pmatrix}$","jcmp_4":"Ch.08 方向微分と $J$ の 1行は?\n\n① 無関係\n② その出力をスカラーとみなすとその勾配(行)\n③ 常に0\n④ ヘッシアン","jcmp_5":"$$f:\\mathbb{R}^2\\to\\mathbb{R}^2$, $g:\\mathbb{R}^2\\to\\mathbb{R}^2$ のとき $J_{g\\circ f}$ のサイズは?\n\n① $1\\times 2$\n② $2\\times 2$\n③ $4\\times 4$\n④ $1\\times 1$","jchain_0":"$$f(x)=3x$ の $J$ (1×1) は?\n\n① $1$\n② $3$\n③ $0$\n④ $9$","jchain_1":"$$f(x)=x$, $g(u)=2u$ のとき $J_{g\\circ f}$ (1×1) は?\n\n① $3$\n② $2$ ($J_g=2$, $J_f=1$)\n③ $1$\n④ $0$","jchain_2":"合成 $h=g\\circ f$ のヤコビアンは?\n\n① $J_f+J_g$\n② $J_g\\,J_f$ (行列積)\n③ $J_f-J_g$\n④ 常に単位行列","jchain_3":"線形 $\\mathbf{f}(\\mathbf{x})=A\\mathbf{x}$, $\\mathbf{g}(\\mathbf{u})=B\\mathbf{u}$. $J_{g\\circ f}$ は?\n\n① $A+B$\n② $BA$\n③ $AB$\n④ $A^{-1}$","jchain_4":"2層 $\\mathbf{z}=W_1\\mathbf{x}$, $\\mathbf{y}=W_2\\mathbf{z}$. $\\partial\\mathbf{y}/\\partial\\mathbf{x}$ は?\n\n① $W_1+W_2$\n② $W_2 W_1$\n③ $W_1 W_2$\n④ $W_2^\\mathsf{T}$","jchain_5":"逆伝播では各層のヤコビアンを ___ する。\n\n① 足し算のみ\n② 連鎖(積)\n③ 割り算\n④ 無視","jloss_0":"層 $\\mathbf{z}=W\\mathbf{x}+\\mathbf{b}$ の $J$ は?\n\n① $\\mathbf{b}$\n② $W$\n③ $W\\mathbf{x}$\n④ $W^\\mathsf{T}W$","jloss_1":"スカラー $L=f(\\mathbf{x})$, $\\mathbf{x}\\in\\mathbb{R}^n$. $J_L$ のサイズは?\n\n① $n\\times n$\n② $1\\times n$\n③ $1\\times 1$ のみ\n④ $n\\times 1$ のみ","jloss_2":"線形 $\\mathbf{f}(\\mathbf{x})=A\\mathbf{x}$ の $J$ は?\n\n① 点ごとに変わる\n② どこでも $A$\n③ 常に $I$\n④ $\\mathbf{0}$","jloss_3":"$$f:\\mathbb{R}^2\\to\\mathbb{R}$ (出力1つ) の $J$ サイズは?\n\n① $2\\times 2$\n② $1\\times 2$\n③ $2\\times 1$ のみ\n④ $1\\times 1$","jloss_4":"$$\\Delta\\mathbf{y}\\approx J\\,\\Delta\\mathbf{x}$ における $J$ の役割は?\n\n① 出力を固定\n② 入力変化→出力変化の表\n③ ヘッシアン\n④ 学習率","jloss_5":"ニューラルネットで複数層の $J$ を掛けると?\n\n① 1層だけ残る\n② 入力→最終出力の変化率\n③ 常に $I$\n④ det のみ","jscn_0":"ロボット関節を少し動かしたとき手の位置変化は?\n\n① ランダム\n② $J\\,\\Delta\\boldsymbol{\\theta}$ で近似\n③ ヘッシアンのみ\n④ 定数","jscn_1":"入力 $\\mathbf{x}$ を少し変えたとき出力の変化は?\n\n① 常に0\n② $J\\,\\Delta\\mathbf{x}$ で近似\n③ det のみ\n④ 2次微分のみ","jscn_2":"Ch.08 勾配 vs ベクトル $\\mathbf{f}$ の $J$?\n\n① $f$ に微分なし\n② Ch.08は 1出力; $J$は出力ごとに1行\n③ 完全に同じ\n④ $J$ が2次","jscn_3":"小さな正方形が $J$ で変換されると通常?\n\n① 円\n② 平行四辺形\n③ 点\n④ 直線","jscn_4":"層 $\\mathbf{z}=W\\mathbf{x}$ の $J$ は?\n\n① $\\mathbf{x}$\n② $W$\n③ $W\\mathbf{x}$\n④ det $W$","jscn_5":"線形 $\\mathbf{f}(\\mathbf{x})=A\\mathbf{x}$ の $J$ は?\n\n① $A^{-1}$\n② $A$\n③ $A^\\mathsf{T}A$\n④ 零行列"},"problemAnswers":{"jdef_0":2,"jdef_1":2,"jdef_2":3,"jdef_3":2,"jdef_4":2,"jdef_5":2,"jtf_0":1,"jtf_1":2,"jtf_2":1,"jtf_3":1,"jtf_4":1,"jtf_5":1,"jcalc_0":2,"jcalc_1":2,"jcalc_2":2,"jcalc_3":2,"jcalc_4":2,"jcalc_5":2,"jprop_0":2,"jprop_1":2,"jprop_2":2,"jprop_3":2,"jprop_4":2,"jprop_5":2,"jcon_0":2,"jcon_1":2,"jcon_2":2,"jcon_3":2,"jcon_4":2,"jcon_5":2,"jgeo_0":2,"jgeo_1":2,"jgeo_2":2,"jgeo_3":2,"jgeo_4":2,"jgeo_5":2,"jcmp_0":2,"jcmp_1":2,"jcmp_2":2,"jcmp_3":2,"jcmp_4":2,"jcmp_5":2,"jchain_0":2,"jchain_1":2,"jchain_2":2,"jchain_3":2,"jchain_4":2,"jchain_5":2,"jloss_0":2,"jloss_1":2,"jloss_2":2,"jloss_3":2,"jloss_4":2,"jloss_5":2,"jscn_0":2,"jscn_1":2,"jscn_2":2,"jscn_3":2,"jscn_4":2,"jscn_5":2},"problemSolutions":{"jdef_0":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jdef_1":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jdef_2":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ③","jdef_3":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jdef_4":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jdef_5":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jtf_0":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ①","jtf_1":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jtf_2":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ①","jtf_3":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ①","jtf_4":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ①","jtf_5":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ①","jcalc_0":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcalc_1":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcalc_2":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcalc_3":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcalc_4":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcalc_5":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jprop_0":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jprop_1":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jprop_2":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jprop_3":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jprop_4":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jprop_5":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcon_0":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcon_1":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcon_2":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcon_3":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcon_4":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcon_5":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jgeo_0":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jgeo_1":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jgeo_2":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jgeo_3":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jgeo_4":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jgeo_5":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcmp_0":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcmp_1":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcmp_2":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcmp_3":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcmp_4":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jcmp_5":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jchain_0":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jchain_1":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jchain_2":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jchain_3":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jchain_4":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jchain_5":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jloss_0":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jloss_1":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jloss_2":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jloss_3":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jloss_4":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jloss_5":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jscn_0":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jscn_1":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jscn_2":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jscn_3":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jscn_4":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②","jscn_5":"**1)** ヤコビアンの定義に立ち返り、数値例で確認します。 **2)** 小さな数値例で確認します。 **3)** 正解 ②"},"problemTestCodes":{"jdef_0":"answer = 2\nassert answer == 2","jdef_1":"answer = 2\nassert answer == 2","jdef_2":"answer = 3\nassert answer == 3","jdef_3":"answer = 2\nassert answer == 2","jdef_4":"answer = 2\nassert answer == 2","jdef_5":"answer = 2\nassert answer == 2","jtf_0":"answer = 1\nassert answer == 1","jtf_1":"answer = 2\nassert answer == 2","jtf_2":"answer = 1\nassert answer == 1","jtf_3":"answer = 1\nassert answer == 1","jtf_4":"answer = 1\nassert answer == 1","jtf_5":"answer = 1\nassert answer == 1","jcalc_0":"answer = 2\nassert answer == 2","jcalc_1":"answer = 2\nassert answer == 2","jcalc_2":"answer = 2\nassert answer == 2","jcalc_3":"answer = 2\nassert answer == 2","jcalc_4":"answer = 2\nassert answer == 2","jcalc_5":"answer = 2\nassert answer == 2","jprop_0":"answer = 2\nassert answer == 2","jprop_1":"answer = 2\nassert answer == 2","jprop_2":"answer = 2\nassert answer == 2","jprop_3":"answer = 2\nassert answer == 2","jprop_4":"answer = 2\nassert answer == 2","jprop_5":"answer = 2\nassert answer == 2","jcon_0":"answer = 2\nassert answer == 2","jcon_1":"answer = 2\nassert answer == 2","jcon_2":"answer = 2\nassert answer == 2","jcon_3":"answer = 2\nassert answer == 2","jcon_4":"answer = 2\nassert answer == 2","jcon_5":"answer = 2\nassert answer == 2","jgeo_0":"answer = 2\nassert answer == 2","jgeo_1":"answer = 2\nassert answer == 2","jgeo_2":"answer = 2\nassert answer == 2","jgeo_3":"answer = 2\nassert answer == 2","jgeo_4":"answer = 2\nassert answer == 2","jgeo_5":"answer = 2\nassert answer == 2","jcmp_0":"answer = 2\nassert answer == 2","jcmp_1":"answer = 2\nassert answer == 2","jcmp_2":"answer = 2\nassert answer == 2","jcmp_3":"answer = 2\nassert answer == 2","jcmp_4":"answer = 2\nassert answer == 2","jcmp_5":"answer = 2\nassert answer == 2","jchain_0":"answer = 2\nassert answer == 2","jchain_1":"answer = 2\nassert answer == 2","jchain_2":"answer = 2\nassert answer == 2","jchain_3":"answer = 2\nassert answer == 2","jchain_4":"answer = 2\nassert answer == 2","jchain_5":"answer = 2\nassert answer == 2","jloss_0":"answer = 2\nassert answer == 2","jloss_1":"answer = 2\nassert answer == 2","jloss_2":"answer = 2\nassert answer == 2","jloss_3":"answer = 2\nassert answer == 2","jloss_4":"answer = 2\nassert answer == 2","jloss_5":"answer = 2\nassert answer == 2","jscn_0":"answer = 2\nassert answer == 2","jscn_1":"answer = 2\nassert answer == 2","jscn_2":"answer = 2\nassert answer == 2","jscn_3":"answer = 2\nassert answer == 2","jscn_4":"answer = 2\nassert answer == 2","jscn_5":"answer = 2\nassert answer == 2"}},"midMathCh10":{"chapter":"Chapter 10","title":"ヘッセ行列：曲面の曲がり具合を読む","description":"ヘッセ行列はスカラー関数の2階偏微分を並べた正方行列で、ある点での曲面の曲率を表します。最適化で極小・極大・鞍点の判定や、ニュートン法・信頼領域法の基礎になります。","sectionTitle":"ヘッセ行列：曲面の曲がり具合を読む","sectionLabels":{"whatIs":"どんな概念か","whyImportant":"なぜ重要か","howUsed":"どう使うか","problemSolving":"問題の解き方"},"whatIs":{"intro":"**ヘッセ行列とは？** — 今立っている点で、あらゆる方向に曲面がどれだけ曲がっているかを数で表した表と考えてよいです。関数を2回微分した値を並べた正方行列で、対角線を挟んで左右が同じ**対称行列**になります。","plain":"目を閉じて山を下ることを想像してください。足で感じる「こっちがより下り」が1階微分（勾配）です。逆に「一歩踏み出したら谷に沈むか、平らか」を事前に知る感覚が2階微分、つまりヘッセです。これがあれば崖を避け、お椀の底のような本当の最小点を見つけられます。","definition":"もう少し正確に言うと、関数 $f$ を $x_i$ と $x_j$ の方向に2回微分した値 $\\frac{\\partial^2 f}{\\partial x_i \\partial x_j}$ を表に並べたものがヘッセ $\\mathbf{H}$ です。この表から出る **固有値** が重要で、すべて正ならその点はお椀の底のような **極小点**、すべて負なら山の頂上のような **極大点**、正負が混ざれば一方は登り他方は下りの **鞍点** になります。","inAI":"機械学習では「誤差が最も小さい谷」を探す作業です。勾配だけ見て少しずつ下る方法は遠回りで遅いです。ヘッセで曲率が分かれば、谷へ大きくジャンプする **ニュートン法** が使え、ずっと速く学習できます。"},"whyImportant":{"fakeBottom":"下っていくと勾配が0の平らな場所にぶつかることがあります。だからといってそこが本当の谷底とは限りません。一瞬平らで、一方は登り一方は下りの鞍点かもしれません。このときヘッセの固有値を見れば、本当の最小点か鞍点か判別できます。変数が多い機械学習では、こうした「偽の谷底」に陥らないことがとても重要です。","smartStep":"狭い道では歩幅を小さく、広い野原では大きくするのが安全で速いです。ヘッセは「どの方向がどれだけ急か」を教えてくれるので、学習時の歩幅（学習率）をうまく合わせ、無駄な歩みなく効率的に下れます。"},"howUsed":{"newton":"ニュートン法は次の式で一気に大きく動く方法です：$\\mathbf{x}_{k+1} = \\mathbf{x}_k - \\mathbf{H}^{-1} \\nabla f(\\mathbf{x}_k)$。ここで $\\mathbf{x}_k$ は今の位置、$\\nabla f(\\mathbf{x}_k)$ はその点での勾配、$\\mathbf{H}$ はその点でのヘッセ行列、$\\mathbf{H}^{-1}$ はその逆行列です。つまり「今の勾配と曲率（ヘッセ）の両方を見て、谷へ大きくジャンプして $\\mathbf{x}_{k+1}$ へ行く」という意味です。少しずつ下るよりずっと速く答えの近くに届けます。","quasiNewton":"ただし変数が増えるとヘッセを正確に求めるコストが大きくなります。実務ではヘッセを完全には計算せず、これまでの勾配の情報だけで「だいたいこんな形だろう」と推定して使う **準ニュートン法**（BFGSなど）がよく使われます。"},"summary":"ヘッセ行列はスカラー関数の2階偏微分からなる対称行列で、ある点での曲率と極値の性質を担っています。勾配が0の点で固有値がすべて正なら極小、すべて負なら極大、正負が混ざれば鞍点と判定されます。機械学習では損失の最小点探索・検証や、ニュートン法・信頼領域・準ニュートン法といった2階最適化の基礎になります。","problemSolving":{"focus":"下表には問題を解くのに必要な **公式と記号の意味** だけをまとめました。表の下の **解き方の例** で実際の解き方を参照してください。","examplesHeading":"解き方の例","examplesTable":"$23"},"problemSolvingLabel":"問題の解き方","problemSolvingTable":"$24","problemSolvingExample1":"**例（成分数）**\n\n$f(x_1,x_2)$ のヘッセは $2\\times2$ なので成分は4個。対称なので独立な成分は3個。→ **答え 4**（総数）または **3**（独立、文脈による）","problemSolvingExample2":"**例（極値判定）**\n\nある点でヘッセの固有値が 2 と 5（ともに正）ならその点は極小点。→ **答え 1**（極小）または問題で指定された数","problemSolvingExample3":"**例（ニュートン法）**\n\n$f(x)=x^2$ のとき $f'(x)=2x$、$f''(x)=2$。$x_0=4$ でのステップ：$x_1 = x_0 - f'(x_0)/f''(x_0) = 4 - 8/2 = 0$。→ **答え 0**","visualShort":"ヘッセ：2階偏微分→曲率・極値","visualIntroShort":"1階微分は「今どちらが下りか」、2階のヘッセは「これから窪むか、一方は登り一方は下り（鞍点）か」を表します。下のアニメで流れを追ってください。","visualWhyHessian":"ヘッセは **2階微分** の行列なので、下の図の「曲がり具合」がヘッセの表す内容です。","visualIntro":"ヘッセ行列は関数 $f$ と点 $\\mathbf{x}$ における2階偏微分を並べた行列で、その点の曲率と極小・極大・鞍点の判定に使います。","visualConceptTitle":"概念の構造","visualConceptStep0":"入力：スカラー関数 $f(\\mathbf{x})$、点 $\\mathbf{x}$","visualConceptStep1":"2階偏微分 $\\frac{\\partial^2 f}{\\partial x_i \\partial x_j}$ を計算","visualConceptStep2":"ヘッセ行列 $\\mathbf{H}$（対称）を構成","visualConceptStep3":"固有値→極小（すべて正）、極大（すべて負）、鞍（混在）","visualFlowTitle":"学習の流れ","visualFlowStep0":"概念：2階偏微分行列","visualFlowStep1":"直感：曲面の曲率","visualFlowStep2":"数学：$H_{ij}$、対称性、固有値","visualFlowStep3":"応用：ニュートン法、極値、信頼領域","visualCaption":"左：お椀型（下にだけ曲がる）→極小。伏せたお椀（上にだけ曲がる）→極大。鞍点：一方向は上がり他方は下がる→極小でも極大でもない。","visualStep1":"入力：スカラー関数 $f(\\mathbf{x})$、点 $\\mathbf{x}$","visualStep2":"2階偏微分 $\\frac{\\partial^2 f}{\\partial x_i \\partial x_j}$ を計算","visualStep3":"ヘッセ行列 $\\mathbf{H}$（対称）を構成","visualStepsLabel":"見る順序","visualBowlTitle":"お椀：下にだけ曲がる→極小点","visualSaddleTitle":"鞍点：こっちは値↑上がり、あっちは値↓下がる","visualCurveDown":"↓ 曲がり","visualFppMin":"f″=2>0→極小","visualMinPoint":"極小点","visualValueUp":"値↑","visualValueDown":"値↓","visualSaddleOrangeGreen":"オレンジ方向は値が上がる・緑方向は値が下がる","visualSaddleNeither":"鞍点：極小でも極大でもない","visualSummary1":"お椀は下にだけ曲がる→ここが極小","visualSummary2":"伏せたお椀は上にだけ曲がる→ここが極大","visualSummary3":"鞍点は一方向は上がり他方は下がる→極小・極大ではない","problemPromptIntro":"問題を読み、ヘッセ行列/極値に関する値を入力してください。","promptDefinition":"次の説明が**正しい**ときは**1**、**誤り**のときは**0**を選んでください。","promptDefinitionChoice":"下の（ア）（イ）（ウ）のうち正しいものを選んでください。","promptElementCount":"入力が{n}変数のスカラー関数$f$について、ヘッセ行列の成分の総数は？","promptIndependentCount":"$$n={n}$変数の対称ヘッセ行列の独立な成分の個数は？","promptMatrixSize":"$$n={n}$変数関数のヘッセ行列の行数（または列数）は？","promptEigenvalueType":"ヘッセの固有値が$\\lambda_1={ev1}$、$\\lambda_2={ev2}$のとき、停留点の種類は？","promptNewton1D":"$$f(x)={a}x^2{bVal}x+{c}$で$x_0={x0}$のとき、ニュートン法1ステップ後の$x_1$は？","promptScalarSecondDeriv":"$$f(x)={a}x^2+bx+c$の2階導関数$f''(x)$の値は？","promptDefault":"下の選択肢から正解を選んでください。","mcDefChoice1":"（ア）","mcDefChoice2":"（イ）","mcDefChoice3":"（ウ）","mcDefChoice4":"（エ）(ア)〜(ウ)のどれも正しくない","mcEigenChoice1":"極小","mcEigenChoice2":"極大","mcEigenChoice3":"鞍点","mcEigenChoice4":"上の三つに当てはまらない","definitionStatements":{"0":"$$C^2$級のスカラー関数のヘッセ行列は対称行列である。","1":"停留点でヘッセの固有値がすべて正なら、その点は極小である。","2":"停留点でヘッセの固有値がすべて負なら、その点は極大である。","3":"ヘッセの$(i,j)$成分は$\\partial^2 f/\\partial x_i\\partial x_j$で定義される。","4":"$$f$が$C^2$なら$\\partial^2 f/\\partial x_i\\partial x_j = \\partial^2 f/\\partial x_j\\partial x_i$である。","5":"$$n$変数スカラー関数のヘッセは$n\\times n$の正方行列である。","6":"ヘッセが正定値なら、固有値はすべて正である。","7":"ヘッセが負定値なら、固有値はすべて負である。","10":"ヘッセの固有値が互いに異なれば、停留点は必ず鞍点である。","11":"すべてのスカラー関数のヘッセは単位行列である。","12":"1変数関数$f(x)$のヘッセは常に$2\\times 2$行列である。","13":"固有値のいずれかが0なら、停留点は必ず極小である。","14":"ヘッセが零行列なら、停留点は必ず極値である。"},"definitionChoiceQuestions":{"0":"(ア) 2変数関数のヘッセの成分の総数は$4$である。\n(イ) $9$である。\n(ウ) $6$である。","1":"(ア) 3変数対称ヘッセの独立成分の個数は$9$である。\n(イ) $6$である。\n(ウ) $3$である。","2":"(ア) 極小\n(イ) 極大\n(ウ) 鞍点\n\n（参考）固有値は$\\lambda_1=2$，$\\lambda_2=-1$。","3":"(ア) 極小\n(イ) 極大\n(ウ) 鞍点\n\n（参考）固有値は$\\lambda_1=3$，$\\lambda_2=5$。","4":"(ア) 極小\n(イ) 極大\n(ウ) 鞍点\n\n（参考）固有値は$\\lambda_1=-2$，$\\lambda_2=-4$。","5":"(ア) $f''(x)=2$\n(イ) $f''(x)=0$\n(ウ) $f''(x)=1$\n\n（参考）$f(x)=x^2+1$。","6":"(ア) 行（列）の個数$4$\n(イ) $3$\n(ウ) $2$\n\n（参考）ヘッセが$2\\times 2$のとき。","7":"(ア) $9$\n(イ) $3$\n(ウ) $6$\n\n（参考）変数が$3$個のときのヘッセの行数は？"}},"midMathCh11":{"chapter":"Chapter 11","title":"テイラー級数：複雑な関数を多項式で追いかける","description":"テイラー級数は、複雑な関数を「今立っている点」の近くで多項式に置き換える方法です。1次近似は接線のように直線で追い、2次・3次に上げるほど曲線にぴったり沿います。AIでは損失関数や活性化関数を単純な式で近似するとき、ニュートン法や2次最適化を理解するときにこの概念が核心になります。","sectionTitle":"テイラー級数：複雑な関数を多項式で追いかける","sectionLabels":{"whatIs":"どんな概念か","whyImportant":"なぜ重要か","howUsed":"どう使うか","problemSolving":"問題解説"},"visualShort":"テイラー：点の近くで多項式近似","visualIntroShort":"複雑な曲線も、1点の近くを拡大すれば直線（1次）や放物線（2次）のように見えます。下のアニメーションで次数を上げるほど原関数に沿う様子を追ってみましょう。","visualWhyTaylor":"テイラー級数は、この点での関数の動きを微分値に込め、近くの区間だけ多項式で代わりに描く道具です。","visualIntro":"中心 $a$ で $f(a), f'(a), f''(a), \\ldots$ を集め $T_n(x)=\\sum_{k=0}^{n}\\frac{f^{(k)}(a)}{k!}(x-a)^k$ を作ります。$a=0$ のときマクローリン級数と呼びます。","visualCaption":"紫が原関数、オレンジ・緑・青が1・2・3次テイラー近似です。中心から離れるほど誤差が大きくなります。","visualStep1":"中心 $a$ での関数値・微分値を読む","visualStep2":"1次（接線）→2次（放物線）→3次多項式を重ねる","visualStep3":"近似曲線が原関数に沿うか確認","visualStepsLabel":"見る順序","whatIs":{"intro":"**テイラー級数とは？** 難しい関数 $f(x)$ を、1点 $a$ の近くだけ使える**多項式**に置き換える公式です。値・傾き・曲率を組み合わせ、近くの $x$ では元の関数とほぼ同じ値になります。","plain":"地図を拡大すると曲がった道も直線に見えます。テイラー級数も同じ原理で、**点 $a$ の近くを拡大**すると複雑な関数は $1 + x + x^2/2 + \\cdots$ のような単純な多項式のように振る舞います。","definition":"正式には $T_n(x)=f(a)+f'(a)(x-a)+\\frac{f''(a)}{2!}(x-a)^2+\\cdots+\\frac{f^{(n)}(a)}{n!}(x-a)^n$ です。$f^{(k)}(a)$ は $a$ での $k$ 階微分、$k!$ は階乗です。**マクローリン級数**は $a=0$ の特別な場合です。","inAI":"機械学習では**損失関数**をパラメータ近傍で2次多項式に近似するとニュートン法・ヘシアン（Ch.10）につながります。**活性化関数**も小さな区間では線形・2次近似で読め、学習率や近似誤差の理解に役立ちます。"},"whyImportant":{"localView":"微分だけでは今の傾きは分かっても曲線全体は分かりにくい。テイラー級数は**同じ点の高次微分**まで使い、近傍の形を1つの多項式にまとめます。","bridgeToNewton":"Ch.10のヘシアンは2次項 $\\frac{f''(a)}{2}(x-a)^2$ を行列に一般化したものです。2次テイラーが分かると、2階微分が曲率・ニュートンステップに使われる理由が自然につながります。"},"howUsed":{"gradientDescent":"**1. 勾配降下ではどう使う？（1次近似）**\n\n勾配降下は「今いる点で損失を最も減らす方向」へ少しずつ進む方法です。このとき内部の考え方は1次テイラー近似と同じです。つまり、現在点の近くでは損失を接線（直線）で近似して次の一歩を決めます。\n\n実務的な流れは次の通りです。\n- 現在のパラメータで損失と勾配を計算する\n- 1次近似の視点で減少方向を決める\n- 学習率を掛けて1ステップ移動する\n\nこの見方の利点は、更新式を暗記ではなく「1次近似に基づく意思決定」として理解できることです。学習率が大きすぎると振動し、小さすぎると遅い理由も説明しやすくなります。","newtonAndHessian":"**2. ニュートン法・ヘシアンではどう使う？（2次近似）**\n\nニュートン法は1次情報（傾き）だけでなく、2次情報（曲率）も使います。2次テイラー近似で損失地形を放物面として見て、その形に合わせて効率の良い移動量を決めます。\n\n簡単に比べると、\n- 1次近似（勾配降下）：方向を決めるのが得意\n- 2次近似（ニュートン法）：方向と移動量をより賢く決める\n\nヘシアンは曲率をまとめた中核の道具です。方向ごとの急さ・緩さが分かるため、方向別に移動量を調整できます。条件が合えば、ニュートン系はかなり速く収束します。","numericalAndDL":"**3. 数値計算・深層学習の実装ではどう使う？**\n\n実務では、複雑な関数を毎回厳密計算するより、必要な区間で近似して計算量を下げる方が有効です。テイラー級数はその代表です。\n\nよくある使い方は次の通りです。\n- $e^x$, $\\sin x$, $\\log(1+x)$ などを小区間で多項式近似して高速化\n- 活性化関数や損失関数を動作区間で単純化して解析\n- 現在点まわりの地形近似を使って安定な最適化ステップを設計\n\n深層学習では、全域を厳密に解析するより「今のパラメータ近傍」をうまく読む方が重要な場面が多いです。テイラー視点は計算を軽くし、なぜその更新になるかの解釈性も上げます。つまり授業用の理論だけでなく、実運用で使う判断軸です。"},"summary":"テイラー級数は、特定の点の近くで複雑な関数を多項式で近似する道具です。1次は勾配、2次はヘシアン・ニュートンと結びつき、次数を上げるほど精度が上がります。Ch.08勾配、Ch.10ヘシアンとともに最適化理解の柱をなします。","problemSolving":{"focus":"下の表は問題解決に必要な**公式と記号**だけをまとめました。表の下の**例題**で手順を確認してください。","examplesHeading":"例題","examplesTable":"$25"},"problemSolvingLabel":"問題解説","problemSolvingTable":"| 公式 | 記号の意味 |\n| :--- | :--- |\n| $T_n(x)=\\sum_{k=0}^{n}\\frac{f^{(k)}(a)}{k!}(x-a)^k$ | $n$次テイラー多項式。$f^{(k)}(a)$ = $k$階微分。 |\n| $T_1(x)=f(a)+f'(a)(x-a)$ | **1次（線形）近似** = 接線。MLの勾配1ステップ。 |\n| $T_2(x)=f(a)+f'(a)(x-a)+\\frac{f''(a)}{2}(x-a)^2$ | **2次近似**。ニュートン・ヘシアン。 |\n| $a=0$（マクローリン） | 中心が原点。 |\n| $n$次の項の数 | **$n+1$** 個。 |\n| $x^n$ の係数 | 低次多項式のマクローリンで判定。 |\n| 剰余項 | おおよそ $(x-a)^{n+1}$ 次。 |\n| ML | 1次→SGD、2次→ニュートン・ヘシアン。 |","problemSolvingExample1":"**例（1次）** $T_1(2)=7$ → **7**","problemSolvingExample2":"**例（2次）** $T_2(2)=4$ → **4**","problemSolvingExample3":"**例（項数）** 3次→4項 → **4**","visualConceptTitle":"概念構造","visualConceptStep0":"入力：関数 $f$、中心 $a$","visualConceptStep1":"微分値 $f^{(k)}(a)$ を集める","visualConceptStep2":"多項式 $T_n(x)$ を組み立てる","visualConceptStep3":"$$|x-a|$ が小さいほど一致","visualFlowTitle":"学習の流れ","visualFlowStep0":"概念：近傍多項式近似","visualFlowStep1":"直感：拡大地図・接線・放物線","visualFlowStep2":"数学：テイラー・マクローリン・次数","visualFlowStep3":"応用：勾配・ニュートン・数値計算","visualOriginalTitle":"原関数（概念用）","visualOrder1Title":"1次：接線で追う","visualOrder2Title":"2次：放物線のように曲げる","visualOrder3Title":"3次：より遠くまで一致","visualCenterLabel":"中心 $a$","visualErrorGrow":"離れるほど誤差↑","visualMatchGood":"近くではよく一致","visualSummary1":"1次 = 接線 = 勾配方向","visualSummary2":"2次 = 曲率 = ヘシアン・ニュートン","visualSummary3":"次数↑ → より正確、式は複雑","problemPromptIntro":"問題を読み、テイラー級数に関する値を入力してください。","promptDefinition":"説明が**真**なら **1**、**偽**なら **0** を選んでください。","promptDefinitionChoice":"（ア）（イ）（ウ）のうち正しいものを選んでください。","promptLinearApprox":"$$f(x)={b}x+{c}$、中心 $a={center}$ のとき、1次テイラー $T_1({x})$ は？","promptQuadraticApprox":"$$f(x)={a}x^2{bVal}x+{c}$、中心 $a={center}$ のとき、2次テイラー $T_2({x})$ は？","promptMaclaurinCoeff":"$$f(x)={coef}x^{power}$ のマクローリン級数で $x^{askPower}$ の係数は？","promptDerivativeAtCenter":"$$f(x)=x^{power}$ の $x=0$ における ${order}$ 階微分 $f^{({order})}(0)$ は？","promptTermCount":"$${order}$ 次テイラー多項式 $T_{order}(x)$ の項の数は？","promptRemainderOrder":"$$n={order}$ 次テイラー近似後、剰余項の代表的な次数は？","promptMlConcept":"テイラー級数と機械学習 — （ア）（イ）（ウ）のうち正しいものを選んでください。","promptDefault":"正しい答えを選んでください。","mcDefChoice1":"(ア)","mcDefChoice2":"(イ)","mcDefChoice3":"(ウ)","mcDefChoice4":"(エ) (ア)～(ウ)のいずれも正しくない","mcRemainderChoice1":"$$(x-a)^{n}$","mcRemainderChoice2":"$$(x-a)^{n+1}$","mcRemainderChoice3":"$$(x-a)^{n+2}$","mcRemainderChoice4":"上記のいずれでもない","definitionStatements":{"0":"テイラー多項式は中心 $a$ で原関数と同じ値 $f(a)$ を持つ。","1":"1次テイラー多項式は $a$ での接線と一致する。","2":"マクローリン級数は $a=0$ のテイラー級数である。","3":"$$n$ 次テイラー多項式は最大 $n+1$ 項を持つ。","4":"テイラー級数で $(x-a)^k$ の係数は $\\frac{f^{(k)}(a)}{k!}$ である。","5":"次数 $n$ を上げると $a$ 近傍での精度は一般に良くなる。","10":"テイラー多項式は常に全実数軸で原関数と完全に一致する。","11":"1次近似は常に2次近似より正確である。","12":"マクローリン級数は $a=1$ でのみ定義される。","13":"テイラー級数は非微分可能な関数にも常に適用できる。","14":"$$f^{(k)}(a)$ は $a$ での $k$ 回積分値である。"},"definitionChoiceQuestions":{"0":"(ア) $T_1(x)=f(a)+f'(a)(x-a)$。\n(イ) $T_1(x)=f(a)+\\frac{f''(a)}{2}(x-a)^2$。\n(ウ) $T_1(x)$ は常に $f(x)$ と等しい。","1":"(ア) マクローリン級数は $a=0$ のテイラー級数。\n(イ) $a=1$ でのみ定義。\n(ウ) 1次近似のみを意味する。","2":"(ア) 3次テイラーは4項。\n(イ) 3項のみ。\n(ウ) 項数は次数と無関係。","3":"(ア) 1次テイラーは勾配降下と結びつく。\n(イ) ヘシアンの固有値と直接等しい。\n(ウ) MLと無関係。","4":"(ア) $f(x)=x^2$ の2次マクローリンは $x^2$。\n(イ) 1次マクローリンが $x^2$ 全体。\n(ウ) テイラー近似不可能。","5":"(ア) $n$ 次後の剰余はおおよそ $(x-a)^{n+1}$ 次。\n(イ) 剰余は常に0。\n(ウ) $(x-a)^n$ と等しい。","6":"(ア) 2次テイラーはニュートン法と結びつく。\n(イ) 順伝播のみ。\n(ウ) 内積と等しい。","7":"(ア) $f(x)=5x^2$ で $x^2$ 係数は5。\n(イ) 10。\n(ウ) 0。"},"mlConceptQuestions":{"0":"(ア) 1次テイラーは勾配1ステップと同じ発想。\n(イ) 常にヘシアン逆行列。\n(ウ) バッチ正規化を定義。","1":"(ア) 2次テイラーは損失の曲率（ヘシアン）を含む。\n(イ) データ拡張のみ。\n(ウ) 常に線形回帰。","2":"(ア) 活性化関数を小区間で単純化できる。\n(イ) GPUメモリのみ削減。\n(ウ) 逆伝播を置き換える。","3":"(ア) 次数を上げると近傍精度が上がることが多い。\n(イ) 常に全局的に完璧。\n(ウ) 次数と精度は無関係。","4":"(ア) Ch.10ニュートン法は2次テイラーと結びつく。\n(イ) 無関係。\n(ウ) 0次近似のみ。"}},"advMathChapters":{"advMath00":{"chapter":"Chapter 00","title":"上級数学とAI：生成理論と複雑系モデリングの骨格","description":"AIのための上級数学：多変量解析、複雑な確率分布、深層学習。生成モデル・強化学習のカリキュラム紹介。"},"advMath01":{"chapter":"Chapter 01","title":"特異値分解（SVD）と擬似逆行列：データの潜在パターン抽出","description":"SVD・擬似逆行列で潜在パターン抽出。PCA・推薦システムの基礎。上級数学 Ch.01。"},"advMath02":{"chapter":"Chapter 02","title":"テンソル代数とアインシュタイン記法","description":"テンソル代数、Einsum、縮約。ニューラルネット・アテンションの記法。上級数学 Ch.02。"},"advMath03":{"chapter":"Chapter 03","title":"ラグランジュ未定乗数とKKT条件：制約付き最適化","description":"ラグランジュ・KKTによる制約付き最適化。SVM・制約付き強化学習の数学的基礎。上級数学 Ch.03。"},"advMath04":{"chapter":"Chapter 04","title":"マルコフ連鎖：状態遷移と確率過程","description":"マルコフ連鎖、遷移行列、定常分布・収束性。MCMC・強化学習の基礎。上級数学 Ch.04。"},"advMath05":{"chapter":"Chapter 05","title":"モンテカルロ積分：数値的近似法","description":"モンテカルロ積分で高次元の期待値・確率を近似。強化学習・ベイズ推論に活用。上級数学 Ch.05。"},"advMath06":{"chapter":"Chapter 06","title":"MCMC：複雑な確率分布からのサンプリング","description":"MCMC、ギブス・メトロポリス-ヘイスティングス。複雑な事後分布からのサンプリング。上級数学 Ch.06。"},"advMath07":{"chapter":"Chapter 07","title":"EMアルゴリズム：潜在変数を含む推論","description":"EMアルゴリズム：Eステップ・Mステップ、潜在変数モデルの最尤推定。GMM・HMMの基礎。上級数学 Ch.07。"},"advMath08":{"chapter":"Chapter 08","title":"MAP推定：ベイズ最適化と正則化","description":"MAP推定、事前確率・L1・L2正則化の数学的根拠。ベイズ深層学習の基礎。上級数学 Ch.08。"},"advMath09":{"chapter":"Chapter 09","title":"共役事前分布：解析的ベイズ推論","description":"共役事前分布で事後分布を解析的に計算。ベイズの定理・ベータ・ディリクレ分布。上級数学 Ch.09。"},"advMath10":{"chapter":"Chapter 10","title":"JSダイバージェンスと相互情報量","description":"JSダイバージェンス・相互情報量。分布の距離・情報共有の定量化。GAN・情報理論。上級数学 Ch.10。"},"advMath11":{"chapter":"Chapter 11","title":"変分推論：扱いにくい確率の近似","description":"変分推論、KL最小化・近似事後。VAE・生成モデルの核心。上級数学 Ch.11。"},"advMath12":{"chapter":"Chapter 12","title":"再パラメータ化トリック：ランダム性の微分","description":"サンプリング演算を微分可能にする再パラメータ化トリック。VAE学習・勾配推定。上級数学 Ch.12。"},"advMath13":{"chapter":"Chapter 13","title":"最適輸送とワッサーシュタイン距離","description":"ワッサーシュタイン距離・Earth Mover。分布が重ならなくても有限距離・WGAN。上級数学 Ch.13。"},"advMath14":{"chapter":"Chapter 14","title":"MDPとベルマン方程式：強化学習の数学的骨格","description":"MDP・ベルマン方程式。状態・行動・報酬・価値関数。強化学習の数学的基礎。上級数学 Ch.14。"},"advMath15":{"chapter":"Chapter 15","title":"フーリエ変換とスペクトル解析","description":"フーリエ変換・周波数領域解析。時系列・画像信号処理、CNN・アテンション。上級数学 Ch.15。"},"advMath16":{"chapter":"Chapter 16","title":"グラフラプラシアン：ネットワーク構造の数学化","description":"グラフラプラシアン・隣接・次数行列。GNN・情報拡散・スムースネス。上級数学 Ch.16。"},"advMath17":{"chapter":"Chapter 17","title":"確率微分方程式（SDE）入門：ノイズの連続的注入","description":"SDE・ブラウン運動。拡散モデルの前向き過程・ノイズスケジュールの定式化。上級数学 Ch.17。"},"advMath18":{"chapter":"Chapter 18","title":"ランジュバン力学とスコアマッチング","description":"ランジュバン力学・スコアマッチング。拡散モデルの逆過程・データ復元。上級数学 Ch.18。"},"advMath19":{"chapter":"Chapter 19","title":"情報幾何と自然勾配","description":"情報幾何・フィッシャー情報行列・自然勾配。リーマン多様体上の最適化。上級数学 Ch.19。"},"advMath20":{"chapter":"Chapter 20","title":"上級数学総まとめ：生成モデルと深い最適化の結合","description":"VAE・GAN・Diffusion・LLMにおいてSDE・変分推論・最適輸送・情報幾何がどう使われるかの総まとめ。上級数学 Ch.20。"}},"midDlChapters":{"midDl00":{"chapter":"Chapter 00","title":"中級ディープラーニング：安定学習と非構造データの理解"},"midDl01":{"chapter":"Chapter 01","title":"重み初期化（Weight Initialization）：学習の正しい出発点"},"midDl02":{"chapter":"Chapter 02","title":"最適化アルゴリズム：慣性と適応的学習率"},"midDl03":{"chapter":"Chapter 03","title":"学習率スケジューリング：時に応じて速度を落とす"},"midDl04":{"chapter":"Chapter 04","title":"損失関数深化：クラス不均衡と距離学習"},"midDl05":{"chapter":"Chapter 05","title":"過学習防止と正則化"},"midDl06":{"chapter":"Chapter 06","title":"正規化層（Batch & Layer Normalization）"},"midDl07":{"chapter":"Chapter 07","title":"データ拡張とノイズロバスト性"},"midDl08":{"chapter":"Chapter 08","title":"畳み込みニューラルネット（CNN）基礎：空間的特徴抽出"},"midDl09":{"chapter":"Chapter 09","title":"プーリングとマルチチャネル"},"midDl10":{"chapter":"Chapter 10","title":"残差接続（Skip Connection）とResNet"},"midDl11":{"chapter":"Chapter 11","title":"軽量畳み込み：演算効率化アーキテクチャ"},"midDl12":{"chapter":"Chapter 12","title":"ビジョン転移学習"},"midDl13":{"chapter":"Chapter 13","title":"ビジョンタスク1：物体検出（Object Detection）"},"midDl14":{"chapter":"Chapter 14","title":"ビジョンタスク2：画像分割（Image Segmentation）"},"midDl15":{"chapter":"Chapter 15","title":"自然言語処理前処理とトークン化"},"midDl16":{"chapter":"Chapter 16","title":"単語埋め込み（Word Embedding）"},"midDl17":{"chapter":"Chapter 17","title":"1D畳み込みによるシーケンス処理"},"midDl18":{"chapter":"Chapter 18","title":"再帰型ニューラルネット（RNN）：逐次情報の状態維持"},"midDl19":{"chapter":"Chapter 19","title":"長短期記憶（LSTM）とGRU：長期依存の制御"},"midDl20":{"chapter":"Chapter 20","title":"エンコーダ-デコーダとアテンション"},"midDl21":{"chapter":"Chapter 21","title":"中級ディープラーニング総まとめ：アーキテクチャ設計とパイプライン"}},"midDlCh00":{"description":"中級ディープラーニングで何を学ぶか、Ch01〜Ch21で扱う学習の安定化と画像・テキストの扱いを一覧で把握します。","roadmapTitle":"チャプター別中級ディープラーニング図","roadmapDescription":"チャプターを進めるたびに、下の図が少しずつ埋まります。ここまでの構造です。","roadmapListHeading":"Ch01～Ch21で学ぶこと","sectionTitle":"中級ディープラーニングとは？","paragraphs":{"0":"**基礎ディープラーニング**ではニューロン、層、勾配まで学びました。**中級**では**学習を安定させる方法**と**画像・テキスト**のような構造化データの扱いを学びます。**重みの初期化**、**オプティマイザ**（モーメンタム、Adam）、**学習率スケジューリング**、**正則化・過学習防止**、**バッチ正規化**などで学習がうまく収束するようにし、**畳み込みネット（CNN）**、**ResNet**、**転移学習**、**物体検出・セグメンテーション**、**自然言語の前処理・埋め込み**、**RNN・LSTM・GRU**、**エンコーダ・デコーダとアテンション**まで扱います。","1":"**画像**はピクセル格子なので**畳み込み**で空間パターンを捉え、**プーリング**で要約し、**残差接続**で深いネットも安定して学習します。**テキスト**は系列なので**トークン化・埋め込み**の後、**1D畳み込み**や**RNN・LSTM**で文脈を反映し、**アテンション**で重要な部分に注目する構造を学びます。","2":"**学習が安定している必要がある理由**は、初期化が悪いと学習が進まなかったり、学習率が大きすぎると発散し、小さすぎると遅くなったりするからです。**オプティマイザ**は勾配だけでなく「これまでの更新の勢い（モーメンタム）」や「パラメータごとのステップ幅（Adam）」を使い、より速く安定して最適解に近づきます。**学習率スケジュール**は最初は大きく、後で小さくしてきれいに収束させ、**正則化**と**バッチ正規化**で各層のスケールを揃え、勾配の消失・爆発を抑えます。","3":"**ビジョン（画像）**では、画素周辺の**局所パターン**（エッジ、テクスチャ）が重要なので**畳み込み**が適しています。**プーリング**で位置を少しぼかしながら情報を圧縮し、**ResNet**の残差接続で層を深くしても前の情報をそのまま足し合わせるため、学習が崩れません。**転移学習**は大量データで学習済みのモデルを流用し、自分のタスク用に少しだけ再学習するので、データが少なくても実用的な性能が出しやすくなります。","4":"**自然言語・系列**では、単語や文字を**トークン**に分け**埋め込み**でベクトルにし、**RNN**や**LSTM・GRU**で「これまでの文脈」を表す状態を伝えながら次を予測します。**アテンション**は「今予測するときに文のどの部分が重要か」を学習し、翻訳・要約・QAなどで必要な部分だけを選んで使えるようにします。このコースを終えると、画像分類・検出・セグメンテーション、そしてテキスト生成・翻訳・要約の基本構造が理解できるようになります。","5":"本コースではCh01〜Ch07で**学習の安定化**（初期化、最適化、スケジュール、損失、正則化、正規化層、データ拡張）、Ch08〜Ch14で**ビジョン**（CNN、プーリング、ResNet、軽量畳み込み、転移学習、検出・セグメンテーション）、Ch15〜Ch21で**自然言語・系列**（前処理、埋め込み、1D CNN、RNN、LSTM・GRU、エンコーダ・デコーダ・アテンション、総まとめ）を順に扱います。"}},"midDlCh01":{"chapter":"Chapter 01","title":"重み初期化：良い出発が半分","description":"学習開始前に各層の重みとバイアスをどの値に置くかを決めるのが**重み初期化**です。悪い出発は勾配消失・爆発を招き学習がほぼ不可能になり、良い出発は速い収束と安定した学習につながります。この章では初期化の概念、Xavier・He初期化の直感と式、実務での使い方を学びます。","sectionTitle":"重み初期化：良い出発が半分","whatIs":{"0":"**重み初期化とは？** — 各層には**重み $W$**と**バイアス $b$**があります。学習前は値が未定なので、**最初にどの数で埋めるか**を決めます。この過程を**重み初期化**といいます。直感的にはマラソンのスタート位置をどこに置くかと同じです。スタートが後ろすぎると（重みが小さすぎると）歩幅が減って学習が遅く、前すぎると（重みが大きすぎると）暴走して発散します。","1":"**数学的には** — 一層の線形和は $z = W \\mathbf{x} + b$ と書きます。$\\mathbf{x}$ は入力ベクトル、$W$ は重み行列、$b$ はバイアスです。$W$ をすべて0にすると同層の全ニューロンが同じ出力を出し**対称性**が保たれ、逆伝播で勾配が均等に分かれません。なので通常**小さな乱数**で初期化し、その**分布（スケール）**を層の入力次元 $n_{in}$ と出力次元 $n_{out}$ に合わせて調整し、層を通過するとき活性の大きさが極端に変わらないようにします。","2":"**実務での適用** — スパム分類モデルで初期化が悪いと損失がほとんど減らない・NaN が出ることがあります。医療用CNNや不正検知のように層が深い場合、Xavier/He を使わないと手前の層の勾配が0に近づき（**勾配消失**）学習が止まったように見えます。逆にスケールが大きすぎると勾配爆発で数値が不安定になります。実務では**Xavier**（tanh・シグモイド系）または**He**（ReLU系）を標準で使います。"},"whyImportant":{"0":"**勾配消失と勾配爆発** — 層が深いほど逆伝播する勾配は連鎖律で多くの数の積になります。重みが小さすぎると積が0に近づき（**勾配消失**）手前の層がほとんど更新されず、大きすぎると積が爆発し（**勾配爆発**）NaN・Inf が出ます。良い初期化は層を通過しても**分散が維持**されるようにし、深いネットワークでも勾配が適度な大きさで伝わるようにします。","1":"**収束速度と最適点** — 適切な初期化だと損失曲面で**良い出発点**に立てます。悪い出発点だと局所最小に陥るか収束が非常に遅くなります。実務では学習率と初期化を変えながら検証損失を見てチューニングします。"},"howUsed":{"0":"**Xavier（Glorot）初期化** — 線形和 $z$ の分散が入出力サイズに依存しないよう、$W$ を**一様分布** $U(-\\sqrt{6/(n_{in}+n_{out})},\\ \\sqrt{6/(n_{in}+n_{out})})$ または**正規分布** $\\mathcal{N}(0,\\ \\sigma^2)$（$\\sigma^2 = 2/(n_{in}+n_{out})$）からサンプリングします。tanh・シグモイドなどの対称活性化に適しています。","1":"**He初期化** — ReLUは0以下を0にするため出力の分散は入力の約半分になります。**He**では $\\sigma^2 = 2/n_{in}$ で補正します。ReLU・Leaky ReLU を使う現代のCNN・MLPではHeを標準でよく使います。","2":"**実務での選択** — 活性化がReLU系ならHe、tanh・シグモイドならXavierをまず試します。PyTorch・TensorFlowのデフォルト初期化も層の種類に応じてこのどちらかを適用していることが多いです。"},"problemSolving":{"0":"**まとめ** — 重み初期化は学習前に各層の $W$，$b$ をどの値に置くか決める段階です。0にすると対称性のため学習が進まないので、通常は小さな乱数で**分散（スケール）**を調整します。Xavierは $\\sigma^2 = 2/(n_{in}+n_{out})$ でtanh・シグモイドに、Heは $\\sigma^2 = 2/n_{in}$ でReLU系に合わせます。良い初期化は勾配消失・爆発を減らし収束を速くします。","2":"**例（定義）**\n\n「重み初期化の主な目的は？①学習前の層のスケールを合わせる ②学習率を上げる ③データ拡張」\n\n目的は層を通過しても活性・勾配のスケールが維持されるようにすること。→**答 1**\n\n---\n\n**例（Xavier vs He）**\n\n「ReLUを使う層でよく使う初期化は？①Xavier ②He ③0」\n\nReLU系ではHe初期化を使う。→**答 2**\n\n---\n\n**例（計算）**\n\n$n_{in}=4$，$n_{out}=6$ のときXavierでの $n_{in}+n_{out}$ の値（整数）は？\n\n$4+6=10$。→**答 10**","3":"**定義の例** — 「重み初期化の主な目的は？①学習前の層のスケールを合わせる ②学習率を上げる ③データ拡張」→目的は層を通過してもスケールが維持されるようにすること。**答 1**\n\n**正誤の例** — 「重み初期化は学習前に$W$，$b$を決める過程である。」→正しい。**答 1**\n\n**応用の例** — 「スパム分類モデルで損失がほとんど減らないとき、まず疑うのは？①初期化・学習率 ②データ数だけ ③バッチサイズだけ」→初期化・学習率の確認が先。**答 1**\n\n**選択の例** — 「He初期化で$\\sigma^2$は？①$2/n_{in}$ ②$2/(n_{in}+n_{out})$ ③$1/n_{in}$」→Heは$\\sigma^2=2/n_{in}$。**答 1**\n\n**概念の例** — 「Xavierで$n_{in}+n_{out}=6$のとき$6/(n_{in}+n_{out})$の値（整数）は？①1 ②2 ③3」→$6/6=1$。**答 1**\n\n**計算の例** — 「$n_{in}=4$，$n_{out}=6$のときXavierでの$n_{in}+n_{out}$の値（整数）は？」→$4+6=10$。**答 10**"},"summary":"重み初期化は、学習開始前に各層の重みとバイアスをどの値に置くか決める過程です。すべて0にするとニューロンが同じ出力を出して対称性が保たれ学習が進まず、乱数で大きすぎ・小さすぎにすると層を通過するとき活性や勾配が爆発または消失します。そこで層の入出力サイズに合わせて分散を調整したXavier初期化とHe初期化が広く使われます。Xavierはtanh・シグモイドなどの対称活性化に、HeはReLU系に適し、良い出発で勾配消失・爆発を減らし収束を安定させます。","sectionLabels":{"whatIs":"どのような概念か","whyImportant":"なぜ重要か","howUsed":"どのように使うか","summary":"まとめ"},"formulaGuide":{"title":"数式の読み方","linear":"**式 $z = W\\mathbf{x}+b$（一層の線形和）**\n\n活性化の前の層出力です。**$z$**は活性化前の生ベクトル、**$W$**は入力が各出力に与える影響の大きさ（初期化で調整する分散）を決めます。**$\\mathbf{x}$**は層への入力（特徴または前層の出力）、**$b$**は基準のシフトで、初期化では多くの場合0です。$W$が大きすぎると活性が爆発し、小さすぎると消えます。","xavierVariance":"**Xavierの分散 $\\sigma^2 = \\frac{2}{n_{in}+n_{out}}$**\n\nXavierはこの分散の正規分布から重みをサンプリングします。**$n_{in}$**は入力次元、**$n_{out}$**は出力（ニューロン）数です。**$n_{in}+n_{out}$**が大きいほど $\\sigma^2$は**小さく**なり、広い層では重みを小さくして和を安定させます。分子の**2**はtanh/シグモイド系で分散を合わせるときに現れる定数です。","heVariance":"**Heの分散 $\\sigma^2 = \\frac{2}{n_{in}}$**\n\nHeはReLU向けで、負の入力を0にするため出力分散はおよそ半分になります。Heは**$n_{in}$のみ**を使います（$n_{out}$は使いません）。因子**2**はその半減を補うためです。","xavierUniform":"**Xavierの一様分布 $[-a,\\ a]$, $a = \\sqrt{\\frac{6}{n_{in}+n_{out}}}$**\n\n重みは $[-a,a]$ の一様分布からもサンプリングできます。$n_{in}+n_{out}$ が与えられたら $6/(n_{in}+n_{out})$ を計算し、整数向けの練習では例として $n_{in}+n_{out}=6$ なら $6/6=1$ となります。"},"visual":"重み初期化が勾配の流れに与える影響を示す可視化です。","problemSolvingLabel":"問題を解くための説明","practiceProblemsTitle":"練習問題","practiceProblemsIntro":"以下はチャプターの内容を確認する例題です。下のボタンで答えを選んでください。","practiceProblemsInstruction":"問題を読み、選択肢から正解を選んでください。","midDlCh01VisualIntro":"重み初期化は学習の第一歩。各層の $W$ と $b$ を適切なスケールに置き、順伝播・逆伝播で分散が維持されるようにします。","midDlCh01VisualStep0":"①初期化：各層の $W$，$b$ を（Xavier/Heなど）規則に従って設定","midDlCh01VisualStep1":"②順伝播：入力→線形和 $z$→活性化 $a$→次層","midDlCh01VisualStep2":"③損失計算ののち逆伝播：勾配が層を伝わる","midDlCh01VisualStep3":"④更新：勾配に従い $W$，$b$ を更新。良い初期化なら勾配の大きさが適度に保たれる","midDlCh01VisualConceptTitle":"概念：初期化→順伝播→損失→逆伝播→更新","midDlCh01VisualFlowTitle":"学習の流れ：層ごとに入力・重み・出力のスケールが合うよう初期化","midDlCh01VisualModelTitle":"層の働き：一層で $z=Wx+b$ の分散が入力分散とほぼ同じになるよう $W$ の分散を決める","midDlCh01VisualScaleTitle":"初期化スケールの影響","midDlCh01VisualScaleSmall":"Wが小さすぎる → 勾配消失","midDlCh01VisualScaleLarge":"Wが大きすぎる → 勾配爆発","midDlCh01VisualScaleGood":"適切なW → 分散が維持される","midDlCh01VisualSegInput":"入力","midDlCh01VisualSegLayer1":"層1","midDlCh01VisualSegLayer2":"層2","midDlCh01VisualSegLayer3":"層3","midDlCh01VisualSegOutput":"出力","midDlCh01VisualRowLabelVanishing":"消失","midDlCh01VisualRowLabelStable":"維持","midDlCh01VisualRowLabelExploding":"爆発","midDlCh01VisualScaleCaption":"層を通過しても**分散が維持**されるよう W, b のスケールを決めるのが良い初期化です。","midDlCh01VisualBannerShort":"良い出発が半分","midDlCh01VisualBannerSub":"適切な初期化 → 速い収束・安定した学習","problems":{"definition_0":"重み初期化の主な目的は？①学習前の層のスケールを合わせる ②学習率を上げる ③データ拡張","definition_1":"学習開始前に各層の $W$，$b$ を決める過程は？①重み初期化 ②勾配降下 ③正則化","definition_2":"ReLU系活性化でよく使う初期化は？①Xavier ②He ③0初期化","definition_3":"tanh・シグモイドでよく使う初期化は？①Xavier ②He ③0初期化","definition_4":"勾配が0に近づき手前の層がほとんど更新されない現象は？①勾配消失 ②勾配爆発 ③過学習","definition_5":"重みが大きすぎるとき勾配が爆発する現象は？①勾配消失 ②勾配爆発 ③未学習","definition_6":"Xavier初期化で分散は $n_{in}$，$n_{out}$ でどう決める？① $2/(n_{in}+n_{out})$ ② $2/n_{in}$ ③ $1/n_{in}$","definition_7":"He初期化で分散は？① $2/(n_{in}+n_{out})$ ② $2/n_{in}$ ③ $1/(n_{in}+n_{out})$","definition_8":"重みをすべて0にしない主な理由は？①対称性のためニューロンが同じ出力を出し学習が進まない ②計算が遅い ③メモリ不足","definition_9":"一層の線形和 $z = W\\mathbf{x}+b$ で $W$ が小さすぎると？①勾配消失に近づく ②勾配爆発 ③影響なし","trueFalse_0":"重み初期化は学習前に $W$，$b$ を決める過程である。正しければ1、誤りなら0。","trueFalse_1":"Xavier初期化はReLU専用である。正しければ1、誤りなら0。","trueFalse_2":"He初期化はReLU系活性化に適している。正しければ1、誤りなら0。","trueFalse_3":"良い初期化は層を通過しても分散が維持されるようにする。正しければ1、誤りなら0。","trueFalse_4":"重みをすべて0にすることが推奨される。正しければ1、誤りなら0。","trueFalse_5":"勾配消失は重みが大きすぎるときに起こる。正しければ1、誤りなら0。","trueFalse_6":"勾配爆発は重みが大きすぎるときに起こりうる。正しければ1、誤りなら0。","trueFalse_7":"初期化は収束速度に影響する。正しければ1、誤りなら0。","trueFalse_8":"Xavierでは $\\sigma^2 = 2/(n_{in}+n_{out})$ である。正しければ1、誤りなら0。","trueFalse_9":"Heでは $\\sigma^2 = 2/n_{in}$ である。正しければ1、誤りなら0。","scenario_0":"スパム分類モデルで損失がほとんど減らないとき、まず疑うのは？①初期化・学習率 ②データ数だけ ③バッチサイズだけ","scenario_1":"深いCNNで手前の層がほとんど更新されないとき、最も多い原因は？①勾配消失 ②過学習 ③データ不足","scenario_2":"ReLUを使うMLPを初めて実装するとき、標準で使いやすい初期化は？①Xavier ②He ③0","scenario_3":"tanhを使う層で分散を $2/(n_{in}+n_{out})$ とする初期化は？①Xavier ②He ③どちらでもない","scenario_4":"学習中にNaNが出たとき、初期化の観点で疑うのは？①勾配爆発（スケール過大）②データだけ ③バッチサイズだけ","scenario_5":"医療画像分類モデルの収束が非常に遅いとき、初期化を変えてみる理由は？①出発点が悪いと収束が遅くなりうる ②データ不足だけ ③学習率だけ調整すればよい","scenario_6":"PyTorchのデフォルトLinear層の初期化はどの方式に近い？①Xavier/He系 ②常に0 ③乱数のみ","scenario_7":"層を通過しても活性の分散が維持されるようにする初期化の目標を何という？①分散維持（スケール合わせ）②正則化 ③ドロップアウト","scenario_8":"不正検知モデルが深いとき初期化を気にする理由は？①勾配消失・爆発の防止 ②データだけ重要 ③バッチサイズだけ重要","scenario_9":"$$n_{in}=8$，$n_{out}=8$ の層でXavierを使うとき $n_{in}+n_{out}$ は？①16 ②8 ③64","choice_0":"重みを0にしない理由は？①対称性のため学習が進まない ②メモリ節約 ③速度が遅い","choice_1":"He初期化で $\\sigma^2$ は？① $2/n_{in}$ ② $2/(n_{in}+n_{out})$ ③ $1/n_{in}$","choice_2":"勾配消失を和らげる方法として適切なのは？①適切な初期化（例：Xavier/He）②学習率だけ上げる ③バッチサイズだけ上げる","choice_3":"Xavier初期化が合う活性化は？①tanh・シグモイド ②ReLUのみ ③なし","choice_4":"一層で $z=W\\mathbf{x}+b$ のとき $W$ のスケールが大きすぎると？①勾配爆発の可能性 ②勾配消失のみ ③影響なし","choice_5":"初期化が学習に及ぼす影響は？①収束速度・安定性 ②データ量だけ ③損失関数の形だけ","choice_6":"ReLUを使う層のHe初期化で、分散は入力次元 $n_{in}$ に？①反比例（$2/n_{in}$）②比例 ③無関係","choice_7":"逆伝播で勾配が0に近づく現象は？①勾配消失 ②勾配爆発 ③正則化","choice_8":"Xavierで $n_{in}=4$，$n_{out}=6$ なら $n_{in}+n_{out}$ は？①10 ②24 ③2","choice_9":"良い初期化の目標に近いのは？①層を通過しても分散を維持 ②重みを0に ③学習率だけ上げる","concept_0":"$$z=W\\mathbf{x}+b$ で $W$ の分散が大きすぎると逆伝播で勾配は？①爆発しうる ②常に0 ③変わらない","concept_1":"Xavierで一様分布の範囲が $[-a,a]$ のとき $a=\\sqrt{6/(n_{in}+n_{out})}$。$n_{in}+n_{out}=12$ なら $6/(n_{in}+n_{out})$ の値を整数で書くと？①0 ②1 ③2","concept_2":"He初期化を使う主な理由は？①ReLUが0以下を0にして分散が減るため ②Xavierより速い ③常に良い","concept_3":"深いネットワークで初期化がより重要な理由は？①勾配が多くの層で掛け合わされるため ②データだけ重要 ③第1層だけ重要","concept_4":"バイアス $b$ は通常どう初期化する？①0に ②1に ③乱数で","concept_5":"Leaky ReLUでもHeに近い初期化をよく使う理由は？①ReLU系で分散の性質が似ている ②Xavierだけ使う ③0初期化","concept_6":"学習率が適切でも損失がほとんど減らないとき？①初期化や構造（勾配消失）を疑う ②データだけ ③バッチだけ","concept_7":"XavierとHeの共通点は？①層のサイズに合わせて分散を決める ②どちらも0初期化 ③ReLU専用","concept_8":"逆伝播で連鎖律により勾配を掛けるとき、0.5を10回掛けると約0.001。似た現象は？①勾配消失 ②勾配爆発 ③正則化","concept_9":"実務でReLU CNNの標準初期化は？①He系 ②0 ③Xavierのみ","calc_0":"$$n_{in}+n_{out}=6$ のとき、一様Xavierの比 $6/(n_{in}+n_{out})$ の値（整数）は？","calc_1":"He初期化 $\\sigma^2=2/n_{in}$ で $n_{in}=8$ のとき、分母の $n_{in}$（整数）は？","calc_2":"Xavier分散 $\\sigma^2=2/(n_{in}+n_{out})$ で $n_{in}=2$，$n_{out}=8$ のとき、分母 $n_{in}+n_{out}$（整数）は？","calc_3":"Heで $\\sigma^2=2/n_{in}$ の分母が $n_{in}=32$ のとき、その分母（整数）は？","calc_4":"$$n_{in}=5$，$n_{out}=5$ のときXavier分散の分母 $n_{in}+n_{out}$（整数）は？","calc_5":"$$n_{in}+n_{out}=3$ のとき $6/(n_{in}+n_{out})$ の値（整数）は？","calc_6":"$$n_{in}=1$，$n_{out}=7$ のときXavier分散の分母 $n_{in}+n_{out}$（整数）は？","calc_7":"He初期化 $\\sigma^2=2/n_{in}$ で $n_{in}=20$ のとき分母（整数）は？","calc_8":"$$n_{in}=4$，$n_{out}=12$ のとき $n_{in}+n_{out}$（整数）は？","calc_9":"$$n_{in}+n_{out}=2$ のとき $6/(n_{in}+n_{out})$ の値（整数）は？"},"problemAnswers":{"definition_0":1,"definition_1":1,"definition_2":2,"definition_3":1,"definition_4":1,"definition_5":2,"definition_6":1,"definition_7":2,"definition_8":1,"definition_9":1,"trueFalse_0":1,"trueFalse_1":0,"trueFalse_2":1,"trueFalse_3":1,"trueFalse_4":0,"trueFalse_5":0,"trueFalse_6":1,"trueFalse_7":1,"trueFalse_8":1,"trueFalse_9":1,"scenario_0":1,"scenario_1":1,"scenario_2":2,"scenario_3":1,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1,"choice_0":1,"choice_1":1,"choice_2":1,"choice_3":1,"choice_4":1,"choice_5":1,"choice_6":1,"choice_7":1,"choice_8":1,"choice_9":1,"concept_0":1,"concept_1":1,"concept_2":1,"concept_3":1,"concept_4":1,"concept_5":1,"concept_6":1,"concept_7":1,"concept_8":1,"concept_9":1,"calc_0":1,"calc_1":8,"calc_2":10,"calc_3":32,"calc_4":10,"calc_5":2,"calc_6":8,"calc_7":20,"calc_8":16,"calc_9":3},"problemSolutions":{"definition_0":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","definition_1":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","definition_2":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 2**。","definition_3":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","definition_4":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","definition_5":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 2**。","definition_6":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","definition_7":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 2**。","definition_8":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","definition_9":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","trueFalse_0":"解説: 記述が正しければ1、誤りなら0として判断します。**正解: 1**。","trueFalse_1":"解説: 記述が正しければ1、誤りなら0として判断します。**正解: 0**。","trueFalse_2":"解説: 記述が正しければ1、誤りなら0として判断します。**正解: 1**。","trueFalse_3":"解説: 記述が正しければ1、誤りなら0として判断します。**正解: 1**。","trueFalse_4":"解説: 記述が正しければ1、誤りなら0として判断します。**正解: 0**。","trueFalse_5":"解説: 記述が正しければ1、誤りなら0として判断します。**正解: 0**。","trueFalse_6":"解説: 記述が正しければ1、誤りなら0として判断します。**正解: 1**。","trueFalse_7":"解説: 記述が正しければ1、誤りなら0として判断します。**正解: 1**。","trueFalse_8":"解説: 記述が正しければ1、誤りなら0として判断します。**正解: 1**。","trueFalse_9":"解説: 記述が正しければ1、誤りなら0として判断します。**正解: 1**。","scenario_0":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","scenario_1":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","scenario_2":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 2**。","scenario_3":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","scenario_4":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","scenario_5":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","scenario_6":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","scenario_7":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","scenario_8":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","scenario_9":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","choice_0":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","choice_1":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","choice_2":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","choice_3":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","choice_4":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","choice_5":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","choice_6":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","choice_7":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","choice_8":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","choice_9":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","concept_0":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","concept_1":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","concept_2":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","concept_3":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","concept_4":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","concept_5":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","concept_6":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","concept_7":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","concept_8":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","concept_9":"解説: 問題文の定義と条件に照らして最も適切な選択肢を選びます。**正解: 1**。","calc_0":"解説: $6/6=1$。**正解: 1**。","calc_1":"解説: 分母は $n_{in}=8$。**正解: 8**。","calc_2":"解説: $2+8=10$。**正解: 10**。","calc_3":"解説: 分母は $n_{in}=32$。**正解: 32**。","calc_4":"解説: $5+5=10$。**正解: 10**。","calc_5":"解説: $6/3=2$。**正解: 2**。","calc_6":"解説: $1+7=8$。**正解: 8**。","calc_7":"解説: 分母は $n_{in}=20$。**正解: 20**。","calc_8":"解説: $4+12=16$。**正解: 16**。","calc_9":"解説: $6/2=3$。**正解: 3**。"},"problemTestCodes":{"definition_0":"answer = 1\nassert answer == 1","definition_1":"answer = 1\nassert answer == 1","definition_2":"answer = 2\nassert answer == 2","definition_3":"answer = 1\nassert answer == 1","definition_4":"answer = 1\nassert answer == 1","definition_5":"answer = 2\nassert answer == 2","definition_6":"answer = 1\nassert answer == 1","definition_7":"answer = 2\nassert answer == 2","definition_8":"answer = 1\nassert answer == 1","definition_9":"answer = 1\nassert answer == 1","trueFalse_0":"answer = 1\nassert answer == 1","trueFalse_1":"answer = 0\nassert answer == 0","trueFalse_2":"answer = 1\nassert answer == 1","trueFalse_3":"answer = 1\nassert answer == 1","trueFalse_4":"answer = 0\nassert answer == 0","trueFalse_5":"answer = 0\nassert answer == 0","trueFalse_6":"answer = 1\nassert answer == 1","trueFalse_7":"answer = 1\nassert answer == 1","trueFalse_8":"answer = 1\nassert answer == 1","trueFalse_9":"answer = 1\nassert answer == 1","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 2\nassert answer == 2","scenario_3":"answer = 1\nassert answer == 1","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1","choice_0":"answer = 1\nassert answer == 1","choice_1":"answer = 1\nassert answer == 1","choice_2":"answer = 1\nassert answer == 1","choice_3":"answer = 1\nassert answer == 1","choice_4":"answer = 1\nassert answer == 1","choice_5":"answer = 1\nassert answer == 1","choice_6":"answer = 1\nassert answer == 1","choice_7":"answer = 1\nassert answer == 1","choice_8":"answer = 1\nassert answer == 1","choice_9":"answer = 1\nassert answer == 1","concept_0":"answer = 1\nassert answer == 1","concept_1":"answer = 1\nassert answer == 1","concept_2":"answer = 1\nassert answer == 1","concept_3":"answer = 1\nassert answer == 1","concept_4":"answer = 1\nassert answer == 1","concept_5":"answer = 1\nassert answer == 1","concept_6":"answer = 1\nassert answer == 1","concept_7":"answer = 1\nassert answer == 1","concept_8":"answer = 1\nassert answer == 1","concept_9":"answer = 1\nassert answer == 1","calc_0":"s = 6\nanswer = 6 // s\nassert answer == 1","calc_1":"n_in = 8\nanswer = n_in\nassert answer == 8","calc_2":"n_in, n_out = 2, 8\nanswer = n_in + n_out\nassert answer == 10","calc_3":"n_in = 32\nanswer = n_in\nassert answer == 32","calc_4":"n_in, n_out = 5, 5\nanswer = n_in + n_out\nassert answer == 10","calc_5":"s = 3\nanswer = 6 // s\nassert answer == 2","calc_6":"n_in, n_out = 1, 7\nanswer = n_in + n_out\nassert answer == 8","calc_7":"n_in = 20\nanswer = n_in\nassert answer == 20","calc_8":"n_in, n_out = 4, 12\nanswer = n_in + n_out\nassert answer == 16","calc_9":"s = 2\nanswer = 6 // s\nassert answer == 3"},"problemDifficulty":{"definition_0":"easy","definition_1":"easy","definition_2":"easy","definition_3":"easy","definition_4":"easy","definition_5":"easy","definition_6":"easy","definition_7":"easy","definition_8":"easy","definition_9":"easy","trueFalse_0":"easy","trueFalse_1":"easy","trueFalse_2":"easy","trueFalse_3":"easy","trueFalse_4":"easy","trueFalse_5":"easy","trueFalse_6":"easy","trueFalse_7":"easy","trueFalse_8":"easy","trueFalse_9":"easy","scenario_0":"medium","scenario_1":"medium","scenario_2":"medium","scenario_3":"medium","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","choice_0":"medium","choice_1":"medium","choice_2":"medium","choice_3":"medium","choice_4":"medium","choice_5":"medium","choice_6":"medium","choice_7":"medium","choice_8":"medium","choice_9":"medium","concept_0":"hard","concept_1":"hard","concept_2":"hard","concept_3":"hard","concept_4":"hard","concept_5":"hard","concept_6":"hard","concept_7":"hard","concept_8":"hard","concept_9":"hard","calc_0":"hard","calc_1":"hard","calc_2":"hard","calc_3":"hard","calc_4":"hard","calc_5":"hard","calc_6":"hard","calc_7":"hard","calc_8":"hard","calc_9":"hard"},"problemOrder":["definition_0","definition_1","definition_2","definition_3","definition_4","definition_5","definition_6","definition_7","definition_8","definition_9","trueFalse_0","trueFalse_1","trueFalse_2","trueFalse_3","trueFalse_4","trueFalse_5","trueFalse_6","trueFalse_7","trueFalse_8","trueFalse_9","scenario_0","scenario_1","scenario_2","scenario_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","choice_0","choice_1","choice_2","choice_3","choice_4","choice_5","choice_6","choice_7","choice_8","choice_9","concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","concept_6","concept_7","concept_8","concept_9","calc_0","calc_1","calc_2","calc_3","calc_4","calc_5","calc_6","calc_7","calc_8","calc_9"]},"midDlCh02":{"chapter":"Chapter 02","title":"最適化アルゴリズム：速度と方向を賢く調整する","description":"モデル学習は、**目隠しをしたまま巨大な山脈で最も深い谷（誤差最小）を探す登山**に似ています。**最適化**は、今いる場所から**どの方向に、どれだけの歩幅で**進むかを決めるナビゲーションです。\n\nCh.01 で出発点を決めたら、本章では勾配を感じながら安全に下る技を学びます。一歩ずつの **SGD**、慣性の **モーメンタム**、地形に合わせて歩幅を変える **Adam** まで、実務で毎日使う最適化を直感的に扱います。","sectionTitle":"最適化アルゴリズム：速度と方向を賢く調整する","whatIs":{"0":"**1. 勾配降下法と SGD：下り坂の反対＝上り勾配の反対へ**\n\n**概念:** 下山で確実なのは、足元を踏んで**一番急な下り**へ一歩ずつ進むことです。それが勾配降下の核心です。\n\n**直感:** 濃い霧の山を下ると想像してください。歩幅（**学習率**）が大きすぎれば崖から落ちたり、向こうの峰に跳ね返ったりします。狭すぎれば日が暮れても谷底に届きません。\n\n**中心の式:**\n$\\theta \\leftarrow \\theta - \\eta \\nabla L(\\theta)$\n- **$\\theta$**: 今いる位置（重み）\n- **$\\eta$**: 歩幅＝**学習率**（0.01、0.001 などが多い）\n- **$\\nabla L$**: 今の位置の勾配\n\n**実務のコツ:** 地図全体を毎回見るのは遅いので、**ミニバッチ SGD** で一部だけ見て素早く方向を決めるのが基本です。","1":"**2. モーメンタム：氷上のボウリング球**\n\n**概念:** SGD は目の前の坂だけ見るので、狭い谷で**ジグザグ**に時間を浪費します。**過去の移動の慣性**を足したのがモーメンタムです。\n\n**直感:** 紙コップは小石でも向きを変えますが、**重いボウリング球**は凹凸を押し抜け、元の方向へ進みます。モーメンタムはその「重み」を与えます。\n\n**中心の式:**\n$v \\leftarrow \\beta v + (1-\\beta)g$\n$\\theta \\leftarrow \\theta - \\eta v$\n- **$v$**: 速度（慣性ベクトル）\n- **$\\beta$**: 過去をどれだけ残すか（多くは **0.9**）\n- **$g$**: 今の勾配\n\n**補足:** **ネステロフ**は、慣性で進んだ**先の点**で勾配を見ます。","2":"**3. 適応型（AdaGrad, RMSProp, Adam）：輪ごとにブレーキ**\n\n**概念:** パラメータによってはもう目的地近く、まだ遠いものもあります。同じ $\\eta$ ではなく、**座標ごとに歩幅を適応**させます。\n\n**発展の流れ:**\n- **AdaGrad:** 「よく動いた次元は歩幅を小さく」— 二乗勾配を蓄積します。\n- **RMSProp:** AdaGrad の「後半ほぼ止まる」問題を、古い履歴を**EMA で忘れる**ことで緩和しました。\n- **Adam:** **モーメンタム（方向）**と **RMSProp 的スケーリング**を組み合わせた現代の定番です。\n\n**実務:** 論文では **weight decay を分離**した **AdamW** がよく使われます。","3":"**4. 三つの目標：安定性・速度・汎化**\n\n**概念:** オプティマイザ選びは「速く谷底へ」だけではありません。**どの谷底に着くか**でテスト性能が変わります。\n\n**直感:** **新幹線（Adam）**は早く着くが、**各停（SGD+モーメンタム）**は時間はかかっても、より良い一般化の谷に着くことがあります。\n\n**実務:** 序盤は歩幅をゆっくり広げる **ウォームアップ**、終盤は小さくする **スケジューラ**を、オプティマイザとセットで使います。"},"whyImportant":{"0":"**プロジェクトの時間とコストを決める**\n\n学習率が大きすぎると発散し、小さすぎると 1 時間で終わるはずが 1 週間になります。適切な設定は **GPU 代と残業**を減らす魔法です。","1":"**テストの点数（汎化）を変える**\n\n同じデータでもオプティマイザで**品質が変わります**。どの谷に落ちるかでテスト精度が変わるからです。","2":"**モデルの「体温計」**\n\n損失が下がらない、NaN が出るとき、まず疑うのは **学習率とオプティマイザ**です。原理を知れば慌てずデバッグを始められます。"},"howUsed":{"0":"**① 実験ログを残し、一度に一つだけ変える**\n\nAPI はライブラリで違いますが、習慣は同じです。**学習率・バッチ・オプティマイザ・シード**を記録し、不調なら**一度に一つだけ**変えて原因を切り分けます。損失が激しく振れるならバッチ・lr・モーメンタムを、長く回すと更新がほぼ止まるなら AdaGrad 系から **RMSProp / Adam** への切り替えを検討します。**症状とつまみ**を対応づけて考える練習が大切です。","1":"**② チートシート**\n\n| 状況 | おすすめ | 理由 |\n| :--- | :--- | :--- |\n| **まずベースラインを早く** | `Adam` / `AdamW` | 適応的で初期 lr に鈍感になりやすい |\n| **NLP・Transformer** | `AdamW` | 疎な構造でも安定しやすい |\n| **CNN を極限まで** | `SGD + Momentum` | 調整は難しいが、最適なら汎化が伸びることが多い |","2":"**③ モニタリング：目を離さない**\n\nTensorBoard や W&B で**損失曲線**を見てください。のこぎりのように振動なら、**学習率を下げる**タイミングかもしれません。"},"problemSolving":{"0":"最適化は、逆伝播で得た勾配を使ってパラメータ $\\theta$ をどう更新するかを決め、損失 $L(\\theta)$ を下げるプロセスです。基本の **SGD** はミニバッチ勾配 $\\hat{g}$ で $\\theta \\leftarrow \\theta - \\eta \\hat{g}$ と1ステップ進み、**学習率 $\\eta$** が歩幅そのものを決めます。**モーメンタム** は速度 $v$ を蓄積して狭い谷でのジグザグを減らし、**Adam/AdamW** は 1次・2次モーメントで座標ごとに異なる適応型更新を行います。損失が振れたり発散したりするときは、オプティマイザ名だけを変えるのではなく、**学習率・バッチサイズ・学習率スケジューラ**をセットで点検することが実務では先です。","2":"**例（定義）**\n\n「モーメンタムの主な役割は？ ① 学習率を 0 にする ② 過去方向を蓄積して振動を減らす ③ 逆伝播を省略する」\n\nモーメンタムは速度 $v$ により方向の慣性を保つ。→ **答え 2**\n\n---\n\n**例（応用）**\n\n「学習損失が大きく振動するとき、最初に確認する組み合わせは？ ① 学習率・モーメンタム・バッチサイズ ② 学習データ 0 ③ 全レイヤ削除」\n\n振動はステップ幅と勾配ノイズに関係するため、①を先に確認する。→ **答え 1**\n\n---\n\n**例（計算）**\n\n$\\eta=0.001$, $g=20$ のとき、SGD の更新量 $\\eta g$ は？\n\n$0.001 \\times 20 = 0.02$。→ **答え 0.02**","3":"**定義例** — 「Adam が同時に使う情報は？ ① 1次・2次モーメント ② バッチ番号のみ ③ ドロップアウトマスクのみ」→ Adam は 1次・2次モーメントを使う。**答え 1**\n\n---\n\n**正誤例** — 「RMSProp は二乗勾配の指数移動平均（EMA）を使う。」→ 正しい。**答え 1**\n\n---\n\n**応用例** — 「学習初期が不安定なとき、まず確認するのは？ ① warmup・学習率スケジュール ② 逆伝播を切る ③ データ削除」→ warmup とスケジュールを先に確認。**答え 1**\n\n---\n\n**選択例** — 「Nesterov の特徴は？ ① 先読み点の勾配 ② 現在点のみ ③ 勾配を使わない」→ 先読み点を使う。**答え 1**\n\n---\n\n**概念例** — 「AdaGrad で頻繁に更新される座標の有効ステップ幅は？ ① 小さくなる傾向 ② 常に同じ ③ 大きくなる傾向」→ 累積により小さくなる傾向。**答え 1**\n\n---\n\n**計算例** — 「サンプル数 64、バッチサイズ 16 のとき 1 エポックのステップ数は？」→ $64/16=4$。**答え 4**"},"summary":"**最適化**は、勾配情報を更新ステップに変換して損失 $L(\\theta)$ を下げるプロセスです。\n\n**SGD** はミニバッチ勾配 $\\hat{g}$ で更新し、**モーメンタム** は速度 $v$ でジグザグを緩和、**Adam/AdamW** は 1次・2次モーメントで座標ごとのステップ幅を適応的に調整します。\n\n**実務デバッグ要約（症状 → 優先点検）**\n- 損失の振動: `lr`、モーメンタム、バッチサイズ\n- 初期発散/NaN: 初期化、`lr`、`grad_norm`、clipping\n- 学習停滞: スケジューラ（warmup 含む）、オプティマイザ再選択（SGD↔AdamW）\n- 検証停滞: weight decay、データ拡張、early stopping\n\n**実戦チューニング順**\n1) ログ正常性確認 → 2) `lr` を先に調整 → 3) オプティマイザ選択 → 4) スケジュール結合 → 5) 安定化手法追加 → 6) 平均性能・分散・再現性で最終選択\n\n**運用原則**: 変数は一度に一つだけ変更し、`optimizer/lr/batch_size/weight_decay/seed/scheduler` を記録して比較する。","sectionLabels":{"whatIs":"どんな概念か","whyImportant":"なぜ重要か","howUsed":"どう使うか","summary":"まとめ"},"formulaGuide":{"title":"数式をやさしく","sgd":"**SGD 1ステップ** $\\theta \\leftarrow \\theta - \\eta \\hat{g}$ — $\\hat{g}$ はミニバッチ推定、$\\eta$ はステップ幅です。","momentum":"**モーメンタム** $v \\leftarrow \\beta v + (1-\\beta)g$, $\\theta \\leftarrow \\theta - \\eta v$ — 過去の方向が $v$ に溜まりジグザグを和らげます。","adam":"**Adam（概念）** — 勾配とその二乗のEMAを座標ごとに使い、初期ステップのバイアスを補正します。","adaptive":"**適応的な直感** — 履歴で勾配が大きい座標ほど実効ステップを小さくします。"},"visual":"損失の**山**の上で SGD・モーメンタム・Adam の軌跡を比較するアニメーション。同じ坂でも**進路が違う**様子を示します。","problemSolvingLabel":"問題の解き方","practiceProblemsTitle":"練習問題","practiceProblemsIntro":"以下は**60問バンク**から無作為に選んだ**10問**です（易4・中3・難3、提示順は易→中→難）。**①②③**は**1・2・3**、**記述**は問題の指示に従い**真偽(1/0)**または**計算結果の整数**を入力してください。","practiceProblemsInstruction":"問題を読み、選択肢から正しい番号を選んでください。","midDlCh02VisualIntro":"目隠しで同じ**損失の山**を下っても、SGD・モーメンタム・Adam は**違うルート**を選びます（単純化した谷の比較）。","midDlCh02VisualStep0":"① **SGD**: 毎ステップ勾配の反対方向（ミニバッチノイズでジグザグ）","midDlCh02VisualStep1":"② **モーメンタム**: 速度 $v$ を蓄積し、曲がりを滑らかに","midDlCh02VisualStep2":"③ **Adam**: 座標ごとに適応的なステップ幅","midDlCh02VisualStep3":"④ **実務**: ログ・スケジュール・初期化（Ch.01）と合わせて調整","midDlCh02VisualConceptTitle":"概念：勾配 →（加工）→ 更新","midDlCh02VisualFlowTitle":"流れ：順伝播 → 損失 → 逆伝播 → オプティマイザ step","midDlCh02VisualModelTitle":"更新：$\\theta \\leftarrow \\theta - \\eta \\cdot(\\text{Adam 等で作ったステップ})$","midDlCh02VisualLegendSgd":"SGD","midDlCh02VisualLegendMom":"モーメンタム","midDlCh02VisualLegendAdam":"Adam","midDlCh02VisualCaption":"**赤（SGD）**は初期から左右に細かく揺れながら下り、ジグザグ感が強く残ります。**緑（モーメンタム）**は揺れを抑えつつ、終盤は谷底の**中心から少し横にずれた位置**に留まり、**青（Adam）**は最も速く谷底の**中央**へ寄ります。","problems":{"definition_0":"損失を減らす勾配降下の1ステップで、$\\theta$ を動かす一般的な向きは？\n1) $\\nabla L$ と同じ向き\n2) $\\nabla L$ の**反対**向き\n3) $\\nabla L$ に直交","definition_1":"PyTorch で `loss.backward()` 直後、ミニバッチ勾配でパラメータを更新する典型的なオプティマイザ動作に最も近い説明は？ ①毎ステップ全訓練データの勾配 ②**一部サンプルから推定した** $\\hat{g}$ で更新 ③逆伝播を省略","definition_2":"狭い谷で左右に振れる動きを和らげるため、過去の勾配を速度 $v$ に蓄積する方法は？\n1) ドロップアウトだけ増やす\n2) **モーメンタム**で慣性を付ける\n3) バッチサイズを常に 1 に固定","definition_3":"Nesterov モメンタムが通常のモメンタムと異なって扱うのは？\n1) 現在の $\\theta$ における $g$ だけ\n2) モメンタム方向に**先読みして移動した点**での $g$\n3) 検証損失だけ","definition_4":"AdaGrad が座標ごとのステップを小さくするために累積する量は？ ①重みの絶対値 ②勾配の**二乗** ③エポック番号","definition_5":"RMSProp が AdaGrad の無制限な二乗勾配の和を和らげる代表的な仕組みは？ ①勾配の符号だけ保存 ②二乗勾配の**指数移動平均(EMA)** ③常に固定 $\\eta$ のみ","definition_6":"Adam が同時に扱う2つの推定に最も近い組み合わせは？\n1) **1次・2次モーメント**（モメンタム＋適応型スケール）\n2) ドロップアウトマスクだけ\n3) プーリングサイズだけ","definition_7":"学習率 $\\eta$ が大きすぎるとき、**典型でない**現象はどれ？ ①損失の振動 ②**常にもっと速い収束だけが保証される** ③NaN","definition_8":"Adam の1次モーメント $m$ が推定しているものに最も近いのは？ ①最近の勾配の**EMA** ②常にゼロベクトル ③検証精度","definition_9":"データ・モデル・ログの制約を見ながらオプティマイザを選ぶとき、優先したい視点は？\n1) モニタ解像度\n2) **安定性・速度・汎化**など学習の観点\n3) ファイル拡張子","trueFalse_0":"[正誤] 典型的な `optimizer.step()` が勾配の**反対**方向に $\\theta$ を動かして損失を減らす勾配降下と一致するなら 1、違えば 0。","trueFalse_1":"[正誤] モメンタムは学習率ハイパーパラメータを常に 0 にする。正しければ 1、誤りなら 0。","trueFalse_2":"[正誤] Adam は適応型の分母とモメンタム的な1次モーメントを一緒に使うことが多い。正しければ 1、誤りなら 0。","trueFalse_3":"[正誤] AdaGrad は長く学習すると一部座標の実効ステップが極端に小さくなり得る。正しければ 1、誤りなら 0。","trueFalse_4":"[正誤] RMSProp の中核は二乗勾配の EMA で累積スケールを安定化することである。正しければ 1、誤りなら 0。","trueFalse_5":"[正誤] ミニバッチが大きいほど勾配推定の分散は**常に**大きくなる。正しければ 1、誤りなら 0。","trueFalse_6":"[正誤] Cosine スケジュールのように時間で $\\eta$ を変えるのは学習率スケジューリングの一例である。正しければ 1、誤りなら 0。","trueFalse_7":"[正誤] Nesterov はモメンタム方向に先に進んだ地点で勾配を見る考え方を含む。正しければ 1、誤りなら 0。","trueFalse_8":"[正誤] Adam の $\\varepsilon$ は $\\sqrt{\\hat{v}}$ の分母が 0 に近いときを和らげる小さな定数である。正しければ 1、誤りなら 0。","trueFalse_9":"[正誤] すべてのデータセット・モデルで Adam が常に SGD+モメンタムより優れる。正しければ 1、誤りなら 0。","scenario_0":"[応用] ResNet 学習中、損失が大きく振れて下がらない。**まず**試すのに良い組み合わせは？ ① **lr・モメンタム・バッチ**を再調整 ②訓練画像を 0 枚 ③ すべての BN を削除","scenario_1":"疎な BoW テキスト分類を素早く回したい。最初に検討しやすいオプティマイザ系は？\n1) **Adam/AdamW** など適応型\n2) フルバッチ GD のみ固定\n3) k-means","scenario_2":"画像 CNN で検証性能まで意識するときよく見る学習の組み合わせは？ ① **SGD+モメンタム（+スケジュール）** または Adam ②逆伝播を切る ③オプティマイザなしで順伝播のみ","scenario_3":"AdaGrad で長く回すと更新がほぼ止まったように見える。次に自然な試みは？\n1) **RMSProp/Adam** へ切り替え・lr を見直す\n2) バッチ 1 だけ永遠に続ける\n3) 入力特徴をすべて削除","scenario_4":"序盤は大きく、後半は小さく $\\eta$ を与えたい。コードで実装するときの核心は？ ① **スケジューラ/ウォームアップ** の設計 ② lr 無限増加 ③ `step()` 省略","scenario_5":"学習中に `grad_norm` が異常に大きい。Ch.01 初期化と合わせて見る項目は？ ① **lr・クリッピング・スケール** ②ログファイル名 ③テーマ色","scenario_6":"モメンタム $\\beta=0.99$ に上げると慣性はどうなるか？\n1) **過去の方向をより長く保持**\n2) 即座に大域最適が保証される\n3) 学習不能","scenario_7":"L2 減衰を Adam と一緒に使うとき、重み減衰を損失項から分離して扱う代表的な変形は？ ① **AdamW** ②SGD のみ ③AdaGrad のみ","scenario_8":"少量データの過学習が疑われるとき、**オプティマイザだけ**変えて解決できるか？\n1) **難しい**；正則化・データが先\n2) Adam なら必ず解決\n3) lr だけ無限大","scenario_9":"マルチ GPU でエポックごとにシャッフルシードが固定され偏りがありそう。調べるべきことは？ ① **シャッフル・同期** ②アイコン ③GPU 削除","choice_0":"純粋なバッチ GD に対してミニバッチ SGD の典型的な特徴は？\n1) 違いがない\n2) $\\hat{g}$ に**サンプリングノイズ**があり鋭い領域からの脱出に有利になり得る\n3) 逆伝播がない","choice_1":"モメンタムで $\\beta \\to 0$ すると速度の蓄積がほぼ消え、どの更新に近づくか？ ① **SGD に近い** ②常に発散 ③lr=0","choice_2":"チュートリアルでよく見る Adam の $(\\beta_1,\\beta_2)$ に最も近いのは？\n1) **$(0.9,\\,0.999)$**\n2) $(0,0)$\n3) $(1,1)$","choice_3":"Transformer ファインチューニング序盤の不安定さを減らすため、序盤ゆっくり lr を上げる手法は？ ① **ウォームアップ** ②常に lr=0 ③データ削除","choice_4":"Adam で2次モメンタが扱う対象に最も近いのは？ ①勾配**二乗**の EMA ②重みの絶対値 ③バッチインデックス","choice_5":"L2 と Adam を一緒に使うときよく使う「減衰分離」変形は？\n1) **AdamW**\n2) softmax を削除\n3) バッチ 0","choice_6":"狭い谷のジグザグを減らすのに役立ちやすい項目は？ ①**モメンタム** ②lr=0 固定 ③推論専用モード","choice_7":"実装で Adam の $\\varepsilon$ のデフォルトがよく置かれるスケールは？\n1) **$10^{-8}$ 付近**\n2) $10^{2}$\n3) 正確に 0","choice_8":"同じモデルでバッチだけ大きくすると、一般に勾配推定の分散は？ ①**小さくなる傾向** ②常に同じ ③常に大きくなる","choice_9":"RNN 言語モデルで爆発する `grad` を抑えるのによく使う手法は？ ①**勾配クリッピング** ②常に有害 ③推論のみ","concept_0":"損失地形が急な狭い峡谷のとき、左右の振れを抑えるのに**最も直結**する組み合わせは？ ①データ拡張のみ ②**モメンタム・lr・条件数/スケジュール** ③バッチ=1 固定","concept_1":"Adam の bias correction が主に和らげようとするものは？\n1) 序盤の $m,\\hat{v}$ が **0 近傍に残る偏り**\n2) 常に lr=0\n3) プーリングサイズ","concept_2":"疎な特徴で、よく更新される座標の AdaGrad ステップはどうなる傾向か？ ①**より小さく** ②常に同じ ③無限大","concept_3":"同じ訓練損失でもオプティマイザによって検証誤差が違ってもおかしくない説明として妥当なのは？\n1) **最適化軌跡・暗黙の正則化**が違い得る\n2) オプティマイザが損失式を変える\n3) 常に同じ","concept_4":"Nesterov が標準モメンタムと異なり**勾配を計算する位置**で差をつける。正しい説明は？ ①同じ ②**違う** ③逆伝播なし","concept_5":"RMSProp が AdaGrad のどの問題を和らげようとしたか？ ①二乗の蓄積が**発散的に大きくなる**傾向 ②常に lr 増加 ③softmax","concept_6":"大きなバッチ（例: 4096）で分散を減らしたあと収束を合わせるときよく検討するのは？\n1) **lr スケーリング（線形則など）**\n2) lr=0 固定\n3) データ削除","concept_7":"毎ステップ新しい `backward()` の前に、前の勾配を空にする慣習は？ ①**`optimizer.zero_grad()`** ②重み削除 ③損失固定","concept_8":"Adam で $\\sqrt{\\hat{v}}+\\epsilon$ で割ると、勾配が大きい座標の実効ステップは？ ①**相対的に小さく** ②常に同じ ③常に大きく","concept_9":"ImageNet スタイルの CNN で検証まで意識するときよく見る組み合わせは？\n1) **SGD+モメンタム + lr スケジュール**\n2) Adam だけ固定\n3) オプティマイザなし","calc_0":"[計算・記述] 訓練サンプル **48**、バッチ **16** のとき、1エポックのミニバッチステップ数を整数で入力。","calc_1":"[計算・記述] エポック **4**、エポックあたりステップ **25** のとき、パラメータ更新の総回数（整数）は？","calc_2":"[計算・記述] $\\eta=3$, $g=2$ のとき $\\eta g$ の値（整数）は？","calc_3":"[計算・記述] $\\beta=0.9$, $v=10$, $g=10$ のとき $v \\leftarrow \\beta v + (1-\\beta)g$ の結果（整数）は？","calc_4":"[計算・記述] $m=0$, $\\beta_1=0.9$, $g=20$ のとき $m \\leftarrow \\beta_1 m + (1-\\beta_1)g$ の結果（整数）は？","calc_5":"[計算・記述] $\\beta=0.5$, $v=6$, $g=2$ のとき $v \\leftarrow \\beta v + (1-\\beta)g$ の結果（整数）は？","calc_6":"[計算・記述] $\\beta_1=0.9$, $m=10$, $g=0$ のとき $m \\leftarrow \\beta_1 m + (1-\\beta_1)g$ の結果（整数）は？","calc_7":"[計算・記述] $t=1$, $\\beta_1=0.9$ のとき $1/(1-\\beta_1^t)$ の値（整数）は？","calc_8":"[計算・記述] サンプル **2048**、バッチ **256** のとき1エポックのステップ数（整数）は？","calc_9":"[計算・記述] 学習率 **0.002** にスケール **500** を掛けた値（整数）は？"},"problemAnswers":{"definition_0":2,"definition_1":2,"definition_2":2,"definition_3":2,"definition_4":2,"definition_5":2,"definition_6":1,"definition_7":2,"definition_8":1,"definition_9":2,"trueFalse_0":1,"trueFalse_1":0,"trueFalse_2":1,"trueFalse_3":1,"trueFalse_4":1,"trueFalse_5":0,"trueFalse_6":1,"trueFalse_7":1,"trueFalse_8":1,"trueFalse_9":0,"scenario_0":1,"scenario_1":1,"scenario_2":1,"scenario_3":1,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1,"choice_0":2,"choice_1":1,"choice_2":1,"choice_3":1,"choice_4":1,"choice_5":1,"choice_6":1,"choice_7":1,"choice_8":1,"choice_9":1,"concept_0":2,"concept_1":1,"concept_2":2,"concept_3":1,"concept_4":2,"concept_5":1,"concept_6":2,"concept_7":1,"concept_8":2,"concept_9":1,"calc_0":3,"calc_1":100,"calc_2":6,"calc_3":10,"calc_4":2,"calc_5":4,"calc_6":9,"calc_7":10,"calc_8":8,"calc_9":1},"problemSolutions":{"definition_0":"**1) 概念:** 勾配降下は損失を下げる方向へ進むには勾配の**反対**へ動かす。**2) 例:** ロジスティック回帰で1ステップは $\\theta\\leftarrow\\theta-\\eta\\nabla L$。**3) 正解 2**","definition_1":"**1) 概念:** ミニバッチ SGD は**部分集合**で $\\hat{g}$ を推定する。**2) 例:** バッチ64なら64サンプルで勾配を作る。**3) 正解 2**","definition_2":"**1) 概念:** モメンタムは速度 $v$ に勾配を混ぜ**慣性**を付ける。**2) 例:** 狭い谷で振れが減る。**3) 正解 2**","definition_3":"**1) 概念:** Nesterov は**先読み**形で勾配を見る。**2) 実務:** `torch.optim.SGD(..., nesterov=True)` など。**3) 正解 2**","definition_4":"**1) 概念:** AdaGrad は勾配**二乗**を累積して割る。**2) 正解 2**","definition_5":"**1) 概念:** RMSProp は二乗勾配の**EMA** を使う。**2) 正解 2**","definition_6":"**1) 概念:** Adam は1次・2次モメンタを同時に使う。**2) 正解 1**","definition_7":"**1) 概念:** $\\eta$ が大きいと振動・NaN などが出得るが「常にもっと速く収束する」保証はない。**2) 選択肢②はその誤解。**3) 正解 2**","definition_8":"**1) 概念:** 1次モメンタは勾配の**EMA**。**2) 正解 1**","definition_9":"**1) 概念:** データ・モデル・安定性・速度を見る。**2) 正解 2**","trueFalse_0":"勾配降下は勾配の反対向きが正しい。**正解 1**","trueFalse_1":"モメンタムは学習率を 0 にしない。**正解 0**","trueFalse_2":"Adam は適応型＋モメンタム的要素を併用し得る。**正解 1**","trueFalse_3":"AdaGrad は累積でステップが極小になり得る。**正解 1**","trueFalse_4":"RMSProp の中核は二乗勾配の EMA。**正解 1**","trueFalse_5":"バッチが大きいと分散は**小さくなる傾向**があり、文は誤り。**正解 0**","trueFalse_6":"学習率スケジューリングは時間で $\\eta$ を変える。**正解 1**","trueFalse_7":"Nesterov は先読みの考え方を含む。**正解 1**","trueFalse_8":"$$\\varepsilon$ は数値安定用。**正解 1**","trueFalse_9":"常に Adam が優れるとは限らない。**正解 0**","scenario_0":"**1) 状況:** 振れは $\\eta$ 過大・モメンタム不足などが多い。**2) 例:** CNN で loss が乱れると lr を10倍下げる。**3) 正解 1**","scenario_1":"**1) 適応型 Adam は速い NLP 実験に多用。**2) 正解 1**","scenario_2":"**1) ビジョンでは SGD+モメンタムまたは Adam が多い。**2) 正解 1**","scenario_3":"**1) AdaGrad が詰まったら RMSProp/Adam を検討。**2) 正解 1**","scenario_4":"**1) スケジューラで $\\eta$ を変える。**2) 正解 1**","scenario_5":"**1) クリッピング・lr・初期化を確認。**2) 正解 1**","scenario_6":"**1) $\\beta$↑で慣性↑。**2) 正解 1**","scenario_7":"**1) AdamW が代表。**2) 正解 1**","scenario_8":"**1) 過学習は正則化・データが先。**2) 正解 1**","scenario_9":"**1) 分散学習ではシャッフル・同期を点検。**2) 正解 1**","choice_0":"**1) ミニバッチのノイズが脱出に有利になり得る。**2) 正解 2**","choice_1":"**1) $\\beta\\approx0$ なら慣性ほぼなし。**2) 正解 1**","choice_2":"**1) 0.9, 0.999 が典型。**2) 正解 1**","choice_3":"**1) ウォームアップは序盤安定化。**2) 正解 1**","choice_4":"**1) 2次モメンタは二乗勾配 EMA。**2) 正解 1**","choice_5":"**1) AdamW は減衰分離。**2) 正解 1**","choice_6":"**1) モメンタムがジグザグ緩和に効く。**2) 正解 1**","choice_7":"**1) $\\varepsilon\\sim10^{-8}$ が一般的。**2) 正解 1**","choice_8":"**1) バッチ↑で分散↓傾向。**2) 正解 1**","choice_9":"**1) クリッピングは爆発緩和。**2) 正解 1**","concept_0":"**1) 狭い峡谷のジグザグはモメンタム・lr が核心。**2) 例: NLP Transformer で Adam+ウォームアップ。**3) 正解 2**","concept_1":"**1) 序盤モメンタは 0 からで偏りがある。**2) 正解 1**","concept_2":"**1) よく更新される座標は AdaGrad でステップが小さくなる。**2) 正解 2**","concept_3":"**1) 軌跡が違い汎化が変わり得る。**2) 正解 1**","concept_4":"**1) Nesterov は勾配評価位置が違う。**2) 正解 2**","concept_5":"**1) RMSProp は無限累積を和らげる。**2) 正解 1**","concept_6":"**1) 大バッチは lr スケーリングが要ることがある。**2) 正解 2**","concept_7":"**1) `zero_grad()` が慣習。**2) 正解 1**","concept_8":"**1) 分母が大きく実効ステップは小さく。**2) 正解 2**","concept_9":"**1) ビジョン大会は SGD+モメンタム+スケジュールが多い。**2) 正解 1**","calc_0":"**1) 計算:** $48/16=3$。**2) 例:** バッチ16なら48を3分割。**3) 正解 3**","calc_1":"**1) 計算:** $4\\times25=100$。**2) 正解 100**","calc_2":"**1) 計算:** $3\\times2=6$（問題の $\\eta=3,g=2$）。**2) 正解 6**","calc_3":"**1) 計算:** $0.9\\times10+0.1\\times10=10$。**2) 正解 10**","calc_4":"**1) 計算:** $0.1\\times20=2$。**2) 正解 2**","calc_5":"**1) 計算:** $0.5\\times6+0.5\\times2=4$。**2) 正解 4**","calc_6":"**1) 計算:** $0.9\\times10+0.1\\times0=9$。**2) 正解 9**","calc_7":"**1) 計算:** $1/(1-0.9)=10$。**2) 正解 10**","calc_8":"**1) 計算:** $2048/256=8$。**2) 正解 8**","calc_9":"**1) 計算:** $0.002\\times500=1$。**2) 正解 1**"},"problemTestCodes":{"definition_0":"answer = 2\nassert answer == 2","definition_1":"answer = 2\nassert answer == 2","definition_2":"answer = 2\nassert answer == 2","definition_3":"answer = 2\nassert answer == 2","definition_4":"answer = 2\nassert answer == 2","definition_5":"answer = 2\nassert answer == 2","definition_6":"answer = 1\nassert answer == 1","definition_7":"answer = 2\nassert answer == 2","definition_8":"answer = 1\nassert answer == 1","definition_9":"answer = 2\nassert answer == 2","trueFalse_0":"answer = 1\nassert answer == 1","trueFalse_1":"answer = 0\nassert answer == 0","trueFalse_2":"answer = 1\nassert answer == 1","trueFalse_3":"answer = 1\nassert answer == 1","trueFalse_4":"answer = 1\nassert answer == 1","trueFalse_5":"answer = 0\nassert answer == 0","trueFalse_6":"answer = 1\nassert answer == 1","trueFalse_7":"answer = 1\nassert answer == 1","trueFalse_8":"answer = 1\nassert answer == 1","trueFalse_9":"answer = 0\nassert answer == 0","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 1\nassert answer == 1","scenario_3":"answer = 1\nassert answer == 1","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1","choice_0":"answer = 2\nassert answer == 2","choice_1":"answer = 1\nassert answer == 1","choice_2":"answer = 1\nassert answer == 1","choice_3":"answer = 1\nassert answer == 1","choice_4":"answer = 1\nassert answer == 1","choice_5":"answer = 1\nassert answer == 1","choice_6":"answer = 1\nassert answer == 1","choice_7":"answer = 1\nassert answer == 1","choice_8":"answer = 1\nassert answer == 1","choice_9":"answer = 1\nassert answer == 1","concept_0":"answer = 2\nassert answer == 2","concept_1":"answer = 1\nassert answer == 1","concept_2":"answer = 2\nassert answer == 2","concept_3":"answer = 1\nassert answer == 1","concept_4":"answer = 2\nassert answer == 2","concept_5":"answer = 1\nassert answer == 1","concept_6":"answer = 2\nassert answer == 2","concept_7":"answer = 1\nassert answer == 1","concept_8":"answer = 2\nassert answer == 2","concept_9":"answer = 1\nassert answer == 1","calc_0":"n, b = 48, 16\nanswer = n // b\nassert answer == 3","calc_1":"answer = 4 * 25\nassert answer == 100","calc_2":"eta, g = 3, 2\nanswer = eta * g\nassert answer == 6","calc_3":"beta, v, g = 0.9, 10, 10\nanswer = int(beta * v + (1 - beta) * g)\nassert answer == 10","calc_4":"beta1, m, g = 0.9, 0, 20\nanswer = int((1 - beta1) * g)\nassert answer == 2","calc_5":"beta, v, g = 0.5, 6, 2\nanswer = int(beta * v + (1 - beta) * g)\nassert answer == 4","calc_6":"beta1, m, g = 0.9, 10, 0\nanswer = int(beta1 * m + (1 - beta1) * g)\nassert answer == 9","calc_7":"beta1, t = 0.9, 1\nanswer = int(1 / (1 - beta1 ** t))\nassert answer == 10","calc_8":"n, b = 2048, 256\nanswer = n // b\nassert answer == 8","calc_9":"lr, k = 0.002, 500\nanswer = int(round(lr * k))\nassert answer == 1"},"problemDifficulty":{"definition_0":"easy","definition_1":"easy","definition_2":"easy","definition_3":"easy","definition_4":"easy","definition_5":"easy","definition_6":"easy","definition_7":"easy","definition_8":"easy","definition_9":"easy","trueFalse_0":"easy","trueFalse_1":"easy","trueFalse_2":"easy","trueFalse_3":"easy","trueFalse_4":"easy","trueFalse_5":"easy","trueFalse_6":"easy","trueFalse_7":"easy","trueFalse_8":"easy","trueFalse_9":"easy","scenario_0":"medium","scenario_1":"medium","scenario_2":"medium","scenario_3":"medium","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","choice_0":"medium","choice_1":"medium","choice_2":"medium","choice_3":"medium","choice_4":"medium","choice_5":"medium","choice_6":"medium","choice_7":"medium","choice_8":"medium","choice_9":"medium","concept_0":"hard","concept_1":"hard","concept_2":"hard","concept_3":"hard","concept_4":"hard","concept_5":"hard","concept_6":"hard","concept_7":"hard","concept_8":"hard","concept_9":"hard","calc_0":"hard","calc_1":"hard","calc_2":"hard","calc_3":"hard","calc_4":"hard","calc_5":"hard","calc_6":"hard","calc_7":"hard","calc_8":"hard","calc_9":"hard"},"problemOrder":["definition_0","definition_1","definition_2","definition_3","definition_4","definition_5","definition_6","definition_7","definition_8","definition_9","trueFalse_0","trueFalse_1","trueFalse_2","trueFalse_3","trueFalse_4","trueFalse_5","trueFalse_6","trueFalse_7","trueFalse_8","trueFalse_9","scenario_0","scenario_1","scenario_2","scenario_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","choice_0","choice_1","choice_2","choice_3","choice_4","choice_5","choice_6","choice_7","choice_8","choice_9","concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","concept_6","concept_7","concept_8","concept_9","calc_0","calc_1","calc_2","calc_3","calc_4","calc_5","calc_6","calc_7","calc_8","calc_9"]},"midDlCh03":{"chapter":"Chapter 03","title":"学習率スケジューリング：時に応じて速度を落とす","description":"山頂から谷底へ、目隠しをして下ると想像してください。最初は大きな歩幅で一気に下るのが効率的です。しかし底に近づくと、同じ大きな歩幅のままだと**最小値を飛び越え**、反対側の斜面を上り下りしながらぐるぐる回ることになります。\n\nCh.02の**オプティマイザ**が「どちらへ歩くか」のコンパスなら、Ch.03の**学習率スケジューラ**は「いつ歩幅を狭めるか」を決める**ブレーキとアクセル**です。初めは広い歩幅で地形を探索し、目的地に近づくほど小さく精密に着地させ、モデルの潜在力を引き出す実戦的な速度調整を学びます。","sectionTitle":"学習率スケジューリング：時に応じて速度を落とす","whatIs":{"0":"**1. 学習率スケジューリングとは？（固定歩幅の罠）**\n\n**概念：** Ch.02 **オプティマイザ**が**方向**を決めれば、スケジューリングは**歩幅（学習率 $\\eta$）**を時間に応じて変えます。各ステップで $\\eta_t$ が変わり、**一歩の大きさ**が変わります。\n\n**比喩：** 序盤は大通りを大股で、谷底付近は小さく精密に歩く。最初から最後まで固定 $\\eta$ だと、序盤は遅く、終盤は最小値を**飛び越えて**振動し続けます。\n\n**実践：** Ch.02 で方向を決めたら、Ch.03 は**時間軸の歩幅設計**。**メモに「歩幅・誤差」を一緒に書く**と、減速タイミングと成績の関係が一目で分かります。","1":"**2. 段階的減衰：ガクッとブレーキ**\n\n**概念：** 指定区間ごとに $\\eta$ を**一気に**下げ、多くは **×0.1（$\\gamma$）**。30・60・90 など**複数の時点**で減衰。\n\n**比喩：** エレベーターが決まった階で速度を落とすイメージ。「いつ」下げるかだけ決めれば、あとはスケジューラ任せ。\n\n**実践：** 画像分類のように**長く**学習するときによく使います。$\\gamma$ が小さすぎ・早すぎ → **学習不足**。減衰回数・タイミングをメモしましょう。","2":"**3. 滑らか減速とウォームアップ：予熱**\n\n**概念：** **コサイン減速**は $\\eta$ を**滑らかに**減らし後半の微調整に有利。**ウォームアップ**は**序盤だけ** 0→目標へゆっくり上げ、大きな初期 $\\eta$ の衝撃を和らげます。\n\n**比喩：** コサイン＝ジェットコースター停止、ウォームアップ＝寒い朝の**エンジン予熱**。\n\n**実践：** **文章AI・画像AI** など大きなモデルでは **予熱 + 滑らか減速** が多い。予熱は全体の **5〜10%** 程度。Ch.02 オプティマイザと組み合わせると序盤の**誤差の暴れ**を抑えやすい。","3":"**4. 成績ベース減衰（Plateau）と OneCycle**\n\n**概念：** **Plateau** は**テスト成績（検証損失・精度）**を見る。**patience** 区間改善なしで $\\eta \\leftarrow \\text{factor}\\cdot\\eta$（例 0.1）。**OneCycle** は短期間に $\\eta$ を**上げてから下げる**一サイクル戦略。\n\n**比喩：** Plateau＝渋滞時だけナビが減速、OneCycle＝短距離スプリント後に滑らか停止。\n\n**実践：** データ・モデル規模が不明なら **Plateau** が安全。**OneCycle** は**短い練習**向け。Ch.02 オプティマイザと「方向＋速度」が揃います。"},"whyImportant":{"0":"**1. 同じ学習時間でより良い結果**\n\n適切なスケジュールは**同じ時間**でも誤差↓・精度↑をもたらすことが多いです。後半に減速すると**精密着地**できます。","1":"**2. Ch.02 オプティマイザの“半分”を完成**\n\nオプティマイザは方向と歩幅を調整しますが、**時間で全体歩幅を縮める**のはスケジューラ。**予熱なし＋大初期 $\\eta$** → 誤差爆発；**終盤減速なし** → 最小値周辺を永遠にグルグル。","2":"**3. 成績が伸びないとき最初に見るグラフ**\n\n**歩幅(LR)グラフ**が **完全平坦(━)** → スケジュール**更新漏れ・タイミング誤り**；**早すぎる急降下** → 学習不足；**高止まり** → 終盤振動。Ch.02 の lr・オプティマイザと**最初に**確認。"},"howUsed":{"0":"**① 序盤・中盤・終盤 — 歩幅は変える**\n\n町探訪の「大通り→路地→玄関一歩ずつ」。学習も **探索→収束→着地** の3幕。序盤大 $\\eta$ で広く探し、中盤からブレーキ、終盤小 $\\eta$ で仕上げ。スケジューラは**今どの幕か**を教えるタイマー。","1":"**② 性格の違うスケジューラ — 用途で選ぶ**\n\n**Step**＝決まった時点で一気減速（**長い**学習）。**Cosine**＝**滑らか**終盤（文章AIなど）。**Warmup**＝**序盤予熱**（大規模モデル）。**Plateau**＝**成績停滞**時のみ。**OneCycle**＝**短い**練習用。","2":"**③ 一歩の黄金順序 — 順番が狂うとスケジュールが効かない**\n\n**① 誤差・損失で坂の急さを確認** → **② Ch.02 オプティマイザで一歩** → **③ スケジューラで次の歩幅**。 **Plateau** は検証成績が伸びないときだけブレーキ。","3":"**④ 学習率と損失グラフを一緒に**\n\n損失が停滞したあと**歩幅を下げた瞬間**に一気に下がれば成功。**早すぎる**減速は学習不足。\n\n**症状別:** 序盤誤差暴れ → Warmup；終盤ジグザグ → Cosine/Step/Plateau；LR 平坦 → **スケジュール更新**確認。**メモ**を残す。"},"problemSolving":{"0":"学習率スケジューリングは Ch.02 **オプティマイザ**の方向に沿って**歩幅**を時間・成績で変えます。**Step**段階減衰、**Cosine**滑らか減速、**Warmup**序盤のみ歩幅**上げ**、**Plateau**は成績停滞時のみ。順序は**誤差確認→一歩→次の歩幅**、**Plateau**は検証指標も参照。序盤誤差暴れ→**Warmup**、終盤ジグザグ→**Cosine/Step/Plateau**、LR平坦→**スケジュール更新漏れ**。","2":"**例（定義）**\n\n\"段階減衰でN区間ごとに$\\eta$に掛ける係数の名前は? ① patience ② gamma ③ beta\"\n\n減衰係数は **$\\gamma$(gamma)** である。 → **答え2**\n\n---\n\n**例（応用）**\n\n\"文章AI学習序盤で誤差が不安定。Ch.02 オプティマイザと一緒に先に検討する組み合わせは? ① 予熱 + 滑らか減速 ② $\\eta$を無限増加 ③ スケジューラ削除のみ\"\n\n序盤の不安定さ → **予熱 + 滑らか減速** を優先検討。 → **答え1**\n\n---\n\n**例（計算）**\n\n$\\eta_0=0.1$, $\\gamma=0.1$, Step減衰 **2回** 後の $\\eta$(×1000, 整数)は?\n\n$0.1 \\times 0.1^2 = 0.001$ → ×1000 = **1**。 → **答え1**","3":"**定義例** — \"Warmupの主な目的は? ① データ拡張 ② 序盤の大きな学習率による不安定の緩和 ③ 重み0\" → Warmupは序盤に$\\eta$をゆっくり上げて衝撃を和らげる。 **答え2**\n\n---\n\n**真偽例** — \"ReduceLROnPlateauは検証指標を見る。\" → 正しい。 **答え1**\n\n---\n\n**応用例** — \"検証損失が5エポック連続で改善しない\" → Plateauは検証停滞時に介入する。 **答え1**\n\n---\n\n**選択例** — \"終盤の滑らかな減速に近いのは? ① StepLRのみ ② CosineAnnealing\" → Cosineはcos曲線で滑らかに減速する。 **答え2**\n\n---\n\n**概念例** — \"Ch.02 オプティマイザ + Ch.03 スケジュールの組み合わせが多い理由? ① 方向決定と時間別歩幅調整が相補的 ② 逆伝播の代替\" → オプティマイザとスケジューラは相補関係。 **答え1**\n\n---\n\n**計算例** — \"サンプル128、バッチ32のとき1エポックのステップ数(整数)?\" → $128/32=4$。 **答え4**"},"summary":"**一行：** 学習率スケジューリングは**歩幅($\\eta$)**を調整し、序盤**探索**と終盤**精密着地**を両立します。\n\n**主要スケジューラ：** **Step**、**Cosine**、**Warmup**、**Plateau**、**OneCycle** — 場面に応じて選択。\n\n**点検（症状→優先確認）**\n- 序盤誤差暴れ：歩幅を下げる、**Warmup**\n- 終盤ジグザグ・未収束：**Cosine/Step/Plateau**、$\\gamma$、patience\n- LR 平坦(━)：**スケジュール更新漏れ**・区間の混同\n- 成績のみ停滞：Plateau、データ・モデル設定\n\n**チューニング順：** 1) 誤差・歩幅**メモ** → 2) 基本歩幅・Warmup → 3) Ch.02 オプティマイザ → 4) スケジュール → 5) 一度に一変数\n\nCh.02 **オプティマイザ（コンパス）** ＋ Ch.03 **スケジューラ（ブレーキ・アクセル）** ＝実務標準。","sectionLabels":{"whatIs":"どんな概念か","whyImportant":"なぜ重要か","howUsed":"どう使うか","summary":"まとめ"},"formulaGuide":{"title":"スケジューラ早見表","step":"**Step / MultiStep** — N 区間（時点）ごとに $\\eta \\leftarrow \\gamma \\cdot \\eta$。$\\gamma$ は多く **0.1**。**長い**学習でよく使う段階減衰。","cosine":"**Cosine Annealing** — $\\eta_t = \\eta_{\\min} + \\frac{1}{2}(\\eta_{\\max}-\\eta_{\\min})(1+\\cos\\frac{\\pi t}{T})$。滑らか減速。","warmup":"**Warmup** — 序盤 $s$ ステップで $\\eta \\approx \\frac{s}{S}\\eta_{\\text{target}}$ と**ゆっくり上昇**。大モデル序盤の**誤差の暴れ**を和らげる。","plateau":"**ReduceLROnPlateau** — **patience** エポック改善なしで $\\eta \\leftarrow \\text{factor}\\cdot\\eta$。「詰まったときだけ」ブレーキ。"},"visual":"エポック軸上で**固定・Step・Cosine・Warmup+Cosine**の4曲線をアニメ比較。オプティマイザが方向、スケジューラが歩幅。","problemSolvingLabel":"問題の解き方","practiceProblemsTitle":"練習問題","practiceProblemsIntro":"**60問バンク**からランダム **5問**(易2・中2・難1、順序は易→中→難)。選択肢番号を選んでください。","practiceProblemsInstruction":"問題を読み、最も適切な選択肢を選んでください。","midDlCh03VisualIntro":"Ch.02 **オプティマイザ**＝コンパス（方向）、Ch.03 **スケジューラ**＝ブレーキ・アクセル（歩幅）。**学習率曲線**の比較です。","midDlCh03VisualStep0":"① **固定学習率** — 終始同じ歩幅。終盤に最小値を飛び越える可能性","midDlCh03VisualStep1":"② **Step decay** — 30・60・90階のように決まったエポックで一気に減速","midDlCh03VisualStep2":"③ **Cosine** — 滑らか減速。長い学習・文章AIでよく使う","midDlCh03VisualStep3":"④ **Warmup+Cosine** — 予熱後に滑らか減速。Ch.02 オプティマイザと相性◎","midDlCh03VisualConceptTitle":"概念：オプティマイザ（方向）＋スケジューラ（歩幅）→ 1ステップ学習","midDlCh03VisualFlowTitle":"一歩の順序：誤差確認 → 一歩 → 次の歩幅","midDlCh03VisualModelTitle":"スケジューラが毎エポック（ステップ）**次の歩幅**を決める","midDlCh03VisualLegendFixed":"固定","midDlCh03VisualLegendStep":"Step","midDlCh03VisualLegendCosine":"Cosine","midDlCh03VisualLegendWarmup":"Warmup+Cosine","midDlCh03VisualCaption":"**固定→Step→Cosine→Warmup+Cosine**を順に表示。点が曲線を動き**今の歩幅**を示します。","problems":{"definition_0":"学習率スケジューリングの主目的に最も近いのは?\n1) 常にAdam固定\n2) **時間(または指標)に応じて $\\eta$ を調整**し探索と収束のバランス\n3) 逆伝播を省略","definition_1":"StepLRで N エポックごとに $\\eta$ に掛ける係数は?\n1) patience\n2) **$\\gamma$**\n3) $\\beta$","definition_2":"Cosine annealing で $t=0$ の $\\eta$ に最も近いのは?\n1) **$\\eta_{\\max}$**\n2) $\\eta_{\\min}$\n3) 常に0","definition_3":"Warmupの主目的は?\n1) データ拡張\n2) **初期の大きな $\\eta$ による不安定の緩和**\n3) 重みを0に","definition_4":"ReduceLROnPlateauが主に見る信号は?\n1) **検証損失・精度など**\n2) GPU温度\n3) ファイルサイズ","definition_5":"エポック単位Step減衰で、歩幅を下げる**最も**自然なタイミングは?\n1) データ1バッチを見る**前**\n2) **1エポック(全データ1周)の学習が終わった後**\n3) モデル保存時のみ","definition_6":"スケジューラ適用後の更新関係として正しいのは?\n1) **$\\theta \\leftarrow \\theta - \\eta_t g$**\n2) $\\eta_t$が損失を変える\n3) スケジューラが逆伝播を代替","definition_7":"学習率スケジューリングの説明として**誤り**なのは?\n1) Cosineは滑らかに減衰\n2) **常に $\\eta$ を増やすだけが核心**\n3) Plateauは指標停滞で減衰","definition_8":"MultiStepLRの特徴は?\n1) ミニバッチごとに乱数 $\\eta$\n2) **指定エポック(マイルストーン)で減衰**\n3) 検証指標不要","definition_9":"OneCycleLRに近い説明は?\n1) **1サイクルで $\\eta$ が上がってから下がる**\n2) $\\eta$ を永遠に0\n3) バッチサイズのみ変更","trueFalse_0":"[真偽] スケジューリングは学習中に $\\eta$ を変えられる。正=1, 誤=0","trueFalse_1":"[真偽] StepLRは step_size エポックごとに $\\gamma$ を掛ける。正=1, 誤=0","trueFalse_2":"[真偽] Cosineは $T$ 終端で $\\eta_{\\min}$ 付近へ行ける。正=1, 誤=0","trueFalse_3":"[真偽] Warmupは初期ステップで $\\eta$ をゆっくり上げる。正=1, 誤=0","trueFalse_4":"[真偽] ReduceLROnPlateauは検証損失・精度など**成績指標**を見る。正=1, 誤=0","trueFalse_5":"[真偽] 次の歩幅(学習率)は通常**今の一歩を踏む前**に決める。正=1, 誤=0","trueFalse_6":"[真偽] 固定 $\\eta$ が常にスケジュールより優れる。正=1, 誤=0","trueFalse_7":"[真偽] CosineAnnealingWarmRestartsは周期再開できる。正=1, 誤=0","trueFalse_8":"[真偽] ExponentialLRは $\\eta \\leftarrow \\gamma \\eta$ が多い。正=1, 誤=0","trueFalse_9":"[真偽] スケジューラだけで最適化器なしに更新される。正=1, 誤=0","scenario_0":"[応用] 文章AI学習の序盤で誤差が不安定。Ch.02オプティマイザと一緒に**最初**に試す組み合わせは? ① **予熱(Warmup)+滑らかな減速(Cosine)** ② $\\eta$ 無限増 ③ スケジューラ削除のみ","scenario_1":"[応用] 画像分類を**長く**学習する。階段式減衰のタイミングに近いのは? ① **30/60/90 など決めた区間** ② 最初のバッチのみ ③ 検証なしで毎ステップ10倍","scenario_2":"[応用] 検証損失が5エポック改善なし。自動で $\\eta$ を下げるのは? ① **ReduceLROnPlateau** ② 固定 $\\eta$ のみ ③ データ削除","scenario_3":"[応用] 階段より**滑らかな**後半減衰は? ① StepLRのみ ② **CosineAnnealingLR** ③ バッチ=0","scenario_4":"[応用] 学習記録でLRが**完全に水平**。まず疑うのは? ① **スケジュールが更新されていない・タイミングずれ** ② GPU色 ③ オプティマイザ名","scenario_5":"[応用] バッチ4倍—Ch.02と合わせて見るのは? ① **base $\\eta$・warmup・線形スケーリング** ② $\\eta$=0固定 ③ 逆伝播停止","scenario_6":"[応用] 少量データ微調整で強い減衰を避けるには? ① **小さい base $\\eta$ + Plateau/短Cosine** ② 毎ステップ $\\eta$×10 ③ スケジュールなしで無限 $\\eta$","scenario_7":"[応用] 短い学習時間で素早い試し走り? ① **OneCycle** ② 常に $\\eta$=0 ③ 検証スキップのみ","scenario_8":"[応用] 序盤の誤差急上昇—スケジュールと**一緒に**下げるのは? ① **基本歩幅(学習率)** ② レイヤー数のみ ③ バッチサイズだけ増やす","scenario_9":"[応用] 文章AIで予熱なし大 $\\eta$。次の実験は? ① **予熱(Warmup)区間を追加** ② $\\eta$ 100倍増 ③ オプティマイザ削除","choice_0":"後半の**滑らかな** $\\eta$ 減少に近いのは? ① StepLR ② **CosineAnnealing** ③ 固定 $\\eta$","choice_1":"Plateauの **patience** は? ① **改善がない待ちエポック数** ② バッチサイズ ③ $\\gamma$","choice_2":"factor=0.1 なら $\\eta$ は? ① **×0.1** ② 10倍増 ③ 変化なし","choice_3":"LinearLRの特徴は? ① **線形に変化** ② cosのみ ③ 逆伝播省略","choice_4":"Cosineで $\\eta_{\\min}>0$ の理由に近いのは? ① **完全停止せず微小更新** ② $\\eta$ 発散 ③ データ拡張","choice_5":"CyclicLRの直感は? ① **周期的に上下** ② 一度だけ減衰 ③ 検証指標必須","choice_6":"Warmupを学習の5–10%にする理由は? ① **序盤を安定させる** ② 常に学習不足 ③ パソコンを冷やす","choice_7":"LambdaLRの特徴は? ① **カスタム倍率関数** ② 特定オプティマイザ専用 ③ バッチのみ","choice_8":"階段式減衰の**減速タイミング一覧**とは? ① **減衰する区間(エポック)のリスト** ② 損失関数名 ③ ドロップアウト率","choice_9":"Ch.02オプティマイザ+スケジュールが多い理由は? ① **方向決定と時間別歩幅が相補** ② スケジュールが逆伝播代替 ③ 固定歩幅のみ","concept_0":"WarmupがCh.02オプティマイザ序盤に効く理由は? ① **大きな歩幅の不安定を和らげる** ② データ削除 ③ バッチ=1必須","concept_1":"バッチ2倍の線形LRスケーリングは? ① **base $\\eta$ も約2倍を検討** ② $\\eta$ 半分のみ ③ スケジュール不要","concept_2":"Cosine $T=20,t=10,\\eta_{\\max}=0.2,\\eta_{\\min}=0$ で $\\eta$×1000整数に近いのは? ① 200 ② **100** ③ 0","concept_3":"Plateau `mode='min'` は? ① **損失最小化** ② 精度最大化のみ不可 ③ 学習率最大化","concept_4":"OneCycle vs Step で正しいのは? ① 同一 ② **OneCycleは上昇後下降、Stepは階段** ③ Stepのみ指標ベース","concept_5":"WarmRestartsが役立つことがあるのは? ① **周期的 $\\eta$ 再上昇で脱出試行** ② 常に発散 ③ 推論のみ","concept_6":"早すぎる大 $\\gamma$ 減衰のリスクは? ① **underfitting** ② 常に速い収束 ③ NaNのみ","concept_7":"再開時 `last_epoch` を渡す理由は? ① **スケジュール状態を継続** ② オプティマイザ削除 ③ データシャッフル禁止","concept_8":"Polynomial decayで power が大きいほど? ① **後半減衰が急** ② $\\eta$ 増加 ③ warmup不可","concept_9":"誤差と歩幅を一緒にメモする理由は? ① **減衰タイミングと成績を結び付け** ② ファイル名統一 ③ 画面の色","calc_0":"[計算] $\\eta_0=0.1,\\gamma=0.1$, decay **2回** 後 $\\eta$×1000整数は?","calc_1":"[計算] **60** エポック, step_size=**20** の decay 回数は?","calc_2":"[計算] Warmup **10**, step=**5**, $\\eta_{target}=0.002$ で $\\eta$×1000整数は?","calc_3":"[計算] $\\eta$×1000=**1000**, factor=**0.5** を **2回** — 結果×1000整数は?","calc_4":"[計算] Cosine $T=10,t=5,\\eta_{\\max}=0.1,\\eta_{\\min}=0$ で $\\eta$×1000整数は?","calc_5":"[計算] サンプル**128**, バッチ**32** の1エポックステップ数は?","calc_6":"[計算] $\\eta=0.01$ に **0.1** を掛けた $\\eta$×1000整数は?","calc_7":"[計算] $\\eta$×1000=**100**, factor=**0.5** 1回後の整数は?","calc_8":"[計算] $\\eta_0$×1000=**100**, $\\gamma=0.9$, **3** エポック後(四捨五入整数)は?","calc_9":"[計算] Warmup **500**, step **250**, peak×1000=**10** の現在×1000整数は?"},"problemAnswers":{"definition_0":2,"definition_1":2,"definition_2":1,"definition_3":2,"definition_4":1,"definition_5":2,"definition_6":1,"definition_7":2,"definition_8":2,"definition_9":1,"trueFalse_0":1,"trueFalse_1":1,"trueFalse_2":1,"trueFalse_3":1,"trueFalse_4":1,"trueFalse_5":0,"trueFalse_6":0,"trueFalse_7":1,"trueFalse_8":1,"trueFalse_9":0,"scenario_0":1,"scenario_1":1,"scenario_2":1,"scenario_3":2,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1,"choice_0":2,"choice_1":1,"choice_2":1,"choice_3":1,"choice_4":1,"choice_5":1,"choice_6":1,"choice_7":1,"choice_8":1,"choice_9":1,"concept_0":1,"concept_1":1,"concept_2":2,"concept_3":1,"concept_4":2,"concept_5":1,"concept_6":1,"concept_7":1,"concept_8":1,"concept_9":1,"calc_0":1,"calc_1":3,"calc_2":1,"calc_3":250,"calc_4":50,"calc_5":4,"calc_6":1,"calc_7":50,"calc_8":73,"calc_9":5},"problemSolutions":{"definition_0":"**1) $\\eta_t$ を調整。**2) 正解 2**","definition_1":"**1) $\\gamma$。**2) 正解 2**","definition_2":"**1) $t=0$ は $\\eta_{\\max}$。**2) 正解 1**","definition_3":"**1) 初期安定。**2) 正解 2**","definition_4":"**1) 検証指標。**2) 正解 1**","definition_5":"**1) エポック終了後。**2) 正解 2**","definition_6":"**1) $\\eta_t$ がステップ幅。**2) 正解 1**","definition_7":"**1) 増加のみは誤り。**2) 正解 2**","definition_8":"**1) マイルストーン減衰。**2) 正解 2**","definition_9":"**1) 上昇後下降。**2) 正解 1**","trueFalse_0":"正。**1**","trueFalse_1":"正。**1**","trueFalse_2":"正。**1**","trueFalse_3":"正。**1**","trueFalse_4":"正。**1**","trueFalse_5":"次の歩幅は**一歩の後**。誤。**0**","trueFalse_6":"誤。**0**","trueFalse_7":"正。**1**","trueFalse_8":"正。**1**","trueFalse_9":"誤。**0**","scenario_0":"**Warmup+Cosine。正解 1**","scenario_1":"**30/60/90。正解 1**","scenario_2":"**Plateau。正解 1**","scenario_3":"**Cosine。正解 2**","scenario_4":"**スケジュール更新。正解 1**","scenario_5":"**LRスケーリング。正解 1**","scenario_6":"**穏やか減衰。正解 1**","scenario_7":"**OneCycle。正解 1**","scenario_8":"**base lr。正解 1**","scenario_9":"**Warmup追加。正解 1**","choice_0":"**Cosine。正解 2**","choice_1":"**patience。正解 1**","choice_2":"**×0.1。正解 1**","choice_3":"**線形。正解 1**","choice_4":"**微小更新。正解 1**","choice_5":"**周期。正解 1**","choice_6":"**初期安定。正解 1**","choice_7":"**Lambda。正解 1**","choice_8":"**milestones。正解 1**","choice_9":"**相補。正解 1**","concept_0":"**Adam初期。正解 1**","concept_1":"**2倍スケール。正解 1**","concept_2":"**100。正解 2**","concept_3":"**min。正解 1**","concept_4":"**違い。正解 2**","concept_5":"**再開。正解 1**","concept_6":"**underfit。正解 1**","concept_7":"**last_epoch。正解 1**","concept_8":"**急減衰。正解 1**","concept_9":"**ログ。正解 1**","calc_0":"**1。正解 1**","calc_1":"**3。正解 3**","calc_2":"**1。正解 1**","calc_3":"**250。正解 250**","calc_4":"**50。正解 50**","calc_5":"**4。正解 4**","calc_6":"**1。正解 1**","calc_7":"**50。正解 50**","calc_8":"**73。正解 73**","calc_9":"**5。正解 5**"},"problemTestCodes":{"definition_0":"answer = 2\nassert answer == 2","definition_1":"answer = 2\nassert answer == 2","definition_2":"answer = 1\nassert answer == 1","definition_3":"answer = 2\nassert answer == 2","definition_4":"answer = 1\nassert answer == 1","definition_5":"answer = 2\nassert answer == 2","definition_6":"answer = 1\nassert answer == 1","definition_7":"answer = 2\nassert answer == 2","definition_8":"answer = 2\nassert answer == 2","definition_9":"answer = 1\nassert answer == 1","trueFalse_0":"answer = 1\nassert answer == 1","trueFalse_1":"answer = 1\nassert answer == 1","trueFalse_2":"answer = 1\nassert answer == 1","trueFalse_3":"answer = 1\nassert answer == 1","trueFalse_4":"answer = 1\nassert answer == 1","trueFalse_5":"answer = 0\nassert answer == 0","trueFalse_6":"answer = 0\nassert answer == 0","trueFalse_7":"answer = 1\nassert answer == 1","trueFalse_8":"answer = 1\nassert answer == 1","trueFalse_9":"answer = 0\nassert answer == 0","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 1\nassert answer == 1","scenario_3":"answer = 2\nassert answer == 2","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1","choice_0":"answer = 2\nassert answer == 2","choice_1":"answer = 1\nassert answer == 1","choice_2":"answer = 1\nassert answer == 1","choice_3":"answer = 1\nassert answer == 1","choice_4":"answer = 1\nassert answer == 1","choice_5":"answer = 1\nassert answer == 1","choice_6":"answer = 1\nassert answer == 1","choice_7":"answer = 1\nassert answer == 1","choice_8":"answer = 1\nassert answer == 1","choice_9":"answer = 1\nassert answer == 1","concept_0":"answer = 1\nassert answer == 1","concept_1":"answer = 1\nassert answer == 1","concept_2":"answer = 2\nassert answer == 2","concept_3":"answer = 1\nassert answer == 1","concept_4":"answer = 2\nassert answer == 2","concept_5":"answer = 1\nassert answer == 1","concept_6":"answer = 1\nassert answer == 1","concept_7":"answer = 1\nassert answer == 1","concept_8":"answer = 1\nassert answer == 1","concept_9":"answer = 1\nassert answer == 1","calc_0":"eta0, gamma, decays = 0.1, 0.1, 2\nanswer = int(round(eta0 * (gamma ** decays) * 1000))\nassert answer == 1","calc_1":"epochs, step_size = 60, 20\nanswer = epochs // step_size\nassert answer == 3","calc_2":"warmup, step, target = 10, 5, 0.002\nanswer = int(round(target * step / warmup * 1000))\nassert answer == 1","calc_3":"eta0, factor, times = 1000, 0.5, 2\nanswer = int(eta0 * (factor ** times))\nassert answer == 250","calc_4":"import math\nt, T, eta_max, eta_min = 5, 10, 0.1, 0\neta = eta_min + 0.5 * (eta_max - eta_min) * (1 + math.cos(math.pi * t / T))\nanswer = int(round(eta * 1000))\nassert answer == 50","calc_5":"n, b = 128, 32\nanswer = n // b\nassert answer == 4","calc_6":"eta, scale = 0.01, 0.1\nanswer = int(round(eta * scale * 1000))\nassert answer == 1","calc_7":"eta, factor = 100, 0.5\nanswer = int(eta * factor)\nassert answer == 50","calc_8":"eta0, gamma, epochs = 100, 0.9, 3\nanswer = int(round(eta0 * (gamma ** epochs)))\nassert answer == 73","calc_9":"warmup, step, peak = 500, 250, 10\nanswer = int(peak * step / warmup)\nassert answer == 5"},"problemDifficulty":{"definition_0":"easy","definition_1":"easy","definition_2":"easy","definition_3":"easy","definition_4":"easy","definition_5":"easy","definition_6":"easy","definition_7":"easy","definition_8":"easy","definition_9":"easy","trueFalse_0":"easy","trueFalse_1":"easy","trueFalse_2":"easy","trueFalse_3":"easy","trueFalse_4":"easy","trueFalse_5":"easy","trueFalse_6":"easy","trueFalse_7":"easy","trueFalse_8":"easy","trueFalse_9":"easy","scenario_0":"medium","scenario_1":"medium","scenario_2":"medium","scenario_3":"medium","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","choice_0":"medium","choice_1":"medium","choice_2":"medium","choice_3":"medium","choice_4":"medium","choice_5":"medium","choice_6":"medium","choice_7":"medium","choice_8":"medium","choice_9":"medium","concept_0":"hard","concept_1":"hard","concept_2":"hard","concept_3":"hard","concept_4":"hard","concept_5":"hard","concept_6":"hard","concept_7":"hard","concept_8":"hard","concept_9":"hard","calc_0":"hard","calc_1":"hard","calc_2":"hard","calc_3":"hard","calc_4":"hard","calc_5":"hard","calc_6":"hard","calc_7":"hard","calc_8":"hard","calc_9":"hard"},"problemOrder":["definition_0","definition_1","definition_2","definition_3","definition_4","definition_5","definition_6","definition_7","definition_8","definition_9","trueFalse_0","trueFalse_1","trueFalse_2","trueFalse_3","trueFalse_4","trueFalse_5","trueFalse_6","trueFalse_7","trueFalse_8","trueFalse_9","scenario_0","scenario_1","scenario_2","scenario_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","choice_0","choice_1","choice_2","choice_3","choice_4","choice_5","choice_6","choice_7","choice_8","choice_9","concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","concept_6","concept_7","concept_8","concept_9","calc_0","calc_1","calc_2","calc_3","calc_4","calc_5","calc_6","calc_7","calc_8","calc_9"]},"midMlChapters":{"midMl00":{"chapter":"Chapter 00","title":"中級機械学習：実データの限界とモデル最適化","description":"基礎機械学習を土台に、現実データの前処理とモデル・チューニングの考え方を概説します。"},"midMl01":{"chapter":"Chapter 01","title":"データスケーリングと分布変換","description":"単位の異なる特徴の影響を均一にする標準化・Min-Maxスケーリング・Robustスケーリングを学びます。"},"midMl02":{"chapter":"Chapter 02","title":"カテゴリ変数エンコーディング","description":"カテゴリデータを数値に変換するワンホット・順序・ターゲットエンコーディングの違いを説明します。"},"midMl03":{"chapter":"Chapter 03","title":"欠損値処理と補完法","description":"削除を超え、平均/中央値補完・KNN補完・回帰補完など統計的に欠損を埋める方法を扱います。"},"midMl04":{"chapter":"Chapter 04","title":"不均衡データ処理の基礎","description":"不正検知・疾患診断などで、SMOTEやクラス重みで多数クラスへの偏りを防ぐ方法を学びます。"},"midMl05":{"chapter":"Chapter 05","title":"高度な交差検証","description":"層化抽出によるクラス比維持と、時系列の順序を保つ時系列分割の違いを学びます。"},"midMl06":{"chapter":"Chapter 06","title":"多クラス評価とROC-AUC","description":"二値の精度・再現率を多クラスへ拡張する方法（Micro/Macro）と、ROC曲線による分類性能の評価を扱います。"},"midMl07":{"chapter":"Chapter 07","title":"SVM基礎：決定境界とマージン","description":"サポートベクターとのマージンを最大にする最適な分離超平面を求める分類手法です。"},"midMl08":{"chapter":"Chapter 08","title":"カーネルトリック：非線形SVM","description":"データを直接動かさず内積だけで高次元に写像し、非線形分離する数学的技法を扱います。"},"midMl09":{"chapter":"Chapter 09","title":"次元削減1（PCA）","description":"分散を最大限保つ少数の直交する主成分軸へ高次元データを線形圧縮する原理です。"},"midMl10":{"chapter":"Chapter 10","title":"アンサンブル：バギングとペースティング","description":"ブートストラップで複数訓練セットを作り投票で合わせるバギングと、非復元のペースティングのバイアス・分散の考え方を説明します。"},"midMl11":{"chapter":"Chapter 11","title":"ブースティング基礎：AdaBoost","description":"誤ったデータに重みを付けて弱学習器を順次結合し誤差を減らすアルゴリズムです。"},"midMl12":{"chapter":"Chapter 12","title":"勾配ブースティングマシン（GBM）","description":"前の木の残差を次が予測する形で、勾配降下とアンサンブルを組み合わせた手法です。"},"midMl13":{"chapter":"Chapter 13","title":"密度ベースクラスタリング（DBSCAN）","description":"密度でクラスタを形成し外れ値を除くアルゴリズムで、K-meansの球状の限界を超えます。"},"midMl14":{"chapter":"Chapter 14","title":"階層的クラスタリングとデンドログラム","description":"クラスタ数を決めず、似たものから順に併合・分割してデンドログラムで可視化する教師なし学習です。"},"midMl15":{"chapter":"Chapter 15","title":"ガウス混合モデル（GMM）","description":"複数の正規分布の混合からデータが生成されたと仮定し、EMで各データの所属確率を求めるソフトクラスタリングです。"},"midMl16":{"chapter":"Chapter 16","title":"異常検知の基礎","description":"ラベルが少ない状況で、分布や距離を使い正常から外れた異常を検出する教師なし・半教師ありの手法を扱います。"},"midMl17":{"chapter":"Chapter 17","title":"パイプライン構築","description":"スケーリング・エンコーディング・次元削減・学習を一つのワークフローにまとめ、再利用とデータ漏れ防止を図ります。"},"midMl18":{"chapter":"Chapter 18","title":"ハイパーパラメータチューニング1：グリッド・ランダムサーチ","description":"木の深さ・学習率などの最適値を、全組み合わせのグリッドサーチと無作為のランダムサーチで探す違いを比較します。"},"midMl19":{"chapter":"Chapter 19","title":"ハイパーパラメータチューニング2：ベイズ最適化（Optuna）","description":"過去の試行を事後モデルに反映し、次に試すハイパーパラメータを統計的に提案して効率よく最適化する手法です。"},"midMl20":{"chapter":"Chapter 20","title":"中級機械学習総まとめ","description":"欠損処理・スケーリング・PCA・SVM・ブースティング・ハイパーパラメータチューニングまでの実務パイプラインをまとめます。"}},"midMlCh00":{"description":"基礎機械学習で学んだデータ・特徴量・学習・評価を土台に、現場の乱れた表の扱い方とモデルを整える考え方を紹介します。","sectionTitle":"現実データと前処理・チューニング：中級MLが扱うこと","sectionLabels":{"whatIs":"どんな概念か","whyImportant":"なぜ重要か","howUsed":"どう使うか"},"whatIs":{"0":"**現実データは練習用の表とは違います** — 基礎で扱う表はきれいなことが多いです。現場では欠損があり、地域や性別などの文字カテゴリが混ざり、所得と年齢のようにスケールの違う数値が並びます。不正検知のように正例がごく少ないこともあります。モデルは結局 $\\mathbf{X}$ と $\\mathbf{y}$ だけを受け取るので、まず **特徴ベクトル** に整える必要があります。","1":"**前処理はモデルが読みやすい形に整える段階です** — スケーリングで単位をそろえ、エンコーディングで文字を数値にし、補完で空欄を埋めます。クラスが偏っているときはリサンプリングもします。基礎 Ch.00 の「良い特徴を選ぶ」が、現場では繰り返し可能な手順の集まりになる、と捉えてください。","2":"**チューニングとパイプラインは実験を安定させます** — 学習で変わる値（重み、木の分割など）と、あらかじめ決める値（木の深さ、SVMの $C$ など）は別物です。後者を **ハイパーパラメータ** と呼びます。**パイプライン** は前処理と学習を一つの流れにまとめ、新しいデータも同じ順で処理します。"},"whyImportant":{"0":"**データとスケールが性能を左右します** — 偏ったデータや一つの特徴だけ桁が大きいと、検証では良く見えても本番で崩れることがあります。KNNやSVMのように距離やマージンに依存するモデルは、スケールがずれると「近さ」の意味が変わります。基礎 KNN で触れた正規化が、中級では日常の習慣になります。","1":"**データリークはスコアを盛ります** — テストの情報が学習・前処理に混ざると、検証は良く見えて運用後は落ちます。全データでスケーラーを合わせてから交差検証するのも同じ落とし穴です。分割のあと、訓練だけで統計を合わせ、検証・テストにはその基準だけを適用する順序が大切です。","2":"**不均衡と評価はセットで見ます** — 正解率だけだと「全部正常」と予測しても高く出ることがあります。少数クラスには適合率・再現率・ROC-AUC も必要です。ハイパーパラメータチューニングは、過学習と未学習のあいだで汎化を整える作業でもあります。"},"howUsed":{"0":"**実務では順序が信頼度になります** — データを眺め、訓練・検証・テストに分け、前処理は訓練だけで基準を合わせ、モデルを学習し、検証を見ながらハイパーパラメータを選び、最後にテストで報告します。この順を守ると、より現実に近い汎化の判断ができます。","1":"**このコースの流れ** — 前半はスケーリング・エンコーディング・欠損、不均衡・交差検証・多クラス評価。中盤は SVM・PCA・アンサンブル・クラスタ・異常検知。後半はパイプラインとグリッド・ランダム・ベイズ探索です。下のロードマップで各章の題名を先に確認できます。","2":"**基礎機械学習につながります** — データ・特徴、欠損、交差検証を学んでいれば、中級では同じテーマを現場の表ひとつに当てはめて深めます。目標は公式の羅列ではなく、なぜ手入れが要るか、どこで指標が嘘をつくか、どう実験するかを落ち着いて身につけることです。"}},"advMlChapters":{"advMl00":{"chapter":"Chapter 00","title":"上級機械学習：最高性能モデルと解釈可能性","description":"Kaggle等で使われる最適化ブースティングアンサンブルの原理と、ブラックボックス予測を解釈するXAIの重要性。"},"advMl01":{"chapter":"Chapter 01","title":"XGBoostアルゴリズム","description":"GBMの速度改善と正則化で木の複雑さを抑え過学習を防ぐアルゴリズム。"},"advMl02":{"chapter":"Chapter 02","title":"LightGBMアルゴリズム","description":"リーフワイズ成長で速度と精度を両立；レベルワイズとの対比。"},"advMl03":{"chapter":"Chapter 03","title":"CatBoost：カテゴリ特化ブースティング","description":"ターゲット漏れを防ぐOrdered Boosting；カテゴリの多い表形式データに強い。"},"advMl04":{"chapter":"Chapter 04","title":"t-SNEによる多様体可視化","description":"局所構造を保つ非線形次元削減で2D/3D可視化。"},"advMl05":{"chapter":"Chapter 05","title":"UMAP：位相幾何","description":"局所・大域構造を保つ高速多様体学習；t-SNEの代替。"},"advMl06":{"chapter":"Chapter 06","title":"Isolation Forest","description":"ランダム分割で異常を検出；異常は少ない分割で孤立。"},"advMl07":{"chapter":"Chapter 07","title":"One-Class SVM","description":"正常データ周りに境界を学習するカーネル法；外側を異常とする。"},"advMl08":{"chapter":"Chapter 08","title":"特徴選択と重要度","description":"順列重要度などで重要変数を同定する方法。"},"advMl09":{"chapter":"Chapter 09","title":"XAI 1：部分従属プロット（PDP）","description":"特徴の予測への限界効果；大域的解釈可能性。"},"advMl10":{"chapter":"Chapter 10","title":"XAI 2：LIME","description":"個別予測を説明する局所線形近似。"},"advMl11":{"chapter":"Chapter 11","title":"XAI 3：SHAP","description":"シャプリー値による予測への公平な特徴寄与。"},"advMl12":{"chapter":"Chapter 12","title":"時系列前処理と定常性","description":"ADF検定と差分による定常化。"},"advMl13":{"chapter":"Chapter 13","title":"ARIMAとSARIMA","description":"AR・MA・I・季節性による古典的統計予測。"},"advMl14":{"chapter":"Chapter 14","title":"Prophet：構造的時系列","description":"トレンド・季節・祝日効果による解釈可能な予測。"},"advMl15":{"chapter":"Chapter 15","title":"推薦1：コンテンツベースフィルタリング","description":"アイテム属性と類似度（例：コサイン）による推薦。"},"advMl16":{"chapter":"Chapter 16","title":"推薦2：行列分解","description":"ユーザー・アイテム評価予測のための潜在因子。"},"advMl17":{"chapter":"Chapter 17","title":"推薦3：因子分解マシン","description":"高次元疎データにおける特徴交互作用の効率的モデル化。"},"advMl18":{"chapter":"Chapter 18","title":"連関ルールとApriori","description":"支持度・信頼度・リフト；従来のバスケット分析。"},"advMl19":{"chapter":"Chapter 19","title":"AutoML基礎：PyCaretとFLAML","description":"前処理・モデル選択・ハイパーパラメータチューニングの自動化。"},"advMl20":{"chapter":"Chapter 20","title":"上級機械学習総まとめ：SOTAパイプラインとXAI","description":"XGBoost/LightGBMパイプラインからSHAP・時系列・推薦システムまで。"}},"advDlChapters":{"advDl00":{"chapter":"Chapter 00","title":"発展ディープラーニング：大規模モデルと生成AIパラダイム"},"advDl01":{"chapter":"Chapter 01","title":"Transformer 1：セルフアテンションと並列化"},"advDl02":{"chapter":"Chapter 02","title":"Transformer：位置エンコーディングとフィードフォワード"},"advDl03":{"chapter":"Chapter 03","title":"Transformer系譜：エンコーダ（BERT）vs デコーダ（GPT）"},"advDl04":{"chapter":"Chapter 04","title":"アテンション最適化：FlashAttentionとスパースアテンション"},"advDl05":{"chapter":"Chapter 05","title":"Vision Transformer（ViT）と画像パッチ"},"advDl30":{"chapter":"Chapter 06","title":"Swin Transformer：階層型ウィンドウと大域文脈"},"advDl31":{"chapter":"Chapter 07","title":"ビジョンモデルの進化：CNNは局所、ViTは大域を見る"},"advDl08":{"chapter":"Chapter 08","title":"PEFT 1：PEFTとLoRA"},"advDl09":{"chapter":"Chapter 09","title":"QLoRAと量子化：より小さくしてチューニング"},"advDl10":{"chapter":"Chapter 10","title":"価値アライメントとRLHF：人間の好みに合わせる"},"advDl11":{"chapter":"Chapter 11","title":"DPO：強化学習なしに選好でアライメント"},"advDl12":{"chapter":"Chapter 12","title":"RAG：検索で幻覚を減らす"},"advDl13":{"chapter":"Chapter 13","title":"LLMエージェント：ツールを使うモデル"},"advDl27":{"chapter":"Chapter 14","title":"CNN完全攻略：カーネル・ストライド・パディングから骨格の進化まで"},"advDl28":{"chapter":"Chapter 15","title":"物体検出（Object Detection）：R-CNN系とYOLOの対決（バウンディングボックスを探す）"},"advDl29":{"chapter":"Chapter 16","title":"画像セグメンテーション：U-NetとDeepLab（ピクセル単位で画像を理解する）"},"advDl15":{"chapter":"Chapter 17","title":"Grad-CAMとXAI：CNNがどこを見たかを見る"},"advDl14":{"chapter":"Chapter 18","title":"グラフニューラルネットワーク（GNN）：近傍へメッセージパッシング"},"advDl16":{"chapter":"Chapter 19","title":"オートエンコーダ：圧縮してから復元"},"advDl17":{"chapter":"Chapter 20","title":"VAE：確率で書く生成空間"},"advDl18":{"chapter":"Chapter 21","title":"GAN基礎：生成と識別の対決"},"advDl19":{"chapter":"Chapter 22","title":"条件付きGAN：条件を与えて欲しいものを作る"},"advDl20":{"chapter":"Chapter 23","title":"拡散モデル（Diffusion）1：ノイズを足してから取り除く"},"advDl21":{"chapter":"Chapter 24","title":"拡散モデル（Diffusion）2：潜在空間で拡散する"},"advDl22":{"chapter":"Chapter 25","title":"視覚・言語モデルとCLIP：画像と文を同じ空間に（先行するCNNとLLMの知識の結合）"},"advDl23":{"chapter":"Chapter 26","title":"音声認識とオーディオ：音をテキストに"},"advDl24":{"chapter":"Chapter 27","title":"モデル圧縮と知識蒸留：大きいものを小さく移す"},"advDl25":{"chapter":"Chapter 28","title":"推論最適化とデプロイ：サーバーからWebブラウザランタイムまでサービス可能に"},"advDl26":{"chapter":"Chapter 29","title":"発展ディープラーニング総まとめ：アーキテクチャと未来を一望"}},"advDlCh00":{"chapter":"Chapter 00","title":"上級ディープラーニング：大規模モデルと生成AIの世界","description":"上級ディープラーニング（Ch.00）は「なぜモデルが巨大になったのか」と「生成AIが実際にどう動くのか」を一本につなぐ導入です。データから表現（representation）を学ぶところから一歩進み、大規模Transformerが文脈を作り次トークンを予測する仕組み、さらに整合（Alignment）と制御、そして実運用のためのデプロイまでを扱います。","roadmapTitle":"大規模生成モデルへ向かう上級ロードマップ","roadmapDescription":"以下のロードマップはCh01から順に埋まっていき、各章が全体システムで果たす役割をつなげて理解できるようにします。","roadmapListHeading":"Ch01~Ch24で学ぶこと","sectionTitle":"上級ディープラーニングとは？（生成AIシステムの視点）","sectionLabels":{"whatIs":"どんな概念か","whyImportant":"なぜ重要か","howUsed":"どう使うか","problemSolving":"問題の読み方"},"whatIs":{"0":"**基盤モデル（Foundation / LLM）**は次トークン予測という目的で学習します。つまり $p(x_t\\mid x_{ tokenization -> context window -> Transformer -> decoding（greedy/beam/sample）` という流れで応答を生成します。デコード方式とプロンプト設計が出力品質を大きく左右します。","1":"整合と制御は複数の方法で行います。例えば **RLHF / DPO** は嗜好を使って改善し、**RAG** は外部知識を検索して根拠のある回答を目指します。","2":"プロダクト視点では、**ツール利用**、キャッシュ/バッチ化、量子化や知識蒸留などの最適化が一体で入ってきます。同じ基盤モデルでも、動かし方で体感は大きく変わります。"},"problemSolving":{"0":"この節では、高度ディープラーニング全体を問題演習の視点から一度に整理します。**次トークン予測**による事前学習は汎用的な言語能力の土台となり、確率生成や表現学習につながります。ユーザ意図に沿った応答を作る **instruction / SFT** ではデータ形式とファインチューニングがセットで現れます。\n\n**整合（Alignment）** は嗜好・安全・真実性を扱い、嗜好学習や報酬モデルと結びつきます。**RAG / grounded generation** は検索・埋め込み・文脈の組み立てで根拠のない主張を減らす方向です。**推論最適化** はレイテンシとコストを下げるため、量子化・キャッシュ・蒸留など実行面の話になります。"}},"advDlCh01":{"chapter":"Chapter 01","title":"Transformer 1: セルフアテンションを一目で見る","description":"Transformerモデルの心臓ともいえる **セルフアテンション（Self-Attention）** は、文章中の単語同士がどう関係しているかを一度に捉える革新的な技術です。従来のモデルが単語を順番に読み進めていく間に前半の情報を失いがちだったのに対し、セルフアテンションは文章全体を俯瞰するように見渡し、すべての単語が互いに与える影響を同時に計算します。このチャプターでは、初心者にもわかるように Query・Key・Value という要点を通して、セルフアテンションが重要な情報をどう選び取るのか、そしてマルチヘッドアテンションが実際のAIサービスでどう活きるのかをやさしく解説します。","sectionTitle":"Transformer 1: セルフアテンションを一目で見る","whatIs":{"0":"**概念説明：文脈を掴む目**\n\nセルフアテンションは、文中の各単語（トークン）が他のすべての単語を同時に見て、「今の単語を理解するために、どの単語をどれくらい参考にするか」を決める重み付けの仕組みです。例えば「『ば』を乗って川を渡り、ばが痛くて果物のばを食べた」というように、『ば』が複数の意味（船／身体の部位／果物）を持つ場合、セルフアテンションは周りの「乗って」「痛くて」「食べた」などの語を同時に見比べて文脈を判断します。","1":"**直観的理解：質問（Q）、手がかり（K）、答え（V）**\n\n図書館で本を探す流れにたとえてみましょう。\n1. **Query（Q）**：あなたが検索窓に入れる質問（探したいこと）です。（「ここで“ば”は身体の部位？」など）\n2. **Key（K）**：本の背表紙に書かれたタイトルやキーワードです。（「私は“痛くて”という語で、病気に関わるキーワードを持つ」など）\n3. **Value（V）**：本の中身、つまり実際の情報です。（「痛み・腹痛・病院など、本当の意味」など）\nセルフアテンションは Query と Key の一致度（相性）を評価してスコアを作り、そのスコアに応じて Value を混ぜ合わせることで、最終的な単語の意味を決めます。","2":"**数式的説明：スケールド・ドット積アテンション**\n\n入力を行列 $X$ とすると、それを3つの学習可能な変換行列で掛けて $Q=XW_Q$, $K=XW_K$, $V=XW_V$ を作ります。アテンションのスコア（相性）は Query と Key を掛けた $QK^T$ で計算します。次元が大きいと値が大きくなりすぎるので、Keyベクトルの次元数である $\\sqrt{d_k}$ で割ってスケーリングします。その後、softmax を通すと合計が1になる確率重み $A$ が得られます。数式は $A=\\mathrm{softmax}(QK^T/\\sqrt{d_k})$ です。最後に、この重み $A$ に実際の情報である $V$ を掛けて最終出力 $AV$ を得ます。","3":"**実際のML例：賢い文の理解**\n\nスパムメールの分類では、「当選」「無料」「クリック」などの語が離れていても、セルフアテンションがそれらの強い関係を一度に見つけてスパム判定に役立ちます。医療の診断システムでも、「頭痛がひどい」「しかし」「発熱なし」のように肯定と否定が混ざった長い文章で、重要な症状とそうでないものを正しく結びつけ、誤診の可能性を大きく下げます。"},"whyImportant":{"0":"**概念説明：長距離依存の解決**\n\nセルフアテンションがディープラーニングの流れを変えた理由は、 **長距離依存（Long-range Dependency）** をうまく扱えるからです。文の先頭の主語と末尾の動詞が対応しているような場合、中にどれだけ修飾語が長く挟まっていても、セルフアテンションは2つの語を直接つなげて意味を落としません。","1":"**直観的理解：リレー走（RNN） vs グループチャット**\n\n従来のRNNは、列に並んで前の人の言葉を後ろに渡す **リレー（リレー走）** のようでした。文章が長いほど、前の情報が弱まってしまいがちです。対してセルフアテンションは、参加者全員が同時にメッセージを見る **グループチャット** のようなものです。100語目を読んでいるときでも、1語目が残した情報をすぐ参照でき、情報の欠落が起きにくくなります。","2":"**数式的説明：情報伝達経路を短く**\n\nRNNでは、1番目のトークンから $n$ 番目のトークンまでの情報伝達経路の長さが $O(n)$ に比例します。つまり距離が長いほど勾配が届きにくくなります。ところがセルフアテンションでは、すべての単語が行列積1回で結ばれるため、経路長はいつでも **$O(1)$** です。経路が短いので、学習中の勾配消失が起きにくく、安定して学習できます。","3":"**実際のML例：長文の要約**\n\n数十ページの法廷文書の要約や、カスタマーと担当者が30分にわたって交わした長いチャットログの分析では、この強みが特に効いてきます。会話の冒頭に出てくる「本当の不満」と、会話の終盤の「結論」を一度に結びつけて、素早く正確な要約を作れます。"},"howUsed":{"0":"**概念説明：トランスフォーマーの構造**\n\n実務では、テキストをトークンに分割したあと、このセルフアテンションを複数つないだ **アテンションブロック** を何層にも積み重ねて巨大モデル（例：GPT、BERT）を作ります。さらに単語の意味だけでなく位置情報（Positional Encoding）も一緒に入れて、文章の順序を認識させます。","1":"**直観的理解：マルチヘッドアテンション（Multi-Head Attention）**\n\n1つの視点だけで文章を見ると偏りが出てしまいます。そこでセルフアテンションを複数（ヘッド）に分けて同時に動かします。これが **マルチヘッドアテンション** です。審査員が複数いるオーディション番組に似ています。1人目は「文法」、2人目は「感情の流れ」、3人目は「固有名詞」を見ます。各視点で採点して最後に統合すれば、より立体的で豊かな理解が可能になります。","2":"**数式的説明：複数ヘッドの結合**\n\n各ヘッド $h$ は、学んだスケールド・ドット積を独立に計算します：$\\mathrm{head}_h=\\mathrm{softmax}(Q_hK_h^T/\\sqrt{d_k})V_h$。もしヘッドが8個なら、8個の出力が得られます。これらを横に連結（Concatenation）したあと、最終の重み行列 $W_O$ を掛けて1つの出力に混ぜ合わせます。数式では $\\mathrm{MultiHead}(X)=\\mathrm{Concat}(\\mathrm{head}_1,\\dots,\\mathrm{head}_H)W_O$ となります。","3":"**実際のML例：多面的なテキスト分析**\n\nGoogle翻訳のような翻訳モデルでは、あるヘッドが「主語と動詞の数の一致」を計算するとき、別のヘッドが「敬語とくだけた言い方の文脈」を計算します。感情分析でも、肯定的な形容詞と否定的な副詞（「決して〜しない」）の関係を複数ヘッドが立体的に捉えることで、人に近い繊細な分析ができるようになります。"},"problemSolving":{"0":"セルフアテンションの設問は「全トークンが互いを参照し $A=\\mathrm{softmax}(QK^T/\\sqrt{d_k})$ を作る」という枠で捉えると速いです。$W_Q,W_K,W_V$ で Q/K/V を作り $\\sqrt{d_k}$ でスケールし、行ごとに和が1の注意重みにします。マルチヘッドは並列の視点で、$d_{model}=n_{head}\\times d_{head}$ などの構成計算も出やすいです。","2":"**例（概念理解）**\n\n\"セルフアテンションで、Query（Q）とKey（K）のドット積（$QK^T$）は何を意味しますか？ ① 単語の長さ ② 単語同士の関連度（類似度） ③ 文の位置情報\"\n\nQueryとKeyの内積は、2つの単語が文脈的にどれくらい関係しているかを表すスコアです。→ **正答 2**\n\n---\n\n**例（構造）**\n\n\"マルチヘッドアテンションを使う一番大きな理由は？ ① 計算速度を遅くするため ② 1つの視点ではなく、文法や意味などの多様な文脈を同時に捉えるため ③ メモリを節約するため\"\n\n複数のヘッドがそれぞれ異なる特徴を学習し、モデルの表現力を高めるためです。→ **正答 2**\n\n---\n\n**例（計算）**\n\nアテンション計算で $QK^T$ を計算したあと、次元の大きさ $d_k=64$ のとき、何で割ってスケーリングしますか？\n\n$\\sqrt{d_k}$ で割るので、$\\sqrt{64}=8$ で割ります。→ **正答 8**","3":"**短い例（定義）** — 「$\\mathrm{Attention}(Q,K,V)$ のソフトマックスはどの軸か？ ①クエリ行ごとのキー方向 ②列だけ」→ ①。**正答 1**\n\n---\n\n**短い例（○×）** — 「$\\sqrt{d_k}$ スケールは内積が大きいときの極端なソフトマックスを緩和する。」→ ○。**正答 1**\n\n---\n\n**短い例（計算）** — 「系列長20の密なスコア行列のセル数は？」→ $400$。**正答 400**"},"summary":"セルフアテンションは、各トークンが文の全体を同時に参照して文脈を理解する仕組みで、Transformerの性能を支える重要な基盤です。Query・Key・Valueに分けて関連度を計算し、softmaxで重要度を確率のように正規化して必要な情報を重み付きで合成します。このため、離れた単語同士の関係も一度に反映でき、長い文脈の問題に特に強くなります。さらにマルチヘッドは、単一視点の限界を減らし、複数の観点を組み合わせることで予測の安定性を高めます。結局、セルフアテンションを理解するとは「情報を選択的に集める方法」を理解することであり、翻訳・要約・分類・検索・医療テキスト分析など、実際の機械学習全般につながっていきます。","sectionLabels":{"whatIs":"それは何か","whyImportant":"なぜ重要か","howUsed":"どう使うか","summary":"要約"},"formulaGuideDiagramCaption":"下図は、Q/K/V の生成からスケーリング、ソフトマックス、重み付き和までのセルフアテンションの計算の流れを示します。","formulaGuide":{"title":"数式をわかりやすく理解する","formulaGuideDiagramCaption":"下図は、Q/K/V の生成からスケーリング、ソフトマックス、重み付き和までのセルフアテンションの計算の流れを示します。","linear":"$$Q=XW_Q$, $K=XW_K$, $V=XW_V$ において、$X$ は入力の埋め込み、$W_Q/W_K/W_V$ は学習される変換行列です。このステップでは、同じ文章を「質問っぽい表現」「マッチングっぽい表現」「内容っぽい表現」に分けます。","xavierVariance":"$$S=QK^T$ はトークン同士の関連度スコア行列です。スコアが大きいほど、2つのトークンの関係は強くなります。ただし次元が大きいと値が過剰に大きくなり得るため、$\\sqrt{d_k}$で割って安定化します。","heVariance":"$$A=\\mathrm{softmax}(S/\\sqrt{d_k})$ は各行の合計が1になる確率重みの行列です。つまり、1つのトークンが他のトークンをどれくらい参考にするかを割合として表します。","xavierUniform":"$$O=AV$ は重み $A$ によって Value を混ぜて作る最終的なコンテキスト表現です。ポイントは、単純平均ではなく「重要度に基づく重み付き平均」であることです。"},"visual":"概念構造図は `入力トークン → 埋め込み → Q/K/V に分岐 → 類似度行列（QK^T）→ スケーリング（√d_k）→ softmax → 重み付き和（AV）→ マルチヘッド結合` の順に描きます。学習フロー図は `トークン化 → 位置情報の結合 → セルフアテンション → フィードフォワード → 予測` を縦方向の段階として表します。モデル動作ダイアグラムは、1つのトークンが他のすべてのトークンへ矢印を送る形で描き、矢印の太さがアテンション重みの大きさを表すように設計します。フロントエンドではコンテナに `min-w-0`, `max-w-full`, `overflow-visible`, `minHeight: \"320px\"` を適用し、SVG は `viewBox` 基準でモバイルでも切れないようにします。","problemSolvingLabel":"問題を解くためのヒント","practiceProblemsTitle":"練習問題","practiceProblemsIntro":"以下は、60問の問題プールからランダムに選んだ10問です。難易度は「易」4問、「中」3問、「難」3問の構成で、答えは整数のみ入力します。","practiceProblemsInstruction":"問題文を読み、空欄(?)に正しい整数を入力してください。","practiceProblemsInstructionConcept":"設問と①②③を読み、最も適切な選択番号1つだけを入力してください。","practiceProblemsInstructionOx":"文が正なら1、誤りなら0だけを入力してください。","practiceProblemsInstructionScenario":"状況説明と①②③を読み、条件に合う選択番号1つだけを入力してください。","practiceProblemsInstructionVote":"与えられた二値ベクトル(0/1)の1の個数(和)を整数1つで入力してください。","practiceProblemsInstructionAggregate":"与えられた数の合計を整数1つで入力してください。","practiceProblemsInstructionConfig":"格子・構成の設問を読み、求める値（例: 一辺$n$の正方形マス数$n^2$）を整数1つで入力してください。","practiceProblemsInstructionEnsemble":"設問と①②③を読み、最も適切な説明の選択番号1つだけを入力してください。","advDlCh01VisualIntro":"セルフ・アテンションは、各トークンが全トークンを参照して文脈を再構成する操作です。","advDlCh01VisualStep0":"① トークン埋め込みを作り、Q・K・Vへ線形変換","advDlCh01VisualStep1":"② QK^Tで関係スコアを計算","advDlCh01VisualStep2":"③ √d_kでスケールし、softmaxで重みを正規化","advDlCh01VisualStep3":"④ 重みをVに掛けて文脈ベクトルを作り、ヘッドを結合","advDlCh01VisualConceptTitle":"概念構造: Q/K/V → スコア → 正規化 → 重み付き和","advDlCh01VisualFlowTitle":"学習フロー: トークン化 → attention → 表現更新 → 予測","advDlCh01VisualModelTitle":"モデル動作: 各トークンが全トークンを同時に参照","advDlCh01VisualInputTokenLabel":"入力トークン","advDlCh01VisualTokenRelationLabel":"トークンの関連（self-attention）","advDlCh01VisualContextVectorOutputLabel":"文脈ベクトルの出力","advDlCh01VisualContextVectorExplainLine1":"文脈ベクトルは","advDlCh01VisualContextVectorExplainLine2":"トークンが見ている情報の要約","advDlCh01VisualCoreFormulaLabel":"核となる数式","advDlCh01VisualLegendWeak":"弱い参照","advDlCh01VisualLegendMedium":"中程度の参照","advDlCh01VisualLegendStrong":"強い参照","advDlCh01VisualCurrentSuffix":"（現在）","problems":{"concept_0":"問題文：自己注意の核となる機能を選んでください。\n\n実際の質問：各トークンが文全体を同時に参照して重要度を計算する仕組みは？ ① 自己注意 ② 最大プーリング ③ ドロップアウト","concept_1":"問題文：Q、K、Vの意味を確認してください。\n\n実際の質問：Queryに最も近い説明は？ ① どんな情報を見つけたいかを表すベクトル ② 正解ラベル ③ 損失値","concept_2":"問題文：数式の記号の意味を確認してください。\n\n実際の質問：$A=softmax(QK^T/\\sqrt{d_k})$ で $d_k$は？ ① バッチサイズ ② Keyベクトルの次元 ③ クラス数","concept_3":"問題文：マルチヘッドの直感を選んでください。\n\n実際の質問：マルチヘッドを使う最も適切な理由は？ ① 異なる視点の関係を同時に見る ② パラメータを0にする ③ トークンを削除する","concept_4":"問題文：自己注意の利点を選んでください。\n\n実際の質問：長い文で、離れている単語同士の関係をうまく捉えられる理由は？ ① 1つの層で直接参照できる ② いつも文が短くなる ③ 損失関数が消える","concept_5":"問題文：実戦例を結びつけてください。\n\n実際の質問：スパムメール分類で自己注意が特に有用な理由は？ ① 単語間の相互作用を一緒に見る ② 学習データを自動生成する ③ GPUをなくす","ox_0":"問題文：正しいか誤りかを判断してください。\n\n実際の質問：自己注意は、各トークンが他のすべてのトークンを同時に参照できる。正しければ1、誤りなら0。","ox_1":"問題文：正しいか誤りかを判断してください。\n\n実際の質問：Query、Key、Valueはすべて同じ意味なので区別は不要である。正しければ1、誤りなら0。","ox_2":"問題文：正しいか誤りかを判断してください。\n\n実際の質問：スケールド・ドット積で $\\sqrt{d_k}$ で割る目的は、スコアの爆発を和らげることである。正しければ1、誤りなら0。","ox_3":"問題文：正しいか誤りかを判断してください。\n\n実際の質問：マルチヘッドは単一ヘッドより常に情報表現が単純になる。正しければ1、誤りなら0。","ox_4":"問題文：正しいか誤りかを判断してください。\n\n実際の質問：softmaxの後、あるトークンの注意重みの合計は通常1である。正しければ1、誤りなら0。","ox_5":"問題文：正しいか誤りかを判断してください。\n\n実際の質問：自己注意は翻訳、要約、分類などのNLPタスクに利用される。正しければ1、誤りなら0。","scenario_0":"問題文：状況に合う最も適切な選択肢を選んでください。\n\n実際の質問：長いカスタマーサポートの相談ログで、前半の否定表現が後ろの文の意味をひっくり返すときに有利なモデル要素は？ ① 自己注意 ② 平均プーリングだけ ③ 単純なルールベース","scenario_1":"問題文：状況に合う最も適切な選択肢を選んでください。\n\n実際の質問：医療テキストで「がんではない」のような表現を安定して解釈するには？ ① 文脈の単語を一緒に見る自己注意 ② 単語頻度だけを使う ③ 最後の単語だけを使う","scenario_2":"問題文：状況に合う最も適切な選択肢を選んでください。\n\n実際の質問：翻訳モデルで主語-動詞の一致をよりよく捉えるには、まず何を確認すべき？ ① アテンションヘッドの設定 ② 画像の拡張 ③ ピクセルの正規化","scenario_3":"問題文：状況に合う最も適切な選択肢を選んでください。\n\n実際の質問：詐欺取引の説明を生成するとき、取引履歴間の関連を反映するには？ ① トークン間の重み計算 ② サンプルの削除 ③ クラスを減らすだけ","vote_0":"問題文：重み付きアンサンブルスコアを求めよ。\n\n実際の質問：ヘッド信頼度重み [3,2,1,2,1]、二値投票 [1,1,0,1,0] のとき、陽性(1)の重み付き和は？","vote_1":"問題文：閾値カウント。\n\n実際の質問：レイヤ確率 [0.92,0.63,0.71,0.48,0.83,0.69] で 0.7 以上を陽性とするとき、陽性の個数は？","vote_2":"問題文：クラス出現回数。\n\n実際の質問：3クラス予測ラベル [2,0,1,2,1,0,2,2] でクラス2が選ばれた回数は？","vote_3":"問題文：アンサンブル差分。\n\n実際の質問：クラスAの得票7、クラスBの得票4のとき A−B は？","scenario_4":"問題文：状況に合う最も適切な選択肢を選んでください。\n\n実際の質問：法的要約で、離れた節どうしをつなぐには、まずどの構造を適用すべきですか？ ① 自己注意 ② 1-gram の頻度表 ③ ランダム選択","scenario_5":"問題文：状況に合う最も適切な選択肢を選んでください。\n\n実際の質問：ニュース要約モデルが重要な文を見落とす場合、まず何を確認すべきですか？ ① 注意重みの分布 ② ファイルの拡張子 ③ フォルダ名","scenario_6":"問題文：状況に合う最も適切な選択肢を選んでください。\n\n実際の質問：多言語翻訳で単語アラインメントの誤りを減らすには、何をチューニングするのが自然ですか？ ① ヘッド数と次元 ② モニターの明るさ ③ マウスの速度","scenario_7":"問題文：状況に合う最も適切な選択肢を選んでください。\n\n実際の質問：長文の分類で、前半の情報が失われるなら、最も関連の深い解決方向は？ ① グローバル文脈参照を強める ② トークンをすべて削除する ③ ラベルを削除する","scenario_8":"問題文：状況に合う最も適切な選択肢を選んでください。\n\n実際の質問：顧客の不満検知で、「まだ返金されていない」という文脈を保つには？ ① 否定語と重要語の関係を注意で反映する ② 単語の長さだけを使う ③ 数字だけを使う","scenario_9":"問題文：状況に合う最も適切な選択肢を選んでください。\n\n実際の質問：実験では、単一ヘッドよりもマルチヘッドの方が安定していました。最も妥当な理由は？ ① 複数の視点を組み合わせる ② データを自動で増やす ③ 損失を無視する","vote_4":"問題文：信頼度重み付き和。\n\n実際の質問：信頼度 [4,3,2,1,2,3,1,2]、投票 [1,1,1,0,1,0,1,1] のとき、投票が1の位置の信頼度の和は？","vote_5":"問題文：閾値カウント。\n\n実際の質問：レイヤ確率 [0.4,0.7,0.2,0.8,0.1,0.6,0.3,0.9,0.55,0.65] で 0.6 以上を陽性とするとき、陽性の個数は？","vote_6":"問題文：2レイヤの比較。\n\n実際の質問：A=[1,0,1,0,1,0,1,0,1,0,1,0]、B=[1,1,1,0,0,0,1,1,1,0,1,1] のとき、異なる位置の個数は？","vote_7":"問題文：2レイヤの比較。\n\n実際の質問：A=[1,1,0,0,1,1,0,0,1,1,0,0]、B=[1,0,0,1,1,0,0,1,1,0,0,1] のとき、両方1の位置の個数は？","vote_8":"問題文：符号付きバランス。\n\n実際の質問：投票ベクトル [0,0,0,1,1,1,1,1,0,1] で (1の個数)−(0の個数) は？","vote_9":"問題文：前半と後半の比較。\n\n実際の質問：前半 [1,1,1,1,1,0]、後半 [0,0,1,0,1,0] のとき (前半の陽性数−後半の陽性数) は？","aggregate_0":"問題文：モデルの予測集計を計算してください。\n\n実際の質問：3つのヘッドのクラス1の予測数が [2,1,2] のとき、合計はいくつですか？","aggregate_1":"問題文：モデルの予測集計を計算してください。\n\n実際の質問：4つのヘッドのスパム予測数が [3,2,1,2] のとき、合計のスパム予測数は？","aggregate_2":"問題文：モデルの予測集計を計算してください。\n\n実際の質問：5つのヘッドがクラス2に与えたスコアが [4,4,3,5,4] のとき、合計は？","aggregate_3":"問題文：モデルの予測集計を計算してください。\n\n実際の質問：ヘッドごとの正常取引の表数が [6,5,7,6] のとき、合計の表数は？","aggregate_4":"問題文：モデルの予測集計を計算してください。\n\n実際の質問：6つのヘッドのスコア [5,4,6,5,4,6] の合計は？","aggregate_5":"問題文：モデルの予測集計を計算してください。\n\n実際の質問：クラス0の表が [7,8,6,9] のとき、合計は？","aggregate_6":"問題文：モデルの予測集計を計算してください。\n\n実際の質問：ヘッドごとのキーワード一致数 [10,12,11,9,8] の合計は？","aggregate_7":"問題文：モデルの予測集計を計算してください。\n\n実際の質問：バッチごとの肯定予測数 [14,16,15] の合計は？","aggregate_8":"問題文：モデルの予測集計を計算してください。\n\n実際の質問：8つのヘッドの誤り数 [1,2,1,2,1,2,1,2] の合計は？","aggregate_9":"問題文：モデルの予測集計を計算してください。\n\n実際の質問：ヘッドごとの注目トークン数 [3,5,7,9,11] の合計は？","config_0":"問題文：モデルの構成計算を行ってください。\n\n実際の質問：ヘッド数が4、ヘッド次元が16のとき、モデル次元 $d_{model}$ は？","config_1":"問題文：モデルの構成計算を行ってください。\n\n実際の質問：ヘッド数が8、ヘッド次元が8のとき、モデル次元 $d_{model}$ は？","config_2":"問題文：モデルの構成計算を行ってください。\n\n実際の質問：トークン数が10のとき、注意スコア行列のサイズ（要素数）は $10\\times10$ です。要素数は？","config_3":"問題文：モデルの構成計算を行ってください。\n\n実際の質問：トークン数が12のとき、スコア行列の要素数は $12\\times12$ です。値は？","config_4":"問題文：モデルの構成計算を行ってください。\n\n実際の質問：ヘッド数が6、ヘッド次元が12のとき $d_{model}$ は？","config_5":"問題文：モデルの構成計算を行ってください。\n\n実際の質問：ヘッド数が3、ヘッド次元が24のとき $d_{model}$ は？","config_6":"問題文：モデルの構成計算を行ってください。\n\n実際の質問：シーケンス長が14のとき、self-attentionのスコア要素数は $14\\times14$ です。値は？","config_7":"問題文：モデルの構成計算を行ってください。\n\n実際の質問：シーケンス長が16のとき、スコア要素数は $16\\times16$ です。値は？","config_8":"問題文：モデルの構成計算を行ってください。\n\n実際の質問：ヘッド数が12、ヘッド次元が10のとき $d_{model}$ は？","config_9":"問題文：モデルの構成計算を行ってください。\n\n実際の質問：トークン数が20のとき、スコア行列の要素数は $20\\times20$ です。値は？","ensemble_0":"問題文：アンサンブル原理について、正しいものを選んでください。\n\n実際の質問：マルチヘッド出力の結合による主な利点は？ ① 多様な表現を組み合わせることで一般化が向上する ② パラメータがなくなる ③ 学習が止まる","ensemble_1":"問題文：アンサンブル原理について、正しいものを選んでください。\n\n実際の質問：異なるヘッドが異なる関係を見ているとき、期待できる効果は？ ① エラーが相殺される可能性が高まる ② 常に同じエラーが起こる ③ 情報の損失だけが増える","ensemble_2":"問題文：アンサンブル原理について、正しいものを選んでください。\n\n実際の質問：単一ヘッドに比べてマルチヘッドが強い最も妥当な理由は？ ① 特徴空間を分割して並列に学習できる ② トークン数を強制的に1にする ③ softmaxを取り除く","ensemble_3":"問題文：アンサンブル原理について、正しいものを選んでください。\n\n実際の質問：アンサンブルの観点から、ヘッド数を増やすときの注意点として正しいのは？ ① 性能と計算量のバランスを確認する ② 計算量は必ず減る ③ 検証なしで無条件に増やす","ensemble_4":"問題文：アンサンブル原理について、正しいものを選んでください。\n\n実際の質問：マルチヘッド結合で分散が減る効果が期待できる理由は？ ① 異なるヘッドの誤差が一部相殺される ② すべてのヘッドが常に完璧である ③ 学習データが不要になる","ensemble_5":"問題文：アンサンブル原理について、正しいものを選んでください。\n\n実際の質問：アンサンブルの観点で、ヘッドの多様性を高める目的は？ ① 同じ入力から違う特徴が見えるようにする ② すべてのヘッドを同じようにコピーする ③ 重みを固定する","ensemble_6":"問題文：アンサンブル原理について、正しいものを選んでください。\n\n実際の質問：実運用でマルチヘッド数を決めるとき、最も重要なのは？ ① 正確度の改善と遅延のバランス ② 常に最大のヘッド数にする ③ 常に最小のヘッド数にする","ensemble_7":"問題文：アンサンブル原理について、正しいものを選んでください。\n\n実際の質問：複数ヘッドを組み合わせても性能が上がらないとき、まず確認すべき項目は？ ① ヘッド同士が似たパターンしか見ていないか ② トークン名の長さ ③ ファイルの色"},"problemAnswers":{"concept_0":1,"concept_1":1,"concept_2":2,"concept_3":1,"concept_4":1,"concept_5":1,"ox_0":1,"ox_1":0,"ox_2":1,"ox_3":0,"ox_4":1,"ox_5":1,"scenario_0":1,"scenario_1":1,"scenario_2":1,"scenario_3":1,"vote_0":7,"vote_1":3,"vote_2":4,"vote_3":3,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1,"vote_4":14,"vote_5":5,"vote_6":4,"vote_7":3,"vote_8":2,"vote_9":3,"aggregate_0":5,"aggregate_1":8,"aggregate_2":20,"aggregate_3":24,"ensemble_0":1,"ensemble_1":1,"ensemble_2":1,"ensemble_3":1,"aggregate_4":30,"aggregate_5":30,"aggregate_6":50,"aggregate_7":45,"aggregate_8":12,"aggregate_9":35,"config_0":64,"config_1":64,"config_2":100,"config_3":144,"config_4":72,"config_5":72,"config_6":196,"config_7":256,"config_8":120,"config_9":400,"ensemble_4":1,"ensemble_5":1,"ensemble_6":1,"ensemble_7":1},"problemSolutions":{"concept_0":"これは自己注意の定義を問う問題です。ポイントは「各トークンが全トークンを同時に参照するかどうか」です。①だけがこの定義を正しく表しています。実務では、スパム分類で特定の単語だけでなく周辺語との関係（例：無料＋クリック）まで見る必要があり、誤検知が減ります。よって正解は1です。","concept_1":"Queryは「何を見つけたいか」を表す質問ベクトルです。Keyはマッチング基準で、Valueは実際に取り出す内容です。医療診断文書の分類では、Queryが現在のトークンに必要な文脈手がかりを探し、Keyと比較して重要なValueを取得します。よって正解は1です。","concept_2":"$$d_k$はKeyベクトルの次元です。次元が大きいと内積の分散が増え、softmaxが片寄りやすくなるため $\\sqrt{d_k}$ で割ってスケールします。このスケーリングは学習の安定化にとても重要で、翻訳モデルの学習爆発を防ぐ目的でも使われます。よって正解は2です。","concept_3":"マルチヘッドは複数の視点からの関係を同時に見られるため、表現力が高まります。例えばあるヘッドは文法、別のヘッドは固有名詞同士のつながりを捉えられます。顧客レビューの感情分析で、否定語の関係を別ヘッドが捉えられると精度が上がります。よって正解は1です。","concept_4":"自己注意は1つの層で任意の距離のトークンを直接参照できるため、長距離依存に強いです。法的文書のように、前の条文が後ろの意味を変えるデータで有利です。よって正解は1です。","concept_5":"スパムメール分類では単語間の相互作用が重要です。自己注意は文脈関係を重みとして反映することで分類性能を高めます。手順：（1）トークン化（2）関係スコア計算（3）重要な文脈の反映（4）分類。よって正解は1です。","ox_0":"自己注意の定義そのままで正しいです。実際の場面でも、各トークンが全体を同時に見ることが翻訳・要約性能の核心です。正解：1。","ox_1":"Q、K、Vは役割が異なります。区別できないと関係計算が成り立ちません。詐欺取引の検知ログでも、質問／マッチング／内容の分離が重要です。正解：0。","ox_2":"正しいです。 $\\sqrt{d_k}$ のスケーリングは大きな内積による softmax の飽和を防ぎ、安定した学習を助けます。正解：1。","ox_3":"誤りです。マルチヘッドはむしろ多様なパターンを学び、表現が豊かになります。正解：0。","ox_4":"softmaxは確率の正規化なので、1行の合計は1になります。したがって正しいです。正解：1。","ox_5":"正しいです。翻訳／要約／分類／質問応答など幅広く使われています。正解：1。","scenario_0":"長いログで離れた単語同士の関係を見るには、グローバル参照が可能な自己注意が適しています。平均プーリングだけだと関係の向きが失われやすいです。カスタマーセンターの不満検知で、前半の否定文が後ろの意味を変えるケースで特に有効です。正解：1。","scenario_1":"「がんではない」には、否定語と病名の関係を一緒に見る必要があります。自己注意は2つのトークンの相互作用を直接反映するため、誤診リスクを減らします。手順：（1）トークン関係スコア計算（2）否定語の重み反映（3）最終分類。正解：1。","scenario_2":"主語-動詞の一致はトークン間の長距離関係の問題なので、アテンションヘッドの設計が最重要の確認ポイントです。画像拡張／ピクセル正規化はテキスト翻訳問題の最優先ではありません。正解：1。","scenario_3":"取引履歴間の関連を反映するには、トークン間の重み計算が必要です。これは自己注意の本質です。詐欺取引の説明生成でも、根拠となるトークンをまとめて解釈しやすくできます。正解：1。","vote_0":"重み [3,2,1,2,1] と投票 [1,1,0,1,0] の要素積の和は $3\\cdot1+2\\cdot1+1\\cdot0+2\\cdot1+1\\cdot0=7$。よって正解は7です。","vote_1":"0.7 以上は 0.92, 0.71, 0.83 の3個。よって正解は3です。","vote_2":"ラベル [2,0,1,2,1,0,2,2] でクラス2は4回。よって正解は4です。","vote_3":"差は $7-4=3$。よって正解は3です。","scenario_4":"法的要約で、離れた節どうしをつなぐことは長距離依存の典型的な問題です。そのため自己注意が最適です。よって正解は1です。","scenario_5":"重要な文の見落としは、注意重みの分布が片側に偏っていると起こりがちです。まず重み分布を確認するのが実用的なアプローチです。よって正解は1です。","scenario_6":"多言語翻訳における単語アラインメントの誤りは、ヘッド数やヘッド次元などの注意構成要素と直接関係します。よって正解は1です。","scenario_7":"前半の情報を失ってしまった場合は、グローバル参照を強めることで対抗します（自己注意を使い、層/ヘッドを調整する）。よって正解は1です。","scenario_8":"ポイントは、否定語と重要語の関係を一緒に見ることです。これは感情分析や不満検知で特に重要です。よって正解は1です。","scenario_9":"マルチヘッド注意が安定性を高める主な理由は、複数の視点を組み合わせることです。並列に異なるパターンを学ぶことで、一般化が向上します。よって正解は1です。","vote_4":"投票が1の位置の信頼度だけ足すと $4+3+2+2+1+2=14$。よって正解は14です。","vote_5":"0.6 以上は 0.7,0.8,0.6,0.9,0.65 の5個。よって正解は5です。","vote_6":"AとBが異なる位置は4個。よって正解は4です。","vote_7":"両方1の位置は3個。よって正解は3です。","vote_8":"陽性6、陰性4なので $6-4=2$。よって正解は2です。","vote_9":"前半の陽性5、後半の陽性2なので $5-2=3$。よって正解は3です。","aggregate_0":"集計合計：$2+1+2=5$。予測集計は、各ヘッドの出力を単純和または重み付き和でまとめる最初のステップです。よって正解は5です。","aggregate_1":"合計：$3+2+1+2=8$。スパム検出の運用でも、バッチごとにヘッド出力を合計し、閾値と比較します。よって正解は8です。","aggregate_2":"スコア合計：$4+4+3+5+4=20$。手順：（1）各ヘッドのスコアを確認（2）合計（3）最も高いスコアのクラスを選択。よって正解は20です。","aggregate_3":"合計：$6+5+7+6=24$。同様の集計は金融の異常検知でも使われます。よって正解は24です。","ensemble_0":"マルチヘッド注意は、多様な表現を組み合わせることで一般化を高めます。単一視点のバイアスを減らすことが要点です。よって正解は1です。","ensemble_1":"異なるヘッドが異なるパターンを見ると、いくつかの誤りは相殺されることがあります。これがアンサンブルの基本原理です。よって正解は1です。","ensemble_2":"特徴空間を分割して並列に観察することがマルチヘッドの強みです。トークン数を1にすることやsoftmaxを取り除くことが本質ではありません。よって正解は1です。","ensemble_3":"ヘッド数を増やすと性能は上がる可能性がありますが、計算量も増えます。トレードオフを確認し、バランスを取ることが重要です。よって正解は1です。","aggregate_4":"合計：$5+4+6+5+4+6=30$。よって正解は30です。","aggregate_5":"合計：$7+8+6+9=30$。よって正解は30です。","aggregate_6":"合計：$10+12+11+9+8=50$。よって正解は50です。","aggregate_7":"合計：$14+16+15=45$。よって正解は45です。","aggregate_8":"合計：$1+2+1+2+1+2+1+2=12$。よって正解は12です。","aggregate_9":"合計：$3+5+7+9+11=35$。よって正解は35です。","config_0":"モデル次元は通常 $d_{model}=head\\_count \\times head\\_dim$ です。計算：$4\\times16=64$。よって正解は64です。","config_1":"計算：$8\\times8=64$。よって正解は64です。","config_2":"要素数は $10\\times10=100$ です。よって正解は100です。","config_3":"計算：$12\\times12=144$。よって正解は144です。","config_4":"計算：$6\\times12=72$。よって正解は72です。","config_5":"計算：$3\\times24=72$。よって正解は72です。","config_6":"計算：$14\\times14=196$。よって正解は196です。","config_7":"計算：$16\\times16=256$。よって正解は256です。","config_8":"計算：$12\\times10=120$。よって正解は120です。","config_9":"計算：$20\\times20=400$。よって正解は400です。","ensemble_4":"異なるヘッドの誤りが完全に同じでないなら、結合によって分散が減る効果が期待できます。よって正解は1です。","ensemble_5":"ヘッドの多様性の目的は、異なる特徴を観測できるようにして、結合の利点を得ることです。よって正解は1です。","ensemble_6":"実運用では、正確度と遅延（SLA）を両方満たす必要があるため、バランスが重要です。よって正解は1です。","ensemble_7":"性能が向上しない場合、まずヘッドの多様性不足を確認してください。似たパターンしか学ばないヘッドでは、アンサンブルの効果が小さくなります。よって正解は1です。"},"problemTestCodes":{"concept_0":"answer = 1\nassert answer == 1","concept_1":"answer = 1\nassert answer == 1","concept_2":"answer = 2\nassert answer == 2","concept_3":"answer = 1\nassert answer == 1","concept_4":"answer = 1\nassert answer == 1","concept_5":"answer = 1\nassert answer == 1","ox_0":"answer = 1\nassert answer == 1","ox_1":"answer = 0\nassert answer == 0","ox_2":"answer = 1\nassert answer == 1","ox_3":"answer = 0\nassert answer == 0","ox_4":"answer = 1\nassert answer == 1","ox_5":"answer = 1\nassert answer == 1","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 1\nassert answer == 1","scenario_3":"answer = 1\nassert answer == 1","vote_0":"weights = [3,2,1,2,1]\nvotes = [1,1,0,1,0]\nassert sum(w*v for w, v in zip(weights, votes)) == 7","vote_1":"probs = [0.92,0.63,0.71,0.48,0.83,0.69]\nassert sum(1 for p in probs if p >= 0.7) == 3","vote_2":"labels = [2,0,1,2,1,0,2,2]\nassert sum(1 for y in labels if y == 2) == 4","vote_3":"a_votes = 7\nb_votes = 4\nassert a_votes - b_votes == 3","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1","vote_4":"weights = [4,3,2,1,2,3,1,2]\nvotes = [1,1,1,0,1,0,1,1]\nassert sum(w*v for w, v in zip(weights, votes)) == 14","vote_5":"probs = [0.4,0.7,0.2,0.8,0.1,0.6,0.3,0.9,0.55,0.65]\nassert sum(1 for p in probs if p >= 0.6) == 5","vote_6":"a = [1,0,1,0,1,0,1,0,1,0,1,0]\nb = [1,1,1,0,0,0,1,1,1,0,1,1]\nassert sum(1 for x, y in zip(a, b) if x != y) == 4","vote_7":"a = [1,1,0,0,1,1,0,0,1,1,0,0]\nb = [1,0,0,1,1,0,0,1,1,0,0,1]\nassert sum(1 for x, y in zip(a, b) if x == 1 and y == 1) == 3","vote_8":"votes = [0,0,0,1,1,1,1,1,0,1]\nones = sum(votes)\nzeros = len(votes) - ones\nassert ones - zeros == 2","vote_9":"early = [1,1,1,1,1,0]\nlate = [0,0,1,0,1,0]\nassert sum(early) - sum(late) == 3","aggregate_0":"values = [2,1,2]\ntotal = sum(values)\nassert total == 5","aggregate_1":"values = [3,2,1,2]\nassert sum(values) == 8","aggregate_2":"values = [4,4,3,5,4]\nassert sum(values) == 20","aggregate_3":"values = [6,5,7,6]\nassert sum(values) == 24","ensemble_0":"answer = 1\nassert answer == 1","ensemble_1":"answer = 1\nassert answer == 1","ensemble_2":"answer = 1\nassert answer == 1","ensemble_3":"answer = 1\nassert answer == 1","aggregate_4":"values = [5,4,6,5,4,6]\nassert sum(values) == 30","aggregate_5":"values = [7,8,6,9]\nassert sum(values) == 30","aggregate_6":"values = [10,12,11,9,8]\nassert sum(values) == 50","aggregate_7":"values = [14,16,15]\nassert sum(values) == 45","aggregate_8":"values = [1,2,1,2,1,2,1,2]\nassert sum(values) == 12","aggregate_9":"values = [3,5,7,9,11]\nassert sum(values) == 35","config_0":"head_count, head_dim = 4, 16\nd_model = head_count * head_dim\nassert d_model == 64","config_1":"head_count, head_dim = 8, 8\nd_model = head_count * head_dim\nassert d_model == 64","config_2":"tokens = 10\ncells = tokens * tokens\nassert cells == 100","config_3":"tokens = 12\ncells = tokens * tokens\nassert cells == 144","config_4":"head_count, head_dim = 6, 12\nassert head_count * head_dim == 72","config_5":"head_count, head_dim = 3, 24\nassert head_count * head_dim == 72","config_6":"tokens = 14\nassert tokens * tokens == 196","config_7":"tokens = 16\nassert tokens * tokens == 256","config_8":"head_count, head_dim = 12, 10\nassert head_count * head_dim == 120","config_9":"tokens = 20\nassert tokens * tokens == 400","ensemble_4":"answer = 1\nassert answer == 1","ensemble_5":"answer = 1\nassert answer == 1","ensemble_6":"answer = 1\nassert answer == 1","ensemble_7":"answer = 1\nassert answer == 1"},"problemDifficulty":{"concept_0":"easy","concept_1":"easy","concept_2":"easy","concept_3":"easy","concept_4":"easy","concept_5":"easy","ox_0":"easy","ox_1":"easy","ox_2":"easy","ox_3":"easy","ox_4":"easy","ox_5":"easy","scenario_0":"easy","scenario_1":"easy","scenario_2":"easy","scenario_3":"easy","vote_0":"easy","vote_1":"easy","vote_2":"easy","vote_3":"easy","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","vote_4":"medium","vote_5":"medium","vote_6":"medium","vote_7":"medium","vote_8":"medium","vote_9":"medium","aggregate_0":"medium","aggregate_1":"medium","aggregate_2":"medium","aggregate_3":"medium","ensemble_0":"medium","ensemble_1":"medium","ensemble_2":"medium","ensemble_3":"medium","aggregate_4":"hard","aggregate_5":"hard","aggregate_6":"hard","aggregate_7":"hard","aggregate_8":"hard","aggregate_9":"hard","config_0":"hard","config_1":"hard","config_2":"hard","config_3":"hard","config_4":"hard","config_5":"hard","config_6":"hard","config_7":"hard","config_8":"hard","config_9":"hard","ensemble_4":"hard","ensemble_5":"hard","ensemble_6":"hard","ensemble_7":"hard"},"problemOrder":["concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","ox_0","ox_1","ox_2","ox_3","ox_4","ox_5","scenario_0","scenario_1","scenario_2","scenario_3","vote_0","vote_1","vote_2","vote_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","vote_4","vote_5","vote_6","vote_7","vote_8","vote_9","aggregate_0","aggregate_1","aggregate_2","aggregate_3","ensemble_0","ensemble_1","ensemble_2","ensemble_3","aggregate_4","aggregate_5","aggregate_6","aggregate_7","aggregate_8","aggregate_9","config_0","config_1","config_2","config_3","config_4","config_5","config_6","config_7","config_8","config_9","ensemble_4","ensemble_5","ensemble_6","ensemble_7"]},"advDlCh02":{"chapter":"Chapter 02","title":"トランスフォーマー: 位置エンコーディングとフィードフォワード","description":"セルフアテンションは**トークン同士の関係**を捉えますが、文中の**何番目か**という順序情報は単体では弱いことがあります。そこでトランスフォーマーはトークン埋め込みに**位置エンコーディング(PE)**を足し、「どの位置の単語か」をモデルに伝えます。ブロック内で関係を混ぜたあと、**フィードフォワード(FFN)**が各トークン表現を深く更新します。本章では正弦・余弦型PEの直感、学習型位置埋め込みとの違い、FFNの**トークンごとのMLP**役割を初心者向けに整理します。","sectionTitle":"トランスフォーマー: 位置エンコーディングとフィードフォワード","whatIs":{"0":"**1. 概念: なぜ位置エンコーディングか**\n\nセルフアテンションは系列全体を見ますが、入力が埋め込みの並びだけだと**先頭と末尾**の区別が弱くなります。**位置エンコーディング**は各位置 $p$ に長さ $d_{model}$ のベクトル $PE(p)$ を作り、埋め込みに**足して**順序を伝えます。\n\n**直感:** 映画館の座席に列・番がないと迷います。PEは各トークン席に**番号札**を付けます。\n\n**数式:** トークン埋め込みを $x_t$ とすると、多くの場合 $h_t^{(0)} = x_t + PE(t)$ です。\n\n**応用:** 翻訳・要約・QAでは語順が意味を変えるため、BERT/GPT 系は位置情報を必ず入れます。","1":"**2. 概念: 正弦・余弦 PE（時計のたとえ）**\n\n**まず直感だけ:** アナログ時計を想像してください。秒針は速く、分針は中くらい、時針はとてもゆっくり動きます。**3本の針の向きの組み合わせ**で「今何時何分」が分かるように、**文の何番目のトークンか**も数字のパターンで区別しやすくします。針の**回る速さが違う**ので、2つの時刻が**近いか遠いか（相対距離）**も読み取りやすくなります。正弦・余弦 PE も、**遅い波と速い波をいくつも重ねて**位置ごとに違うベクトルを作る発想に近いです。\n\n**もう一歩だけ:** 古典的トランスフォーマーは、次元を分けて $\\sin$ 型・対になる $\\cos$ 型の**繰り返す（周期的な）値**を入れ、複数の周波数帯で**近い位置と遠い位置**を分けやすくします。\n\n**数式（暗記不要・参照用）:** $PE(t,2i)=\\sin(t/10000^{2i/d_{model}})$、$PE(t,2i+1)=\\cos(t/10000^{2i/d_{model}})$ など。$t$ は**位置番号**、$i$ は**次元インデックス**、$d_{model}$ は**ベクトルの長さ**です。\n\n**かんたん解説:** 式全体は「**何番目($t$)**ごとに、数字の**位置パターン（指紋）**を1本作る」イメージで十分です。ベクトルは長さ $d_{model}$ の**たくさんの成分**で、隣り合う2成分ずつが**回る速さの違う波**になります。**$t$**は「文の**何番目のトークン**か」、**$i$**は「**どの周波数帯（遅い波〜速い波）**を使うか」に近いです。**$d_{model}$**は全体の長さで、指数の中で**波が極端に速すぎ/遅すぎ**にならないようスケールを合わせます。**隣の位置**では値が**少しずつ**しか変わらず、**離れた位置**ほどパターンが**違いやすく**、「前後の距離感」を読み取りやすくなります。**$\\sin$ と $\\cos$ のペア**は、**針の向き（角度）**を2つの数で書くのに似て、1本の波だけより安定して位置を表せます（細部は暗記不要）。\n\n**応用:** 長い文脈のエンコーダ、その後 RoPE などへ発展。","2":"**3. 概念: フィードフォワード(FFN) — トークンごとの「個別面談」**\n\n**一行:** **注意(アテンション)** はトークン同士が**混ざり合う**段階、**FFN** はそのあと **各位置の列を分けたまま**、**同じ**小さなネットを**列ごとに1回ずつ**通す段階です（上の図の緑の**計算ブロック**に近いです）。\n\n**たとえ:** 全員ミーティング（注意）のあと、**一人ずつ**ブースに入って**個別ヒアリング**（FFN）を受けるイメージです。ベクトル幅 $d_{model}$ をいったん**広げて**（中間が太い）また**元の幅に戻す**砂時計型が一般的です。\n\n**なぜ必要？** 注意だけだと「掛け算・足し算」中心になりがちです。FFN に **ReLU**（$\\max(0,\\cdot)$）などの**非線形**を入れて、直線だけでは表せない**複雑な形**を学べます。\n\n**数式（参照）:** $\\mathrm{FFN}(x)=\\max(0,xW_1+b_1)W_2+b_2$。$W_1,W_2$ は多くの場合**全位置で共有**です。\n\n**応用:** 感情分析・NER など。注意が文脈を集め、FFN が各トークンを磨く。","3":"**4. 概念: ブロック内の流れ — コンベアの一駅**\n\n**一行:** エンコーダ**ブロック1つ**は、工場の**一駅**のように、いつも**同じ順番**で処理します。\n\n**かんたんな順序:**\n1. **準備:** 埋め込みに **PE** を足し、「何番目か」が載った状態にする。\n2. **混ぜる:** **注意**でトークン間が文脈を交換する。\n3. **つなぐ:** **Add & Norm** — 手前の値を**足す（残差）**のと、**層正規化**でスケールをそろえる。\n4. **列ごと:** **FFN**で**各位置**を非線形に更新する。\n5. もう一度 **Add & Norm** で締める。\n\n**数式（参照）:** まず $h'=\\mathrm{LayerNorm}(h+\\mathrm{Attn}(h))$、つづけて $h''=\\mathrm{LayerNorm}(h'+\\mathrm{FFN}(h'))$。この**かたまり**を何十回も積む。\n\n**応用:** 検索・チャット・コード生成など。"},"whyImportant":{"0":"**順序は意味を変える**\n\n「ごはんを食べた」と語順を変えると文法・意味が変わります。PEがないと一貫して保つのが難しくなります。金融ログでも**時系列**は不正検知の要です。","1":"**FFNが非線形を担う**\n\n注意は主に線形変換とソフトマックスの組み合わせですが、FFNは高次元へ広げて ReLU/GELU などを入れ、**複雑な規則**を学びます。","2":"**計算のトレードオフ**\n\n$d_{ff}$ や層数を上げると表現力は上がりますがGPUコストと遅延も増えます。","3":"**最新モデルへの土台**\n\n絶対位置埋め込み、正弦PE、RoPE、ALiBiなど進化は続きますが、「順序をテンソルに載せる」考え方は同じです。"},"howUsed":{"0":"**実務: トークン化 → 埋め込み → +PE**\n\nトークン化し、埋め込み行列をかけ、位置ベクトルを足します。学習可能なPEテーブルは max_position_embeddings などで長さを決めます。長文QAでは**コンテキスト長**も一緒に設計します。","1":"**FFNのハイパーパラメータ**\n\nintermediate_size ($d_{ff}$)、活性化（GELU）、ドロップアウトなど。例: $d_{model}=768$ なら $d_{ff}=3072$ がよく使われます。","2":"**デコーダの注意**\n\nマスクで未来を隠しても、PEは**左から右への順序**を伝えます。","3":"**デバッグのヒント**\n\n順序が重要ならPE/RoPE/文脈長を確認し、表現が単調ならFFN幅・深さ・活性化を見ます。"},"problemSolving":{"0":"PE・FFNの問題は「順序はPE、トークン間の関係は注意、トークンごとの非線形はFFN」と役割分けすると解きやすいです。典型は $h=x+PE(pos)$ で、FFNは同じ層で位置間に同じMLP重みを共有することが多いです。$d_{ff}$・深さ・文脈長は表現力とコストを一緒に動かします。","2":"$26","3":"**短い例（○×）** — 「注意だけで絶対順序が常に完全に分かる。」→ ×（PE等が必要）。**正答 0**\n\n---\n\n**短い例（○×）** — 「正弦PEは複数周波数で位置を区別する。」→ ○。**正答 1**\n\n---\n\n**短い例（計算）** — 「$N=50$ のとき密なスコア行列のセル数は？」→ $2500$。**正答 2500**"},"summary":"注意機構が強力でも、各トークンが**どの位置か**を安定して伝えるには、順序情報を別途ベクトルで載せる必要があります。正弦・余弦PEは複数の周波数で位置パターンを作り、埋め込みに足して初期表現を完成させます。その後、注意がトークン間を調整し、FFNが各位置で同じ非線形変換を繰り返して表現を練ります。拡張してから戻すFFNは、品質と計算コストの現実的なつまみです。","sectionLabels":{"whatIs":"どんな考えか","whyImportant":"なぜ重要か","howUsed":"どう使うか","summary":"まとめ"},"formulaGuide":{"title":"数式の読み方","linear":"$$h_t^{(0)} = x_t + PE(t)$ で、$x_t$ はトークン埋め込み、$PE(t)$ は位置 $t$ のベクトルです。**内容**と**順番（何番目かを数にした情報）**を足して入力を作ります。","xavierVariance":"正弦・余弦PEは $PE(t,2i)=\\sin(t/10000^{2i/d})$、$PE(t,2i+1)=\\cos(t/10000^{2i/d})$ の形で、複数の周波数 $i$ で位置を符号化します。$d$ は $d_{model}$、$t$ はトークンインデックスです。","heVariance":"$$\\mathrm{FFN}(h)=W_2\\,\\sigma(W_1 h+b_1)+b_2$ で、$\\sigma$ は非線形、$W_1$ は $d_{model}\\to d_{ff}$、$W_2$ は $d_{ff}\\to d_{model}$ です。","xavierUniform":"**重み共有**（各位置で同じFFN）は汎化を助け、実装を簡単にします。"},"visual":"位置エンコーディングとFFNの流れを示すインタラクティブ可視化です。","problemSolvingLabel":"解法のための説明","practiceProblemsTitle":"練習問題","practiceProblemsIntro":"以下は60問のプールから無作為に選んだ10問です。難易度は易しめ4・中3・難3で、答えは**整数のみ**です。","practiceProblemsInstruction":"指示文と設問を読み、答えを整数で入力してください。","practiceProblemsInstructionConcept":"設問と①②③を読み、最も適切な選択番号1つだけを入力してください。","practiceProblemsInstructionOx":"文が正なら1、誤りなら0だけを入力してください。","practiceProblemsInstructionScenario":"状況説明と①②③を読み、条件に合う選択番号1つだけを入力してください。","practiceProblemsInstructionVote":"与えられた二値ベクトル(0/1)の1の個数(和)を整数1つで入力してください。","practiceProblemsInstructionAggregate":"与えられた数の合計を整数1つで入力してください。","practiceProblemsInstructionConfig":"格子・構成の設問を読み、求める値（例: 一辺$n$の正方形マス数$n^2$）を整数1つで入力してください。","practiceProblemsInstructionEnsemble":"設問と①②③を読み、最も適切な説明の選択番号1つだけを入力してください。","advDlCh02VisualZoneLabelTop":"上","advDlCh02VisualZoneLabelBottom":"下","advDlCh02VisualIntroTop":"左から右に読み、各マスで **意味** と **何番目かを数にした情報（PE）** を **足す**。","advDlCh02VisualIntroBottom":"本同士は **混ぜず**、**同じ計算ブロック**（同じ重み・同じ演算）を 4 本が **それぞれ** 一度ずつ通ります。","advDlCh02VisualIntroNote":"論文ではこの計算ブロックを **FFN** と呼びます。","advDlCh02VisualStep0":"① **意味** + **何番目か** を足す（PE を足すのと同じ考え方）","advDlCh02VisualStep1":"② そのあと（必要なら）注意で周りのトークンと混ぜる","advDlCh02VisualStep2":"③ FFN: 広い中間層 → 非線形(一度曲げる) → 元の幅へ戻して出力","advDlCh02VisualStep3":"④ 少し足して(+)、整えて、次の層か出力へ","advDlCh02VisualConceptTitle":"① 入力を作る →（中間は省略）→ ② 本ごとに同じFFN","advDlCh02VisualBridgeLead":"**①**のあと **②**が、同じブロックの中で順に進みます。","advDlCh02VisualBridgeBlock1":"**①** まず **意味+順番(PE)** を足して **入力**を作ります。（間の注意は図では省略）","advDlCh02VisualBridgeBlock2":"**②** そのあと **同じFFN** を本ごとに一度ずつ通します。本同士は混ぜません。","advDlCh02VisualBridgeMicroCaption":"1ブロック内の順番","advDlCh02VisualAnimHint":"図が段階ごとにゆっくり強調されます（約7秒ずつ）。","advDlCh02VisualAnimStepPe":"① 入力","advDlCh02VisualAnimStepBridge":"つなぎ","advDlCh02VisualAnimStepFfn":"② FFN","advDlCh02VisualFlowTitle":"全体の流れ: 分割 → 順番情報を足す → 層を繰り返す → 予測","advDlCh02VisualModelTitle":"一言: 意味と順番を混ぜたベクトルが層を通る","advDlCh02VisualInputTokenLabel":"入力トークン + 位置","advDlCh02VisualTokenRelationLabel":"トークン埋め込み + PE の合成","advDlCh02VisualContextVectorOutputLabel":"トークンごとの更新表現","advDlCh02VisualContextVectorExplainLine1":"FFNは各位置で","advDlCh02VisualContextVectorExplainLine2":"同じMLPで非線形変換","advDlCh02VisualCoreFormulaLabel":"式では: **意味+順番(PE)** を $h{+}PE$ にし、**各本**で $\\mathrm{FFN}(h)$ が整える","advDlCh02VisualLegendWeak":"低い中間活性","advDlCh02VisualLegendMedium":"中程度","advDlCh02VisualLegendStrong":"高い中間活性","advDlCh02VisualCurrentSuffix":"（現在）","advDlCh02VisualPanelPeTitle":"① 意味と順の数（PE）を一つにまとめる","advDlCh02VisualPanelFfnTitle":"② 同じ計算ブロックで一本ずつ整える（FFN）","advDlCh02VisualTrainCaption":"**文の中で何番目の語か**を数で書き留めるのに近いです。","advDlCh02VisualSameMachineHint":"3本は混ぜず、同じ計算ブロックだけ通過","advDlCh02VisualMachineIn":"入力","advDlCh02VisualMachineMid":"広い層","advDlCh02VisualMachineOut":"出力","advDlCh02VisualMachineAct":"非線形","advDlCh02VisualEmbShort":"意味","advDlCh02VisualPosShort":"位置","advDlCh02VisualPosSlotShort":"番号","advDlCh02VisualPeShort":"順の値","advDlCh02VisualSumPrimary":"{slot}の合成","advDlCh02VisualSumSub":"意味+順の値","advDlCh02VisualFfnSameNote":"4本とも **同じ計算ブロック**（W₁, W₂ 共有）","advDlCh02VisualFfnPerToken":"本","advDlCh02VisualFfnInLabel":"マス幅","advDlCh02VisualLegendExpand":"広げる","advDlCh02VisualLegendNonlin":"非線形","advDlCh02VisualLegendProject":"狭める","advDlCh02VisualLegendFfnLabel":"計算ブロック(FFN)","problems":{"concept_0":"セルフアテンションだけでは順序が弱い。順序をベクトルで入れるのは? ① 位置エンコーディング ② ドロップアウトのみ ③ バッチ正規化のみ","concept_1":"元論文の正弦PEで、偶数次元 $2i$ には通常? ① $\\sin$ ② $\\cos$ ③ ReLU","concept_2":"トランスフォーマーブロックのFFNは各トークンに何をする? ① トークン間を混ぜる ② 同じMLPを適用して表現を深める ③ 系列長を縮める","concept_3":"よく $d_{ff}=4d_{model}$。$d_{model}=128$ なら自然な $d_{ff}$ は? ① 256 ② 512 ③ 64","concept_4":"学習可能な位置埋め込みに近いのは? ① 位置ベクトルを足す ② $\\sin$ のみ ③ 位置なし","concept_5":"文の順序がラベルに重要なとき、注意と一緒に必要な入力は? ① 埋め込み+位置 ② ピクセルのみ ③ ファイル名のみ","ox_0":"加算型PEは通常トークン埋め込みに足される。正=1、誤=0。","ox_1":"FFNは系列全体に一度にソフトマックスをかける。正=1、誤=0。","ox_2":"同じFFN重みを位置間で共有するのが一般的。正=1、誤=0。","ox_3":"正弦PEは相対距離を周期的パターンで反映するよう設計された。正=1、誤=0。","ox_4":"通常 $d_{ff}$ は $d_{model}$ より小さいだけ。正=1、誤=0。","ox_5":"エンコーダで注意の後のFFNはNLPで広く使われる。正=1、誤=0。","scenario_0":"医療要約で投与前後の順序が重要。まず強化するのは? ① PEを含む順序 ② 画像回転 ③ バッチサイズのみ","scenario_1":"スパムで「無料」と「今すぐクリック」が離れていても関係がある。注意と順序を入れるには? ① 埋め込み+PE ② 色空間 ③ 音声のみ","scenario_2":"詐欺テキストで金額と時間の順序がラベルに関係。表現力を広げる層は? ① トークンごとFFN ② プーリングのみ ③ 正規表現のみ","scenario_3":"法文書で条の相対距離が重要。周期的パターンに強い古典PEは? ① 正弦PE ② ランダム削除 ③ 拡張子","scenario_4":"「今日」「明日」の順序を混同する。まず確認? ① PE+埋め込み ② 解像度 ③ フォント","scenario_5":"FFN中間次元を上げると計算も増える。バランスは? ① $d_{ff}$ と遅延 ② DPI ③ テーマ色","scenario_6":"語順が違う言語対。前処理は? ① サブワード埋め込み+PE ② ピクセル正規化のみ ③ 圧縮のみ","scenario_7":"長いログで前方の否定が後方を変える。順序を保つには? ① PE付き入力 ② 語長のみ ③ UUIDのみ","scenario_8":"感情分析で「ない」「よい」の後に非線形が要る? ① FFN ② 平均のみ ③ 停止","scenario_9":"FFNを外すと性能が大きく落ちた。理由は? ① 深い非線形変換が失われる ② バッチが1 ③ GPU消失","vote_0":"票 [1,1,0,1,0] の1の個数は?","vote_1":"票 [1,0,1,1,1,0] の1の個数は?","vote_2":"票 [0,0,1,0,1,1,1,0] の1の個数は?","vote_3":"票 [1,1,1,1,0,0,1,0,1,1] の1の個数は?","vote_4":"票 [1,1,1,0,1,0,1,1] の1の個数は?","vote_5":"票 [0,1,0,1,0,1,0,1,1,1] の1の個数は?","vote_6":"票 [1,0,1,0,1,0,1,0,1,0,1,0] の1の個数は?","vote_7":"票 [1,1,0,0,1,1,0,0,1,1,0,0] の1の個数は?","vote_8":"票 [0,0,0,1,1,1,1,1,0,1] の1の個数は?","vote_9":"票 [1,1,1,1,1,0,0,0,1,0,1,0] の1の個数は?","aggregate_0":"三ヘッドの陽性予測数 [2,1,2] の合計は?","aggregate_1":"四ブロックのスパムスコア [3,2,1,2] の合計は?","aggregate_2":"五つのFFN活性数 [4,4,3,5,4] の合計は?","aggregate_3":"四位置のPEマッチ数 [6,5,7,6] の合計は?","aggregate_4":"六層スコア [5,4,6,5,4,6] の合計は?","aggregate_5":"クラス0の数 [7,8,6,9] の合計は?","aggregate_6":"キーワード一致 [10,12,11,9,8] の合計は?","aggregate_7":"バッチ陽性 [14,16,15] の合計は?","aggregate_8":"八ヘッド誤り [1,2,1,2,1,2,1,2] の合計は?","aggregate_9":"位置関心トークン数 [3,5,7,9,11] の合計は?","ensemble_0":"ブロックを積む効果に近いのは? ① 段階的抽象で複雑パターン ② パラメータゼロ ③ 学習不能","ensemble_1":"深さで誤差が相殺しうる理由は? ① 層ごとに異なる変換 ② 常に同じ出力 ③ データ削除","ensemble_2":"単層FFNより多層が強い理由は? ① 非線形の反復で表現力 ② 長さ1強制 ③ softmax削除","ensemble_3":"ブロックを増やすとき注意は? ① 性能・計算・過学習 ② 無限増加 ③ 検証不要","ensemble_4":"層が似た機能だけなら? ① 冗長で利益小 ② 必ず向上 ③ 学習不能","ensemble_5":"深さの目的は? ① 段階的抽象 ② 同一コピー ③ 固定","ensemble_6":"本番で層数を決めるときは? ① 精度と遅延 ② リフレッシュレート ③ アイコン","ensemble_7":"伸び悩むときは? ① 層が同じパターンか ② ファイル名 ③ テーマ","config_0":"ヘッド4、ヘッド次元16 のとき $d_{model}$ は?","config_1":"ヘッド8、ヘッド次元8 のとき $d_{model}$ は?","config_2":"トークン10 のとき注意スコア行列は $10\\times10$。値は?","config_3":"トークン12 のとき $12\\times12$。値は?","config_4":"ヘッド6、ヘッド次元12 のとき $d_{model}$ は?","config_5":"ヘッド3、ヘッド次元24 のとき $d_{model}$ は?","config_6":"長さ14 のとき $14\\times14$ の値は?","config_7":"長さ16 のとき $16\\times16$ の値は?","config_8":"ヘッド12、ヘッド次元10 のとき $d_{model}$ は?","config_9":"トークン20 のとき $20\\times20$ の値は?"},"problemAnswers":{"concept_0":1,"concept_1":1,"concept_2":2,"concept_3":2,"concept_4":1,"concept_5":1,"ox_0":1,"ox_1":0,"ox_2":1,"ox_3":1,"ox_4":0,"ox_5":1,"scenario_0":1,"scenario_1":1,"scenario_2":1,"scenario_3":1,"vote_0":3,"vote_1":4,"vote_2":4,"vote_3":7,"scenario_4":1,"scenario_5":1,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1,"vote_4":6,"vote_5":6,"vote_6":6,"vote_7":6,"vote_8":6,"vote_9":7,"aggregate_0":5,"aggregate_1":8,"aggregate_2":20,"aggregate_3":24,"ensemble_0":1,"ensemble_1":1,"ensemble_2":1,"ensemble_3":1,"aggregate_4":30,"aggregate_5":30,"aggregate_6":50,"aggregate_7":45,"aggregate_8":12,"aggregate_9":35,"config_0":64,"config_1":64,"config_2":100,"config_3":144,"config_4":72,"config_5":72,"config_6":196,"config_7":256,"config_8":120,"config_9":400,"ensemble_4":1,"ensemble_5":1,"ensemble_6":1,"ensemble_7":1},"problemSolutions":{"concept_0":"純粋な自己注意だけでは順序手がかりが弱くなりやすく、PEで補います。正解 1.","concept_1":"古典的な正弦PEでは偶数次元 $2i$ に $\\sin$ を使う構成が一般的です。正解 1.","concept_2":"FFNはトークン同士を混ぜず、各位置に同じMLPを適用して表現を深めます。正解 2.","concept_3":"$$4\\times128=512$. 正解 2.","concept_4":"学習可能な絶対位置埋め込みは、位置ごとに学習ベクトルを加える考え方です。正解 1.","concept_5":"順序が重要な課題では埋め込みに位置情報を合わせて入れる必要があります。正解 1.","ox_0":"加算型PEは埋め込みに足し合わせます。正解 1.","ox_1":"FFNは位置ごとの変換であり、系列長方向の1回softmaxではありません。正解 0.","ox_2":"同じFFN重みを位置間で共有するのが一般的です。正解 1.","ox_3":"周期的な設計で相対的な距離手がかりを表しやすくします。正解 1.","ox_4":"多くは $d_{ff} \\ge d_{model}$ なので、この文は誤りです。正解 0.","ox_5":"標準的なNLPブロックでFFNは広く使われます。正解 1.","scenario_0":"医療文書の順序情報にはPE付き入力が有効です。正解 1.","scenario_1":"離れた語の関係を扱うには埋め込み+PEを注意と併用します。正解 1.","scenario_2":"逐トークンFFNで特徴を拡張します。正解 1.","scenario_3":"古典的な正弦PEが適合します。正解 1.","scenario_4":"まずPEと埋め込みの接続設定を確認します。正解 1.","scenario_5":"FFN幅と遅延のバランス調整が必要です。正解 1.","scenario_6":"サブワード埋め込み+PEが基本です。正解 1.","scenario_7":"順序維持にはPE付き入力が有効です。正解 1.","scenario_8":"非線形性の追加にはFFNが必要です。正解 1.","scenario_9":"FFN除去で深い非線形変換が失われるためです。正解 1.","vote_0":"合計は 3。正解 3.","vote_1":"合計は 4。正解 4.","vote_2":"合計は 4。正解 4.","vote_3":"合計は 7。正解 7.","vote_4":"合計は 6。正解 6.","vote_5":"合計は 6。正解 6.","vote_6":"合計は 6。正解 6.","vote_7":"合計は 6。正解 6.","vote_8":"合計は 6。正解 6.","vote_9":"合計は 7。正解 7.","aggregate_0":"$$2+1+2=5$. 正解 5.","aggregate_1":"$$3+2+1+2=8$. 正解 8.","aggregate_2":"$$4+4+3+5+4=20$. 正解 20.","aggregate_3":"$$6+5+7+6=24$. 正解 24.","ensemble_0":"深さを積むと段階的な表現が作れます。正解 1.","ensemble_1":"層ごとに異なる変換が可能なためです。正解 1.","ensemble_2":"非線形を重ねることで表現力が増します。正解 1.","ensemble_3":"過学習と計算コストの両方を確認すべきです。正解 1.","aggregate_4":"合計は 30。正解 30.","aggregate_5":"合計は 30。正解 30.","aggregate_6":"合計は 50。正解 50.","aggregate_7":"合計は 45。正解 45.","aggregate_8":"合計は 12。正解 12.","aggregate_9":"合計は 35。正解 35.","config_0":"$$4\\times16=64$. 正解 64.","config_1":"$$8\\times8=64$. 正解 64.","config_2":"$$10\\times10=100$. 正解 100.","config_3":"$$12\\times12=144$. 正解 144.","config_4":"$$6\\times12=72$. 正解 72.","config_5":"$$3\\times24=72$. 正解 72.","config_6":"$$14\\times14=196$. 正解 196.","config_7":"$$16\\times16=256$. 正解 256.","config_8":"$$12\\times10=120$. 正解 120.","config_9":"$$20\\times20=400$. 正解 400.","ensemble_4":"機能が重複した層は改善幅が小さくなります。正解 1.","ensemble_5":"深さは段階的な抽象化を可能にします。正解 1.","ensemble_6":"精度と遅延の両立で判断します。正解 1.","ensemble_7":"表現の多様性が出ているか確認します。正解 1."},"problemTestCodes":{"concept_0":"answer = 1\nassert answer == 1","concept_1":"answer = 1\nassert answer == 1","concept_2":"answer = 2\nassert answer == 2","concept_3":"answer = 2\nassert answer == 2","concept_4":"answer = 1\nassert answer == 1","concept_5":"answer = 1\nassert answer == 1","ox_0":"answer = 1\nassert answer == 1","ox_1":"answer = 0\nassert answer == 0","ox_2":"answer = 1\nassert answer == 1","ox_3":"answer = 1\nassert answer == 1","ox_4":"answer = 0\nassert answer == 0","ox_5":"answer = 1\nassert answer == 1","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 1\nassert answer == 1","scenario_3":"answer = 1\nassert answer == 1","vote_0":"votes = [1,1,0,1,0]\nassert sum(votes) == 3","vote_1":"votes = [1,0,1,1,1,0]\nassert sum(votes) == 4","vote_2":"votes = [0,0,1,0,1,1,1,0]\nassert sum(votes) == 4","vote_3":"votes = [1,1,1,1,0,0,1,0,1,1]\nassert sum(votes) == 7","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1","vote_4":"votes = [1,1,1,0,1,0,1,1]\nassert sum(votes) == 6","vote_5":"votes = [0,1,0,1,0,1,0,1,1,1]\nassert sum(votes) == 6","vote_6":"votes = [1,0,1,0,1,0,1,0,1,0,1,0]\nassert sum(votes) == 6","vote_7":"votes = [1,1,0,0,1,1,0,0,1,1,0,0]\nassert sum(votes) == 6","vote_8":"votes = [0,0,0,1,1,1,1,1,0,1]\nassert sum(votes) == 6","vote_9":"votes = [1,1,1,1,1,0,0,0,1,0,1,0]\nassert sum(votes) == 7","aggregate_0":"values = [2,1,2]\nassert sum(values) == 5","aggregate_1":"values = [3,2,1,2]\nassert sum(values) == 8","aggregate_2":"values = [4,4,3,5,4]\nassert sum(values) == 20","aggregate_3":"values = [6,5,7,6]\nassert sum(values) == 24","ensemble_0":"answer = 1\nassert answer == 1","ensemble_1":"answer = 1\nassert answer == 1","ensemble_2":"answer = 1\nassert answer == 1","ensemble_3":"answer = 1\nassert answer == 1","aggregate_4":"values = [5,4,6,5,4,6]\nassert sum(values) == 30","aggregate_5":"values = [7,8,6,9]\nassert sum(values) == 30","aggregate_6":"values = [10,12,11,9,8]\nassert sum(values) == 50","aggregate_7":"values = [14,16,15]\nassert sum(values) == 45","aggregate_8":"values = [1,2,1,2,1,2,1,2]\nassert sum(values) == 12","aggregate_9":"values = [3,5,7,9,11]\nassert sum(values) == 35","config_0":"assert 4 * 16 == 64","config_1":"assert 8 * 8 == 64","config_2":"assert 10 * 10 == 100","config_3":"assert 12 * 12 == 144","config_4":"assert 6 * 12 == 72","config_5":"assert 3 * 24 == 72","config_6":"assert 14 * 14 == 196","config_7":"assert 16 * 16 == 256","config_8":"assert 12 * 10 == 120","config_9":"assert 20 * 20 == 400","ensemble_4":"answer = 1\nassert answer == 1","ensemble_5":"answer = 1\nassert answer == 1","ensemble_6":"answer = 1\nassert answer == 1","ensemble_7":"answer = 1\nassert answer == 1"},"problemDifficulty":{"concept_0":"easy","concept_1":"easy","concept_2":"easy","concept_3":"easy","concept_4":"easy","concept_5":"easy","ox_0":"easy","ox_1":"easy","ox_2":"easy","ox_3":"easy","ox_4":"easy","ox_5":"easy","scenario_0":"easy","scenario_1":"easy","scenario_2":"easy","scenario_3":"easy","vote_0":"easy","vote_1":"easy","vote_2":"easy","vote_3":"easy","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","vote_4":"medium","vote_5":"medium","vote_6":"medium","vote_7":"medium","vote_8":"medium","vote_9":"medium","aggregate_0":"medium","aggregate_1":"medium","aggregate_2":"medium","aggregate_3":"medium","ensemble_0":"medium","ensemble_1":"medium","ensemble_2":"medium","ensemble_3":"medium","aggregate_4":"hard","aggregate_5":"hard","aggregate_6":"hard","aggregate_7":"hard","aggregate_8":"hard","aggregate_9":"hard","config_0":"hard","config_1":"hard","config_2":"hard","config_3":"hard","config_4":"hard","config_5":"hard","config_6":"hard","config_7":"hard","config_8":"hard","config_9":"hard","ensemble_4":"hard","ensemble_5":"hard","ensemble_6":"hard","ensemble_7":"hard"},"problemOrder":["concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","ox_0","ox_1","ox_2","ox_3","ox_4","ox_5","scenario_0","scenario_1","scenario_2","scenario_3","vote_0","vote_1","vote_2","vote_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","vote_4","vote_5","vote_6","vote_7","vote_8","vote_9","aggregate_0","aggregate_1","aggregate_2","aggregate_3","ensemble_0","ensemble_1","ensemble_2","ensemble_3","aggregate_4","aggregate_5","aggregate_6","aggregate_7","aggregate_8","aggregate_9","config_0","config_1","config_2","config_3","config_4","config_5","config_6","config_7","config_8","config_9","ensemble_4","ensemble_5","ensemble_6","ensemble_7"]},"advDlCh03":{"chapter":"Chapter 03","title":"トランスフォーマー系譜：BERTは理解、GPTは生成","description":"トランスフォーマーという偉大な発明は、大きく二つの家系へと発展しました。文全体を一度に見通す **エンコーダ家のBERT（理解型）** と、これまでの語から次の語を途切れなく生み出す **デコーダ家のGPT（生成型）** です。BERTが「大学受験国語の穴埋め推論」の名人なら、GPTは「しりとりと小説執筆」の天才です。本章では、二つのモデルがどう学習し、実務でなぜ役割がまったく違うのかを、初心者にも追いやすい比喩で整理します。","sectionTitle":"トランスフォーマー系譜：BERTは理解、GPTは生成","whatIs":{"0":"**1. BERT：文を双方向に読み「理解」するエンコーダ型**\n\n**概念：** BERT（Bidirectional Encoder Representations from Transformers）は、Transformerの **エンコーダ** 部分だけを発展させたモデルです。核心は **双方向（Bidirectional）文脈** です。左の語と右の語を同時に参照し、現在の語が文中でどういう意味かを最も正確な **表現ベクトル** に落とし込みます。\n\n**直感：** 患者を診るとき、既往（左）と今日の検査（右）を **同時に** 広げて総合判断する名医のようです。全体像を一度に見られるので文脈把握に強いです。\n\n**数学：** BERTの代表的学習は **MLM（Masked Language Modeling）** です。文中の語に穴（`[MASK]`）を開け、周辺文脈から正解トークン $w_t$ の確率分布 $p(w_t \\mid \\text{全文脈})$ を当てるように訓練します。\n\n**応用：** 「このレビューはポジティブ？ネガティブ？」「文書から人名と日付を」など、テキスト分類・固有表現抽出・文書検索に広く使われます。","1":"**2. GPT：次の語を途切れなく「生成」するデコーダ型**\n\n**概念：** GPT（Generative Pre-trained Transformer）はTransformerの **デコーダ** を発展させたモデルです。文を最初から最後まで一度に見せないよう **マスク** で未来の語を隠し、 **過去のトークン（$1\\ldots t-1$）だけ** を見て次のトークン $t$ を予測する **自己回帰（Autoregressive）** です。\n\n**直感：** タイプライターで小説を書く作家のようです。**まだ書いていない次の文を先に見ることはできません。** ここまで書いた流れだけを手がかりに、自然な次の語を想像して綴ります。\n\n**数学：** 未来トークンが混ざらないよう、注意行列の上三角を $-\\infty$ で覆う **Causal Masking** を使います。学習は、与えられた $x_{> 3\nassert answer == 32","ensemble_1":"answer = 96 // 4\nassert answer == 24","ensemble_2":"answer = 80 // 2\nassert answer == 40","ensemble_3":"answer = 512 // 4\nassert answer == 128","ensemble_4":"answer = 14 * 14\nassert answer == 196","ensemble_5":"answer = 10 * 10\nassert answer == 100","ensemble_6":"answer = 8 * 8\nassert answer == 64","ensemble_7":"answer = 32 // 2\nassert answer == 16","config_0":"assert 8 * 8 == 64","config_1":"assert 9 * 9 == 81","config_2":"assert 10 * 10 == 100","config_3":"assert 11 * 11 == 121","config_4":"assert 12 * 12 == 144","config_5":"assert 6 * 6 == 36","config_6":"assert 7 * 7 == 49","config_7":"assert 16 * 16 == 256","config_8":"assert 20 * 20 == 400","config_9":"assert 25 * 25 == 625"},"problemDifficulty":{"concept_0":"easy","concept_1":"easy","concept_2":"easy","concept_3":"easy","concept_4":"easy","concept_5":"easy","ox_0":"easy","ox_1":"easy","ox_2":"easy","ox_3":"easy","ox_4":"easy","ox_5":"easy","scenario_0":"easy","scenario_1":"easy","scenario_2":"easy","scenario_3":"easy","vote_0":"easy","vote_1":"easy","vote_2":"easy","vote_3":"easy","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","vote_4":"medium","vote_5":"medium","vote_6":"medium","vote_7":"medium","vote_8":"medium","vote_9":"medium","aggregate_0":"medium","aggregate_1":"medium","aggregate_2":"medium","aggregate_3":"medium","ensemble_0":"medium","ensemble_1":"medium","ensemble_2":"medium","ensemble_3":"medium","aggregate_4":"hard","aggregate_5":"hard","aggregate_6":"hard","aggregate_7":"hard","aggregate_8":"hard","aggregate_9":"hard","config_0":"hard","config_1":"hard","config_2":"hard","config_3":"hard","config_4":"hard","config_5":"hard","config_6":"hard","config_7":"hard","config_8":"hard","config_9":"hard","ensemble_4":"hard","ensemble_5":"medium","ensemble_6":"hard","ensemble_7":"hard"},"problemOrder":["concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","ox_0","ox_1","ox_2","ox_3","ox_4","ox_5","scenario_0","scenario_1","scenario_2","scenario_3","vote_0","vote_1","vote_2","vote_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","vote_4","vote_5","vote_6","vote_7","vote_8","vote_9","aggregate_0","aggregate_1","aggregate_2","aggregate_3","ensemble_0","ensemble_1","ensemble_2","ensemble_3","aggregate_4","aggregate_5","aggregate_6","aggregate_7","aggregate_8","aggregate_9","config_0","config_1","config_2","config_3","config_4","config_5","config_6","config_7","config_8","config_9","ensemble_4","ensemble_5","ensemble_6","ensemble_7"]},"advDlCh13":{"chapter":"Chapter 15","title":"物体検出: R-CNN ファミリー vs YOLO（バウンディングボックスを見つける）","description":"**分類**は「この写真に猫がいる？」と聞きます。**物体検出**は一歩進んで **「猫はどこ(X,Y)に、どれくらい(W,H)？」** と尋ね、**バウンディングボックス**を描きます。自動運転・不良検査・ロボットビジョンの中核です。\n\n本章では分野を二分する2つの発想に出会います。疑わしい領域を先に探してから確認する **慎重な2-stage R-CNN** と、画像を格子のように分け **一度だけ** 見渡す **高速1-stage YOLO**。設計思想の違いと、箱の質を測るわかりやすい指標を学びます。","sectionTitle":"物体検出: R-CNN vs YOLO","whatIs":{"0":"**1. 分類 vs 検出：「何」から「どこにある何」へ**\n\n**画像分類**は「この部屋に猫がいる？」**物体検出**は「猫は**どこ**にいる？」写真中の複数物体に箱を描き、名前も当てる、より高度な作業です。","1":"**2. R-CNN 系 (2-stage)：慎重な探偵**\n\n①「ここに何かありそう」と**領域提案(RoI)**を多数出す → ②各候補を詳しく見て「猫だ！箱はこの大きさ！」と決める。**正確**だが2段階のため**やや遅い**。","2":"**3. YOLO (1-stage)：一目で把握する警備員**\n\n**YOLO**は名の通り画像を**一度だけ**見ます。**S×S 格子**に分け、各セルが同時に「私の区域に犬！」と叫び箱を描く。**リアルタイム**向きの圧倒的な速さ。","3":"**4. 品質の道具：IoU · NMS · mAP**\n\n- **IoU：** 予測と正解の箱がどれだけ重なるか(0~1)。核心は**交差÷結合**。詳しい式は**数式ガイド**へ。\n- **NMS（Non-Maximum Suppression）：** 同じ犬に箱が乱立したら、**お掃除**して**いちばん確かな1つ**だけ残す。\n- **mAP（mean Average Precision）：** どれだけうまく見つけ、箱を引けたかの**総合成績表**。"},"whyImportant":{"0":"**現実世界で動くAIの「目」**\n\n自動運転は歩行者・車の**正確な位置**がないとブレーキを踏めません。ロボットも**どこを掴むか**必要です。分類を超えた**空間理解**を与えます。","1":"**速度か精度か？用途に合わせて選ぶ**\n\nCCTV・自動運転では**YOLO(1-stage)**、医療画像の微細病変では**R-CNN(2-stage)**。両方の長所を知れば最適な選択ができます。","2":"**指標なしに「良い/悪い」は言えない**\n\nクラス名が合っても箱がズレれば意味がありません。**IoU**と**mAP**が客観的な証拠と改善の物差しになります。","3":"**セグメンテーションへの踏み台**\n\n箱はざっくりした外接矩形。検出をマスターすれば、ピクセル単位の**セグメンテーション**へ自然に伸びます。"},"howUsed":{"0":"**ステップ1：データと箱座標の準備**\n\n各物体の位置をラベル化。**(x_min, y_min, x_max, y_max)** または **(cx, cy, w, h)** のどちらかに統一します。","1":"**ステップ2：用途に合うネットワーク選択**\n\n**リアルタイム**なら**YOLO系格子**モデル。小さく密集した物体を高精度でなら**RPN付き Faster R-CNN**。","2":"**ステップ3：学習 — マッチングと損失**\n\n**IoU**で予測と正解を対応づけ、**分類誤差**と**回帰誤差**を同時に減らします。","3":"**ステップ4：重複除去(NMS)と成績確認(mAP)**\n\n低スコアを捨て、**NMS（Non-Maximum Suppression、お掃除）**で重複を整理し、検証データの**mAP（mean Average Precision、総合成績）**で性能を確認します。"},"problemSolving":{"0":"**まずこう読んで始めましょう**\n\n- 問われている軸を先に分ける: **分類 vs 検出 / R-CNN 2-stage vs YOLO 1-stage / IoU·NMS·mAP**\n- 計算問題は型を固定: YOLO 格子 **S×S** → 総セル数 **S²** (例: S=7 → **7×7=49**)\n- IoU·和集合: **和集合 = A + B − 交差**, 重なり **4×4** → 面積 **16**\n\n---\n\n**例（概念型）**\n「物体検出の目的に最も近いのは?」\n① 画像全体にクラス1つ ② **各物体のボックス+クラス** ③ ピクセル分割のみ ④ 学習率のみ\n**正解 2**\n\n**なぜ?** 検出は **何 + どこ** を同時に求めます。分類は全体ラベル1つです。\n\n---\n\n**例（O/X型）**\n「YOLOは常に2-stageのみを使う」\n**正解 0** (誤)\n\n**なぜ?** YOLOは **S×S 格子で1-stage** 一括予測です。\n\n---\n\n**例（計算型）**\n「YOLO 格子 S=7 の総セル数は?」 → **7×7=49**","1":"**問題タイプ別の例 + 正解の理由**\n\n**例（シナリオ型）**\n「推論後、同じ人の周りにボックスが5つ重なる。まず?」\n① **NMSで重複除去** ② ラベルシャッフル ③ バックボーン0層 ④ mAP削除\n**正解 1**\n\n**なぜ?** 重なった重複ボックスは **NMS** で整理します。\n\n---\n\n**例（選択計算型）**\n「ボックスA·B 各面積32、交差16 の和集合面積は?」\n**正解 48** (32+32-16)\n\n**なぜ?** **和集合 = A + B − 交差** の型です。\n\n---\n\n**例（格子型）**\n「YOLO 格子 S=9 の総セル数は?」\n**正解 81** (9×9)\n\n**なぜ?** **S×S 格子**は一辺のセル数を二乗します。\n\n---\n\n**例（総合推論型）**\n「CCTVでリアルタイム推論が必要。構造は?」\n① Selective Searchのみ ② 原典R-CNNのみ ③ **YOLO系1-stage** ④ 増強停止\n**正解 3**\n\n**なぜ?** **速度**重視なら **1-stage YOLO** を先に検討します。"},"summary":"**一行要約:** 物体検出は各物体の**種類と箱**を同時に求める技術。**2-stage R-CNN**と**1-stage YOLO**の二大流派。\n\n**要点:** **IoU**で重なり、**NMS（重複除去）**で整理、**mAP（総合成績）**が性能の物差し。\n\n**次:** 箱から**セグメンテーション**へ — ピクセル輪郭まで。","sectionLabels":{"whatIs":"概念","whyImportant":"重要性","howUsed":"使い方","summary":"まとめ","problemSolving":"問題解説ノート"},"formulaGuide":{"title":"数式の読み方（物体検出）","linear":"**1. IoU — 核心の式**\n\n$\\text{IoU}=|A\\cap B|/|A\\cup B|$\n\n- **交差:** 重なり\n- **結合:** 両方を覆う領域","xavierVariance":"**2. バウンディングボックス座標 — 写真の上の四角をどう書く?**\n\n物体を囲む **四角** の位置は、よく次の2通りで書きます。\n\n- **角の方式:** 左上・右下 **(x_min, y_min, x_max, y_max)** — 四角の **2つの角** を指定\n- **中心方式:** 中心 **(cx, cy)** と **幅・高さ (w, h)** — **中心 + 大きさ**\n\n**w, h** は **横・縦** の長さ。面積はだいたい **w×h**。\n\n**YOLO** では画像や格子のサイズに合わせ **0~1** に縮めることが多いです。(例: 横が画像の半分なら **0.5**)","heVariance":"**3. NMS（Non-Maximum Suppression）— 同じ物体に箱が5つ? 1つだけ残す**\n\n1人の周りに **箱が5つ** 出ると見づらい。**NMS** は重なった箱を片付ける **お掃除** です。\n\n1. **信頼度が高い順** に並べる\n2. **1位の箱** を残す\n3. 1位と **重なりすぎる** 箱(IoUが閾値超)は **捨てる**。残りで繰り返す\n\n**要点:** 同じ物体には **いちばん確かな箱1つ** だけ。","xavierUniform":"**4. mAP（mean Average Precision）— 検出器の成績表**\n\n**mAP** は **どれだけうまく見つけたか** の **総合点** です。\n\n- **クラスごと** に PR 曲線下の **AP** を求める\n- 全クラス **APの平均** が **mAP**\n- 予測が正解と **半分以上**(IoU **0.5** 以上)重なって初めて **正解**\n\n**高いほど** 余計な箱が少なく、 **見逃しも少ない** 意味です。"},"formulaGuideDiagramCaption":"**要点:** 予測箱Aと正解箱Bの**重なり(交差)**を**合わせた面積(結合)**で割った値が IoU。","formulaGuideDiagramAria":"IoU 図: 2つのバウンディングボックスの交差と結合","formulaGuideDiagramFrozenHint":"交差","advDlCh13FormulaGuideLossHint":"IoU · ボックス重なり","advDlCh13VisualInputLabel":"入力","visual":"アニメーション: 入力→バックボーン→(R-CNN: 提案/RoI | YOLO: 格子)→分類・回帰→NMS→mAP。","problemSolvingLabel":"問題解説ノート","practiceProblemsTitle":"練習問題","practiceProblemsIntro":"問題バンク **60問** から各セッション **10問** を**ランダム**出題。**易4→中3→難3** の順。**同一セッション内で問題種類(接頭辞+難易度)は重複しません**。計算問題は**小さな整数の乗算・合算**中心。概念・O/X・シナリオは**物体検出の要点**のみ。","practiceProblemsInstruction":"最も適切な選択肢を選んでください。","practiceProblemsInstructionCalc":"値を計算し、最も適切な選択肢を選んでください。","practiceProblemsInstructionConcept":"概念問題です。最も適切な選択肢を選んでください。","practiceProblemsInstructionOx":"正なら 1、誤りなら 0。","practiceProblemsInstructionScenario":"状況に合う対策を選んでください。","practiceProblemsInstructionVote":"計算結果に対応する選択肢を選んでください。","practiceProblemsInstructionAggregate":"IoU・格子・ボックス面積の計算結果に対応する選択肢を選んでください。","practiceProblemsInstructionConfig":"格子 S×S に対応する値を選んでください。","practiceProblemsInstructionEnsemble":"検出パイプライン・格子・アンカー計算に対応する値を選んでください。","advDlCh13VisualIntro":"同じ写真で **「犬はどこ？」** を探すとき、**R-CNN** は **疑わしい領域(候補ボックス)** を先にたくさん出し、一つずつ確認します。**YOLO** は写真を **格子** に分け、各マスが **同時に** 位置と種類を報告します。最後に **重複ボックス除去 NMS**(Non-Maximum Suppression、**お掃除**)で重なりを整理し、**検出成績 mAP**(mean Average Precision、**総合点**)でうまく見つけたか評価します。","advDlCh13VisualConceptTitle":"R-CNN: 候補を選んで確認 · YOLO: 格子ごとに一括","advDlCh13VisualSectionTitle":"物体検出一覧","advDlCh13VisualMetaphor":"**R-CNN** は候補箱を **一つずつ開ける** 倉庫検品、**YOLO** は **担当区域ごとに同時報告** する現場点検のイメージです。","advDlCh13VisualRcnnLaneTitle":"R-CNN — 候補を先に、確認は後","advDlCh13VisualYoloLaneTitle":"YOLO — 格子ごとに一括","advDlCh13VisualTwoStageHint":"まず「ここに何かありそう」という **点線候補** を多数出し、確認した **1つだけ** 実線ボックスに残します。","advDlCh13VisualOneStageHint":"写真を **格子** に分けると、各セル担当が **一度に** 担当区域の **位置と種類** を一緒に報告します。","advDlCh13VisualTopInputLabel":"入力画像","advDlCh13VisualTopFeatureLabel":"特徴マップ / 格子","advDlCh13VisualTopOutputLabel":"検出結果(ボックス+クラス)","advDlCh13VisualBackboneLabel":"バックボーン(CNN)","advDlCh13VisualProposalLabel":"Region Proposal / RPN","advDlCh13VisualProposalHint":"物体候補領域","advDlCh13VisualRoILabel":"RoI Pooling/Align","advDlCh13VisualRoIHint":"候補を固定サイズ特徴へ","advDlCh13VisualHeadLabel":"分類・回帰ヘッド","advDlCh13VisualBboxLabel":"バウンディングボックス","advDlCh13VisualGridCellLabel":"格子セル S×S","advDlCh13VisualGridHint":"YOLO: 各セルが担当区域","advDlCh13VisualAnchorHint":"アンカー: 複数スケール・比率","advDlCh13VisualNmsLabel":"NMS","advDlCh13VisualNmsHint":"重複ボックスを除去","advDlCh13VisualMapLabel":"mAP","advDlCh13VisualMapHint":"クラス別 AP の平均","advDlCh13VisualLossLabel":"検出損失","advDlCh13VisualFlowTitle":"1枚の写真はこう処理される","advDlCh13VisualStep0":"まず **RGB 画像** を入れます。分類と違い、**複数物体がどこにあるか** まで探すのが目的です。","advDlCh13VisualStep1":"**CNN バックボーン** が画像を **特徴マップ** に変えます。この後の段階がこの特徴を読んでボックスを描きます。","advDlCh13VisualStep2":"**R-CNN** は物体がありそうな **候補領域** を多数提案します。**YOLO** は画像を **S×S 格子** に分割します。","advDlCh13VisualStep3":"各 **候補や格子セル** で **何か(クラス)** と **どこか(ボックス)** を同時に予測します。","advDlCh13VisualStep4":"**重複除去(NMS)** で同じ物体の重なった箱を1つに整理し、**成績(mAP)** と **重なり(IoU)** でどれだけ正確か評価します。","advDlCh13VisualRcnnStep0":"① 入力画像","advDlCh13VisualRcnnStep1":"② バックボーン CNN → 特徴マップ","advDlCh13VisualRcnnStep2":"③ **領域提案** — 候補ボックスを多数生成","advDlCh13VisualRcnnStep3":"④ **RoI → 分類・回帰** — 候補ごとに処理","advDlCh13VisualYoloStep0":"① 入力 + バックボーン (1回の推論)","advDlCh13VisualYoloStep1":"② **S×S 格子**に分割","advDlCh13VisualYoloStep2":"③ **全セル**でボックス+クラスを同時予測","problems":{"concept_0":"**物体検出**の目標に最も近いのは？\n① 画像全体に**クラス1つ**だけ\n② **各物体のバウンディングボックスとクラス**を見つける\n③ ピクセル分割のみ\n④ 学習率のみ最適化","concept_1":"**バウンディングボックス**に最も近い説明は？\n① 常に円形\n② **物体を囲む矩形座標 (x,y,w,h 等)**\n③ softmax 出力1つ\n④ バッチ正規化パラメータ","concept_2":"**R-CNN 系**に近い特徴は？\n① 常に 1-stage\n② **領域提案(RoI)の後に分類・ボックス回帰する 2-stage 傾向**\n③ GAN と同一\n④ オートエンコーダ復元のみ","concept_3":"**YOLO**の核心に近いのは？\n① 切り出しのみ\n② Selective Search のみ\n③ **S×S 格子セルごとに 1回の推論でボックス+クラス(1-stage)**\n④ PCA のみ","concept_4":"**IoU**を使う理由に近いのは？\n① 学習率スケジュールのみ\n② **予測ボックスと正解ボックスの重なりを数値化**\n③ ファイルサイズ測定\n④ 恒等写像","concept_5":"**NMS**の役割に近いのは？\n① すべての候補を保持\n② **重複ボックスを除きスコア高いものだけ残す**\n③ 画像を回転\n④ ラベルを 0 に","ox_0":"検出は**ボックスとクラス**を同時に予測する。\n正なら 1、誤りなら 0。","ox_1":"IoU は**結合(Union)のみ**で計算し交差は不要。\n正なら 1、誤りなら 0。","ox_2":"R-CNN 系は**提案→RoI→ヘッド**の流れが多い。\n正なら 1、誤りなら 0。","ox_3":"YOLO は**常に 2-stage のみ**。\n正なら 1、誤りなら 0。","ox_4":"NMS は**同一物体の重複ボックス**整理に有用。\n正なら 1、誤りなら 0。","ox_5":"**mAP**は検出性能の総合指標としてよく使われる。\n正なら 1、誤りなら 0。","scenario_0":"**YOLO 学習中** GPU メモリ不足。**まず**試すのは？\n① 学習率を無限に上げる\n② **バッチ・解像度・モデル幅を減らす**\n③ データ削除\n④ NMS 除去","scenario_1":"推論後、**同一人物にボックス5個**が重なる。**まず**？\n① **NMS で重複除去**\n② ラベルシャッフル\n③ バックボーン 0 層\n④ mAP 除去","scenario_2":"CCTV **リアルタイム**が必要。構造は？\n① Selective Search のみ\n② 原典 R-CNN のみ\n③ **YOLO 等 1-stage を検討**\n④ 拡張停止","scenario_3":"**小物体**がよく漏れる。**まず**？\n① confidence を 0\n② **解像度・FPN・アンカー/格子を調整**\n③ NMS IoU を 1.0\n④ ラベル削除","vote_0":"YOLO **S=7** の**総格子セル数**は？","vote_1":"YOLO **S=8** の総セル数は？","vote_2":"YOLO **S=6** の総セル数は？","vote_3":"YOLO **S=10** の総セル数は？","scenario_4":"検証 **mAP** が学習より大幅に低い。疑うのは？\n① 学習が遅い\n② **過学習**\n③ バッチ常に 1\n④ オプティマイザ名","scenario_5":"アンカーが物体サイズと**合わない**。**まず**？\n① **アンカー/格子スケール・縦横比を再設定**\n② IoU 定義変更\n③ NMS 除去\n④ mAP=0","scenario_6":"**positive マッチ IoU 閾値が低すぎる**。期待される問題は？\n① 常に mAP=1\n② **誤ったボックスも positive で学習し品質低下**\n③ NMS 不要\n④ 2-stage→1-stage","scenario_7":"**微小欠陥**検出を改善？\n① **高解像度・FPN・小アンカー**\n② ランダム推測\n③ データ破棄\n④ 損失除去","scenario_8":"**False positive** が多い。**まず**調整？\n① NMS オフ\n② **confidence 閾値を上げる**\n③ クラス数 0\n④ バックボーン削除","scenario_9":"検出器を**公平に比較**するには？\n① **mAP 等の標準指標**\n② 学習 loss のみ\n③ ボックス数のみ\n④ IoU 不使用","vote_4":"2ボックスの**交差**が 4×4 ピクセルのとき、交差**面積**は？","vote_5":"各面積 **32**、**交差 16** のとき**結合**面積は？ (32+32-16)","vote_6":"YOLO **S=7** の**総セル数**は？","vote_7":"ボックス **幅2・高さ4** の**面積**は？","vote_8":"ボックス **5×5** の**面積**は？","vote_9":"ボックス **幅3・高さ6** の**面積**は？","aggregate_0":"ボックスA·B 各**面積20**、**交差8** のとき**結合(Union)** 面積は？ (20+20-8)","aggregate_1":"ボックスA·B 各**面積24**、**交差10** のとき**結合**面積は？","aggregate_2":"2ボックスの**交差**が 5×4 ピクセルのとき、交差**面積**は？","aggregate_3":"YOLO **S=9** の**総セル数**は？","ensemble_0":"**YOLO 格子**: 一辺 **4** セルの正方形の**総セル数**は？","ensemble_1":"**YOLO 格子**: 一辺 **8** セルの正方形の**総セル数**は？","ensemble_2":"ボックスA·B 各**面積35**、**交差21** のとき**結合**面積は？","ensemble_3":"**YOLO 格子**: 一辺 **5** セルの正方形の**総セル数**は？","aggregate_4":"ボックスA·B 各**面積36**、**交差12** のとき**結合**面積は？","aggregate_5":"ボックス **幅6・高さ8** の**面積**は？","aggregate_6":"YOLO **S=11** の**総セル数**は？","aggregate_7":"ボックスA **面積45**、B **面積30**、**交差15** のとき**結合**面積は？","aggregate_8":"2ボックスの**交差**が 6×6 ピクセルのとき、交差**面積**は？","aggregate_9":"YOLO **S=12** の**総セル数**は？","config_0":"**YOLO 格子**: 縦横 **5** セルずつの**総マス数**は？","config_1":"一辺 **6** セル — 総マス数？","config_2":"一辺 **7** セル — 総マス数？","config_3":"一辺 **8** セル — 総マス数？","config_4":"一辺 **9** セル — 総マス数？","config_5":"一辺 **4** セル — 総マス数？","config_6":"一辺 **3** セル — 総マス数？","config_7":"一辺 **10** セル — 総マス数？","config_8":"一辺 **7** セル — 総マス数？","config_9":"一辺 **8** セル — 総マス数？","ensemble_4":"YOLO **S=7** の**総セル数**は？","ensemble_5":"YOLO **S=6** の**総セル数**は？","ensemble_6":"ボックス**交差** 3×3 ピクセルの**面積**は？","ensemble_7":"YOLO **S=8** の**総セル数**は？"},"problemSolutions":{"concept_0":"**例:** COCO で人物2・自転車1を各ボックスで。\n\n**手順:** 位置+クラス → **2**。","concept_1":"**例:** (x,y,w,h) で領域表示。\n\n**手順:** **2**。","concept_2":"**例:** Faster R-CNN = RPN + RoI。\n\n**手順:** **2**。","concept_3":"**例:** YOLO 格子予測。\n\n**手順:** **3**。","concept_4":"**例:** IoU=交差/結合。\n\n**手順:** **2**。","concept_5":"**例:** NMS で重複除去。\n\n**手順:** **2**。","ox_0":"**例:** ボックス+クラス。\n\n**手順:** 正 **1**。","ox_1":"**例:** IoU は交差も必要。\n\n**手順:** 誤 **0**。","ox_2":"**例:** 2-stage。\n\n**手順:** 正 **1**。","ox_3":"**例:** YOLO は 1-stage。\n\n**手順:** 誤 **0**。","ox_4":"**例:** NMS が重複整理。\n\n**手順:** 正 **1**。","ox_5":"**例:** mAP は標準指標。\n\n**手順:** 正 **1**。","scenario_0":"**手順:** OOM → 規模縮小 **2**。","scenario_1":"**手順:** 重複 → NMS **1**。","scenario_2":"**手順:** リアルタイム → YOLO **3**。","scenario_3":"**手順:** 小物体 → 解像度/FPN **2**。","vote_0":"**計算:** 7×7=49。**答え 49**。","vote_1":"**計算:** 8×8=64。**答え 64**。","vote_2":"**計算:** 6×6=36。**答え 36**。","vote_3":"**計算:** 10×10=100。**答え 100**。","scenario_4":"**手順:** val mAP 低 → 過学習 **2**。","scenario_5":"**手順:** アンカー再設定 **1**。","scenario_6":"**手順:** IoU 低すぎ → 品質↓ **2**。","scenario_7":"**手順:** FPN・高解像度 **1**。","scenario_8":"**手順:** 誤検 → confidence↑ **2**。","scenario_9":"**手順:** mAP で比較 **1**。","vote_4":"**計算:** 4×4=16。**答え 16**。","vote_5":"**計算:** 32+32-16=48。**答え 48**。","vote_6":"**計算:** 7×7=49。**答え 49**。","vote_7":"**計算:** 2×4=8。**答え 8**。","vote_8":"**計算:** 5×5=25。**答え 25**。","vote_9":"**計算:** 3×6=18。**答え 18**。","aggregate_0":"**計算:** 20+20-8=32。**答え 32**。","aggregate_1":"**計算:** 24+24-10=38。**答え 38**。","aggregate_2":"**計算:** 5×4=20。**答え 20**。","aggregate_3":"**計算:** 9×9=81。**答え 81**。","ensemble_0":"**計算:** 4×4=16。**答え 16**。","ensemble_1":"**計算:** 8×8=64。**答え 64**。","ensemble_2":"**計算:** 35+35-21=49。**答え 49**。","ensemble_3":"**計算:** 5×5=25。**答え 25**。","aggregate_4":"**計算:** 36+36-12=60。**答え 60**。","aggregate_5":"**計算:** 6×8=48。**答え 48**。","aggregate_6":"**計算:** 11×11=121。**答え 121**。","aggregate_7":"**計算:** 45+30-15=60。**答え 60**。","aggregate_8":"**計算:** 6×6=36。**答え 36**。","aggregate_9":"**計算:** 12×12=144。**答え 144**。","config_0":"**計算:** 5×5=25。**答え 25**。","config_1":"**計算:** 6×6=36。**答え 36**。","config_2":"**計算:** 7×7=49。**答え 49**。","config_3":"**計算:** 8×8=64。**答え 64**。","config_4":"**計算:** 9×9=81。**答え 81**。","config_5":"**計算:** 4×4=16。**答え 16**。","config_6":"**計算:** 3×3=9。**答え 9**。","config_7":"**計算:** 10×10=100。**答え 100**。","config_8":"**計算:** 7×7=49。**答え 49**。","config_9":"**計算:** 8×8=64。**答え 64**。","ensemble_4":"**計算:** 7×7=49。**答え 49**。","ensemble_5":"**計算:** 6×6=36。**答え 36**。","ensemble_6":"**計算:** 3×3=9。**答え 9**。","ensemble_7":"**計算:** 8×8=64。**答え 64**。"},"problemAnswers":{"concept_0":2,"concept_1":2,"concept_2":2,"concept_3":3,"concept_4":2,"concept_5":2,"ox_0":1,"ox_1":0,"ox_2":1,"ox_3":0,"ox_4":1,"ox_5":1,"scenario_0":2,"scenario_1":1,"scenario_2":3,"scenario_3":2,"vote_0":49,"vote_1":64,"vote_2":36,"vote_3":100,"scenario_4":2,"scenario_5":1,"scenario_6":2,"scenario_7":1,"scenario_8":2,"scenario_9":1,"vote_4":16,"vote_5":48,"vote_6":49,"vote_7":8,"vote_8":25,"vote_9":18,"aggregate_0":32,"aggregate_1":38,"aggregate_2":20,"aggregate_3":81,"ensemble_0":16,"ensemble_1":64,"ensemble_2":49,"ensemble_3":25,"aggregate_4":60,"aggregate_5":48,"aggregate_6":121,"aggregate_7":60,"aggregate_8":36,"aggregate_9":144,"config_0":25,"config_1":36,"config_2":49,"config_3":64,"config_4":81,"config_5":16,"config_6":9,"config_7":100,"config_8":49,"config_9":64,"ensemble_4":49,"ensemble_5":36,"ensemble_6":9,"ensemble_7":64},"problemTestCodes":{"concept_0":"answer = 2\nassert answer == 2","concept_1":"answer = 2\nassert answer == 2","concept_2":"answer = 2\nassert answer == 2","concept_3":"answer = 3\nassert answer == 3","concept_4":"answer = 2\nassert answer == 2","concept_5":"answer = 2\nassert answer == 2","ox_0":"answer = 1\nassert answer == 1","ox_1":"answer = 0\nassert answer == 0","ox_2":"answer = 1\nassert answer == 1","ox_3":"answer = 0\nassert answer == 0","ox_4":"answer = 1\nassert answer == 1","ox_5":"answer = 1\nassert answer == 1","scenario_0":"answer = 2\nassert answer == 2","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 3\nassert answer == 3","scenario_3":"answer = 2\nassert answer == 2","vote_0":"answer = 7 * 7\nassert answer == 49","vote_1":"answer = 8 * 8\nassert answer == 64","vote_2":"answer = 6 * 6\nassert answer == 36","vote_3":"answer = 10 * 10\nassert answer == 100","scenario_4":"answer = 2\nassert answer == 2","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 2\nassert answer == 2","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 2\nassert answer == 2","scenario_9":"answer = 1\nassert answer == 1","vote_4":"inter = 4 * 4\nanswer = inter\nassert answer == 16","vote_5":"inter = 4 * 4\nunion = 32 + 32 - inter\nanswer = union\nassert answer == 48","vote_6":"answer = 7 * 7\nassert answer == 49","vote_7":"answer = 2 * 4\nassert answer == 8","vote_8":"answer = 5 * 5\nassert answer == 25","vote_9":"answer = 3 * 6\nassert answer == 18","aggregate_0":"inter = 8\nunion = 20 + 20 - inter\nanswer = union\nassert answer == 32","aggregate_1":"inter = 10\nunion = 24 + 24 - inter\nanswer = union\nassert answer == 38","aggregate_2":"inter = 5 * 4\nanswer = inter\nassert answer == 20","aggregate_3":"answer = 9 * 9\nassert answer == 81","ensemble_0":"answer = 4 * 4\nassert answer == 16","ensemble_1":"answer = 8 * 8\nassert answer == 64","ensemble_2":"inter = 21\nunion = 35 + 35 - inter\nanswer = union\nassert answer == 49","ensemble_3":"answer = 5 * 5\nassert answer == 25","aggregate_4":"inter = 12\nunion = 36 + 36 - inter\nanswer = union\nassert answer == 60","aggregate_5":"answer = 6 * 8\nassert answer == 48","aggregate_6":"answer = 11 * 11\nassert answer == 121","aggregate_7":"inter = 15\nunion = 45 + 30 - inter\nanswer = union\nassert answer == 60","aggregate_8":"inter = 6 * 6\nanswer = inter\nassert answer == 36","aggregate_9":"answer = 12 * 12\nassert answer == 144","config_0":"assert 5 * 5 == 25","config_1":"assert 6 * 6 == 36","config_2":"assert 7 * 7 == 49","config_3":"assert 8 * 8 == 64","config_4":"assert 9 * 9 == 81","config_5":"assert 4 * 4 == 16","config_6":"assert 3 * 3 == 9","config_7":"assert 10 * 10 == 100","config_8":"assert 7 * 7 == 49","config_9":"assert 8 * 8 == 64","ensemble_4":"answer = 7 * 7\nassert answer == 49","ensemble_5":"answer = 6 * 6\nassert answer == 36","ensemble_6":"answer = 3 * 3\nassert answer == 9","ensemble_7":"answer = 8 * 8\nassert answer == 64"},"problemDifficulty":{"concept_0":"easy","concept_1":"easy","concept_2":"easy","concept_3":"easy","concept_4":"easy","concept_5":"easy","ox_0":"easy","ox_1":"easy","ox_2":"easy","ox_3":"easy","ox_4":"easy","ox_5":"easy","scenario_0":"easy","scenario_1":"easy","scenario_2":"easy","scenario_3":"easy","vote_0":"easy","vote_1":"easy","vote_2":"easy","vote_3":"easy","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","vote_4":"medium","vote_5":"medium","vote_6":"medium","vote_7":"medium","vote_8":"medium","vote_9":"medium","aggregate_0":"medium","aggregate_1":"medium","aggregate_2":"medium","aggregate_3":"medium","ensemble_0":"medium","ensemble_1":"medium","ensemble_2":"medium","ensemble_3":"medium","aggregate_4":"hard","aggregate_5":"hard","aggregate_6":"hard","aggregate_7":"hard","aggregate_8":"hard","aggregate_9":"hard","config_0":"hard","config_1":"hard","config_2":"hard","config_3":"hard","config_4":"hard","config_5":"hard","config_6":"hard","config_7":"hard","config_8":"hard","config_9":"hard","ensemble_4":"hard","ensemble_5":"medium","ensemble_6":"hard","ensemble_7":"hard"},"problemOrder":["concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","ox_0","ox_1","ox_2","ox_3","ox_4","ox_5","scenario_0","scenario_1","scenario_2","scenario_3","vote_0","vote_1","vote_2","vote_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","vote_4","vote_5","vote_6","vote_7","vote_8","vote_9","aggregate_0","aggregate_1","aggregate_2","aggregate_3","ensemble_0","ensemble_1","ensemble_2","ensemble_3","aggregate_4","aggregate_5","aggregate_6","aggregate_7","aggregate_8","aggregate_9","config_0","config_1","config_2","config_3","config_4","config_5","config_6","config_7","config_8","config_9","ensemble_4","ensemble_5","ensemble_6","ensemble_7"]},"advDlCh14":{"chapter":"Chapter 12","title":"RAG: 検索で幻覚を減らす","description":"社内の**規程チャットボット**を想像してください。「**今年の有給は何日まで繰り越せる?**」と聞いたのに、**古いがそれっぽい**一般論だけ返ると、すぐ信頼が崩れます。それが**幻覚(Hallucination)** — **出典なしで自信ありげ**に答える状態です。\n\n**RAG(検索拡張生成)** は**オープンブック**のように、答える前に**社内文書から関連ページを探し**、質問文に貼ってから書かせます。**Closed-book** は資料なしの**暗記試験**に近く、学習後のモデルは**新しい PDF·ニュース·社内DB**を常に正確には持てません。**検索(Retrieve)→差し込み(Augment)→生成(Generate)** の順で動きます。\n\n実務でよく出る語は、長文の**チャンク(1枚)**、意味を**数字の座標**にする**埋め込み**、似た文を**早く探す** **ベクタDB**、**Top-k**(上位 k 枚だけ)、**cos**(向きが近いかの点数)、一度に読める**ctx**、**指示+質問**の**プロンプト**、だいたい語·音節サイズの**トークン**です。**budget = ctx−prompt−query** は、答案用紙で**問題説明を引いたあと残った行**と覚えれば十分です。本章は比喩と数字でつなぎ、難しい証明はしません。","sectionTitle":"RAG: 検索で根拠ある回答","whatIs":{"0":"**1. オープンブック vs クローズドブック — RAGの誕生**\n\nLLMだけ使う方式を**Closed-book(クローズドブック)** と呼びます。**資料持ち込み不可の暗記試験**のように、**学習時の記憶だけ**で答えます。一方**RAG(検索拡張生成)** は**オープンブック**に近く、答える前に**図書館(文書ストア)** から**1ページ分(チャンク)** を探して質問文に貼ります。\n\n流れは**検索(Retrieve)→穴埋め(Augment)→生成(Generate)** です。関連チャンクを選び、`{context}` に入れてからLLMが文章を書きます。\n\n「**今年の有給規定はどう変わった?**」と聞かれたとき、Closed-bookは**去年の常識**でそれっぽく答え、RAGは**今年の人事PDF 7ページ**を根拠に答えます。違いは**どのページを見たか**です。","1":"**2. 埋め込み — 文字を座標に**\n\nコンピュータは「返金」「返品」の**意味**をそのまま比較しにくいので、**埋め込み**で文を**数字のリスト(ベクトル)** に変換します。似た話題は座標空間で**近く**、違う話題は**遠く**に並びます。\n\n検索では**コサイン類似度(cos)** を使います。二つのベクトルが**同じ方向を向くか(角度)** を見る点数で、**直線距離**より「話題が重なるか」に近いです。「**返金**」と「**返品·チャージバック**」は近く、「**昼食メニュー**」は遠い。RAGはこの点数で**関連チャンク**を選びます。","2":"**3. チャンク分割 & Top-$k$ 検索**\n\n**500ページ**の規程PDFも、プロンプトに**丸ごと入れられません**。**チャンク分割**は長文を**一口サイズ(例:200トークン)** に切って保管することです。細かく切るほど**検索単位は増えます**が、短すぎると**文脈が切れます**。\n\n質問が来ると埋め込みとcosで順位をつけ、**Top-$k$** で**上位k枚だけ**渡します(**k=3**なら**3枚**)。数万枚を速く探すために**ベクタDB**を使います。**カード索引**のように、毎回PDF全体を読まず**似た断片**だけ取り出します。\n\n**k**が大きすぎると**無関係な段落**が混ざりコストも増えます。**適切なk**が重要です。","3":"**4. コンテキスト予算 & プロンプトテンプレート**\n\nモデルには**一度に読める上限(ctx)** があります。**答案用紙1枚**と考えてください。まず**指示(prompt)** と**質問(query)** がスペースを使い、**残り**に検索チャンクを貼ります。残りが**チャンク予算**で、**budget = ctx−prompt−query** です。\n\n貼るときは**プロンプトテンプレート**という固定型を使い、`{context}` に検索結果、`{question}` にユーザー質問を入れます。「**以下の文書のみで答えよ**」も入れ、**空欄の外を推測**させません。\n\nctx=**4096**、指示**512**、質問**200**なら予算**3384**。チャンク**200**トークンならおおよそ**3384 // 200 ≈ 16**枚。**引き算(予算)** と**//(最大枚数)** は同じ話の前後です。"},"whyImportant":{"0":"**1. なぜRAGが必要か — もっともらしい推測から、根拠ある回答へ**\n\nLLMは**文章を滑らかに書く**のが得意です。そのため**社内規程·最新ニュース·未学習の製品情報**では、**自信ありげな誤答**が出やすく、**承認や顧客対応**に使われた後で気づくこともあります。\n\nRAGは**先に文書を検索しプロンプトに入れてから**生成します。「**人事規程PDF 12ページ**を参照」と**追跡**でき、文書や検索設定を**直せます**。幻覚をゼロにするというより、**検証しやすい答え**に近づけます。\n\n**例:** 「**海外配送も7日返金?**」— Closed-bookは**国内ルール**を一般化しがち、RAGは**配送条項チャンク**で**条件付き**に答えます。","1":"**2. 全再学習なしで『今日の知識』に合わせる**\n\n**月曜朝**に新PDFが出ても、**7Bを丸ごと再学習**するのは現実的ではありません。RAGでは**チャンク化→埋め込み→ベクタDB更新**だけで、**同じLLM**が新条文を引用できます。\n\n**比喩:** 教科書**改訂**時に全員の記憶を入れ替えるのではなく、**図書館の本だけ差し替える**イメージです。\n\n**例:** 「**2026福利厚生**」— シナリオ問題で**再チャンク·DB更新**が先になる理由です。","2":"**3. 賢いLLMでもページが違えば外れる — 検索は半分の仕事**\n\n生成が優秀でも、**検索でページが違えば**答えは外れます。「**返品**」の質問に「**食堂メニュー**」が入れば、文はきれいでも**業務的には失敗**です。\n\n答えがおかしいときは、**temperature**より**Top-k**·**チャンクサイズ**·**オーバラップ**·**再ランク**を先に見ます。**recall@k**は「**正しい文書が上位 k に入ったか?**」の**検索の成績表**で、文章の上手さとは**別評価**です。RAGは**①根拠 ②最新性 ③検索品質**を**一本のパイプライン**で扱うための仕組みです。"},"howUsed":{"0":"**① 知識の図書館を作る(取り込み·チャンク化)**\n\nまず**根拠になる文書**を集め、規程·マニュアル·FAQを**チャンク**に切ります。**ファイル名·ページ**などの**メタデータ**を残せば、後で「**出典を見せて**」にすぐ応じられます。\n\n各チャンクを**埋め込み**して**ベクタDB**へ。毎回PDF全体を読まない**索引**を作る段階で、以降は**関連断片だけ**取り出します。","1":"**② ぴったりの文書を探す(検索)**\n\n質問も**ベクトル化**し、cos(q,c) が大きい順に**Top-$k$** を選びます。**k=5**なら**5枚**だけ次へ。必要なら**再ランク**·**重複除去**もします。\n\n「**検索はするが答えが外れる**」ときは、まず**k·チャンクサイズ·オーバラップ**を疑います。","2":"**③ 試験用紙を組み立てる(増強)**\n\n**ctx−prompt−query** の**予算**内でチャンクをつなぎ、`{context}` **テンプレ穴**に入れます。「**以下の文書のみで答えよ**」と書くのが**Augment** — **空の頭で推測**させないためです。","3":"**④ 答えを書く(生成) — 四段階の流れ**\n\n完成プロンプトでLLMが回答し、**出典·ページ·チャンクID**を示すと信頼が上がります。**k·サイズ·予算·スコア**をログし、幻覚や古い答えが増えたら**検索設定**を調整します。\n\n全体では、**収集/チャンク**で文書を**ピザのように**分割保管し(Splitter, Vector DB)、**検索**で**しおり**のように cos·Top-$k$ でページを選び、**増強**で**オープンブック**のようにテンプレ·予算内に貼り、**生成**でLLMが**参考文を見て**答えます。**図書館→ページ検索→穴埋め→生成**が製品上の動きです。"},"problemSolving":{"0":"問題ではまず**暗記試験(Closed-book) vs オープンブック(RAG)** を思い出します。Closed-bookは**検索なし**、RAGは**ページ検索**→cos(q,c)·**Top-$k$**·**予算**·**テンプレ**で穴埋めしてから**生成**します。\n\n流れは**Retrieve→Augment→Generate**。**budget = ctx−prompt−query** のあと **budget // チャンクサイズ** で最大枚数。**temperature**は答えの**ばらつき**で、検索品質とは別です。\n\n**よく出る数値:** ctx=**4096**, prompt=**512**, query=**200** → **3384** · Top-$k$=**5** → **5**枚 · 予算**1200**, サイズ**200** → 1200 // 200= **6**。「**返品**」↔「**返金規程**」は近く、「**食堂**」は遠い。\n\n---\n\n**例 (概念 · concept)** — RAGに最も近い? **② 検索→増強→生成** → **2**\n\n---\n\n**例 (判定 · ox)** — 埋め込み検索で選ぶ → **1**\n\n---\n\n**例 (判定 · ox)** — Closed-bookがPDFをTop-k → **0**","1":"セッションでは**コンテキスト予算(vote)·Top-k(vote)·チャンク数(aggregate/config)** がよく出ます。パターンは「**ctxから prompt·query を引き、残りを //**」です。\n\n**例 (コンテキスト予算 · vote)** — 上限**4096**、プロンプト**512**、クエリ**200** → チャンク予算? → **3384**\n\n---\n\n**例 (Top-k · vote)** — Top-k**5** → チャンク数? → **5**\n\n---\n\n**例 (チャンク数 · aggregate)** — 予算**1200**、サイズ**200** → 1200 // 200= **6**\n\n---\n\n**例 (整数除算 · config)** — 1400 // 200 は? → **7**","2":"**例 (シナリオ · scenario)**\n\n「社内規程QAで**最新PDF**を急ぎ反映。**まず?** ①全再学習 ②**再チャンク化·ベクタDB更新** ③softmax削除」\n→ **正解2**\n\n---\n\n**例 (シナリオ · scenario)**\n\n「検索はするが回答が外れる。**まず?** ①temperatureのみ ②**Top-k·チャンクサイズ·再ランク** ③GPUドライバ」\n→ **正解2**\n\n---\n\n**例 (概念 · concept)**\n\n「**Top-k**が大きすぎると? ①検索不可 ②**ノイズ·コスト増** ③次元0」\n→ **正解2**\n\n---\n\n**例 (概念 · concept)**\n\n「**埋め込み**に近い説明は? ①最適化手法名 ②**テキストをベクトル化して類似検索** ③BNのみ」\n→ **正解2**","3":"**例 (判定 · ox)**\n\n「**プロンプトテンプレート**は`{context}`·`{question}`に検索結果を入れる枠。」\n→ **正解1**\n\n---\n\n**例 (判定 · ox)**\n\n「**コサイン類似度**が大きいと常に**ユークリッド距離**も小さい(学習用の簡略説明)。」\n→ 向きの話 → **正解0**\n\n---\n\n**例 (パイプライン · ensemble)**\n\n「Top-k**2**、要約**4**文/チャンク → 合計? ($2 \\times 4$)」\n→ **8**\n\n---\n\n**例 (コンテキスト予算 · vote)**\n\n「上限**8192**、プロンプト**1024**、クエリ**256** → 予算?」\n→ **6912**\n\n---\n\n**例 (チャンク数 · config)**\n\n「予算**2400**、サイズ**200** → **12**」"},"summary":"この章を一文でまとめると、RAGは**図書館で関連ページを探し、質問文に貼ってから答えるオープンブック**です。流れは**検索(Retrieve)→穴埋め(Augment)→生成(Generate)** です。\n\nまず質問に近い**チャンク**を選びます。**コサイン類似度** cos(q,c) は「質問 **q** とチャンク **c** の意味の向きが近いか」の点数で、高い順に**Top-$k$** だけ残します。次に**プロンプトテンプレート**の `{context}` に貼ります。モデルが一度に読める上限が **ctx** で、**指示(prompt)** と**質問(query)** を引いた**残り**が**予算**です。**budget = ctx−prompt−query**、チャンクが**200**トークンならおおよそ **budget // chunk_size** 枚入ります。\n\n**例:** 「**返金ポリシーは?**」なら cos で**規程PDFから3枚**だけ選びます。**ctx=4096**、指示**512**、質問**200**なら **512+200** を引いた**残りの行**にだけ根拠を貼ります。\n\n**一度の検索では足りない**複雑な質問は、**マルチホップ**(検索を何度かつなぐ)や**エージェント**(次に何を探すか自分で決める)へ広げます。","sectionLabels":{"whatIs":"概念","whyImportant":"重要性","howUsed":"使い方","summary":"まとめ","problemSolving":"問題解説ノート"},"formulaGuide":{"title":"数式の読み方（RAG）","linear":"**1. コサイン類似度 + Top-k — 検索の心臓**\n\n検索では、質問 **q** とチャンク **c** の**意味の向き**がどれだけ近いかを数値化します。それが**コサイン類似度**で、式は次のとおりです。\n$$\\text{cos}(\\mathbf{q},\\mathbf{c})=\\dfrac{\\mathbf{q}\\cdot\\mathbf{c}}{\\|\\mathbf{q}\\|\\|\\mathbf{c}\\|}$$\n\n**$\\mathbf{q}$** は質問の埋め込み、**$\\mathbf{c}$** はチャンクの埋め込みです。値が大きいほど関連が強く、**Top-$k$** で**上位 $k$** だけ渡します(**k=5** なら**5枚**)。動画サイトが**タイトル·説明**の座標で「**次に見る**」を選ぶのと同様です。スコア **0.92, 0.81, 0.55, 0.30, 0.12** なら **Top-k=3** で**上3つ**。「**出張経費**」は「**交通費**」に近く「**サークル**」は遠い — **角度→上位k→根拠**の順で覚えます。","xavierVariance":"**2. チャンク分割 — 一口サイズ**\n\nPDFを**丸ごと**入れられないので、**チャンク**という**一口サイズ**に分けて保存します。1000ページの**料理百科**を**レシピカード**に分けるイメージです。\n\n**チャンクサイズ**(例:**200**トークン)と**オーバラップ**(例:**40**トークン)を調整します。「**7日以内返金**」が境界で切れると、オーバラップなしで次カードに逃げて**検索ミス**になります。**20トークン**は文脈不足、**800トークン**は1枚で予算を食います。**サイズ+オーバラップ**が土台です。","heVariance":"**3. コンテキスト予算 — 答案用紙1枚**\n\n**ctx** は**答案用紙1枚**です。まず**指示(prompt)** と**質問(query)** を書き、**残り**にチャンクを貼ります。\n$$\\text{chunk\\_budget}=\\text{ctx}-\\text{prompt}-\\text{query}$$\n\n4096−512−200=**3384**。予算**1200**、サイズ**200**なら 1200 // 200= **6** 枚。8192−1024−256=**6912**。**引き算**と **//** は同じ流れの前後です。","xavierUniform":"**4. プロンプトテンプレート — 穴埋め**\n\n固定の**型**に、**Top-$k$** で選んだ文だけ `{retrieved_chunks}` に入れます。「**以下の資料のみで答えよ**」+ **貼り付け欄** + **問題**の構造です。\n\n```\nContext:\n{retrieved_chunks}\n\nQuestion: {user_query}\nAnswer:\n```\n\n例えば `[チャンク1] 購入後7日以内に返金...` を貼り、`海外配送も対象?` と質問します。テンプレは**Augment の箱**です。"},"formulaGuideDiagramCaption":"図では棒の高さが**cos(q,c)**。**緑線の下 Top-k** だけテンプレ穴に入れると読みます。","formulaGuideDiagramAria":"RAG図: クエリ-チャンク類似度とTop-k","formulaGuideDiagramFrozenHint":"類似度","advDlCh14FormulaGuideLossHint":"Top-k · 類似チャンク","advDlCh14VisualInputLabel":"クエリ","visual":"上部ビジュアルは、同じ質問が**暗記のみ(Closed-book)** と**オープンブックRAG**でどう違うかを示します。RAGは**図書館→検索→穴埋め→根拠付き回答**の順です。ラベルを本文と照らし合わせて見てください。","problemSolvingLabel":"問題解説ノート","practiceProblemsTitle":"練習問題","practiceProblemsIntro":"問題バンク**60問**はすべて**RAG(検索拡張生成)** です。各セッション**5問**は**易→難**(2·2·1)で、**同じ種類(接頭辞+難易度)は重複しません**。数値は**Top-k·予算·チャンク数**、概念·O/X·シナリオは**Closed-book vs RAG** です。先に「問題解説ノート」を読むと解きやすいです。","practiceProblemsInstruction":"最も適切な選択肢を選んでください。","practiceProblemsInstructionCalc":"値を計算し、最も適切な選択肢を選んでください。","practiceProblemsInstructionConcept":"概念問題です。最も適切な選択肢を選んでください。","practiceProblemsInstructionOx":"正なら 1、誤りなら 0。","practiceProblemsInstructionScenario":"状況に合う対策を選んでください。","practiceProblemsInstructionVote":"計算結果に対応する選択肢を選んでください。","practiceProblemsInstructionAggregate":"Top-k·予算·チャンク数の計算結果に対応する選択肢を選んでください。","practiceProblemsInstructionConfig":"予算 // チャンクサイズに対応する値を選んでください。","practiceProblemsInstructionEnsemble":"RAGパイプライン·Top-k·チャンク組み合わせ計算に対応する選択肢を選んでください。","advDlCh14VisualIntro":"**「返金ポリシーは？」** に Closed-book は**記憶のみ**、RAG は**Top-k検索→増強→生成**。","advDlCh14VisualConceptTitle":"Closed-book: 記憶のみ · RAG: 検索後生成","advDlCh14VisualSectionTitle":"RAGを一望","advDlCh14VisualMetaphor":"Closed-book=暗記試験、RAG=**オープンブック**","advDlCh14VisualClosedBookLaneTitle":"Closed-book — 検索なし生成","advDlCh14VisualRagLaneTitle":"RAG — 検索·増強·生成","advDlCh14VisualTwoStageHint":"外部文書なし→**幻覚·古い情報**リスク","advDlCh14VisualRagHint":"**保存→埋め込み→Top-k→増強→生成**","advDlCh14VisualQueryLabel":"クエリ","advDlCh14VisualEmbedLabel":"埋め込み","advDlCh14VisualRetrieveLabel":"検索","advDlCh14VisualAugmentLabel":"増強","advDlCh14VisualGenerateLabel":"生成","advDlCh14VisualTopInputLabel":"ユーザークエリ","advDlCh14VisualTopFeatureLabel":"埋め込みベクトル","advDlCh14VisualTopOutputLabel":"根拠付き回答","advDlCh14VisualBackboneLabel":"文書ストア","advDlCh14VisualProposalLabel":"ベクトル検索","advDlCh14VisualProposalHint":"cos(q,c)候補チャンク","advDlCh14VisualRoILabel":"Top-k選択","advDlCh14VisualRoIHint":"類似度上位k","advDlCh14VisualHeadLabel":"LLM生成ヘッド","advDlCh14VisualBboxLabel":"チャンク","advDlCh14VisualGridCellLabel":"チャンクサイズ","advDlCh14VisualGridHint":"トークン単位で分割","advDlCh14VisualAnchorHint":"オーバーラップで境界文脈","advDlCh14VisualNmsLabel":"コンテキスト予算","advDlCh14VisualNmsHint":"ctx − prompt − query","advDlCh14VisualMapLabel":"プロンプトテンプレート","advDlCh14VisualMapHint":"{context}+{question}","advDlCh14VisualLossLabel":"幻覚·根拠率","advDlCh14VisualFlowTitle":"1つの質問の処理","advDlCh14VisualStep0":"**ユーザーの質問**が入る","advDlCh14VisualStep1":"**埋め込み**で類似度を測る","advDlCh14VisualStep2":"Closed-book=検索なし、RAG=**Top-k**","advDlCh14VisualStep3":"**テンプレート**で増強、**予算**内","advDlCh14VisualStep4":"**生成**、出典·kをログ","advDlCh14VisualClosedBookStep0":"① ユーザークエリ","advDlCh14VisualClosedBookStep1":"② パラメータ記憶のみ","advDlCh14VisualClosedBookStep2":"③ 外部検索なし","advDlCh14VisualClosedBookStep3":"④ 幻覚リスク","advDlCh14VisualRagStep0":"① クエリ+チャンク埋め込み","advDlCh14VisualRagStep1":"② **Top-k**類似チャンク","advDlCh14VisualRagStep2":"③ **増強→生成**","problems":{"concept_0":"**RAG(検索拡張生成)**の目標に最も近いのは?\n① LLMの重みだけを無限に増やす\n② **外部文書を検索しプロンプトに入れて回答を生成する**\n③ 画像ピクセルだけを分割する\n④ 学習率だけを0にする","concept_1":"**チャンク分割(Chunking)**に最も近い説明は?\n① 文書を1文字ずつだけ保存\n② **長い文書を検索·コンテキストに合わせて細かく分ける**\n③ GPU温度を測る\n④ softmaxを削除","concept_2":"**埋め込み(Embedding)**の役割に近いのは?\n① 常にランダム文字列を生成\n② **テキストをベクトル化し類似度検索を可能にする**\n③ バッチ正規化だけ\n④ モデルを削除","concept_3":"**コサイン類似度**で検索するときの核心は?\n① L2ノルムだけ0\n② **クエリとチャンクの向き(角度)が近いほど関連性↑**\n③ 常に積集合/和集合\n④ 学習率スケジュール","concept_4":"**Top-k**検索で k=5 のとき最も近い説明は?\n① 常に5クラスだけ分類\n② 5文だけ生成\n③ **類似度上位5チャンクだけ取得**\n④ 5エポックだけ学習","concept_5":"**Augment(増強)**に近いのは?\n① 検索結果を捨てる\n② **検索チャンクをプロンプトテンプレートに挿入する**\n③ 重みを0にする\n④ **検索なしのClosed-bookのみ**","ox_0":"RAGは**外部知識ストア**から関連文書を**検索**してから回答する。\n正なら 1、誤りなら 0。","ox_1":"RAGパイプラインで**埋め込み·ベクトル検索**は全く不要である。\n正なら 1、誤りなら 0。","ox_2":"長い文書を**チャンク**に分けるとコンテキスト枠に合わせて検索しやすい。\n正なら 1、誤りなら 0。","ox_3":"Top-kで**kを大きくすれば**常に精度だけ上がる。\n正なら 1、誤りなら 0。","ox_4":"検索段階で**コサイン類似度**によりクエリとチャンクを比較することが多い。\n正なら 1、誤りなら 0。","ox_5":"**プロンプトテンプレート**に検索コンテキストを入れ幻覚を減らすのがRAGの核心である。\n正なら 1、誤りなら 0。","scenario_0":"埋め込み**バッチ処理中にGPU OOM**が出た。**まず**試すことは?\n① バッチ·シーケンス長を無限に増やす\n② **バッチサイズ·チャンク長·次元を減らす**\n③ 文書ストアを削除\n④ Top-kを0に","scenario_1":"検索結果で**同じチャンクが重複**する。**まず**適用することは?\n① ラベルをシャッフル\n② **重複除去·再ランク(re-rank)**\n③ 埋め込みモデルを削除\n④ コンテキスト予算を無限に","scenario_2":"社内**最新規程PDF**に根拠した回答が必要。構造として最も近いのは?\n① パラメータだけの**Closed-book LLM**のみ\n② 学習率だけ調整\n③ **RAG: 文書ストア + 検索 + 生成**\n④ データ拡張を止める","scenario_3":"チャンクが**小さすぎて**文脈が切れる。**まず**試すことは?\n① 類似度しきい値を0\n② **チャンクサイズ·オーバラップを調整**\n③ Top-kを1だけ使う\n④ プロンプトテンプレートを削除","vote_0":"検索**Top-k**が **5** のとき、取得するチャンク数は?","vote_1":"Top-kが **3** のとき取得するチャンク数は?","vote_2":"コンテキスト予算 **1000** トークン、チャンク **200** トークン/個のとき**最大チャンク数**は? (1000 // 200)","vote_3":"予算 **2000** トークン、チャンク **500** トークン/個のとき**最大チャンク数**は? (2000 // 500)","scenario_4":"RAGの回答はそれっぽいが**引用チャンクが質問と無関係**。**まず**見るべきは?\n① temperatureのみ0\n② **Top-k·cos·チャンクサイズ·再ランク(recall@k)**\n③ 学習率のみ0\n④ softmax削除","scenario_5":"チャンクサイズが文書構造と**合わない**。**まず**することは?\n① **チャンクサイズ·オーバラップを再設定**\n② コサイン類似度の定義を変える\n③ Top-kを削除\n④ コンテキスト予算を0","scenario_6":"類似度**しきい値が低すぎる**。起こりやすい問題は?\n① 常に精度100%\n② **無関係チャンクまで入り回答品質低下**\n③ 埋め込み不要\n④ Closed-bookになる","scenario_7":"**専門ドメイン文書**で精度を上げるには?\n① **ドメイン文書追加·埋め込み微調整**を検討\n② 常にランダム推測\n③ ストア削除\n④ 損失関数を削除","scenario_8":"**幻覚(虚偽の引用)**が多い。**まず**調整することは?\n① 検索をオフ\n② **出典引用·temperature·Top-k**\n③ クラス数を0\n④ LLMを削除","scenario_9":"RAGシステムを**公平に比較**するには?\n① 学習lossだけ\n② **根拠付き精度·recall@k など標準指標**\n③ チャンク数だけ数える\n④ 類似度を使わない","vote_4":"コンテキスト上限 **4096**、システムプロンプト **512**、クエリ **200** トークンのとき**チャンク用トークン**は? (4096-512-200)","vote_5":"チャンク **3** 個、各 **400** トークンのとき**チャンク合計トークン**は? ($3 \\times 400$)","vote_6":"Top-kが **4** のとき取得チャンク数は?","vote_7":"予算 **1500** トークン、チャンク **300** トークン/個のとき**最大チャンク数**は? (1500 // 300)","vote_8":"上限 **8192**、プロンプト **1024**、クエリ **256** トークンのとき**チャンク予算**は? (8192-1024-256)","vote_9":"予算 **3600** トークン、チャンク **600** トークン/個のとき**最大チャンク数**は? (3600 // 600)","aggregate_0":"予算 **1200** トークン、チャンク **200** トークン/個のとき**最大チャンク数**は? (1200 // 200)","aggregate_1":"予算 **1400** トークン、チャンク **200** トークン/個のとき**最大チャンク数**は? (1400 // 200)","aggregate_2":"上限 **2048**、プロンプト **256**、クエリ **128** トークンのとき**チャンク予算**は? (2048-256-128)","aggregate_3":"予算 **3000** トークン、チャンク **100** トークン/個のとき**最大チャンク数**は? (3000 // 100)","ensemble_0":"Top-k **2**、チャンクあたり要約 **4** 文のとき**文の合計**は? ($2 \\times 4$)","ensemble_1":"Top-k **3**、チャンクあたり **3** 箇条書きのとき**箇条書き合計**は? ($3 \\times 3$)","ensemble_2":"Top-kが **5** のとき取得チャンク数は?","ensemble_3":"Top-k **3**、チャンクあたりメタフィールド **4** 個のとき**フィールド合計**は? ($3 \\times 4$)","aggregate_4":"予算 **2000** トークン、チャンク **200** トークン/個のとき**最大チャンク数**は? (2000 // 200)","aggregate_5":"チャンク **35** 個、各 **100** トークンのとき**合計トークン**は? ($35 \\times 100$)","aggregate_6":"Top-k **2**、チャンクあたり出典タグ **4** 個のとき**タグ合計**は? ($2 \\times 4$)","aggregate_7":"Top-kが **4** のとき取得チャンク数は?","aggregate_8":"予算 **1500** トークン、チャンク **100** トークン/個のとき**最大チャン크数**は? (1500 // 100)","aggregate_9":"予算 **2000** トークン、チャンク **100** トークン/個のとき**最大チャンク数**は? (2000 // 100)","config_0":"チャンク予算 **1200**、チャンク **200** トークン/個のとき**最大チャンク数**は?","config_1":"予算 **1400**、チャンク **200** トークン/個のとき**最大チャンク数**は?","config_2":"予算 **1600**、チャンク **200** トークン/個のとき**最大チャンク数**は?","config_3":"予算 **1800**、チャンク **200** トークン/個のとき**最大チャンク数**は?","config_4":"予算 **2000**、チャンク **200** トークン/個のとき**最大チャンク数**は?","config_5":"予算 **800**、チャンク **200** トークン/個のとき**最大チャンク数**は?","config_6":"予算 **600**、チャンク **200** トークン/個のとき**最大チャン크数**は?","config_7":"予算 **2400**、チャンク **200** トークン/個のとき**最大チャンク数**は?","config_8":"予算 **1000**、チャンク **200** トークン/個のとき**最大チャンク数**は?","config_9":"予算 **1200**、チャンク **200** トークン/個のとき**最大チャンク数**は?","ensemble_4":"Top-kが **5** のとき取得チャンク数は?","ensemble_5":"Top-kが **4** のとき取得チャンク数は?","ensemble_6":"Top-k **3**、チャンクあたりメタフィールド **3** 個のとき**合計**は? ($3 \\times 3$)","ensemble_7":"Top-kが **7** のとき取得チャンク数は?"},"problemSolutions":{"concept_0":"**例:** 社内PDFを検索して回答。\n\n**手順:** RAG=検索+生成 → **2**。","concept_1":"**例:** 512トークン単位で分割。\n\n**手順:** **2**。","concept_2":"**例:** クエリ·文書→ベクトル。\n\n**手順:** **2**。","concept_3":"**例:** cos(q,c)で順位付け。\n\n**手順:** **2**。","concept_4":"**例:** 上位5チャンク。\n\n**手順:** **3**。","concept_5":"**例:** contextを挿入。\n\n**手順:** **2**。","ox_0":"**例:** 外部KBを検索。\n\n**手順:** 正 **1**。","ox_1":"**例:** 埋め込みは必須。\n\n**手順:** 誤 **0**。","ox_2":"**例:** チャンク化で検索しやすい。\n\n**手順:** 正 **1**。","ox_3":"**例:** k↑→ノイズ↑。\n\n**手順:** 誤 **0**。","ox_4":"**例:** コサイン類似度。\n\n**手順:** 正 **1**。","ox_5":"**例:** テンプレ+コンテキスト。\n\n**手順:** 正 **1**。","scenario_0":"**手順:** OOM→規模縮小 **2**。","scenario_1":"**手順:** 重複→dedupe **2**。","scenario_2":"**手順:** 最新文書→RAG **3**。","scenario_3":"**手順:** チャンク調整 **2**。","vote_0":"**計算:** Top-k=5。**答え 5**。","vote_1":"**計算:** Top-k=3。**答え 3**。","vote_2":"**計算:** 1000 // 200 = 5。**答え 5**。","vote_3":"**計算:** 2000 // 500 = 4。**答え 4**。","scenario_4":"**手順:** 根拠ページ不一致→検索調整 **2**。","scenario_5":"**手順:** チャンク再設定 **1**。","scenario_6":"**手順:** 低しきい値→ノイズ **2**。","scenario_7":"**手順:** ドメイン文書·FT **1**。","scenario_8":"**手順:** 幻覚→引用·temperature **2**。","scenario_9":"**手順:** recall@k 等 **1**。","vote_4":"**計算:** 4096-512-200=3384。**答え 3384**。","vote_5":"**計算:** $3 \\times 400 = 1200$。**答え 1200**。","vote_6":"**計算:** Top-k=4。**答え 4**。","vote_7":"**計算:** 1500 // 300 = 5。**答え 5**。","vote_8":"**計算:** 8192-1024-256=6912。**答え 6912**。","vote_9":"**計算:** 3600 // 600 = 6。**答え 6**。","aggregate_0":"**計算:** 1200 // 200 = 6。**答え 6**。","aggregate_1":"**計算:** 1400 // 200 = 7。**答え 7**。","aggregate_2":"**計算:** 2048-256-128=1664。**答え 1664**。","aggregate_3":"**計算:** 3000 // 100 = 30。**答え 30**。","ensemble_0":"**計算:** $2 \\times 4 = 8$。**答え 8**。","ensemble_1":"**計算:** $3 \\times 3 = 9$。**答え 9**。","ensemble_2":"**計算:** Top-k=5。**答え 5**。","ensemble_3":"**計算:** $3 \\times 4 = 12$。**答え 12**。","aggregate_4":"**計算:** 2000 // 200 = 10。**答え 10**。","aggregate_5":"**計算:** $35 \\times 100 = 3500$。**答え 3500**。","aggregate_6":"**計算:** $2 \\times 4 = 8$。**答え 8**。","aggregate_7":"**計算:** Top-k=4。**答え 4**。","aggregate_8":"**計算:** 1500 // 100 = 15。**答え 15**。","aggregate_9":"**計算:** 2000 // 100 = 20。**答え 20**。","config_0":"**計算:** 1200 // 200 = 6。**答え 6**。","config_1":"**計算:** 1400 // 200 = 7。**答え 7**。","config_2":"**計算:** 1600 // 200 = 8。**答え 8**。","config_3":"**計算:** 1800 // 200 = 9。**答え 9**。","config_4":"**計算:** 2000 // 200 = 10。**答え 10**。","config_5":"**計算:** 800 // 200 = 4。**答え 4**。","config_6":"**計算:** 600 // 200 = 3。**答え 3**。","config_7":"**計算:** 2400 // 200 = 12。**答え 12**。","config_8":"**計算:** 1000 // 200 = 5。**答え 5**。","config_9":"**計算:** 1200 // 200 = 6。**答え 6**。","ensemble_4":"**計算:** Top-k=5。**答え 5**。","ensemble_5":"**計算:** Top-k=4。**答え 4**。","ensemble_6":"**計算:** $3 \\times 3 = 9$。**答え 9**。","ensemble_7":"**計算:** Top-k=7。**答え 7**。"},"problemAnswers":{"concept_0":2,"concept_1":2,"concept_2":2,"concept_3":2,"concept_4":3,"concept_5":2,"ox_0":1,"ox_1":0,"ox_2":1,"ox_3":0,"ox_4":1,"ox_5":1,"scenario_0":2,"scenario_1":2,"scenario_2":3,"scenario_3":2,"vote_0":5,"vote_1":3,"vote_2":5,"vote_3":4,"scenario_4":2,"scenario_5":1,"scenario_6":2,"scenario_7":1,"scenario_8":2,"scenario_9":1,"vote_4":3384,"vote_5":1200,"vote_6":4,"vote_7":5,"vote_8":6912,"vote_9":6,"aggregate_0":6,"aggregate_1":7,"aggregate_2":1664,"aggregate_3":30,"ensemble_0":8,"ensemble_1":9,"ensemble_2":5,"ensemble_3":12,"aggregate_4":10,"aggregate_5":3500,"aggregate_6":8,"aggregate_7":4,"aggregate_8":15,"aggregate_9":20,"config_0":6,"config_1":7,"config_2":8,"config_3":9,"config_4":10,"config_5":4,"config_6":3,"config_7":12,"config_8":5,"config_9":6,"ensemble_4":5,"ensemble_5":4,"ensemble_6":9,"ensemble_7":7},"problemTestCodes":{"concept_0":"answer = 2\nassert answer == 2","concept_1":"answer = 2\nassert answer == 2","concept_2":"answer = 2\nassert answer == 2","concept_3":"answer = 2\nassert answer == 2","concept_4":"answer = 3\nassert answer == 3","concept_5":"answer = 2\nassert answer == 2","ox_0":"answer = 1\nassert answer == 1","ox_1":"answer = 0\nassert answer == 0","ox_2":"answer = 1\nassert answer == 1","ox_3":"answer = 0\nassert answer == 0","ox_4":"answer = 1\nassert answer == 1","ox_5":"answer = 1\nassert answer == 1","scenario_0":"answer = 2\nassert answer == 2","scenario_1":"answer = 2\nassert answer == 2","scenario_2":"answer = 3\nassert answer == 3","scenario_3":"answer = 2\nassert answer == 2","vote_0":"answer = 5\nassert answer == 5","vote_1":"answer = 3\nassert answer == 3","vote_2":"answer = 1000 // 200\nassert answer == 5","vote_3":"answer = 2000 // 500\nassert answer == 4","scenario_4":"answer = 2\nassert answer == 2","scenario_5":"answer = 1\nassert answer == 1","scenario_6":"answer = 2\nassert answer == 2","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 2\nassert answer == 2","scenario_9":"answer = 1\nassert answer == 1","vote_4":"answer = 4096 - 512 - 200\nassert answer == 3384","vote_5":"answer = 3 * 400\nassert answer == 1200","vote_6":"answer = 4\nassert answer == 4","vote_7":"answer = 1500 // 300\nassert answer == 5","vote_8":"answer = 8192 - 1024 - 256\nassert answer == 6912","vote_9":"answer = 3600 // 600\nassert answer == 6","aggregate_0":"answer = 1200 // 200\nassert answer == 6","aggregate_1":"answer = 1400 // 200\nassert answer == 7","aggregate_2":"answer = 2048 - 256 - 128\nassert answer == 1664","aggregate_3":"answer = 3000 // 100\nassert answer == 30","ensemble_0":"answer = 2 * 4\nassert answer == 8","ensemble_1":"answer = 3 * 3\nassert answer == 9","ensemble_2":"answer = 5\nassert answer == 5","ensemble_3":"answer = 3 * 4\nassert answer == 12","aggregate_4":"answer = 2000 // 200\nassert answer == 10","aggregate_5":"answer = 35 * 100\nassert answer == 3500","aggregate_6":"answer = 2 * 4\nassert answer == 8","aggregate_7":"answer = 4\nassert answer == 4","aggregate_8":"answer = 1500 // 100\nassert answer == 15","aggregate_9":"answer = 2000 // 100\nassert answer == 20","config_0":"assert 1200 // 200 == 6","config_1":"assert 1400 // 200 == 7","config_2":"assert 1600 // 200 == 8","config_3":"assert 1800 // 200 == 9","config_4":"assert 2000 // 200 == 10","config_5":"assert 800 // 200 == 4","config_6":"assert 600 // 200 == 3","config_7":"assert 2400 // 200 == 12","config_8":"assert 1000 // 200 == 5","config_9":"assert 1200 // 200 == 6","ensemble_4":"answer = 5\nassert answer == 5","ensemble_5":"answer = 4\nassert answer == 4","ensemble_6":"answer = 3 * 3\nassert answer == 9","ensemble_7":"answer = 7\nassert answer == 7"},"problemDifficulty":{"concept_0":"easy","concept_1":"easy","concept_2":"easy","concept_3":"easy","concept_4":"easy","concept_5":"easy","ox_0":"easy","ox_1":"easy","ox_2":"easy","ox_3":"easy","ox_4":"easy","ox_5":"easy","scenario_0":"easy","scenario_1":"easy","scenario_2":"easy","scenario_3":"easy","vote_0":"easy","vote_1":"easy","vote_2":"easy","vote_3":"easy","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","vote_4":"medium","vote_5":"medium","vote_6":"medium","vote_7":"medium","vote_8":"medium","vote_9":"medium","aggregate_0":"medium","aggregate_1":"medium","aggregate_2":"medium","aggregate_3":"medium","ensemble_0":"medium","ensemble_1":"medium","ensemble_2":"medium","ensemble_3":"medium","aggregate_4":"hard","aggregate_5":"hard","aggregate_6":"hard","aggregate_7":"hard","aggregate_8":"hard","aggregate_9":"hard","config_0":"hard","config_1":"hard","config_2":"hard","config_3":"hard","config_4":"hard","config_5":"hard","config_6":"hard","config_7":"hard","config_8":"hard","config_9":"hard","ensemble_4":"hard","ensemble_5":"medium","ensemble_6":"hard","ensemble_7":"hard"},"problemOrder":["concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","ox_0","ox_1","ox_2","ox_3","ox_4","ox_5","scenario_0","scenario_1","scenario_2","scenario_3","vote_0","vote_1","vote_2","vote_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","vote_4","vote_5","vote_6","vote_7","vote_8","vote_9","aggregate_0","aggregate_1","aggregate_2","aggregate_3","ensemble_0","ensemble_1","ensemble_2","ensemble_3","aggregate_4","aggregate_5","aggregate_6","aggregate_7","aggregate_8","aggregate_9","config_0","config_1","config_2","config_3","config_4","config_5","config_6","config_7","config_8","config_9","ensemble_4","ensemble_5","ensemble_6","ensemble_7"]},"advDlCh17":{"chapter":"Chapter 17","title":"オートエンコーダ: 圧縮して復元する","description":"高次元データ $x$ を **エンコーダ** が**重要な要約コード $z$**（潜在表現）に**符号化**し、**デコーダ** が同じ形の $\\hat{x}$ に**復号**する対称ネットワークが **オートエンコーダ** です。学習目標は入力 $x$ と出力 $\\hat{x}$ の差を減らす **再構成損失** の最小化。ラベルなしでデータ自体を教師にする典型的な **教師なし学習** です。\n\n狭い**ボトルネック**で次元削減・異常検知の基礎を固め、次章の **VAE（変分オートエンコーダ）** へつなげます。","sectionTitle":"オートエンコーダ: 圧縮して復元する","whatIs":{"0":"**1. 対称構造: エンコーダとデコーダ**\n\n**概念:** 入力 $x$ を **エンコーダ** $f_\\theta$ が $z=f_\\theta(x)$ に変換し、**デコーダ** $g_\\phi$ が $\\hat{x}=g_\\phi(z)$ に戻します。$z$ は入力よりはるかに小さい **ボトルネック** に閉じ込められます。\n\n**直感:** 目撃者が似顔絵師に「目が垂れ気味、鼻が高い…」と少数の特徴（$z$）だけ伝え、師が元の顔に近い絵を描くのと同じです。","1":"**2. 損失: どれだけ復元できたか**\n\n**概念:** 実数連続値にはピクセル単位の **MSE** $\\frac{1}{d}\\sum_i (x_i-\\hat{x}_i)^2$ が一般的です。$[0,1]$ に正規化したグレースケールには **BCE** も使われます。\n\n**直感:** 原画とコピーを重ねてピクセルずれを採点するイメージです。","2":"**3. なぜボトルネックか**\n\n$z$ が入力と同じ大きさなら、ネットワークは **恒等写像（コピー）** だけ学ぶかもしれません。狭いボトルネックが、データの**本質的パターン**だけを $z$ に押し込みます。\n\n**実務（異常検知）:** **正常**データだけで復元を学習すると、未知の**異常**では再構成誤差が跳ね上がります。","3":"**4. デノイジング AE (DAE)**\n\n**応用:** ノイズやマスクを付けた入力から**きれいな元**へ戻すよう学習し、**頑健な**特徴を得ます。","4":"**5. 潜在空間（Latent space）とは？**\n\n**概念:** **潜在空間**は、ピクセルや生の特徴ではなく、エンコーダが作った **コード $z$ が置かれる低次元ベクトル空間**のことです。各サンプルは空間内の **1点（座標ベクトル）**に対応し、学習が進むと似た入力は近く、異なるパターンは離れるといった **幾何学的な構造**が現れやすくなります。\n\n**オートエンコーダでは:** ボトルネック次元 $k$ が潜在空間の **次元**です。デコーダ $g_\\phi$ はこの空間の点を、元の次元の $\\hat{x}$ に **展開**します。（次章の **VAE** ではこの空間に **確率分布**を載せてサンプリング・生成へ広げます。）","5":"**6. PCA（主成分分析）とは？**\n\n**概念:** **PCA** は、高次元データのうち **分散が最も大きく広がる方向**を順に求め、互いに直交する **主成分軸** を作る **線形** の次元削減です。先頭の少数軸へ**射影**すると、**できるだけ分散を残した**低次元の要約が得られます（捨てた軸の分散ぶん情報が減ります）。\n\n**オートエンコーダとの比較:** PCA は **線形変換**のみ。活性化を入れた AE は **非線形**でより複雑な構造を学べます。（**線形** AE + MSE は条件によって PCA と結びつく直感があります。）"},"whyImportant":{"0":"**PCAを超える次元削減**\n\n上で **PCA** の説明のとおり、PCA は **線形**な圧縮に近いです。一方オートエンコーダは非線形活性化で、高次元データを 2〜3 次元に**より柔軟に**圧縮・可視化できます。","1":"**教師なしの特徴抽出**\n\nラベル付けは高コスト。AEはデータだけで $z$ を得られ、学習済みエンコーダは分類器への**転移学習**に使えます。","2":"**生成AIへの入口**\n\n圧縮だけでなく、潜在 $z$ を動かして新しい顔や画像を想像する発想が **VAE** や **GAN** へつながります。"},"howUsed":{"0":"**ステップ1: 正規化・スケーリング**\n\n画素は多く $0$〜$255$ なので **Min–Max** で $[0,1]$ にするか、チャネルごとに**標準化**します。**RGB** のチャネル順 $(R,G,B)$ を固定し、バッチごとに同じ前処理をかけます。スケールが揃わないと MSE の勾配スケールが変わり、収束が遅くなったり不安定になります。","1":"**ステップ2: 構造・ボトルネック $k$・損失**\n\n**画像**は局所を保つ **CAE** が一般的で、**ベクトル・系列**は 1D 畳み込みや全結合の積み上げも選びます。$k$ が小さいほど圧縮は強いが細部が失われ、大きいほど復元は楽だが要約は弱くなります—**検証損失**で $k$ を選びます。実数出力なら **MSE**、$[0,1]$ に近いグレースケールなら **BCE** も候補です。","2":"**ステップ3: 学習ループ・出力・安定化**\n\nミニバッチごとに $\\hat{x}$ を計算して MSE/BCE を逆伝播。$[0,1]$ ならデコーダ最終層に **シグモイド**。**Adam**、**学習率スケジュール**、必要なら **勾配クリッピング**。**学習/検証**を分け、過学習なら **早期終了**・**ドロップアウト/重み減衰**・**Denoising AE** を検討します。","3":"**ステップ4: 評価・可視化・下流**\n\n損失曲線だけでなく $\\hat{x}$ を**目で確認**します。潜在 $z$ を **2D に射影**（例: t-SNE）して構造や外れ値を見ます。**異常検知**は正常のみ学習し、検証で再構成誤差の**閾値**を決めます。学習済み**エンコーダ**を固定/微調整して**少数ラベル分類**や**クラスタリング**に繋げます。","4":"**用途の早見表**\n\n| 目的 | 要点 |\n| --- | --- |\n| **異常検知** | 正常だけで学習 → **再構成誤差が大きい**サンプルを疑う |\n| **ノイズ除去** | **DAE**: 破損入力 → きれいな元 |\n| **次元削減・可視化** | 狭い $z$ や $z$ の 2D 射影 |\n| **表現の事前学習** | エンコーダを分類器の前段などに**転移** |"},"problemSolving":{"0":"オートエンコーダの問題は「**$z=f_\\theta(x)$, $\\hat{x}=g_\\phi(z)$**」の一行と「**再構成損失**で $x$ と $\\hat{x}$ を近づける」という目的をセットで思い出すと解きやすいです。**ボトルネック**では通常 **$k \\ll d$**、**全結合** $d \\to k$ 一層のパラメータはおおよそ **重み $d \\times k$ + バイアス $k$**。**画像を展開した長さ**は縦×横（RGBなら **×3**）、**パッチ数**（CLS なし）は $(H/p)\\times(W/p)$ です（**ViT のパッチ・格子**、Chapter 05 の復習と同じ考え方）。","1":"**異常検知**は正常データだけで**再構成**を学習し、**再構成誤差**が大きいサンプルを疑う図式です。**Denoising AE** は壊れた入力をきれいな元に戻し、**頑健な特徴**を学びます。実数ピクセルには **MSE**、$[0,1]$ 灰度などには **BCE** がよく使われます。**$k/d$ やパーセント**は分子分母の対応を確認します。","2":"**畳み込みオートエンコーダ**は Chapter 12 の **CNN** で**局所・空間構造**を保ったまま積み上げるイメージです。**$k$ が大きすぎる**と**恒等写像**（入力のコピー）に近づきやすく、問題では **$k$ を小さくすると何が強まるか**など**圧縮と表現力**のトレードオフを問うことがあります。","3":"次章の **VAE** はこの**潜在 $z$**に**確率分布**を載せて**生成**へ進みます。「**確率的**な潜在・**サンプリング**」なら **VAE** を連想してください。"},"summary":"**一行要約:** エンコーダが狭いボトルネック $z$ に**圧縮**し、デコーダが元の形 $\\hat{x}$ に**復元**する。再構成誤差を小さくしてデータの核となる特徴を学ぶ。\n\n**つながり:** Dense と CNN を組み合わせてブロックを組めます。複雑なデータほど畳み込み AE が有利です。\n\n**次章:** 潜在 $z$ に**確率分布**を載せて**生成**する **VAE** へ。","sectionLabels":{"whatIs":"概念","whyImportant":"重要性","howUsed":"使い方","summary":"まとめ"},"formulaGuide":{"title":"数式の読み方（オートエンコーダ）","linear":"**1. エンコーダ・デコーダの一行**\n\n$z=f_\\theta(x)$, $\\hat{x}=g_\\phi(z)$。損失例: $\\mathcal{L}=\\|x-\\hat{x}\\|_2^2$。\n\n- **$z$:** ボトルネックの**潜在コード**\n- **$\\hat{x}$:** **復元出力**","xavierVariance":"**2. ボトルネックと圧縮**\n\n入力次元 $d$, 潜在 $k\\ll d$ のとき圧縮比はおおよそ $k/d$。\n\n- **$k$ が小さいほど** 強い圧縮（情報損失の可能性）\n\n- **$k$ が大きいほど** 復元は楽だが要約は弱くなりうる","heVariance":"**3. 線形 AE と PCA**\n\n活性化が線形で MSE なら、条件によって**主成分方向**と結びつく直感があります。\n\n- **非線形**ならより豊かな表現が可能","xavierUniform":"**4. 実務のヒント**\n\nスケールを揃え、ボトルネックと深さを調整し、必要ならノイズを入れる **DAE** で頑健な表現を学びます。"},"formulaGuideDiagramCaption":"**要点:** $x$ を狭い $z$ に圧縮し $\\hat{x}$ に展開し、$x$ と比較します。","formulaGuideDiagramAria":"オートエンコーダ図: 入力エンコーダボトルネックデコーダ損失","formulaGuideDiagramFrozenHint":"ボトルネック","advDlCh17FormulaGuideLossHint":"x と x̂ の比較・再構成損失","advDlCh17VisualInputLabel":"入力","visual":"アニメーション: 入力→エンコーダ→ボトルネック z→デコーダ→復元 x̂→再構成損失の順に段階が強調されます。","problemSolvingLabel":"解法のヒント","practiceProblemsTitle":"練習問題","practiceProblemsIntro":"問題バンク **60問** はすべて **オートエンコーダ** 向けです（圧縮・復元・ボトルネック・再構成・異常検知・CAE・画像/パッチ・線形層パラメータなど）。**10問** は難易度 **易4→中3→難3** で、**同一セッション内では種類（接頭辞+難易度）が重複しません**。","practiceProblemsInstruction":"最も適切な選択肢を選んでください。","practiceProblemsInstructionCalc":"最も適切な選択肢を選んでください。","practiceProblemsInstructionConcept":"最も適切な選択肢を選んでください。","practiceProblemsInstructionOx":"最も適切な選択肢を選んでください。","practiceProblemsInstructionScenario":"最も適切な選択肢を選んでください。","practiceProblemsInstructionVote":"最も適切な選択肢を選んでください。","practiceProblemsInstructionAggregate":"最も適切な選択肢を選んでください。","practiceProblemsInstructionConfig":"最も適切な選択肢を選んでください。","practiceProblemsInstructionEnsemble":"最も適切な選択肢を選んでください。","advDlCh17VisualIntro":"**入力 $x$** を **エンコーダ** が潜在 **ボトルネック $z$** に圧縮し、**デコーダ** が **$\\hat{x}$** に展開します。**再構成損失**が小さいほど原入力に近づきます。","advDlCh17VisualConceptTitle":"概念: エンコーダ→ボトルネック→デコーダ","advDlCh17VisualSectionTitle":"オートエンコーダ: 圧縮と復元","advDlCh17VisualMetaphor":"付箋メモに要約してから本文に戻すイメージ。","advDlCh17VisualTopInputLabel":"入力画像","advDlCh17VisualTopLatentLabel":"潜在表現","advDlCh17VisualTopReconLabel":"復元画像","advDlCh17VisualEncoderLabel":"エンコーダ","advDlCh17VisualBottleneckLabel":"ボトルネック z","advDlCh17VisualBottleneckHint":"次元が最も小さくなる箇所","advDlCh17VisualDecoderLabel":"デコーダ","advDlCh17VisualReconLabel":"復元 x̂","advDlCh17VisualLossLabel":"損失","advDlCh17VisualFlowTitle":"学習の流れ","advDlCh17VisualStep0":"**① 入力:** $x$ を与える。","advDlCh17VisualStep1":"**② エンコーダ:** $x\\to z$。","advDlCh17VisualStep2":"**③ ボトルネック:** 小さな $z$。","advDlCh17VisualStep3":"**④ デコーダ:** $z\\to \\hat{x}$。","advDlCh17VisualStep4":"**⑤ 損失:** $x$ と $\\hat{x}$ の差を最小化。","advDlCh17VisualStage0":"入力 x","advDlCh17VisualStage1":"エンコーダ","advDlCh17VisualStage2":"ボトルネック z","advDlCh17VisualStage3":"デコーダ","advDlCh17VisualStage4":"損失","problems":{"concept_0":"**オートエンコーダ**の学習目標に最も近いのはどれか？\n① 分類精度だけを最大化\n② **入力をよく再構成するよう再構成損失を最小化する**\n③ 強化学習の報酬だけを最大化\n④ データセットを削除する","concept_1":"潜在ベクトル $z$ の役割に最も近いのはどれか？\n① 常に入力と同じ次元\n② **圧縮された要約表現**\n③ クラス確率だけを保持\n④ 学習率を保持","concept_2":"グレースケール画像ベクトルによく使う再構成損失は？\n① **MSE（平均二乗誤差）**\n② 常にクロスエントロピーのみ\n③ 精度\n④ F1 スコア","concept_3":"ボトルネック次元 $k$ を**小さくすると**一般的に期待できるのは？\n① 常に再構成が楽になる\n② 情報がより多く残る\n③ **より強い圧縮（表現力の制約）**\n④ 損失が意味を失う","concept_4":"**Denoising AE**に近い説明はどれか？\n① ラベルをすべて 0 にする\n② **破損した入力をきれいな目標に復元するよう学習する**\n③ 常に恒等写像を学習\n④ アテンションを除く","concept_5":"正常データだけで学習したあと**再構成誤差が大きいサンプル**を疑う応用は？\n① 常に分類\n② **異常検知**\n③ データ拡張のみ\n④ 量子化","ox_0":"オートエンコーダは多くの場合**エンコーダとデコーダ**からなる。\n正なら 1、誤りなら 0。","ox_1":"ボトルネック $z$ は常に入力 $x$ より次元が大きくなければならない。\n正なら 1、誤りなら 0。","ox_2":"再構成損失を減らすことが典型的な学習目標である。\n正なら 1、誤りなら 0。","ox_3":"線形活性化 + MSE の線形 AE は**常に** GAN と同一である。\n正なら 1、誤りなら 0。","ox_4":"畳み込み層を使うと空間情報を活かした復元が可能である。\n正なら 1、誤りなら 0。","ox_5":"オートエンコーダは**分類ラベルなし**で再構成のみで学習できる。\n正なら 1、誤りなら 0。","scenario_0":"**オートエンコーダ学習中**に GPU メモリ不足。**まず**試すべきなのはどれか？\n① バッチ・入力・モデル幅を減らす\n② 学習率だけを無限に上げる\n③ データをすべて削除\n④ 損失を除く","scenario_1":"異常検知に使うなら？\n① **正常データで再構成を学習し大きな誤差を検出**\n② ラベルをランダムにシャッフル\n③ 常にフルファインチューニングのみ\n④ オプティマイザだけ変更","scenario_2":"ノイズの多い画像で**頑健な表現**が欲しいなら？\n① データを 0 だけで埋める\n② **Denoising AE のようにノイズ入力をきれいな元に復元**\n③ 層を 0 に\n④ 学習を停止","scenario_3":"ボトルネックが広すぎて恒等写像に近いなら？\n① **ボトルネックを狭めるか正則化を強める**\n② 量子化のみ\n③ データを半分だけ使う\n④ 学習率を 0 に固定","vote_0":"$$28\\times28$ グレースケール画像を**1列に畳んだ**入力次元 $d$ は？","vote_1":"$$16\\times16$ グレースケールを畳んだ $d$ は？","vote_2":"$$32\\times32$ グレースケールを畳んだ $d$ は？","vote_3":"$$224\\times224$ を $16\\times16$ パッチに分けた**パッチ数**（CLS なし）は？","scenario_4":"検証 MSE が学習 MSE よりはるかに大きい。まず疑うのは？\n① **過学習**\n② 学習が遅すぎる\n③ バッチが常に 1\n④ オプティマイザの名前","scenario_5":"画像ピクセルが [0,255] スケールなら？\n① そのままが常に最善\n② **[0,1] などへの正規化を検討**\n③ ラベルを増やす\n④ チャネルを削除","scenario_6":"潜在空間を**確率的**に扱い生成まで行うなら次章で自然なのは？\n① **VAE**\n② 恒等のみ\n③ k-means のみ\n④ 単純 PCA のみ","scenario_7":"オートエンコーダの $z$ を分類器入力に使う戦略に近いのは？\n① **表現学習のあと少数ラベルで線形分類**\n② 常にランダム推測\n③ データを捨てる\n④ 損失を除く","scenario_8":"CNN エンコーダを使う理由に近いのは？\n① **局所パターンと空間構造を利用**\n② 常にパラメータを 0 に\n③ RNN のみ\n④ パディング禁止","scenario_9":"DAE でノイズを入れる主な目的に近いのは？\n① **頑健な特徴を学ぶ**\n② 精度を常に 0 に\n③ データ削除\n④ 学習停止","vote_4":"$$32\\times16$ グレースケールを畳んだ $d$ は？","vote_5":"$$32\\times32$ **RGB 3チャンネル**を畳んだ $d$ は？","vote_6":"幅 16・高さ 8 のグレースケールを畳んだ $d$ は？","vote_7":"全結合 1 層 $d_{in}=100$, $d_{out}=20$ の**重みの個数**（バイアス除く）は？","vote_8":"$$6\\times6\\times2$ テンソルを畳んだ長さは？","vote_9":"入力 $d=1000$, ボトルネック $k=500$ のとき **$k/d$ を整数パーセント**で表すと？（例: 50% → **50**）","aggregate_0":"**AE 実験**でボトルネック $k$ の候補を **[3,4,5]** と記録したとき、その**和**は？","aggregate_1":"同様に候補 **[2,6,7]** の**和**は？","aggregate_2":"ボトルネック候補を **6** で三回 ($6+6+6$) とったときの**和**は？","aggregate_3":"候補 **[2,3,6]** の**和**は？","ensemble_0":"**画像入力** $224\\times224$ をパッチ $16\\times16$ に分けた**CLS なし**のパッチトークン数は？","ensemble_1":"**パッチ格子**: 一辺にパッチが **8個**の正方形の総パッチ数は？","ensemble_2":"線形**エンコーダ** 1 層 $d_{in}=20$, $d_{out}=20$ のとき**重みの個数**（バイアス除く）は？","ensemble_3":"$$96\\times96$ をパッチ $8\\times8$、**CLS なし**で分けたパッチ数は？","aggregate_4":"複数回試したボトルネック候補 **[7,7,7,7]** の**和**は？","aggregate_5":"候補 **[11,11,11]** の**和**は？","aggregate_6":"ボトルネック候補 **3** を **7回** 記録した値の**和**は？ ($3\\times7$)","aggregate_7":"候補 **[4,5,10]** の**和**は？","aggregate_8":"記録 **[3,4,5,6,6]** の**和**は？","aggregate_9":"同一候補 **5** を **6回** 足した**和**は？ ($5\\times6$)","config_0":"**画像→パッチ格子**: 縦横にパッチが**8個ずつ**の正方形格子の総マス数は？","config_1":"一辺のパッチが**9個**なら総マス数は？","config_2":"一辺のパッチが**10個**なら総マス数は？","config_3":"一辺のパッチが**11個**なら総マス数は？","config_4":"一辺のパッチが**12個**なら総マス数は？","config_5":"一辺のパッチが**6個**なら総マス数は？","config_6":"一辺のパッチが**7個**なら総マス数は？","config_7":"一辺のパッチが**16個**なら総マス数は？","config_8":"一辺のパッチが**20個**なら総マス数は？","config_9":"一辺のパッチが**25個**なら総マス数は？","ensemble_4":"$$30\\times30$ グレースケールを畳んだ $d$ は？","ensemble_5":"パッチトークン **196** + **CLS 1** ならシーケンス長は？","ensemble_6":"入力 $d=16$, ボトルネック $k=2$ の**線形 1 層**エンコーダ（重みのみ、バイアス除く）の重み数は？","ensemble_7":"$$32\\times32$ をパッチ分割せず**1ベクトル**に畳んだ長さは？"},"problemSolutions":{"concept_0":"**例:** MNIST 復元で MSE を下げる。\n\n**手順:** 目標は $x$ と $\\hat{x}$ の差を減らすこと → **2**。","concept_1":"**例:** $z$ は低次元の要約。\n\n**手順:** **2**。","concept_2":"**例:** 実数ピクセルには MSE。\n\n**手順:** **1**。","concept_3":"**例:** $k$ を小さくすると圧縮が強まる。\n\n**手順:** **3**。","concept_4":"**例:** ノイズ入力→きれいな目標。\n\n**手順:** **2**。","concept_5":"**例:** 正常のみ学習→誤差大で異常。\n\n**手順:** **2**。","ox_0":"**例:** 多くはエンコーダ–デコーダ構造。\n\n**手順:** 正 **1**。","ox_1":"**例:** ボトルネックは通常より小さい。\n\n**手順:** 誤 **0**。","ox_2":"**例:** 典型的な目的。\n\n**手順:** 正 **1**。","ox_3":"**例:** GAN は目的・構造が異なる。\n\n**手順:** 誤 **0**。","ox_4":"**例:** Conv AE で空間を利用。\n\n**手順:** 正 **1**。","ox_5":"**例:** 教師なし再構成。\n\n**手順:** 正 **1**。","scenario_0":"**手順:** メモリ不足は規模縮小が先 → **1**。","scenario_1":"**手順:** 正常学習後に誤差閾値 → **1**。","scenario_2":"**手順:** DAE はノイズに頑健 → **2**。","scenario_3":"**手順:** ボトルネック縮小/正則化 → **1**。","vote_0":"**計算:** $28\\times28=784$。**答え 784**。","vote_1":"**計算:** $16\\times16=256$。**答え 256**。","vote_2":"**計算:** $32\\times32=1024$。**答え 1024**。","vote_3":"**計算:** $(224/16)^2=196$。**答え 196**。","scenario_4":"**手順:** 検証が大きい→過学習 → **1**。","scenario_5":"**手順:** スケール正規化 → **2**。","scenario_6":"**手順:** VAE が確率潜在 → **1**。","scenario_7":"**手順:** 表現学習+少数ラベル → **1**。","scenario_8":"**手順:** CNN が空間構造 → **1**。","scenario_9":"**手順:** DAE の目的は頑健性 → **1**。","vote_4":"**計算:** $32\\times16=512$。**答え 512**。","vote_5":"**計算:** $32\\times32\\times3=3072$。**答え 3072**。","vote_6":"**計算:** $16\\times8=128$。**答え 128**。","vote_7":"**計算:** $100\\times20=2000$。**答え 2000**。","vote_8":"**計算:** $6\\times6\\times2=72$。**答え 72**。","vote_9":"**計算:** $k/d=0.5$ → パーセント **50**。","aggregate_0":"**例:** $3+4+5=12$。**答え 12**。","aggregate_1":"**例:** $2+6+7=15$。**答え 15**。","aggregate_2":"**例:** $6+6+6=18$。**答え 18**。","aggregate_3":"**例:** $2+3+6=11$。**答え 11**。","ensemble_0":"**計算:** $(224/16)^2=196$。**答え 196**。","ensemble_1":"**計算:** $8\\times8=64$。**答え 64**。","ensemble_2":"**計算:** 重みのみ $20\\times20=400$。**答え 400**。","ensemble_3":"**計算:** $(96/8)^2=144$。**答え 144**。","aggregate_4":"**例:** $7\\times4=28$。**答え 28**。","aggregate_5":"**例:** $11\\times3=33$。**答え 33**。","aggregate_6":"**例:** $3\\times7=21$。**答え 21**。","aggregate_7":"**例:** $4+5+10=19$。**答え 19**。","aggregate_8":"**例:** $3+4+5+6+6=24$。**答え 24**。","aggregate_9":"**例:** $5\\times6=30$。**答え 30**。","config_0":"**計算:** $8\\times8=64$。**答え 64**。","config_1":"**計算:** $9\\times9=81$。**答え 81**。","config_2":"**計算:** $10\\times10=100$。**答え 100**。","config_3":"**計算:** $11\\times11=121$。**答え 121**。","config_4":"**計算:** $12\\times12=144$。**答え 144**。","config_5":"**計算:** $6\\times6=36$。**答え 36**。","config_6":"**計算:** $7\\times7=49$。**答え 49**。","config_7":"**計算:** $16\\times16=256$。**答え 256**。","config_8":"**計算:** $20\\times20=400$。**答え 400**。","config_9":"**計算:** $25\\times25=625$。**答え 625**。","ensemble_4":"**計算:** $30\\times30=900$。**答え 900**。","ensemble_5":"**計算:** $196+1=197$。**答え 197**。","ensemble_6":"**計算:** 重みのみ $16\\times2=32$。**答え 32**。","ensemble_7":"**計算:** $32\\times32=1024$。**答え 1024**。"},"problemAnswers":{"concept_0":2,"concept_1":2,"concept_2":1,"concept_3":3,"concept_4":2,"concept_5":4,"ox_0":1,"ox_1":0,"ox_2":1,"ox_3":0,"ox_4":1,"ox_5":0,"scenario_0":1,"scenario_1":1,"scenario_2":2,"scenario_3":1,"vote_0":784,"vote_1":256,"vote_2":1024,"vote_3":196,"scenario_4":1,"scenario_5":2,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1,"vote_4":512,"vote_5":3072,"vote_6":128,"vote_7":2000,"vote_8":72,"vote_9":50,"aggregate_0":12,"aggregate_1":15,"aggregate_2":18,"aggregate_3":11,"ensemble_0":196,"ensemble_1":64,"ensemble_2":400,"ensemble_3":144,"aggregate_4":28,"aggregate_5":33,"aggregate_6":21,"aggregate_7":19,"aggregate_8":24,"aggregate_9":30,"config_0":64,"config_1":81,"config_2":100,"config_3":121,"config_4":144,"config_5":36,"config_6":49,"config_7":256,"config_8":400,"config_9":625,"ensemble_4":900,"ensemble_5":197,"ensemble_6":32,"ensemble_7":1024},"problemTestCodes":{"concept_0":"answer = 2\nassert answer == 2","concept_1":"answer = 2\nassert answer == 2","concept_2":"answer = 1\nassert answer == 1","concept_3":"answer = 3\nassert answer == 3","concept_4":"answer = 2\nassert answer == 2","concept_5":"answer = 4\nassert answer == 4","ox_0":"answer = 1\nassert answer == 1","ox_1":"answer = 0\nassert answer == 0","ox_2":"answer = 1\nassert answer == 1","ox_3":"answer = 0\nassert answer == 0","ox_4":"answer = 1\nassert answer == 1","ox_5":"answer = 0\nassert answer == 0","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 2\nassert answer == 2","scenario_3":"answer = 1\nassert answer == 1","vote_0":"answer = 784\nassert answer == 784","vote_1":"answer = 256\nassert answer == 256","vote_2":"answer = 1024\nassert answer == 1024","vote_3":"answer = 196\nassert answer == 196","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 2\nassert answer == 2","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1","vote_4":"answer = 512\nassert answer == 512","vote_5":"answer = 3072\nassert answer == 3072","vote_6":"answer = 128\nassert answer == 128","vote_7":"answer = 2000\nassert answer == 2000","vote_8":"answer = 72\nassert answer == 72","vote_9":"answer = 50\nassert answer == 50","aggregate_0":"values = [3, 4, 5]\nassert sum(values) == 12","aggregate_1":"values = [2, 6, 7]\nassert sum(values) == 15","aggregate_2":"values = [6, 6, 6]\nassert sum(values) == 18","aggregate_3":"values = [2, 3, 6]\nassert sum(values) == 11","ensemble_0":"answer = 196\nassert answer == 196","ensemble_1":"answer = 64\nassert answer == 64","ensemble_2":"answer = 400\nassert answer == 400","ensemble_3":"answer = 144\nassert answer == 144","aggregate_4":"values = [7, 7, 7, 7]\nassert sum(values) == 28","aggregate_5":"values = [11, 11, 11]\nassert sum(values) == 33","aggregate_6":"values = [3, 3, 3, 3, 3, 3, 3]\nassert sum(values) == 21","aggregate_7":"values = [4, 5, 10]\nassert sum(values) == 19","aggregate_8":"values = [3, 4, 5, 6, 6]\nassert sum(values) == 24","aggregate_9":"values = [5, 5, 5, 5, 5, 5]\nassert sum(values) == 30","config_0":"assert 8 * 8 == 64","config_1":"assert 9 * 9 == 81","config_2":"assert 10 * 10 == 100","config_3":"assert 11 * 11 == 121","config_4":"assert 12 * 12 == 144","config_5":"assert 6 * 6 == 36","config_6":"assert 7 * 7 == 49","config_7":"assert 16 * 16 == 256","config_8":"assert 20 * 20 == 400","config_9":"assert 25 * 25 == 625","ensemble_4":"answer = 900\nassert answer == 900","ensemble_5":"answer = 197\nassert answer == 197","ensemble_6":"answer = 32\nassert answer == 32","ensemble_7":"answer = 1024\nassert answer == 1024"},"problemDifficulty":{"concept_0":"easy","concept_1":"easy","concept_2":"easy","concept_3":"easy","concept_4":"easy","concept_5":"easy","ox_0":"easy","ox_1":"easy","ox_2":"easy","ox_3":"easy","ox_4":"easy","ox_5":"easy","scenario_0":"easy","scenario_1":"easy","scenario_2":"easy","scenario_3":"easy","vote_0":"easy","vote_1":"easy","vote_2":"easy","vote_3":"easy","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","vote_4":"medium","vote_5":"medium","vote_6":"medium","vote_7":"medium","vote_8":"medium","vote_9":"medium","aggregate_0":"medium","aggregate_1":"medium","aggregate_2":"medium","aggregate_3":"medium","ensemble_0":"medium","ensemble_1":"medium","ensemble_2":"medium","ensemble_3":"medium","aggregate_4":"hard","aggregate_5":"hard","aggregate_6":"hard","aggregate_7":"hard","aggregate_8":"hard","aggregate_9":"hard","config_0":"hard","config_1":"hard","config_2":"hard","config_3":"hard","config_4":"hard","config_5":"hard","config_6":"hard","config_7":"hard","config_8":"hard","config_9":"hard","ensemble_4":"hard","ensemble_5":"medium","ensemble_6":"hard","ensemble_7":"hard"},"problemOrder":["concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","ox_0","ox_1","ox_2","ox_3","ox_4","ox_5","scenario_0","scenario_1","scenario_2","scenario_3","vote_0","vote_1","vote_2","vote_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","vote_4","vote_5","vote_6","vote_7","vote_8","vote_9","aggregate_0","aggregate_1","aggregate_2","aggregate_3","ensemble_0","ensemble_1","ensemble_2","ensemble_3","aggregate_4","aggregate_5","aggregate_6","aggregate_7","aggregate_8","aggregate_9","config_0","config_1","config_2","config_3","config_4","config_5","config_6","config_7","config_8","config_9","ensemble_4","ensemble_5","ensemble_6","ensemble_7"]},"advDlCh18":{"chapter":"Chapter 21","title":"GAN基礎：生成と識別の対決","description":"GAN（Generative Adversarial Network）は、何かを創り出す **生成器（Generator, $G$）** と、本物か偽物かを見抜く **識別器（Discriminator, $D$）** が終わりなく競い合いながら成長する革新的な仕組みです。天才偽造犯とベテラン鑑識官の息詰まる頭脳戦のようです。偽造犯はより精巧な偽物を作り、鑑識官は見抜き技術を限界まで高めます。この緊張した **ミニマックス** の綱渡りの先に、人間の目では本物と区別できない創造物が生まれることがあります。本章では GAN の数学、ミニマックスゲーム、マンネリ化の **モード崩壊** を豊富な例とともに掘り下げます。","sectionTitle":"GAN: 生成器と識別器","whatIs":{"0":"**1. GAN の核心構造: 生成器と識別器の激しい対決**\n\nGAN は二つのネットワークが互いに勝とうとしながら成長する独特の構造です。**生成器（$G$）** は偽物を本物らしく作り、**識別器（$D$）** は真偽を鋭く判定します。\n* **比喩:** 贋作画家（生成器）と鑑定士（識別器）が互いの腕を磨き合う関係です。","1":"**2. ミニマックス（Minimax）ゲーム**\n\n核心の目的関数は次のとおりです。\n$\\min_G \\max_D V(D, G) = \\mathbb{E}_{x}[\\log D(x)] + \\mathbb{E}_{z}[\\log(1 - D(G(z)))]$\n* **識別器（$D$）は最大化:** 本物 $x$ では $D(x)\\to 1$、偽物 $G(z)$ では $D(G(z))\\to 0$。\n* **生成器（$G$）は最小化:** $D(G(z))\\to 1$ になるよう偽物を作り、後項を小さくします。","2":"**3. 潜在ノイズ $z$**\n\n生成器への指示として渡す乱数ベクトルを **潜在ノイズ（$z$）** と呼びます。\n* **比喩:** 粘土の塊の形が少し変わるだけで、仕上がりの表情や色が変わるイメージです。","3":"**4. モード崩壊（Mode Collapse）**\n\n生成器が多様性を失い、**一度識別器を騙した一種類のサンプルだけを無限に複製**する現象です。\n* **比喩:** キムチチゲだけで満点を取った店が、一年間メニューをそれだけにするようなものです。","4":"**5. 条件付き GAN（cGAN）**\n\n**条件（$y$）**—クラスやテキスト—を $z$ と一緒に入れ、「猫を描いて」「スケッチを彩色して」など生成を制御します。"},"whyImportant":{"0":"**1. 生成型 AI の出発点**\n\n分類が「犬です」と答えるなら、GAN は **存在しない犬の絵を描く** 側です。画像・音声など現代の生成革命の骨格です。","1":"**2. 鮮明でリアルなディテール**\n\n平均に寄るモデルと違い、厳しい識別器を通るため **シャープ** な質感を出しやすいです。","2":"**3. データ拡張**\n\n少数の雪の夜道写真から大量の合成データを作るなど、希少データを増やす技術として重要です。"},"howUsed":{"0":"**ステップ1: 正規化と tanh**\n\nピクセルを $[-1,1]$ に揃えます。生成器が **$tanh$** で出力するなら、本物画像も同じ範囲に合わせます。","1":"**ステップ2: BCE とラベルスムージング**\n\n真偽の **二値クロスエントロピー（BCE）** を使い、過信を抑える **ラベルスムージング**（例: $0.9$）も有効です。","2":"**ステップ3: 交互学習**\n\n$G$ と $D$ を同時に強く更新しません。$D$ を $k$ 回、その後 $G$ を更新するなど **交互** が基本です。","3":"**ステップ4: 安定化と FID**\n\nモード崩壊を目視確認し、**FID** で本物と偽物の分布の近さを評価します。"},"problemSolving":{"0":"**まずはこの一行だけ:** **生成器 $G$** がノイズ $z$ で **偽物**を作り、**識別器 $D$** が **本物 / 偽物**を見分けます。先に **誰が作るか・誰が見分けるか** を確認し、必要なら **ミニマックス**、**交互更新**、**モード崩壊**を足します。\n\n**数値が出たら:** 展開長は (高さ)×(幅)(RGB なら **×3**)、パッチ格子(CLS なし)は $(H/p)\\times(W/p)$、全結合 1 層の重みはおおよそ $d_{\\mathrm{in}}\\times d_{\\mathrm{out}}$ です。","1":"**例 (展開)** — GAN グレースケール $28\\times28$ の $d$ → **784**\n\n---\n\n**例 (パッチ格子)** — $224\\times224$, パッチ $16\\times16$, CLS なし → $14^2=$ **196**","2":"**例 (概念)** — GAN の生成器の役割? ② **ノイズ $z$ から偽物生成** → **2**\n\n---\n\n**例 (計算)** — RGB $32\\times32$ 3 チャンネルの展開 $d$? → **3072**\n\n---\n\n**例 (応用)** — 識別器が強すぎる? ① **G/D 更新のバランス**","3":"**定義** — モード崩壊はほぼ同じサンプルばかり出す現象。→ その説明を選ぶ\n\n---\n\n**真偽** — 条件付き GAN はラベル・条件を使える。→ **1**"},"summary":"**一言まとめ:** GAN は、ノイズ $z$ から本物らしいサンプルを作る生成器と、それを見抜く識別器の競争です。\n\n**重要点:** 安定性、バランス、多様性が性能を左右します。\n\n**次へ:** 条件付きGANなどの拡張へ自然につながります。","sectionLabels":{"whatIs":"概念","whyImportant":"重要性","howUsed":"使い方","summary":"まとめ"},"formulaGuide":{"title":"数式の読み方（GAN）","linear":"**一言で:** $G$ が **偽物を作り**、$D$ が **本物か偽物か** を当てます。\n\n$\\min_G \\max_D V(D,G)=\\mathbb{E}_{x\\sim p_{data}}[\\log D(x)] + \\mathbb{E}_{z\\sim p(z)}[\\log(1-D(G(z)))]$\n\n**$G$ (生成器):** ノイズ $z$ から **新しい偽物サンプル**を作ります。\n\n**$D$ (識別器):** 入力が **本物である確率**を 0〜1 で出します。\n\n**$\\min_G \\max_D$:** $G$ と $D$ は **逆方向**に有利なスコアを取ろうとします。だから **交互に**学習します。\n\n**$V(D,G)$:** 両者が競う **目的関数**の名前です。下の **左項と右項**の和です。\n\n**$\\mathbb{E}_{x\\sim p_{data}}[\\cdot]$ (左項):** 本物データ $x$ を何度も引き、$\\log D(x)$ の **平均**です。**本物**で識別器を鍛えます。\n\n**$\\log D(x)$:** $D(x)$ が **1 に近いほど**大きくなります。本物 $x$ に **「本物」**と高い点数を付けたい意図です。\n\n**$\\mathbb{E}_{z\\sim p(z)}[\\cdot]$ (右項):** ノイズ $z$ から $G(z)$ を作り、$\\log(1-D(G(z)))$ の **平均**です。**偽物**の側です。\n\n**$G(z)$:** そのときの $z$ で作った **偽物 1 枚**です。\n\n**$\\log(1-D(G(z)))$:** 偽物を **偽物**と見るほど ($D(G(z))$ が **0 に近いほど**) 大きくなります。生成器は **識別器を騙す**ほど有利です。\n\n**$D(x)$ まとめ:** 入力が **0(偽)〜1(本)** の **本物らしさ**です。"},"formulaGuideDiagramCaption":"**要点:** ノイズ $z$ が生成器に入り、偽物サンプルを作り、識別器が真偽を競い合います。","formulaGuideDiagramAria":"GAN 図: ノイズ生成器偽物サンプル識別器真偽競争","formulaGuideDiagramFrozenHint":"競争","advDlCh18FormulaGuideLossHint":"真偽判定・敵対的損失","advDlCh18VisualInputLabel":"画像(本物または偽物)","visual":"アニメーション: ランダムなノイズ → 生成器 → 生成画像、画像 → 識別器 → 本物らしさの点数。","problemSolvingLabel":"解法のヒント","practiceProblemsTitle":"練習問題","practiceProblemsIntro":"問題バンク **60問** はすべて **GAN** 文脈（生成器/識別器、ノイズ、モード崩壊、安定化、画像サイズ・パッチ数・重み計算など）です。**10問** は **易4→中3→難3** で、同じタイプ（接頭辞+難易度）は 1 セッションで重複しません。","practiceProblemsInstruction":"最も適切な選択肢を選んでください。","practiceProblemsInstructionCalc":"最も適切な選択肢を選んでください。","practiceProblemsInstructionConcept":"最も適切な選択肢を選んでください。","practiceProblemsInstructionOx":"最も適切な選択肢を選んでください。","practiceProblemsInstructionScenario":"最も適切な選択肢を選んでください。","practiceProblemsInstructionVote":"最も適切な選択肢を選んでください。","practiceProblemsInstructionAggregate":"最も適切な選択肢を選んでください。","practiceProblemsInstructionConfig":"最も適切な選択肢を選んでください。","practiceProblemsInstructionEnsemble":"最も適切な選択肢を選んでください。","advDlCh18VisualIntro":"**本物の写真**と**ノイズで作った偽物**が**識別器**に入り、**本物 / 偽物**に分かれます。まず**作る側(G)**と**見分ける側(D)**だけ区別してみてください。","advDlCh18VisualConceptTitle":"概念: 生成器と識別器","advDlCh18VisualSectionTitle":"GAN: 作って見分ける対決","advDlCh18VisualMetaphor":"偽札の作り手と鑑定士が互いに腕を上げるイメージです。","advDlCh18VisualBrandTitle":"GAN :","advDlCh18VisualLatentBridgeHint":"AE・VAEでは潜在空間ベクトルになる","advDlCh18VisualSamplingHint":"本物データからサンプリング","advDlCh18VisualRealPoolLabel":"本物データ","advDlCh18VisualRealSampleLabel":"本物サンプル","advDlCh18VisualNoiseDistHint":"ノイズ分布から潜在変数をサンプル","advDlCh18VisualFakeGenHint":"偽画像を生成","advDlCh18VisualGenBadge":"G","advDlCh18VisualDiscBadge":"D","advDlCh18VisualOutputRealLabel":"本物","advDlCh18VisualOutputFakeLabel":"偽物","advDlCh18VisualTopInputLabel":"ランダムなノイズ","advDlCh18VisualTopLatentLabel":"生成された画像","advDlCh18VisualTopReconLabel":"判定結果","advDlCh18VisualEncoderLabel":"生成器","advDlCh18VisualBottleneckLabel":"潜在ノイズ","advDlCh18VisualBottleneckHint":"ランダムベクトルが出発点","advDlCh18VisualDecoderLabel":"識別器","advDlCh18VisualReconLabel":"真偽判定","advDlCh18VisualLossLabel":"敵対的損失","advDlCh18VisualScoreHint":"画像がどれだけ本物らしいかを予測","advDlCh18VisualFlowTitle":"学習の流れ","advDlCh18VisualStep0":"**① 本物の写真:** 学習データから **本物サンプル** $x$ を 1 つ取り出します。","advDlCh18VisualStep1":"**② ランダムなノイズ:** どんな絵を作るか決める **ノイズ** $z$ を無作為に選びます。","advDlCh18VisualStep2":"**③ 生成器の仕事:** ノイズ $z$ を **偽物サンプル** $\\hat{x}$ に変えます。","advDlCh18VisualStep3":"**④ 識別器の判定:** $x$ と $\\hat{x}$ を見て **本物 / 偽物** を見分けます。","advDlCh18VisualStep4":"**⑤ 交互に学習:** **G** と **D** が順番に少しずつ更新されます。","advDlCh18VisualStage0":"本物データのサンプリング","advDlCh18VisualStage1":"ランダムなノイズ","advDlCh18VisualStage2":"生成器(G)","advDlCh18VisualStage3":"識別器(D)","advDlCh18VisualStage4":"本物/偽物","problems":{"concept_0":"**GAN** で生成器の役割に最も近いのは？\n① 真偽を判定する\n② **ノイズ $z$ から偽物サンプルを作る**\n③ ラベルだけを保存する\n④ 損失を消す","concept_1":"潜在ノイズ $z$ の説明として最も適切なのは？\n① 常に入力と同じ次元\n② **新しいサンプル生成の出発点となる乱数ベクトル**\n③ 正解クラスだけを保存\n④ 学習率を保存","concept_2":"GAN 識別器の典型的な出力の意味は？\n① 回帰値だけ\n② **入力が本物である確率**\n③ データセット名\n④ patch 数","concept_3":"GAN 学習が不安定になりやすい理由は？\n① 答えが固定だから\n② **生成器と識別器が同時に変わるから**\n③ データが小さいからだけ\n④ CNN を使うからだけ","concept_4":"モード崩壊とは？\n① 出力が多様になりすぎること\n② **ほぼ同じサンプルを繰り返し出すこと**\n③ 学習率が 0 になること\n④ ラベルが 2 個しかないこと","concept_5":"条件付きGANの利点として最も近いのは？\n① 条件を完全に無視する\n② **ラベルや条件で生成種類を制御できる**\n③ 損失を一切使わない\n④ 識別器を消す","ox_0":"GAN は通常、**生成器と識別器**が競い合う構造である。\n正なら 1、誤りなら 0。","ox_1":"生成器は通常 **ノイズ $z$** を入力に取り、サンプルを作る。\n正なら 1、誤りなら 0。","ox_2":"識別器は入力が本物か偽物かを判定する。\n正なら 1、誤りなら 0。","ox_3":"GAN の学習は常に安定しており、モード崩壊は起こらない。\n正なら 1、誤りなら 0。","ox_4":"画像スケールを生成器の出力範囲に合わせるのは有効である。\n正なら 1、誤りなら 0。","ox_5":"条件付きGANはラベルや条件を一緒に使える。\n正なら 1、誤りなら 0。","scenario_0":"GAN 学習の初期に識別器の精度がすぐ 100% に近づく。まず試すべきは？\n① **生成器と識別器の更新バランスを調整する**\n② 学習率を無限に上げる\n③ データセットをすべて削除する\n④ 識別器を消す","scenario_1":"生成結果がどれも似すぎている。最も疑うべき問題は？\n① ただの過学習\n② **モード崩壊**\n③ ただのパディング不具合\n④ ただの正規化のしすぎ","scenario_2":"入力画像が [0,255] なのに生成器は tanh 出力を使う。まず何をする？\n① **入力を正規化する**\n② ラベル数を増やす\n③ 識別器を消す\n④ バッチを 0 にする","scenario_3":"条件付きGANで数字 7 だけを生成したい。最適な方法は？\n① 条件なしで生成する\n② **ラベル 7 を条件として入れる**\n③ 識別器を固定しない\n④ ノイズを消す","vote_0":"GAN で判別・生成入力に使う $28\\times28$ グレースケール画像を 1 次元に展開した次元 $d$ は？","vote_1":"GAN 入力として使う $16\\times16$ グレースケール画像を展開した $d$ は？","vote_2":"GAN 入力として使う $32\\times32$ グレースケール画像を展開した $d$ は？","vote_3":"GAN 識別器の文脈で $224\\times224$ 画像を $16\\times16$ パッチに分けたとき(CLS なし)、パッチ数は？","scenario_4":"GAN のバッチサイズが 64 なら、半分はいくつ？\n① 16\n② **32**\n③ 48\n④ 64","scenario_5":"潜在ノイズベクトルの長さを 100 にする意味は？\n① **潜在ノイズ次元**\n② バッチ数\n③ patch 数\n④ クラス数","scenario_6":"識別器が強すぎて生成器の勾配がほぼ消える。まず考えるべきは？\n① **学習率・更新比・正則化を調整する**\n② データセットを半分にする\n③ ノイズを消す\n④ 出力を 0 に固定する","scenario_7":"GAN の結果を見るとき、損失以外に見るべきものは？\n① **サンプル品質と多様性**\n② ファイル名\n③ 数字の並び\n④ patch index だけ","scenario_8":"条件付きGANでテキスト説明を使って出力を制御したい。最も重要なのは？\n① **条件情報と生成目標を一致させること**\n② 識別器を消すこと\n③ ノイズをすべて 0 にすること\n④ バッチを 1 に固定すること","scenario_9":"モード崩壊が見えたら、まず思い浮かべる問題は？\n① **多様性不足**\n② patch が多すぎるだけ\n③ ラベルが多すぎるだけ\n④ 損失が 0 でないこと","vote_4":"GAN 前処理用の $32\\times16$ グレースケール画像を展開した $d$ は？","vote_5":"GAN RGB 生成で $32\\times32$ 3 チャンネル画像を展開した $d$ は？","vote_6":"GAN 用グレースケール入力(幅 16, 高さ 8)を展開した $d$ は？","vote_7":"GAN でよく使う潜在ノイズベクトル長が 100 のとき、$z$ の次元は？","vote_8":"GAN 学習でバッチ 64 を半分に分けた片側の大きさは？","vote_9":"GAN で入力 $d=1000$, 潜在ノイズ次元 $k=500$ のとき、$k/d$ を整数パーセントで表すと？","vote_10":"GAN 入力として使う $24\\times24$ グレースケール画像を展開した $d$ は？","vote_11":"GAN 入力として使う $48\\times48$ グレースケール画像を展開した $d$ は？","vote_12":"GAN RGB 生成で $16\\times16$ 3 チャンネル画像を展開した $d$ は？","vote_13":"GAN 学習でバッチ 128 を半分に分けた片側の大きさは？","ensemble_0":"GAN 識別器の文脈で $224\\times224$ を $16\\times16$ パッチに分けたとき(CLS なし)、パッチトークン数は？","ensemble_1":"GAN feature map を 1 辺 8 パッチの正方格子とみなしたときの総パッチ数は？","ensemble_2":"GAN 識別器の線形 1 層で $d_{in}=20$, $d_{out}=20$ のときの重み数は？","ensemble_3":"GAN 識別器の文脈で $96\\times96$ を $8\\times8$ パッチに分けた patch 数は？","vote_14":"GAN 入力として使う $64\\times64$ グレースケール画像を展開した $d$ は？","vote_15":"GAN RGB 生成で $48\\times48$ 3 チャンネル画像を展開した $d$ は？","vote_16":"GAN 生成器のノイズベクトル長を 256 にするとき、$z$ の次元は？","vote_17":"GAN 学習でバッチ 256 を半分に分けた片側の大きさは？","vote_18":"GAN 入力として使う $80\\times80$ グレースケール画像を展開した $d$ は？","vote_19":"GAN RGB 生成で $24\\times24$ 3 チャンネル画像を展開した $d$ は？","config_0":"GAN 識別器 feature map 格子で 1 辺 8 パッチの正方の総マス数は？","config_1":"GAN 識別器 feature map 格子で 1 辺 9 パッチの正方の総マス数は？","config_2":"GAN 識別器 feature map 格子で 1 辺 10 パッチの正方の総マス数は？","config_3":"GAN 識別器 feature map 格子で 1 辺 11 パッチの正方の総マス数は？","config_4":"GAN 識別器 feature map 格子で 1 辺 12 パッチの正方の総マス数は？","config_5":"GAN 識別器 feature map 格子で 1 辺 6 パッチの正方の総マス数は？","config_6":"GAN 識別器 feature map 格子で 1 辺 7 パッチの正方の総マス数は？","config_7":"GAN 識別器 feature map 格子で 1 辺 16 パッチの正方の総マス数は？","config_8":"GAN 識別器 feature map 格子で 1 辺 20 パッチの正方の総マス数は？","config_9":"GAN 識別器 feature map 格子で 1 辺 25 パッチの正方の総マス数は？","ensemble_4":"GAN 生成・識別入力として $30\\times30$ グレースケール画像を展開した $d$ は？","ensemble_5":"GAN 識別シーケンスでパッチトークン 196 個に CLS 1 個を足したシーケンス長は？","ensemble_6":"GAN 生成器の線形 1 層で入力 $d=16$, 潜在 $k=2$ のときの重み数は？","ensemble_7":"GAN で $32\\times32$ 画像をパッチなしで 1 ベクトルに展開した長さは？"},"problemSolutions":{"concept_0":"GAN の概念を思い出すと答えは 2 です。","concept_1":"GAN の概念を思い出すと答えは 2 です。","concept_2":"GAN の概念を思い出すと答えは 1 です。","concept_3":"GAN の概念を思い出すと答えは 3 です。","concept_4":"GAN の概念を思い出すと答えは 2 です。","concept_5":"GAN の概念を思い出すと答えは 4 です。","ox_0":"文の真偽を判定すると答えは 1 です。","ox_1":"文の真偽を判定すると答えは 0 です。","ox_2":"文の真偽を判定すると答えは 1 です。","ox_3":"文の真偽を判定すると答えは 0 です。","ox_4":"文の真偽を判定すると答えは 1 です。","ox_5":"文の真偽を判定すると答えは 0 です。","scenario_0":"最も自然な選択は 1 です。","scenario_1":"最も自然な選択は 1 です。","scenario_2":"最も自然な選択は 2 です。","scenario_3":"最も自然な選択は 1 です。","vote_0":"そのまま計算すると 784 です。","vote_1":"そのまま計算すると 256 です。","vote_2":"そのまま計算すると 1024 です。","vote_3":"そのまま計算すると 196 です。","scenario_4":"最も自然な選択は 1 です。","scenario_5":"最も自然な選択は 2 です。","scenario_6":"最も自然な選択は 1 です。","scenario_7":"最も自然な選択は 1 です。","scenario_8":"最も自然な選択は 1 です。","scenario_9":"最も自然な選択は 1 です。","vote_4":"そのまま計算すると 512 です。","vote_5":"そのまま計算すると 3072 です。","vote_6":"そのまま計算すると 128 です。","vote_7":"そのまま計算すると 100 です。","vote_8":"そのまま計算すると 32 です。","vote_9":"そのまま計算すると 50 です。","vote_10":"そのまま計算すると 576 です。","vote_11":"そのまま計算すると 2304 です。","vote_12":"そのまま計算すると 768 です。","vote_13":"そのまま計算すると 64 です。","ensemble_0":"構造を数えると 196 です。","ensemble_1":"構造を数えると 64 です。","ensemble_2":"構造を数えると 400 です。","ensemble_3":"構造を数えると 144 です。","vote_14":"そのまま計算すると 4096 です。","vote_15":"そのまま計算すると 6912 です。","vote_16":"そのまま計算すると 256 です。","vote_17":"そのまま計算すると 128 です。","vote_18":"そのまま計算すると 6400 です。","vote_19":"そのまま計算すると 1728 です。","config_0":"格子/二乗の計算で 64 です。","config_1":"格子/二乗の計算で 81 です。","config_2":"格子/二乗の計算で 100 です。","config_3":"格子/二乗の計算で 121 です。","config_4":"格子/二乗の計算で 144 です。","config_5":"格子/二乗の計算で 36 です。","config_6":"格子/二乗の計算で 49 です。","config_7":"格子/二乗の計算で 256 です。","config_8":"格子/二乗の計算で 400 です。","config_9":"格子/二乗の計算で 625 です。","ensemble_4":"構造を数えると 900 です。","ensemble_5":"構造を数えると 197 です。","ensemble_6":"構造を数えると 32 です。","ensemble_7":"構造を数えると 1024 です。"},"problemAnswers":{"concept_0":2,"concept_1":2,"concept_2":1,"concept_3":3,"concept_4":2,"concept_5":4,"ox_0":1,"ox_1":0,"ox_2":1,"ox_3":0,"ox_4":1,"ox_5":0,"scenario_0":1,"scenario_1":1,"scenario_2":2,"scenario_3":1,"vote_0":784,"vote_1":256,"vote_2":1024,"vote_3":196,"scenario_4":1,"scenario_5":2,"scenario_6":1,"scenario_7":1,"scenario_8":1,"scenario_9":1,"vote_4":512,"vote_5":3072,"vote_6":128,"vote_7":100,"vote_8":32,"vote_9":50,"vote_10":576,"vote_11":2304,"vote_12":768,"vote_13":64,"ensemble_0":196,"ensemble_1":64,"ensemble_2":400,"ensemble_3":144,"vote_14":4096,"vote_15":6912,"vote_16":256,"vote_17":128,"vote_18":6400,"vote_19":1728,"config_0":64,"config_1":81,"config_2":100,"config_3":121,"config_4":144,"config_5":36,"config_6":49,"config_7":256,"config_8":400,"config_9":625,"ensemble_4":900,"ensemble_5":197,"ensemble_6":32,"ensemble_7":1024},"problemTestCodes":{"concept_0":"answer = 2\nassert answer == 2","concept_1":"answer = 2\nassert answer == 2","concept_2":"answer = 1\nassert answer == 1","concept_3":"answer = 3\nassert answer == 3","concept_4":"answer = 2\nassert answer == 2","concept_5":"answer = 4\nassert answer == 4","ox_0":"answer = 1\nassert answer == 1","ox_1":"answer = 0\nassert answer == 0","ox_2":"answer = 1\nassert answer == 1","ox_3":"answer = 0\nassert answer == 0","ox_4":"answer = 1\nassert answer == 1","ox_5":"answer = 0\nassert answer == 0","scenario_0":"answer = 1\nassert answer == 1","scenario_1":"answer = 1\nassert answer == 1","scenario_2":"answer = 2\nassert answer == 2","scenario_3":"answer = 1\nassert answer == 1","vote_0":"answer = 784\nassert answer == 784","vote_1":"answer = 256\nassert answer == 256","vote_2":"answer = 1024\nassert answer == 1024","vote_3":"answer = 196\nassert answer == 196","scenario_4":"answer = 1\nassert answer == 1","scenario_5":"answer = 2\nassert answer == 2","scenario_6":"answer = 1\nassert answer == 1","scenario_7":"answer = 1\nassert answer == 1","scenario_8":"answer = 1\nassert answer == 1","scenario_9":"answer = 1\nassert answer == 1","vote_4":"answer = 512\nassert answer == 512","vote_5":"answer = 3072\nassert answer == 3072","vote_6":"answer = 128\nassert answer == 128","vote_7":"answer = 100\nassert answer == 100","vote_8":"answer = 32\nassert answer == 32","vote_9":"answer = 50\nassert answer == 50","vote_10":"answer = 576\nassert answer == 576","vote_11":"answer = 2304\nassert answer == 2304","vote_12":"answer = 768\nassert answer == 768","vote_13":"answer = 64\nassert answer == 64","ensemble_0":"answer = 196\nassert answer == 196","ensemble_1":"answer = 64\nassert answer == 64","ensemble_2":"answer = 400\nassert answer == 400","ensemble_3":"answer = 144\nassert answer == 144","vote_14":"answer = 4096\nassert answer == 4096","vote_15":"answer = 6912\nassert answer == 6912","vote_16":"answer = 256\nassert answer == 256","vote_17":"answer = 128\nassert answer == 128","vote_18":"answer = 6400\nassert answer == 6400","vote_19":"answer = 1728\nassert answer == 1728","config_0":"assert 8 * 8 == 64","config_1":"assert 9 * 9 == 81","config_2":"assert 10 * 10 == 100","config_3":"assert 11 * 11 == 121","config_4":"assert 12 * 12 == 144","config_5":"assert 6 * 6 == 36","config_6":"assert 7 * 7 == 49","config_7":"assert 16 * 16 == 256","config_8":"assert 20 * 20 == 400","config_9":"assert 25 * 25 == 625","ensemble_4":"answer = 900\nassert answer == 900","ensemble_5":"answer = 197\nassert answer == 197","ensemble_6":"answer = 32\nassert answer == 32","ensemble_7":"answer = 1024\nassert answer == 1024"},"problemDifficulty":{"concept_0":"easy","concept_1":"easy","concept_2":"easy","concept_3":"easy","concept_4":"easy","concept_5":"easy","ox_0":"easy","ox_1":"easy","ox_2":"easy","ox_3":"easy","ox_4":"easy","ox_5":"easy","scenario_0":"easy","scenario_1":"easy","scenario_2":"easy","scenario_3":"easy","vote_0":"easy","vote_1":"easy","vote_2":"easy","vote_3":"easy","scenario_4":"medium","scenario_5":"medium","scenario_6":"medium","scenario_7":"medium","scenario_8":"medium","scenario_9":"medium","vote_4":"medium","vote_5":"medium","vote_6":"medium","vote_7":"medium","vote_8":"medium","vote_9":"medium","vote_10":"medium","vote_11":"medium","vote_12":"medium","vote_13":"medium","ensemble_0":"medium","ensemble_1":"medium","ensemble_2":"medium","ensemble_3":"medium","vote_14":"hard","vote_15":"hard","vote_16":"hard","vote_17":"hard","vote_18":"hard","vote_19":"hard","config_0":"hard","config_1":"hard","config_2":"hard","config_3":"hard","config_4":"hard","config_5":"hard","config_6":"hard","config_7":"hard","config_8":"hard","config_9":"hard","ensemble_4":"hard","ensemble_5":"medium","ensemble_6":"hard","ensemble_7":"hard"},"problemOrder":["concept_0","concept_1","concept_2","concept_3","concept_4","concept_5","ox_0","ox_1","ox_2","ox_3","ox_4","ox_5","scenario_0","scenario_1","scenario_2","scenario_3","vote_0","vote_1","vote_2","vote_3","scenario_4","scenario_5","scenario_6","scenario_7","scenario_8","scenario_9","vote_4","vote_5","vote_6","vote_7","vote_8","vote_9","vote_10","vote_11","vote_12","vote_13","ensemble_0","ensemble_1","ensemble_2","ensemble_3","vote_14","vote_15","vote_16","vote_17","vote_18","vote_19","config_0","config_1","config_2","config_3","config_4","config_5","config_6","config_7","config_8","config_9","ensemble_4","ensemble_5","ensemble_6","ensemble_7"]},"paperReviewInfluenceKernelVonMises":{"chapter":"Chapter PR-01","title":"Kernel von Mises Formula of the Influence Function","description":"本論文は、モデルごとに影響関数(IF)を手で導出しなければならなかったボトルネックを、カーネルとスペクトル展開に基づくデータ駆動の計算手順へ置き換えます。特に点質量(point-mass)摂動で起きやすい数値的不安定(ill-conditioned)を和らげ、正則化された推定量により**実装可能性**と**理論的一貫性(Consistency)**の両立を図った点が主要な貢献です。","sectionTitle":"学ぶ / 論文レビュー / 理論・数学 / CPAL2026","viewOriginalPdf":"原論文のPDFを開く","coreFlow":{"0":"**[要約・はじめに] 3行要約と問題設定**\n\n① 従来のIF計算はモデルが変わるたびに式を手で導き直す必要があり、自動化が難しい。\n② 分布を点質量で突く古典的手法は応答が鋭くなり、数値的に不安定になりやすい。\n③ 本論文はデータを複数の「滑らかなパターン」に分け、各パターンの影響を計算してから足し合わせ、手計算ではなく計算機で安定にIFを求められるようにする。\n\n**身近な例:** 複雑な鍋料理で「豆腐1片がスープの味にどれだけ効くか」を知りたいとする。従来は鍋を針で突くように急な摂動を入れるので値が大きく揺れやすい。本論文は針の代わりに穏やかな波のように複数方向へ少しずつ動かし、その応答を合成して「どの材料が味をどれだけ変えたか」をより安定に推定するイメージに近い。","1":"**[背景知識] 必要な基礎（詳しめ）**\n\n**定義 → 直感 → 本論文での役割** で読んでください。\n\n- **影響関数 $\\psi_P$**\n 分布 $P$ をわずかに変えたときの汎関数 $\\theta(P)$ の感度。点 $x$ 方向の摂動に対する応答をまとめます。Cook 距離のような **データ点の影響** の発想に近いが、対象は **分布全体に依存する汎関数** になりうる。点質量摂動はスペクトルが尖り **数値不安定** になりやすく、本論文は滑らかなモード合成へ移行します。\n\n- **汎関数パラメータ $\\theta(P)$**\n 入力が分布 $P$（平均、ERM 解、リスクなど）。世界の分布が変われば目的そのものも変わる。**分布レベルの感度** を扱う動機になり、滑らかな経路 $P_t^j$ 上の微分が登場します。\n\n- **カーネル / RKHS**\n カーネルが誘導する **滑らかでノルム制御された関数空間**。尖った摂動への暴れを抑え、安定した推定経路を作る。点質量の代わりに **カーネル方向の穏やかな摂動** を使います。\n\n- **スペクトル分解と直交基底 $e_j$**\n 固有値 $\\sigma_j$・固有関数 $e_j$ で作用素をモード分解し、$sum_j (\\cdots)e_j$ で再構成。フーリエ的に **成分ごとに感度を見て足し戻す** イメージ。Theorem 3.3 の和と $\\frac{1}{1+2\\lambda/\\sigma_j}$ がその実装です。\n\n- **経路微分**\n 滑らかな $P_t^j$ に沿って $\\left.\\frac{d}{dt}\\theta(P_t^j)\\right|_{t=0}$ をとる。**瞬間注入**ではなく **ゆるやかな傾き** への応答。本論文のスペクトラル von Mises 公式の中核です。","2":"**[提案手法: 核となるアイデア]**\n\n点質量摂動を直接使わず、固有関数方向の経路摂動 $P_t^j$ に沿って $\\theta$ の経路微分を計算し、IFを再構成する。中心結果は **Theorem 3.3 (Spectral von Mises formula)** で、モードごとの寄与の和としてIFを表す。さらに正則化パラメータ $\\lambda$ を入れ、小さい固有値モードの過剰増幅を抑えて安定性を高める。","3":"$27","4":"**[実験と結果]**\n\n論文は最も基本的な関数型目標である平均を中心に、おもちゃのモンテカルロ実験を構成し、提案スペクトル推定量が実際の計算環境でどう動くかを示します。確認すべき点は二つあります。\n\n第一に、**正則化強度 $\\lambda$ によるバイアス–分散の移動**です。$\\lambda$ が小さすぎると小さい固有値モードまで強く反映され推定値が振動し(分散増)、大きすぎると重要モードまで過度に押され真値から離れるバイアスが大きくなります。したがって縮小係数 $\\frac{1}{1+2\\lambda/\\sigma_j}$ は、数値安定性と情報保持の間を調整する**実用的なつまみ**として働きます。\n\n第二に、**サンプル数 $n$ の増加に伴う一貫性(Consistency)**です。サンプルが増えるほど提案推定量は理論的IFに近づく傾向があり、論文中の理論結果(例: Theorem 4.7)と同じ方向です。言い換えれば、データが十分増えるほど「計算機が求めたIF」が「数学的に期待されるIF」へ収束することが実験的にも示唆されます。\n\n実務的には、単におもちゃ例が合ったという以上に、正則化パラメータの選び方でモデル感度分析を**再現可能に安定化**できるというシグナルです。どのデータがモデルを揺らすかを分析するとき、走ごとに結果がばらつかず、データが増えるほど信頼できる方向へ向かう推定量である点が重要です。","5":"**[結論と限界]**\n\n本論文の最大の意義は、IF計算を「研究者個人の手書き導出作業」から「データとアルゴリズムで繰り返し実行できる計算手順」へ移した点にあります。従来はモデルが少し変わるたびIFを導き直すコストが大きかったが、カーネルに基づくスペクトル展開と経路微分の組み合わせで共通の計算枠を提示します。特に Nyström 型固有分解でモード $(\\sigma_j,e_j)$ を推定し、モード別感度を正則化付き重み和で再構成する流れは、実装観点でも非常に明確なパイプラインです。\n\n実務では三つの活用価値が大きいです。第一に、予測に過大な影響を与えるデータ点を見つけ、ラベル誤りや外れ値を優先的に点検できます。第二に、モデル更新前後でどのサンプルの影響力がどれだけ変わったか比較し、デバッグ指標にできます。第三に、説明可能AI(XAI)や頑健学習(robust ML)の文脈で「なぜその判断か」をデータ影響の視点で解釈する基盤を提供します。\n\n一方、論文が率直に残した限界も明確です。最も代表的なのは**収束速度(rate) の精密解析**がまだ開いている点です。一貫性(最終的に正しい値へ向かうこと)は示されたが、「どれだけ速く近づくか」は別途の研究が必要です。もう一つは経路微分計算の**完全自動化(autodiff 統合)**です。理論上経路微分項が中核ですが、多様なモデルで安定して自動計算するエンジニアリング層にはまだ発展余地があります。したがって本論文は「問題の最終解答」というより、IF計算の実用化における強力な基準点であり、次の研究を開く出発点と捉えるのが最も妥当です。"},"mainMethodFiveSteps":{"0":"**1) 核となる提案（概念）**\n\n点質量で突くのではなく、カーネル固有関数軸に沿って分布を滑らかに摂動し、経路微分を合成してIFを求めます。","1":"**2) 身近な例（直感）**\n\nギターの弦を1本強く弾くとノイズが乗りますが、複数の弦を適度に混ぜると安定した和音になります。IFも1点の鋭い刺激より、多モードの合成の方が安定しやすいです。","2":"**3) 数式の詳細（数学）**\n\n重み $\\frac{1}{1+2\\lambda/\\sigma_j}$ は小さい $\\sigma_j$ モードの暴走を抑える減衰器です。分散は下がりますが、$\\lambda$ を大きくしすぎるとバイアスが増えることがあります。","3":"**4) Math to Code（実装）**\n\n以下のコードは $\\sigma_j$、経路微分の近似、$e_j(x)$ を用いて $\\psi_{P,\\lambda}(x)$ を計算します。論文の計算パイプライン（モード分解→モード別感度→減衰付き重み和）を圧縮した例であり、記号を変数名に1:1で対応させています。","4":"**5) AI実務での使い道**\n\n- 予測に大きく効く学習サンプルの検出\n- 外れ値・ラベル誤りデータの優先検証\n- モデル更新前後の感度比較"},"mathToCodeTitle":"論文アルゴリズムの実装例 (NumPy)","mathToCodeCode":"import numpy as np\n\n# 固有値 sigma_j ベクトル(論文の \\sigma_j)\nsigma = np.array([8, 4, 2, 1], dtype=float)\n\n# 経路微分の近似 [d/dt theta(P_t^j)]_{t=0}\ndtheta = np.array([6, 4, 2, 2], dtype=float)\n\n# e_j(x): ある x における固有関数の値\ne_x = np.array([3, 2, 1, 1], dtype=float)\n\n# 正則化ハイパラ \\lambda\nlambda_reg = 2.0\n\n# 分母 1 + 2*lambda/sigma_j\nshrink = 1.0 / (1.0 + 2.0 * lambda_reg / sigma)\n\n# モードごとの寄与 = shrink_j * dtheta_j * e_j(x)\nterm = shrink * dtheta * e_x\n\n# r=4 の低ランク近似 IF\npsi_hat = int(np.round(np.sum(term)))\n\nprint('shrink =', shrink.astype(int))\nprint('term =', term.astype(int))\nprint('psi_hat =', psi_hat)","mathToCodeOutput":"shrink = [0 0 0 0]\nterm = [10 4 1 0]\npsi_hat = 16","visualPlanTitle":"図解：限界と提案の鮮明な対比","visualPlan":"左のブロックは**点質量・スパイク**で感度が激しく揺れる**従来の限界**、右の2段は**モード分解と正則化加重**で**滑らかで抑え可能なIF**へ再構成する**提案**を同時に示し、ギャップが一目で分かるようにしました。","visualLimitBannerTitle":"従来の限界","visualLimitBannerDetail":"点質量・スパイク → 感度の暴れ・不安定さ","visualProposalBannerTitle":"論文の提案","visualProposalBannerDetail":"スペクトル分解 → 正則化再構成 → 安定したIF","visualStep1Heading":"1) 点質量摂動","visualStep1Body":"スパイクにより感度が大きく振れる","visualStep2Heading":"2) スペクトル分解","visualStep2Body1":"モードごとに $(\\sigma_j, e_j)$ で分解","visualStep2Body2":"小さい $\\sigma_j$ モードは重みで減衰","visualStep3Heading":"3) 正則化再構成","visualStep3Body1":"加重和でIFを滑らかに復元","visualStep3Body2":"$$\\frac{1}{1+2\\lambda/\\sigma_j}$ がノイズモードを抑制","visualVsLabel":"VS","visualVsAria":"従来の限界ブロックと論文提案ブロックの区切り","summary":"本論文は、IF計算を「モデルごとの手導出」から「データとアルゴリズムで再現可能な手順」へ移した点に大きな意義があります。実務では、どのサンプルが予測を大きく動かすかを**安定して**追跡でき、データ品質チェック・外れ値分析・デバッグに直結します。一方で正則化強度の選び方に伴うバイアス–分散、**収束速度(rate)** の精密解析、経路微分の**完全自動化**など、今後の理論・システム拡張の課題も残されています。","problemSolvingLabel":"解法のヒント","problemSolving":{"0":"| タイプ | 解き方・例(論文の記号→答え) |\n| :--- | :--- |\n| 記号 | $\\lambda$ は正則化強度、$\\sigma_j$ は固有値、$e_j(x)$ は固有関数の値 |\n| 個数 | 固有関数を5つ使えば和の項は5個 |\n| 縮小 | $\\sigma_j=4, \\lambda=2$ なら分母 $1+2\\lambda/\\sigma_j=2$ |\n| おもちゃの和 | 項 [8,4,2,2] の和は 16 |\n| 傾向 | $\\lambda$ を大きくすると小さい $\\sigma_j$ モードの寄与は減る |\n| コード対応 | $\\lambda \\leftrightarrow$ lambda_reg, $\\sigma_j \\leftrightarrow$ sigma |","1":"**例 A**\n\n問題: $\\sigma_j=4$, $\\lambda=2$ のとき $1+2\\lambda/\\sigma_j$ を求めよ。\n\n計算: $1+2\\times2/4=2$\n\n答え: 2","2":"**例 B**\n\n問題: モード別寄与が [6, 4, 2, 4] のとき IF の近似値(和)は?\n\n計算: $6+4+2+4=16$\n\n答え: 16"},"practiceProblemsTitle":"練習問題","practiceProblemsIntro":"60問のプールから無作為に10問を出題します。難易度は易しめ4・ふつう3・難しめ3の順で、答えは整数のみです。","practiceProblemsInstruction":"指示文と設問の間に空行があります。答えは必ず整数で入力してください。","problems":{"q00":"指示: 主要貢献を選びなさい。\n\n設問: 本論文の中心はどれか? ①点質量摂動を強める ②カーネル–スペクトルでIFをデータ駆動計算 ③CNN分類器を追加","q01":"指示: 記号の意味を選びなさい。\n\n設問: 式の $\\lambda$ は何か? ①正則化強度 ②サンプル数 ③クラス数","q02":"指示: 記号の意味を選びなさい。\n\n設問: $\\sigma_j$ は何か? ①固有値 ②バッチサイズ ③層の数","q03":"指示: 記号の意味を選びなさい。\n\n設問: $e_j(x)$ は何か? ①$j$番目固有関数の値 ②損失関数 ③最適化器","q04":"指示: 正誤判定。\n\n設問: 点質量摂動は数値的に不安定になりうる。正=1 偽=0","q05":"指示: 正誤判定。\n\n設問: $\\lambda$ を大きくすると小さい $\\sigma_j$ モードの寄与は通常減る。正=1 偽=0","q06":"指示: 正誤判定。\n\n設問: 提案式はモード別寄与の和でIFを再構成する。正=1 偽=0","q07":"指示: 項の個数を数えなさい。\n\n設問: 和を $j=1$ から $r=6$ まで取るとき項はいくつ?","q08":"指示: 分母を計算しなさい。\n\n設問: $\\lambda=2$, $\\sigma_j=4$ のとき $1+2\\lambda/\\sigma_j$ は?","q09":"指示: 分母を計算しなさい。\n\n設問: $\\lambda=3$, $\\sigma_j=3$ のとき $1+2\\lambda/\\sigma_j$ は?","q10":"指示: 分母を計算しなさい。\n\n設問: $\\lambda=1$, $\\sigma_j=2$ のとき $1+2\\lambda/\\sigma_j$ は?","q11":"指示: 分母を計算しなさい。\n\n設問: $\\lambda=4$, $\\sigma_j=8$ のとき $1+2\\lambda/\\sigma_j$ は?","q12":"指示: 和を求めなさい。\n\n設問: 寄与 [5,4,3] の和は?","q13":"指示: 和を求めなさい。\n\n設問: 寄与 [6,2,2,2] の和は?","q14":"指示: 和を求めなさい。\n\n設問: 寄与 [9,1,3,3] の和は?","q15":"指示: 減少量を求めなさい。\n\n設問: 正則化前20・後16 のとき減少量は?","q16":"指示: 整数で答えなさい。\n\n設問: 易/中/難が 4/3/3 なら1セッションの問題数は?","q17":"指示: 個数を数えなさい。\n\n設問: 易20・中20・難20 なら合計は?","q18":"指示: 個数を数えなさい。\n\n設問: 固有関数4つ、各1項なら総項数は?","q19":"指示: 減少量を求めなさい。\n\n設問: 小さい固有値モードの寄与が5から2に減った。減少量は?","q20":"指示: おもちゃ計算。\n\n設問: 寄与 [8,4,2,2] の和は?","q21":"指示: おもちゃ計算。\n\n設問: 寄与 [10,3,1,2] の和は?","q22":"指示: おもちゃ計算。\n\n設問: 寄与 [7,5,4] の和は?","q23":"指示: おもちゃ計算。\n\n設問: 寄与 [12,6,2] の和は?","q24":"指示: おもちゃ計算。\n\n設問: 寄与 [4,4,4,4] の和は?","q25":"指示: おもちゃ計算。\n\n設問: 寄与 [3,3,5,5] の和は?","q26":"指示: おもちゃ計算。\n\n設問: 寄与 [15,1] の和は?","q27":"指示: おもちゃ計算。\n\n設問: 寄与 [11,2,3] の和は?","q28":"指示: おもちゃ計算。\n\n設問: 寄与 [6,6,2,2] の和は?","q29":"指示: おもちゃ計算。\n\n設問: 寄与 [14,2] の和は?","q30":"指示: 項の個数を数えなさい。\n\n設問: $r=10$ なら和の項はいくつ?","q31":"指示: 項の個数を数えなさい。\n\n設問: $r=12$ なら和の項はいくつ?","q32":"指示: 項の個数を数えなさい。\n\n設問: $r=15$ なら和の項はいくつ?","q33":"指示: 項の個数を数えなさい。\n\n設問: $r=18$ なら和の項はいくつ?","q34":"指示: 分母を計算しなさい。\n\n設問: $\\lambda=6$, $\\sigma_j=6$ のとき $1+2\\lambda/\\sigma_j$ は?","q35":"指示: 分母を計算しなさい。\n\n設問: $\\lambda=8$, $\\sigma_j=4$ のとき $1+2\\lambda/\\sigma_j$ は?","q36":"指示: 分母を計算しなさい。\n\n設問: $\\lambda=5$, $\\sigma_j=10$ のとき $1+2\\lambda/\\sigma_j$ は?","q37":"指示: 分母を計算しなさい。\n\n設問: $\\lambda=9$, $\\sigma_j=9$ のとき $1+2\\lambda/\\sigma_j$ は?","q38":"指示: 推定値を比較しなさい。\n\n設問: 前28・後20 なら減少量は?","q39":"指示: 推定値を比較しなさい。\n\n設問: 前35・後27 なら減少量は?","q40":"指示: 難しい和。\n\n設問: 寄与 [20,10,6,4] の和は?","q41":"指示: 難しい和。\n\n設問: 寄与 [18,12,8,2] の和は?","q42":"指示: 難しい和。\n\n設問: 寄与 [16,9,7,4] の和は?","q43":"指示: 難しい和。\n\n設問: 寄与 [22,8,5,1] の和は?","q44":"指示: 難しい和。\n\n設問: 寄与 [14,14,6,2] の和は?","q45":"指示: 難しい和。\n\n設問: 寄与 [25,5,4,2] の和は?","q46":"指示: 難しい和。\n\n設問: 寄与 [30,4,1,1] の和は?","q47":"指示: 難しい和。\n\n設問: 寄与 [19,9,5,3] の和は?","q48":"指示: 難しい和。\n\n設問: 寄与 [17,11,6,2] の和は?","q49":"指示: 難しい和。\n\n設問: 寄与 [24,7,3,2] の和は?","q50":"指示: 難しい分母。\n\n設問: $\\lambda=10$, $\\sigma_j=5$ のとき $1+2\\lambda/\\sigma_j$ は?","q51":"指示: 難しい分母。\n\n設問: $\\lambda=12$, $\\sigma_j=6$ のとき $1+2\\lambda/\\sigma_j$ は?","q52":"指示: 難しい分母。\n\n設問: $\\lambda=14$, $\\sigma_j=7$ のとき $1+2\\lambda/\\sigma_j$ は?","q53":"指示: 難しい分母。\n\n設問: $\\lambda=16$, $\\sigma_j=8$ のとき $1+2\\lambda/\\sigma_j$ は?","q54":"指示: 難しい分母。\n\n設問: $\\lambda=18$, $\\sigma_j=9$ のとき $1+2\\lambda/\\sigma_j$ は?","q55":"指示: 難しい分母。\n\n設問: $\\lambda=20$, $\\sigma_j=10$ のとき $1+2\\lambda/\\sigma_j$ は?","q56":"指示: セットサイズを計算しなさい。\n\n設問: 問題プール60問から1セッションで10問出すと残りは?","q57":"指示: セットサイズを計算しなさい。\n\n設問: 易しめ20問からセッションで易しめ4問出すと残りの易しめは?","q58":"指示: セットサイズを計算しなさい。\n\n設問: ふつう20問からセッションでふつう3問出すと残りのふつうは?","q59":"指示: セットサイズを計算しなさい。\n\n設問: 難しめ20問からセッションで難しめ3問出すと残りの難しめは?"},"problemAnswers":{"q00":2,"q01":1,"q02":1,"q03":1,"q04":1,"q05":1,"q06":1,"q07":6,"q08":2,"q09":3,"q10":2,"q11":2,"q12":12,"q13":12,"q14":16,"q15":4,"q16":10,"q17":60,"q18":4,"q19":3,"q20":16,"q21":16,"q22":16,"q23":20,"q24":16,"q25":16,"q26":16,"q27":16,"q28":16,"q29":16,"q30":10,"q31":12,"q32":15,"q33":18,"q34":3,"q35":5,"q36":2,"q37":3,"q38":8,"q39":8,"q40":40,"q41":40,"q42":36,"q43":36,"q44":36,"q45":36,"q46":36,"q47":36,"q48":36,"q49":36,"q50":5,"q51":5,"q52":5,"q53":5,"q54":5,"q55":5,"q56":50,"q57":16,"q58":17,"q59":17},"problemSolutions":{"q00":"核は点質量摂動を置き換えるカーネル–スペクトルIF推定です。数値不安定と手導出負担を減らすのが貢献なので答えは2。","q01":"$$\\lambda$ は正則化強度で、小さい固有値モードの過大寄与を抑えるハイパラです。答えは1。","q02":"$$\\sigma_j$ はスペクトル分解における $j$ 番目モードの固有値です。答えは1。","q03":"$$e_j(x)$ は $j$ 番目固有関数を $x$ で評価した値です。答えは1。","q04":"論文の問題意識は点質量摂動の数値的脆弱性です。真なので1。","q05":"縮小係数の分母が $1+2\\lambda/\\sigma_j$ なので $\\lambda$ が大きいほど係数は小さくなる。真なので1。","q06":"中心式はモード別寄与の和の構造です。真なので1。","q07":"$$j=1$ から $6$ までなので項の個数は6。","q08":"$$1+2\\times2/4=1+1=2$。","q09":"$$1+2\\times3/3=1+2=3$。","q10":"$$1+2\\times1/2=2$。","q11":"$$1+2\\times4/8=2$。","q12":"$$5+4+3=12$。","q13":"$$6+2+2+2=12$。","q14":"$$9+1+3+3=16$。","q15":"$$20-16=4$。","q16":"$$4+3+3=10$。","q17":"$$20+20+20=60$。","q18":"関数4つに項が1つずつなら合計4。","q19":"$$5-2=3$。","q20":"$$8+4+2+2=16$。","q21":"$$10+3+1+2=16$。","q22":"$$7+5+4=16$。","q23":"$$12+6+2=20$。","q24":"$$4+4+4+4=16$。","q25":"$$3+3+5+5=16$。","q26":"$$15+1=16$。","q27":"$$11+2+3=16$。","q28":"$$6+6+2+2=16$。","q29":"$$14+2=16$。","q30":"$$r=10$ なら項数は10。","q31":"$$r=12$ なら項数は12。","q32":"$$r=15$ なら項数は15。","q33":"$$r=18$ なら項数は18。","q34":"$$1+2\\times6/6=3$。","q35":"$$1+2\\times8/4=5$。","q36":"$$1+2\\times5/10=2$。","q37":"$$1+2\\times9/9=3$。","q38":"$$28-20=8$。","q39":"$$35-27=8$。","q40":"$$20+10+6+4=40$。","q41":"$$18+12+8+2=40$。","q42":"$$16+9+7+4=36$。","q43":"$$22+8+5+1=36$。","q44":"$$14+14+6+2=36$。","q45":"$$25+5+4+2=36$。","q46":"$$30+4+1+1=36$。","q47":"$$19+9+5+3=36$。","q48":"$$17+11+6+2=36$。","q49":"$$24+7+3+2=36$。","q50":"$$1+2\\times10/5=5$。","q51":"$$1+2\\times12/6=5$。","q52":"$$1+2\\times14/7=5$。","q53":"$$1+2\\times16/8=5$。","q54":"$$1+2\\times18/9=5$。","q55":"$$1+2\\times20/10=5$。","q56":"$$60-10=50$。","q57":"$$20-4=16$。","q58":"$$20-3=17$。","q59":"$$20-3=17$。"},"problemTestCodes":{"q00":"answer = 2\nassert answer == 2","q01":"answer = 1\nassert answer == 1","q02":"answer = 1\nassert answer == 1","q03":"answer = 1\nassert answer == 1","q04":"answer = 1\nassert answer == 1","q05":"answer = 1\nassert answer == 1","q06":"answer = 1\nassert answer == 1","q07":"assert 6 == 6","q08":"assert 1 + 2 * 2 // 4 == 2","q09":"assert 1 + 2 * 3 // 3 == 3","q10":"assert 1 + 2 * 1 // 2 == 2","q11":"assert 1 + 2 * 4 // 8 == 2","q12":"values = [5,4,3]\nassert sum(values) == 12","q13":"values = [6,2,2,2]\nassert sum(values) == 12","q14":"values = [9,1,3,3]\nassert sum(values) == 16","q15":"before = 20\nafter = 16\nassert before - after == 4","q16":"assert 4 + 3 + 3 == 10","q17":"assert 20 + 20 + 20 == 60","q18":"assert 4 * 1 == 4","q19":"assert 5 - 2 == 3","q20":"values = [8,4,2,2]\nassert sum(values) == 16","q21":"values = [10,3,1,2]\nassert sum(values) == 16","q22":"values = [7,5,4]\nassert sum(values) == 16","q23":"values = [12,6,2]\nassert sum(values) == 20","q24":"values = [4,4,4,4]\nassert sum(values) == 16","q25":"values = [3,3,5,5]\nassert sum(values) == 16","q26":"values = [15,1]\nassert sum(values) == 16","q27":"values = [11,2,3]\nassert sum(values) == 16","q28":"values = [6,6,2,2]\nassert sum(values) == 16","q29":"values = [14,2]\nassert sum(values) == 16","q30":"answer = 10\nassert answer == 10","q31":"answer = 12\nassert answer == 12","q32":"answer = 15\nassert answer == 15","q33":"answer = 18\nassert answer == 18","q34":"assert 1 + 2 * 6 // 6 == 3","q35":"assert 1 + 2 * 8 // 4 == 5","q36":"assert 1 + 2 * 5 // 10 == 2","q37":"assert 1 + 2 * 9 // 9 == 3","q38":"assert 28 - 20 == 8","q39":"assert 35 - 27 == 8","q40":"values = [20,10,6,4]\nassert sum(values) == 40","q41":"values = [18,12,8,2]\nassert sum(values) == 40","q42":"values = [16,9,7,4]\nassert sum(values) == 36","q43":"values = [22,8,5,1]\nassert sum(values) == 36","q44":"values = [14,14,6,2]\nassert sum(values) == 36","q45":"values = [25,5,4,2]\nassert sum(values) == 36","q46":"values = [30,4,1,1]\nassert sum(values) == 36","q47":"values = [19,9,5,3]\nassert sum(values) == 36","q48":"values = [17,11,6,2]\nassert sum(values) == 36","q49":"values = [24,7,3,2]\nassert sum(values) == 36","q50":"assert 1 + 2 * 10 // 5 == 5","q51":"assert 1 + 2 * 12 // 6 == 5","q52":"assert 1 + 2 * 14 // 7 == 5","q53":"assert 1 + 2 * 16 // 8 == 5","q54":"assert 1 + 2 * 18 // 9 == 5","q55":"assert 1 + 2 * 20 // 10 == 5","q56":"assert 60 - 10 == 50","q57":"assert 20 - 4 == 16","q58":"assert 20 - 3 == 17","q59":"assert 20 - 3 == 17"},"problemDifficulty":{"q00":"easy","q01":"easy","q02":"easy","q03":"easy","q04":"easy","q05":"easy","q06":"easy","q07":"easy","q08":"easy","q09":"easy","q10":"easy","q11":"easy","q12":"easy","q13":"easy","q14":"easy","q15":"easy","q16":"easy","q17":"easy","q18":"easy","q19":"easy","q20":"medium","q21":"medium","q22":"medium","q23":"medium","q24":"medium","q25":"medium","q26":"medium","q27":"medium","q28":"medium","q29":"medium","q30":"medium","q31":"medium","q32":"medium","q33":"medium","q34":"medium","q35":"medium","q36":"medium","q37":"medium","q38":"medium","q39":"medium","q40":"hard","q41":"hard","q42":"hard","q43":"hard","q44":"hard","q45":"hard","q46":"hard","q47":"hard","q48":"hard","q49":"hard","q50":"hard","q51":"hard","q52":"hard","q53":"hard","q54":"hard","q55":"hard","q56":"hard","q57":"hard","q58":"hard","q59":"hard"},"problemOrder":["q00","q01","q02","q03","q04","q05","q06","q07","q08","q09","q10","q11","q12","q13","q14","q15","q16","q17","q18","q19","q20","q21","q22","q23","q24","q25","q26","q27","q28","q29","q30","q31","q32","q33","q34","q35","q36","q37","q38","q39","q40","q41","q42","q43","q44","q45","q46","q47","q48","q49","q50","q51","q52","q53","q54","q55","q56","q57","q58","q59"]},"paperReviewCurseDepthLlm":{"chapter":"Chapter PR-02","title":"The Curse of Depth in Large Language Models","description":"このレビューでは、「なぜ LLM を深くしても後段レイヤーが十分に働かなくなるのか」を解説します。論文は Pre-LN Transformer における深さ方向の分散蓄積を理論的に分析し、LayerNorm 出力に $\\frac{1}{\\sqrt{l}}$ を掛けるだけで深いレイヤーの有効性を回復できることを示します。","viewOriginalPdf":"原文論文 PDF を見る","coreFlow":{"0":"### [要約と導入]\n\n- 深い LLM では後段レイヤーの寄与が落ちやすい\n- Pre-LN は安定だが深さで分散が蓄積しうる\n- LNS は $\\frac{1}{\\sqrt{l}}$ で深さ依存の制御を入れる\n\n**比喩:** 100台のアンプを直列につないだ音響系を想像してください。後ろに行くほど雑音が積み上がると、最後は原音よりノイズが勝ってしまいます。LNS は後段ほど強く効く自動ボリューム制御です。","1":"**[背景知識] 必要な基礎（詳しめ）**\n\n**定義 → 深さで何が起きるか → 本論文** の順で読んでください。\n\n- **残差接続**\n $h_{l+1}=h_l+F(h_l)$ で $h_l$ がショートカットされ、$F$ が更新を担います。勾配・表現の流れは助ける一方、各 $F$ の小さな揺らぎが **加算で積み上がる経路** でもあります。LNS はその振幅を **深さに応じて抑え**、後段も変換に関与させます。\n\n- **Pre-LN / Post-LN**\n Pre-LN は $h_{l+1}=h_l+F(\\mathrm{LN}(h_l))$ で大規模 LLM で主流。Post-LN は $h_{l+1}=\\mathrm{LN}(h_l+F(h_l))$ で学習が難しめのことも。本論文は Pre-LN 前提で **深い層の実質パススルー** を論じ、$\\frac{1}{\\sqrt{l}}$ スケールで緩和します。\n\n- **分散の膨張**\n 深さに伴い活性の **広がり** が増し、後段で差が拡大します。残差の足し算が揺らぎを蓄積させ、制御なしでは **恒等に近い安定写像** へ寄りやすい。$\\frac{1}{\\sqrt{l}}$ は **有効分散を $1/l$ 側へ** という読み方ができます。\n\n- **恒等化（アイデンティティ崩壊）**\n $J_l\\approx I$ なら $h_{out}\\approx h_{in}$ に近く、計算はするが **新特徴がほぼ出ない層**。LNS はその傾向を遅らせ **深さの実利用** を取り戻す狙いです。\n\n- **深さの利用率**\n 層を増やしたコストに見合う損失改善があるか。なければ深さはオーバーヘッド。本論文は「より深く積む」より **深さを最後まで働かせる** 設計と読むのが適切です。","2":"### [提案法] 核心式\n\n$\\tilde{h}^{(l)} = \\mathrm{LN}(h^{(l)}) \\cdot \\frac{1}{\\sqrt{l}}$\n\n深い層ほど LayerNorm 出力の振幅をより強く抑える、非常にシンプルな設計です。\n\n$\\mathrm{Var}\\left[\\tilde{h}^{(l)}\\right] \\approx \\frac{1}{l}\\,\\mathrm{Var}\\left[\\mathrm{LN}(h^{(l)})\\right]$\n\nと読むと、深さに応じて有効分散をなだらかに抑える意図が見えます。\n\n**記号の読み方（同じ「提案」節の中）**\n\n別カードを付けず、上の核となる式に出てくる記号だけを **意味と役割** で整理します。\n\n- $l$: 現在のレイヤー番号。\n\n- $L$: 全レイヤー数。\n\n- $h^{(l)}$: $l$ 層で LayerNorm に入る活性。\n\n- $d$: hidden dimension。\n\n- $\\mathrm{LN}(h^{(l)})$: 正規化された信号。\n\n- $\\tilde{h}^{(l)}$: LNS 適用後の出力。\n\n- $\\frac{1}{\\sqrt{l}}$: 深い層ほど強く効く減衰係数。\n\n- Residual 系がアクセルなら、LNS は暴走を止めるブレーキです。\n\n- 要点は深い層を弱めることではなく、壊れずに学習を続けられるよう安定化することです。\n\n### [直感的理解]\n\n- LayerNorm は信号を整える基本整流\n- $\\frac{1}{\\sqrt{l}}$ は深い層ほど強くなるブレーキ\n- Residual/Attention/FFN はアクセル、LNS はブレーキ\n- 両者を組み合わせることで、深層でも表現力を保ちながら暴走を防ぐ\n\n要するに LNS は深い層を殺すのではなく、深い層が壊れず働けるように振幅を管理する仕組みです。","3":"### [Toy Data Walkthrough]\n\n6層モデルを考えると、$l=1$ では係数は 1.0、$l=2$ では約 0.707、$l=4$ では 0.5 と、深くなるほど出力が段階的に抑えられます。これにより、前半では十分な表現拡張を許しつつ、後半ではノイズの累積だけを強く抑えます。","4":"### [実験と結果]\n\n論文は小規模から数十億パラメータ級まで、LNS が実際の学習でも有効であることを示します。\n\n- 追加のハイパーパラメータに頼らない\n- 大規模学習でより良い収束傾向を示す\n- 深い層の表現多様性をより保つ\n\n実務的には、実装コストが小さいわりに深さ効率の改善余地が大きい点が魅力です。","5":"### [結論と限界]\n\n- 深い層が有効になると、剪定や量子化の前段階の表現品質が上がる\n- SFT や下流タスク適応で使える深層特徴が増える\n- 既存の Pre-LN パイプラインに入れやすい\n\n一方で、Post-LN や Normalization-free、マルチモーダル分岐への一般化は今後の課題です。"},"visualPlanTitle":"可視化企画: 暴走増幅 vs 深さ制御","visualPlan":"左は深さ増加に伴う分散蓄積、右は深さ依存スケーリングによる安定化を示します。レスポンシブ実装では `minHeight: 320px` と SVG `viewBox` を維持します。","visualLegacyTitle":"従来 Pre-LN","visualLegacyBody":"分散が積み上がり、後段が恒等写像に近づきます。","visualProposedTitle":"提案 LNS","visualProposedBody":"深さごとの制御で振幅を安定させ、深層寄与を保ちます。","visualAxisStart":"Layer 1","visualAxisEnd":"Layer L","visualLegacyCurveLabel":"分散増大","visualProposedCurveLabel":"制御された振幅","visualContributionLabel":"レイヤー寄与度","visualLegacyBadgeLabel":"後段レイヤーの恒等化","visualProposedBadgeLabel":"深層寄与を維持","summary":"LNS の魅力は、巨大な設計変更なしに深さの呪いへ正面から対処できる点です。深さを単なる計算量ではなく、実際の学習能力へ変えるための極めて実用的な一手と言えます。"},"paperReviewAlphaFormer":{"sectionTitle":"学ぶ / 論文レビュー / コア・アーキテクチャとアルゴリズム / CPAL2026 / AlphaFormer: End-to-End Symbolic Regression of Alpha Factors with Transformers","title":"AlphaFormer: End-to-End Symbolic Regression of Alpha Factors with Transformers","description":"クオンツ現場ではアルファ因子は依然として **手作りの式** と **ブラックボックスモデル** の間で揺れます。AlphaFormer は **合成時系列で Transformer を事前学習**し、新しい市場データに対して **解釈可能な記号式** をエンドツーエンドで生成します。線形プール、IC 指標、PPO 型の安定化を数式ごとに読み解きます。","viewOriginalPdf":"原著 PDF を開く","coreFlow":{"0":"**[要約と導入] 3 行サマリー + 問題提起**\n\n**3 行サマリー**\n\n- **① 従来の致命的な非効率:** GP や RL ベースの記号回帰は **データセットが変わるたびに探索をゼロから** やり直し、学んだ「式の文法」を再利用しにくい。毎朝レシピを一から発明するようなもの。\n- **② 古典的手法の限界:** LightGBM や LSTM は予測は強いが **ブラックボックス**。人手設計は探索空間が広すぎてスケールしない。\n- **③ 論文の核:** 多様な **合成株価で Transformer を事前学習**し、実データ $X_t$ だけで **RPN 形式のアルファ式を即生成**——多くの「偽の厨房」で練習したシェフが、本番の材料で皿を出すイメージ。\n\n**比喩: レシピを毎回ランダム試行するロボ vs 文法を体に染み込ませたシェフ**\n\n従来探索は **厨房（市場）が変わるたびに調味料比率をやり直すロボ**です。AlphaFormer は **合成データの厨房で文法を学び**、実戦の材料 $X_t$ を見て **その場で式（アルファ因子）を完成**させます。ブラックボックスに頼らず探索コストを下げる方向です。","1":"$28","2":"$29","3":"$2a","4":"**[実験と結果]**\n\n- **探索効率:** 強いベースラインより **少ない候補生成** で CSI300/CSI500 で **IC・Rank IC がトップ帯**——針穴を広げたのではなく **手が安定した**。\n- **推論効率:** 推論時に **大規模な逐次パラメータ更新が不要** というストーリー。\n- **汎化:** 合成生成器を **単一ではなくアンサンブル** すると IC が伸びる；**中国で事前学習したモデルを米 S&P500 にゼロショット** でも戦えるという報告は、取引所ノイズだけでなく **時系列・演算の文法** が一部移っている可能性を示唆。\n\n**実務読み:** GPU 時間を抑えつつ説明可能な因子が欲しいチームに、「合成事前学習＋境界の効いた RL」は MLOps 的に魅力的な妥協点です。","5":"**[結論と限界]**\n\n**実務への示唆（3 点以内）**\n\n1. **ホワイトボックス:** RPN／演算木はリスク部門に **式そのもの** を渡しやすい。\n2. **探索コスト削減:** 文法の事前圧縮で **市場が変わるたびのコールドスタート** を減らす。\n3. **E2E パイプライン:** 生成→プール→IC→(任意)PPO で再現性とデプロイが単純化。\n\n**限界**\n\n- **ハードウェア:** GPU 前提は **CPU のみのレガシー** には合わない場合がある。\n- **レジーム:** ゼロショットでも構造破壊後は **再学習・ドメイン適応** が要るかもしれない。\n- **ラベル:** IC は **将来リターン定義とリーク管理** に敏感。"},"visualPlanTitle":"図解企画: 混沌探索 vs 制御された生成","visualPlan":"左は試行の散布と **IC 目標に届かないジグザグ経路** でコールドスタート探索を表現。右は **合成系列→事前学習→トークン生成→IC/プール** の **一本パイプライン** で AlphaFormer の E2E を表す。","visualLegacyTitle":"従来: GP / RL 記号探索","visualLegacyBody":"データセットごとに広い探索から再開；候補が多くても IC は不安定。","visualProposedTitle":"提案: AlphaFormer","visualProposedBody":"合成で文法を学び、少ない生成で IC が安定し、ゼロショット転移も視野に入る。","visualAxisStart":"試行 1","visualAxisEnd":"試行 N","visualLegacyCurveLabel":"ランダム探索","visualProposedCurveLabel":"事前学習生成","visualContributionLabel":"累積効率","visualLegacyBadgeLabel":"過探索","visualProposedBadgeLabel":"少数因子・高 IC","summary":"AlphaFormer は「市場が変わるたび記号探索をゼロから」を **文法の事前学習＋クリップ付き RL 微調整** に置き換えます。プール・L1・IC・PPO は **ミキサー・ハサミ・審査・シートベルト** の役分担。GPU 依存とラベル品質を踏まえて PoC から段階導入が現実的です。"},"paperReviewPolarQuant":{"sectionTitle":"学ぶ / 論文レビュー / モデル最適化・軽量化 / PolarQuant: Quantizing KV Caches with Polar Transformation","title":"Chapter 1: PolarQuant: Quantizing KV Caches with Polar Transformation","description":"長文脈 LLM の実運用では、重みより **KV キャッシュ** が先にメモリを圧迫することがよくあります。PolarQuant はランダム前処理のあとでベクトルを極座標に移し、**角度をコンパクトに保存**することで、従来のように **「元の数値に戻すための付け足し情報」** を抱え続ける負担を大きく減らします。このレビューでは、なぜ角度分布が $\\pi/4$ 近傍に集中し、その性質がなぜ超低ビット量子化を可能にするのかを数式と直感で説明します。","viewOriginalPdf":"原論文 PDF を開く","coreFlow":{"0":"$2b","1":"$2c","2":"$2d","3":"**[トイデータで追う] 整数の例**\n\n上の式を **数字で一度だけ**追うための短い例です。記号より **Level 1 → Level 2 → $\\pi/4$** のつながりを見てください。\n\n$x=(3,4,4,3)$ とし、**手計算しやすい**前処理後ベクトルを整数で $x'=(3,4,4,3)$ と置きます（実際の $Sx$ は一般に非整数です）。\n\n**なぜ $x$ と $x'$ を同じにするか:** 本番では $x'=Sx$ で値が変わります。ここではノルム比がきれいに出るように **数字だけ** を選んだ例です（手順の定義は同じ）。\n\n**Level 1**\n\n$$\n\\psi_1^{(1)} = \\tan^{-1}(4/3),\\quad \\psi_2^{(1)} = \\tan^{-1}(3/4)\n$$\n\nおおよそ $\\psi_1^{(1)}\\approx 0.93$ rad、$\\psi_2^{(1)}\\approx 0.64$ rad。\n\n**Level 2（ブロックノルム）**\n\n$$\n\\|x'_{1:2}\\|_2 = \\sqrt{3^2+4^2}=5,\\quad \\|x'_{3:4}\\|_2 = \\sqrt{4^2+3^2}=5\n$$\n\n比はちょうど $1$ なので\n\n$$\n\\psi_1^{(2)} = \\tan^{-1}(1) = \\frac{\\pi}{4}.\n$$\n\n$(3,4)$ と $(4,3)$ が同じ長さ 5（3–4–5）になるため、高レベル角が **ちょうど $\\pi/4$** に一致する整数例です。復元した $\\hat{K},\\hat{V}$ を通常のアテンションに入れます。","4":"$2e","5":"**[結論と限界]**\n\n**実務的な意義**\n\n1. 正規化メタデータが必須という発想を崩した。\n2. 長文脈サービングのメモリ痛点を直接狙っている。\n3. attention 自体は変えず、キャッシュ表現だけを変える。\n\n**限界**\n\n- コードブック構成にはまだ改良余地がある。\n- 重みや activation への一般化には追加検証が必要。\n- 実運用では CUDA kernel や packing 最適化が重要になる。","6":"**[図解プラン] 極端な対比の可視化**\n\n左は従来のブロック量子化：**保存した値を復元するための補助数字** が各ブロックに付きまとう様子。右は PolarQuant：ランダム前処理、極座標、半径 1 個と **$45^\\circ$ 近傍に集中した角度**。"},"visualPlanTitle":"KV 保存の対比","visualPlan":"従来はブロックごとに FP16 メタが積み上がり、PolarQuant は r と角度にまとめます。","visualLegacyTitle":"ブロック量子化","visualLegacyBody":"ブロックごとに **短いコードを元の数値に戻す補助数字** が要るため、見かけは圧縮でもオーバーヘッドが残ります。","visualProposedTitle":"PolarQuant","visualProposedBody":"ランダム前処理後に極座標へ移し、集中した角度だけを量子化します。","visualAxisStart":"従来方式","visualAxisEnd":"PolarQuant","visualLegacyCurveLabel":"メタ負荷 ↑","visualProposedCurveLabel":"保存負荷 ↓","visualContributionLabel":"メモリ効率","visualLegacyBadgeLabel":"+FP16 メタ / ブロック","visualProposedBadgeLabel":"r + θ codebook","visualGlossary":{"title":"図の記号の読み方","items":[{"term":"FP16","hint":"**半精度**の浮動小数（16 ビット）。FP32 の半分のビットなので同じ個数ならメモリもおおよそ半分ですが、目盛りはやや粗くなります。"},{"term":"量子化","hint":"連続的な実数を **短い整数コード** に丸めて保存すること。利用時は **逆量子化**し、ブロックごとに **範囲を伝える補助数字** が要ることが多いです。"},{"term":"KV","hint":"過去トークンの Key/Value を載せたキャッシュベクトルの塊です。"},{"term":"INT4","hint":"数値を 4 ビットに圧縮した値。そのままでは使いにくく、補助情報が要ります。"},{"term":"+meta / FP16","hint":"短くした数値を元のレンジに戻すために付ける **追加の数字**。たいてい **高精度（例: FP16）** で別に保存されます。"},{"term":"× N","hint":"ブロックが N 個あると、メタもだいたい N 回分かさばるイメージです。"},{"term":"S","hint":"座標を混ぜるランダム前処理行列。極座標へ移しやすい分布にします。"},{"term":"r","hint":"極座標の半径＝ベクトル全体の大きさです。"},{"term":"θ","hint":"角度（向き）。実数全部ではなくコードブック番号として保存します。"},{"term":"codebook","hint":"よく出る角度の候補を並べた表。インデックスだけでビットを節約します。"}]},"summary":"PolarQuant の美しさは、問題を別の座標系へ移した点にあります。生の座標を無理に削る代わりに、長さと方向へ分けて保存することで、KV キャッシュが支配的な環境で大きな価値を持ちます。"},"paperReviewAutomlAgent":{"sectionTitle":"学ぶ / 論文レビュー / 自動機械学習 & MLパイプライン / ICML 2025 / AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML","title":"AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML","description":"AutoML-Agentは「AutoMLを少し手伝う」ではなく、データ探索から前処理、モデル設計、HPO、コード生成、そしてデプロイまでを **フルパイプライン** で自動化するマルチエージェントLLMフレームワークです。この記事では入力→計画→分解→実行→検証の流れを、数式ベースでやさしく読み解きます。","viewOriginalPdf":"原文PDFを開く","coreFlow":{"0":"**[要約 & 導入] 3行サマリー + 問題提起**\n\n**3行要約：**\n\n- **致命的な問題：** AutoMLは強力ですが、ツールが複雑で専門性がないと始めにくい。\n- **従来の限界：** LLMベースの支援はパイプラインの一部しか扱えない場合があり、計画生成が単発で探索が非効率。\n- **解決策：** AutoML-Agentは複数の専門エージェント協業、**RAP（検索拡張計画）**による候補計画の改善、そして**マルチステージ検証**でデプロイ可能なコードに到達します。\n\n**たとえ：**\n- 既存AutoMLは「材料はあるけど、調理順と火加減は自分でやる」ミールキット。\n- LLM補助は「レシピを読んでくれることもあるが、最後まで料理してサーブはしない」半自動トースター。\n- AutoML-Agentは「役割分担された厨房スタッフ」が協働し、メニュー（要求）を渡せば材料調達から提供（デプロイ）まで一気通貫。\n\nここから数式の手順へ入ります。","1":"**[背景知識] 必要な基礎概念**\n\n数式の理解に必要な5つです。\n\n- **Full-Pipeline AutoML：** データ探索/選定、前処理、モデル設計、HPO、コード生成、デプロイまでの一連。\n- **Multi-Agent System：** 1つのLLMに全部押し込まず役割を分ける設計。\n- **Retrieval-Augmented Planning（RAP）：** 外部知識を検索して計画を補強する。\n- **Plan Decomposition & Parallel：** 計画を分解し、依存を最小にして並列実行する。\n- **Multi-Stage Verification：** コードが動くか、性能が良いか、デプロイ可能かを段階的に確認する。\n\nこの5つが分かれば、本論文の「数式＝地図」が見え始めます。","2":"$2f","3":"**[数式の動作シミュレーション] Toy Data Walkthrough**\n\n小さな例で「1フレームずつ」動く感覚を作ります。\n\n**状況：**\n- $I$: 「画像分類。前処理→高速学習→デプロイ可能なコードを出して。実行失敗は避けたい。」\n\n**フレーム1：** $R=\\mathcal{A}_p(I)$（タスクと制約を構造化）\n\n**フレーム2：** $P=\\mathcal{A}_{mgr}(RAP(R))$ で $P=2$ 案\n- $p_1$: 小規模から効率的前処理＋軽量モデル\n- $p_2$: クラス不均衡を先に扱うリサンプリング＋安定スケジュール\n\n**フレーム3：** データ側でそれぞれ $O_1^d,O_2^d$ を生成\n\n**フレーム4：** モデル側で $O_1^m,O_2^m$（モデル/HPO案）\n\n**フレーム5：** 検証で $O^{*}$ を選び、$\\mathcal{M}^{*}=\\mathcal{A}_o(I^{*})$ を生成\n\n**フレーム6：** CS簡易版\n- $SR=0.9$\n- $s=0.25 \\Rightarrow NPS=\\frac{1}{1.25}=0.8$\n- $CS=0.5\\times0.9+0.5\\times0.8=0.85$\n\n一言：RAPが計画を賢くし、分解が並列実行を可能にし、検証がデプロイへ閉じます。","4":"**[実験と結果]**\n\n14のデータセットで、モダリティ横断の「フルパイプライン自動化」を評価します。\n\n| モダリティ | タスク | 例 |\n| :--- | :--- | :--- |\n| Image | 分類 | Butterfly Image, Shopee-IET |\n| Text | 分類 | Ecommerce Text, Textual Entailment |\n| Tabular | 分類 | Banana Quality, Software Defects |\n| Tabular | 回帰 | Crab Age, Crop Price |\n| Tabular | クラスタリング | Smoker Status, Higher Education Students Performance |\n| Time Series | 予測 | Weather, Electricity |\n| Graph | ノード分類 | Cora, Citeseer |\n\n**追加データセット（比較用、定型データ 6種）：**\n- Smoker Status (Binary): 喫煙の有無を予測する二値分類ベンチマーク。\n- Click Prediction Small: 広告クリック/CTRを予測する二値分類データセット。\n- MFeat Factors: 複数の因子（feature）に基づく定型ベンチマークで、ML評価に使われます。\n- Wine Quality White: ホワイトワインの化学成分から品質スコアを予測する回帰データセット。\n- Colleges: 学生・大学関連の指標から入学/成績（成果）を分類・予測する定型データセット。\n- House Prices: 物件の特徴量から住宅価格を予測する代表的な回帰ベンチマーク。\n\n**主要な実験結果（数値）：**\n- **制約下での成功率:** 平均 **87.1%**（constraint-aware）。\n- **探索速度:** SELA（MCTS）に比べて **約8倍** 速い探索。\n- **時間・コスト効率:** モデル開発→デプロイまで平均 **525秒**、費用は約 **$0.30**（GPT-4o基準）。\n\nつまり、「良いモデル探し」ではなく「良いエンジニアリング成果」を狙う設計です。","5":"**[結論と限界]**\n\n**最終の意義（≤3）：**\n\n1. **フルパイプラインの考え方：** AutoMLを一工程ではなく連鎖として定義。\n2. **RAP＋マルチエージェント：** 計画探索を単発生成から、導かれた候補探索へ。\n3. **検証ファースト：** 典型的なLLM失敗（それっぽいのに壊れる）を減らす。\n\n**限界 / Future Work：**\n\n- **テンプレ/骨格依存：** 新しいタイプのタスクではベースがさらに必要かもしれない。\n- **バックボーンLLM依存：** 強いLLMほど良い計画と実装を出しやすい。\n- **指標の設計に敏感：** SR/NPSや検証基準の定義次第で評価が変わる。\n\n最後に、全体のオーケストレーションを一枚の図にまとめます。"},"visualPlanTitle":"[図解] フルパイプラインのオーケストレーションボード","visualPlan":"1枚の流れ図に整理します。ユーザ入力 $I$ を標準表現 $R$ にし、**RAP**で計画を補強したうえで、**データ・モデル・コード**の段階が分解された作業を並列処理し、**マルチステージ検証**を通過した結果だけが**デプロイ**へ進みます。","visualLegacyTitle":"旧方式：単発計画/逐次実行のボトルネック","visualLegacyBody":"探索が長くなり、段階間の接続が切れるとコード/デプロイが失敗しやすい。失敗の繰り返しはユーザの手作業を増やします。","visualProposedTitle":"AutoML-Agent：RAP + マルチエージェント + マルチステージ検証","visualProposedBody":"要求を標準化して $R$ にし、RAPで候補計画を作り、データ/モデルを分解して並列実行。最後に検証でデプロイ可能な結果だけを確定します。","visualAxisStart":"自然言語","visualAxisEnd":"デプロイ","visualDiagramUserNode":"作業指示","visualDiagramStdNode":"標準要求","visualDiagramStdCaption":"解析・標準化","visualLegacyCurveLabel":"コスト↑ 成功↓","visualProposedCurveLabel":"成功率↑","visualContributionLabel":"フルパイプライン制御","visualLegacyBadgeLabel":"制御不能","visualProposedBadgeLabel":"精密制御","visualDiagramData":"データ","visualDiagramModel":"モデル","visualDiagramOps":"コード","visualDiagramVerify":"検証","visualDiagramShip":"デプロイ","visualAnimPhases":["**作業指示** — ユーザの自然言語による指示（論文の $I$）。","**標準要求** — ツールと検索が扱える**標準形**（論文の $R$）。","**RAP** — 論文・コード・事例を**検索**して計画候補を補強。","**データ**段階 — 前処理・分割など入力準備。","**モデル**段階 — 構造・学習・チューニング。","**コード**段階 — 実行スクリプトとデプロイ準備。","**マルチステージ検証** — 実行・指標・デプロイ可否を段階確認。","**すべての検証を通過**した結果だけが最終デプロイへ。"],"datasetSectionTitle":"データセットと評価設定","datasetSectionContent":"実験は画像・テキスト・表形式・時系列・グラフのベンチマークで行い、成功率と正規化性能を併せて評価します。","summary":"AutoML-Agentは「自動化」を部品ではなく **全パイプライン** として定義します。RAPが計画探索を加速し、分解されたマルチエージェントが並列で動き、マルチステージ検証が信頼性をロックします。数式が長くても、結局は 1 本の流れとして覚えられます：入力標準化 → 候補計画 → 並列実行 → デプロイ可能な最終コード。"},"paperReviewSela":{"sectionTitle":"学ぶ / 論文レビュー / AutoML・MLパイプライン / ICLR 2025 / SELA: Tree-Search Enhanced LLM Agents for Automated Machine Learning","title":"SELA: Tree-Search Enhanced LLM Agents for Automated Machine Learning","description":"LLMエージェントは**多様性の低い・非最適な**コードをしばしば生成し、従来のAutoMLは**固定パイプライン**に縛られます。\n\n**MCTS（モンテカルロ木探索）**は、実験・意思決定を**ツリー**で表し、ロールアウトと**検証スコア**から**次にどの枝を試すか**を決める探索法です。**UCT-DP**は、次のノードを選ぶ**UCT**の式を論文側で変形したもので、**学習・実行などコストの大きい深い段階**が**浅い探索**に押し負けにくくします。\n\n**SELA**はパイプラインをこのような**ツリー**として**MCTS**で実験順を決め、**UCT-DP**で深い段階を優先します。Insightから正規化スコアまで数式を分解します。","viewOriginalPdf":"論文PDF（arXiv）","chapter1Lead":"# Chapter 1: SELAとツリー探索AutoML\n\n上の説明と同じです。MCTS はロールアウトと検証スコアで次に試す枝を選ぶ木探索であり、UCT-DP は次ノードを選ぶ UCT の式を論文側で変形し、学習・実行などコストの大きい深い段階が浅い探索に押し負けにくくします。","mctsIntroTitle":"モンテカルロ木探索（MCTS）とは？","mctsIntroDescription":"**かんたん要約:** これから試す実験を**ツリー**に書き、4ステップを繰り返します。\n\n- **① 選ぶ（選択）:** UCT などで**次にどのノード**へ行くか決めます。\n\n- **② 増やす（拡張）:** まだない**子ノード**（新しい試行）を付け足します。\n\n- **③ 試す（ロールアウト）:** その枝でコードやシミュレを走らせ**検証スコア**を得ます。\n\n- **④ 戻す（逆伝播）:** スコアを**親の上へ**上げて訪問回数・平均を更新します。\n\nSELA は LLM が提案したパイプラインの枝を、この**4ステップ**と検証スコアで探索します。\n\n**UCT とは？**（Upper Confidence Bound を木に適用したもの）兄弟の子ノードのうち**次にどれへ行くか**を決めるためのスコア式です。**これまでの平均報酬が高い枝**（活用）と**まだ訪れていない枝**（探索）を**一つの式の中で**まとめ、数値比較で次のノードを選びます。論文の **UCT-DP** はこの UCT を少し変え、**学習コストの大きい深い段階**が**浅い探索**に押し負けにくくします。","mctsPhaseRowTitle":"4ステップ（1サイクル）","mctsPhase1":"① 選ぶ","mctsPhase2":"② 増やす","mctsPhase3":"③ 試す","mctsPhase4":"④ 戻す","mctsSvgRoot":"ルート","mctsSvgLeft":"枝A","mctsSvgRight":"枝B","mctsSvgLeaf":"ロールアウト","mctsSvgScore":"検証スコア s","mctsCaption":"紫の点線は「今回選んだ経路」の例です。繰り返すほど各枝にスコアが蓄積します。","coreFlow":{"0":"### [要約 & 序論] 3行要約 + 問題提起\n\n**3行要約**\n\n- **既存LLMエージェントの限界:** コードの**多様性が低く**、何度試しても**良い解に収束しにくい**。\n- **従来AutoMLの限界:** Auto-sklearn型の**固定パイプライン・探索テンプレート**に近く、データや問題が変わると**動的にパイプラインを組み替え**にくい。\n- **SELAの要点:** パイプラインを**ツリー**で表し、**MCTS**で実験順を決め、**検証スコア**で次の分岐を選ぶ。**UCT-DP**は学習コストの大きい**深いノード**を、浅い探索より**優先**するようUCTを変形したもの。\n\n**比喩:** モータースポーツで**工場の整備マニュアル順だけ**踏むのは従来AutoMLに近い。**足まわり・エンジンマップ・タイヤ圧を一括で変えて一周だけ走る**のは単発のLLMコード生成に近い。SELAは**セクタータイムとテレメトリを見て**（検証スコア）**次に何をいじるか分岐を比較する**レースエンジニアに近い。","1":"# Chapter 2: 背景知識 — 本文の数式を読むための5つの概念\n\n### [背景知識]\n\n- **AutoML:** 前処理・モデル・ハイパーパラメータなどを人の介入を減らして自動化する流れ全体。多くの場合 **試す→測る→直す** の繰り返しです。\n\n- **LLM エージェント:** 自然言語のタスク説明とデータ要約から **コードを生成・実行** する構成です。SELA では **計画（プラン）** と **コード／実行** が段階に分かれます。\n\n- **探索空間（Search space）:** あるデータセット・タスクで試せる **前処理×モデル×ハイパーパラメータ** の組み合わせの集合です。組み合わせ爆発のため **全数探索** は現実的ではありません。\n\n- **MCTS:** 木上でロールアウトと統計を組み合わせ **有望な枝** を選ぶアルゴリズムです。**探索（exploration）** と **活用（exploitation）** のバランスが鍵です。\n\n- **探索 vs 活用:** まだ十分に訪れていない子ノードを多く見るか、平均報酬の高い経路を深めるかを **一つの式で** 同時に調整します。**UCT-DP** は **深い学習段階を優先する** という追加の工夫を入れます。","2":"$30","3":"# Chapter 4: おもちゃデータのウォークスルー\n\n### [おもちゃのシミュレーション]\n\n数値は **説明用** — **流れ** だけ掴めれば十分です。\n\n**フレーム 1 — Proposer** \n**平易な説明:** 「二値分類＋欠損あり」でも LLM は前処理アイデアの **短いリスト** を出します。 \n$p$=二値分類、$d$=表形式・欠損あり → $\\Lambda$ に補完／スケーリング案。\n\n**フレーム 2 — MCTS が $c$ を選択** \n**平易な説明:** 探索が **一つの組み合わせ**（例: 標準化＋ロジスティック回帰）を選び、その **枝** を辿ります。\n\n**フレーム 3 — $E_{\\mathrm{plan}}$** \n**平易な説明:** 組み合わせを **具体的なパイプライン順** に落とします。 \n`SimpleImputer` → `StandardScaler` → `LogisticRegression` のように指示 $I^{\\tau}$ を埋めます。\n\n**フレーム 4 — 実行** \n**平易な説明:** コードを走らせ **一つ** の検証スコアを読む—ここでは F1 $=0.72$ と仮定。 \n検証 F1 $s_{\\mathrm{raw}}=0.72$ → 高いほど良い指標なら $\\mathrm{NS}=0.72$。\n\n**フレーム 5 — UCT-DP 更新** \n**平易な説明:** スコアを戻し、このノードが次に **兄弟と競争** できるようにする；**未訪問** 処理のおかげで深いノードも不利になりにくい。 \n$v(x)$ に報酬を足し訪問を増やし、兄弟間で $\\mathrm{UCTDP}$ を比較。\n\n**フレーム 6 — Rescaled NS** \n**平易な説明:** SELA を 1、他手法は SELA で割る。**1 未満** ならここでは SELA 優位の読み。 \nSELA の NS が $0.72$、ベースラインが $0.65$ なら比 $\\approx 0.90$（<1 は SELA 有利）。","4":"# Chapter 5: 実験\n\n### [結果]\n\n**20 個の ML データセット**（arXiv 要約）では、SELA は各ベースライン対しておおよそ **勝率 65〜80%** を報告—**一貫した優位性**。**MCTS はランダム探索を上回り**、**ロールアウトを増やすほど** スコアは **改善** しやすい—API／時間の予算配分に有用です。","5":"# Chapter 6: 結論と図の読み方\n\n### [結論]\n\n**実務で使える要点（3 つ以内）**\n\n1. **手作業で全部選ばずに** 強い AutoML 基線を得やすい。\n2. **ロールアウトをキャッシュ** して API／GPU コストを下げる。\n3. **木のログ** で **どの枝に入ったか** を説明しやすい。\n\n**限界:** ロボティクス／ソフトウェア工学への一般化、巨大探索空間でのサンプル効率、**解釈性** の UI 設計は今後の課題。\n\n### [図の要約]\n\n- **従来:** 線形／一発生成—フィードバックが弱く目標品質に届かないことがある。\n- **SELA:** 木の上で **MCTS + UCT-DP**、**検証スコア** で更新—下の **左右パネル** は対比のスケッチに過ぎません。"},"visualPlanTitle":"対比の要点","visualPlan":"**左:** 固定順・単発生成ではフィードバックが弱いことがある。**右:** 検証スコアで枝を選ぶツリー探索。下は**要点図**のみ。","visualLegacyTitle":"従来：固定パイプライン・単発生成","visualLegacyBody":"一発で全体を決めるとフィードバックが弱く、点が収束しにくい。","visualProposedTitle":"SELA：ツリー探索＋UCT-DP","visualProposedBody":"段階ごとに分岐し、検証スコアで平均報酬を更新。","visualAxisStart":"開始","visualAxisEnd":"目標品質","visualLegacyCurveLabel":"散らばった試行","visualProposedCurveLabel":"ツリー上の収束","visualContributionLabel":"実験難易度","visualLegacyBadgeLabel":"制御しにくい","visualProposedBadgeLabel":"制御された実験","visualLegacyTemplateLabel":"固定AutoMLテンプレ（順序固定）","visualLegacyStageFe":"FE・前処理","visualLegacyStageModel":"モデル","visualLegacyStageTrain":"学習・検証","visualLegacyDeadEndHint":"不一致→行き止まり","visualLegacyOneshotLabel":"単発LLM：パイプライン全体σを一括生成","visualLegacyOpenLoopLabel":"検証スコアsがΛの再設計に戻りにくい","visualProposedInsightLabel":"Insight候補Λ（LLM）","visualProposedPrunedLabel":"UCT低・枝切り","visualProposedFeedbackLabel":"検証s→v(x),n更新","visualProposedCacheLabel":"σ・中間結果キャッシュ","visualProposedUctDpLabel":"UCT-DP：深い学習優先","visualProposedRolloutLabel":"MCTSロールアウト","visualProposedBestScoreLabel":"目標に近いスコア","visualSvgLabelPrep":"データ準備","visualSvgLabelModel":"モデル選択","visualSvgLabelTrain":"学習·検証","visualSvgLabelStuck":"ここで止まる","visualSvgLabelOneShot":"一括でコード","visualSvgLabelLowVal":"検証が低い","visualSvgLabelStart":"開始","visualSvgLabelSkip":"弱い枝","visualSvgLabelAvg":"これまでの平均","visualSvgLabelDone":"目標に近い","visualSvgFeedbackLine":"検証スコアが上へ伝わる","summary":"SELAは**LLMのアイデアをツリー上でMCTS配置**し、**UCT-DP**で浅い探索の浪費を減らします。**NS**は公平な比較、キャッシュとログは**コストと説明**に効きます。"},"mlChapters":{"mlSectionLabels":{"whatIs":"どのような概念か","whyImportant":"なぜ重要か","howUsed":"どのように使われるか","problemSolving":"まとめ"},"mlKnnProblemSolvingLabel":"問題を解くための説明","mlKnnVisualIntro":"新データ(?)に最も近いK=3個の近傍を選び、そのラベルの多数決で予測します。","mlKnnVisualCaption":"点線の円: 距離の順。K=3近傍(紫)のラベル: 1, 2, 2 → 多数決で 2","mlKnnVisualStep0":"① 学習データ — 特徴空間の点（ラベル1または2）","mlKnnVisualStep1":"② 新データ(?)が登場 — この点のラベルを予測します","mlKnnVisualStep2":"③ 最も近いK=3個まで距離（点線の円）で確認","mlKnnVisualStep3":"④ K=3近傍へ線で接続 — 近い順に表示","mlKnnVisualStep4":"⑤ 多数決: ラベル 1, 2, 2 → 予測 2","mlLinearRegressionVisualIntro":"データ点に最もよく合う直線 $\\hat y = w x + b$ を求めます。","mlLinearRegressionVisualStep0":"① 学習データ — (x, y) 散布図","mlLinearRegressionVisualStep1":"② 間違った初期直線 — 勾配降下前","mlLinearRegressionVisualStep2":"③ 直線が学習し最適位置へ移動","mlLinearRegressionVisualStep3":"④ 学習完了 — 新入力 $x$ で $\\hat y$ を予測","mlLinearRegressionVisualCaption":"$$y \\approx 0.7x + 1.1$ — 勾配降下で $w$, $b$ を学習","mlLinearRegressionVisualLearningBadge":"学習中...","mlLinearRegressionVisualPlay":"直線の学習過程を見る","mlLinearRegressionVisualReplay":"もう一度見る","mlLinearRegressionProblemSolvingLabel":"問題を解くための説明","mlMseVisualIntro":"**回帰損失の例：** 予測 $\\hat y$ と実測 $y$ の差を2乗して平均したものがMSEです。（分類ではクロスエントロピーを使います。）","mlMseVisualStep0":"① データ点と予測直線 $\\hat y = w x + b$","mlMseVisualStep1":"② 各点から直線までの残差（誤差）","mlMseVisualStep2":"③ 誤差の2乗 $(y_i - \\hat y_i)^2$","mlMseVisualStep3":"④ MSE $= \\frac{1}{n}\\sum_i (y_i - \\hat y_i)^2$","mlMseVisualCaption":"MSE $= \\frac{1}{n}\\sum_i (y_i - \\hat y_i)^2$ — 損失が小さいほど直線がデータに良くフィット。","mlMseVisualSquaresLabel":"二乗誤差 = 面積（1辺 = |残差|）","mlMseProblemSolvingLabel":"問題を解くための説明","mlLogisticProblemSolvingLabel":"問題を解くための説明","mlLogisticVisualIntro":"線形スコア $z$ が大きいほど $\\sigma(z)$ が 1 に近づき class 1 に分類されます。$z=0$ が決定境界です。","mlLogisticVisualCaption":"シグモイド: $\\sigma(z) = \\frac{1}{1+e^{-z}}$。$z>0$ なら $\\hat y=1$、$z \\le 0$ なら $\\hat y=0$。","mlLogisticVisualFormulaExplain":"**数式の読み方** — $z$ が大きな負のとき $e^{-z}$ が大きくなり $\\sigma(z) \\approx 0$。$z=0$ なら $\\sigma(0)=0.5$。$z$ が大きな正のとき $e^{-z} \\approx 0$ で $\\sigma(z) \\approx 1$。つまりどんな $z$ も 0～1 の確率に押し込む式です。","mlLogisticVisualXAxisLabel":"z (線形スコア)","mlLinearRegressionProblemSolvingTable":"**手順**\n\n- **直線（モデル）** — $\\hat y = w x + b$。傾き $w$ と切片 $b$ で定まる予測式です。\n- **予測** — 与えられた $w,b,x$ を使って $\\hat y = wx+b$ を計算します。\n- **傾き** — 2点 $(x_1,y_1),(x_2,y_2)$ から $w = \\frac{y_2-y_1}{x_2-x_1}$ を求めます。\n- **切片** — 点 $(x,y)$ と傾き $w$ が分かれば $b = y-wx$ です。\n- **2点からの予測** — 先に傾きと切片を求め、最後に与えられた $x$ を代入して $\\hat y$ を出します。\n- **残差** — 実測と予測の差で、**残差 $= y-\\hat y$**。\n- **残差の和** — 全データで $\\sum_i (y_i-\\hat y_i)$ を計算します。\n\n---\n\n**例1（予測）**\n\n$\\hat y=2x+1$、$x=3$ のとき $\\hat y=7$。→ **正解 7**\n\n---\n\n**例2（傾き）**\n\n(1,3) と (4,9) から $w=2$。→ **正解 2**\n\n---\n\n**例3（切片）**\n\n傾き2・点(3,7)より $b=1$。→ **正解 1**\n\n---\n\n**例4（2点から予測）**\n\n(0,1),(2,5) を通る直線で $x=1$ のとき $\\hat y=3$。→ **正解 3**\n\n---\n\n**例5（残差）**\n\n$\\hat y=2x+1$、点(3,8) の残差は $8-7=1$。→ **正解 1**\n\n---\n\n**例6（残差の和）**\n\n点(0,2),(1,4) と $\\hat y=2x+1$ の残差和は 2。→ **正解 2**","mlKnnProblemSolvingTable":"**アルゴリズムの段階**\n\n- **入力** — 新データの特徴ベクトル $\\mathbf{x}$\n- **保存データ** — (特徴、ラベル) の組 $(\\mathbf{x}_i, y_i)$\n- **1** — $\\mathbf{x}$ と各 $\\mathbf{x}_i$ との距離 $d(\\mathbf{x}, \\mathbf{x}_i)$ を計算\n- **2** — 距離が小さい順にK個を選択\n- **3（分類）** — K個のラベルの**多数決**で予測 $\\hat y$ を決定\n- **3（回帰）** — K個の $y_i$ の**平均**を予測 $\\hat y$ として使用","mlDecisionTreeProblemSolvingLabel":"問題を解くための説明","mlDecisionTreeVisualIntro":"ルートから質問に「はい/いいえ」で枝をたどると、リーフで予測が得られます。","mlDecisionTreeVisualStep0":"① ルートノード — 最初の質問（例：特徴 $x_1 \\le 3$？）","mlDecisionTreeVisualStep1":"② いいえ(0)/はい(1)で左・右の子へ移動","mlDecisionTreeVisualStep2":"③ 内部ノードで質問を繰り返す","mlDecisionTreeVisualStep3":"④ リーフノード — これ以上分割せず予測（クラスまたは値）を出力","mlDecisionTreeVisualPathCaption0":"① ルートノード — 最初の質問を投げます。はい/いいえで枝をたどります。","mlDecisionTreeVisualPathCaption1":"④ 経路: はい(1) → リーフ0","mlDecisionTreeVisualPathCaption2":"⑤ 経路: いいえ(0) → リーフ1","mlDecisionTreeVisualStep0Description":"① ルートノード — 最初の質問ではい/いいえに分かれ、左右の枝を下ります。","mlDecisionTreeVisualLabelRoot":"ルート","mlDecisionTreeVisualLabelYes":"はい(1)","mlDecisionTreeVisualLabelNo":"いいえ(0)","mlDecisionTreeVisualLabelQuestion":"質問","mlDecisionTreeVisualLabelLeaf0":"リーフ0","mlDecisionTreeVisualLabelLeaf1":"リーフ1","mlDecisionTreeVisualDiagramAriaLabel":"決定木の構造: ルート—質問—リーフ","mlEnsembleVisualIntro":"複数モデル（木）の予測を投票または平均で合わせ、最終予測を得ます。","mlEnsembleVisualStep0":"① 訓練データからブートストラップサンプルを抽出し複数の木を学習","mlEnsembleVisualStep1":"② 各木が独立に予測","mlEnsembleVisualStep2":"③ 分類：多数決、回帰：平均 → 最終予測","mlEnsembleVisualStep3":"④ 最終予測が決まります","mlEnsembleVisualLabelData":"データ","mlEnsembleVisualLabelVote":"投票/平均","mlEnsembleVisualLabelPrediction":"予測","mlEnsembleVisualLabelTree1":"木1","mlEnsembleVisualLabelTree2":"木2","mlEnsembleVisualLabelTree3":"木3","mlEnsembleVisualAriaLabel":"アンサンブル流れ：データ→木→投票/平均→予測","mlKmeansProblemSolvingLabel":"問題を解くための説明","mlKmeansVisualIntro":"最も近い中心に割り当て、中心を属する点の平均に更新することを繰り返します。","mlKmeansVisualStep0":"① データ — ラベルのない点が特徴空間に散らばっている","mlKmeansVisualStep1":"② K個の中心を初期化 — クラスタ数Kだけ中心を置く","mlKmeansVisualStep2":"③ 割り当て — 各点を最も近い中心に割り当て（色で区別）","mlKmeansVisualStep3":"④ 中心の更新 — 各クラスタの点の座標平均を新中心にする","mlKmeansVisualStep4":"⑤ 繰り返し — 割り当てと更新が変わらなくなるまで反復","mlKmeansVisualCaption":"K-means：割り当て→更新を繰り返しSSE（歪み）を最小化。","mlKmeansVisualAriaLabel":"K-meansの流れ：データ→初期中心→割り当て→更新→収束","mlKmeansVisualMeanLabel":"平均","mlKmeansVisualPointDataLabel":"点: データ","mlKmeansVisualLineCaption":"線: 各点から割り当て中心(μ)まで","mlKmeansVisualCenterMoveCaption":"中心がクラスタ平均へ移動","mlCrossValidationProblemSolvingLabel":"問題を解くための説明","mlCrossValidationVisualIntro":"データを訓練・検証・テストに分け、K-Foldでは交代で検証し平均で性能を推定します。","mlCrossValidationVisualTitle":"① 5-Fold","mlCrossValidationVisualFoldLabel":"Fold{n}","mlCrossValidationVisualTrainLabel":"訓練","mlCrossValidationVisualValLabel":"検証","mlCrossValidationVisualScoreLabel":"検証スコア","mlCrossValidationVisualMeanLabel":"平均 μ","mlCrossValidationVisualStep0":"① 全データ — 学習・検証に使うサンプル","mlCrossValidationVisualStep1":"② Train/Val/Test 分割 — 訓練で学習、検証でチューニング、テストで最終評価","mlCrossValidationVisualStep2":"③ K-Fold — K個に分け、1区間ずつ検証・残りで学習","mlCrossValidationVisualStep3":"④ Foldごとの検証スコア — 各Foldで $S_1, \\ldots, S_K$ を得る","mlCrossValidationVisualStep4":"⑤ 平均 $\\bar{S} = \\frac{1}{K}\\sum_{k=1}^K S_k$ — 最終推定","mlCrossValidationVisualCaption":"交差検証：模試（検証）で実力推定、本番（テスト）で最終確認。","mlCrossValidationVisualAriaLabel":"交差検証の流れ：データ→分割→K-Fold→Fold別スコア→平均","mlCrossValidationProblemPrompt":"以下の指示を読んで答えを（?）に入力してください。","mlCrossValidationProblemPromptDefinition":"次の説明が**正しい**ときは**正**、**誤り**のときは**偽**を選んでください。\n\n{statement}","mlCrossValidationProblemPromptDefinitionChoice":"次の質問に最も合う選択肢を選んでください。\n\n{question}","mlCrossValidationProblemPromptHoldoutTrain":"データ{n}個を訓練比率{trainRatio}で分けるとき訓練個数は？（整数）","mlCrossValidationProblemPromptHoldoutTest":"データ{n}個を訓練比率{trainRatio}で分けるときテスト個数は？（整数）","mlCrossValidationProblemPromptKfoldSize":"データ{n}個を{K}-Foldで分けるとき1 Fold（検証集）の大きさは？（商の整数）","mlCrossValidationProblemPromptKfoldScoreMean":"K-Fold検証スコア(%)が{scores}のとき、平均(整数)を求めよ。","mlCrossValidationProblemPromptScenario":"次のシナリオに最も適した方法を選んでください。\n\n{scenario}","mlCrossValidationProblemPromptStratified":"次の質問に最も合う選択肢を選んでください。\n\n{question}","mlCrossValidationStatement_0":"交差検証は訓練データだけで採点せず、検証・テストに分けて性能を推定する。","mlCrossValidationStatement_1":"検証集合は模試のようにハイパーパラメータ選択やモデル比較に使う。","mlCrossValidationStatement_2":"K-FoldではデータをK個に分け、交代で検証し検証スコアの平均を最終推定にする。","mlCrossValidationStatement_3":"テスト集合は最終性能報告用に1回だけ使う。","mlCrossValidationStatement_4":"Hold-outはデータを1回だけ訓練/検証（または訓練/テスト）に分ける方法である。","mlCrossValidationStatement_5":"過学習は訓練スコアは高いが検証・テストスコアが低いときに疑う。","mlCrossValidationStatement_6":"訓練集合はモデルが重み・パラメータを学習するときに使うデータである。","mlCrossValidationStatement_7":"K-Foldの1 Foldの大きさは通常 n/K の商（整数）とする。","mlCrossValidationStatement_10":"検証集合で学習したあとそのまま最終性能を報告してよい。","mlCrossValidationStatement_11":"Hold-outは常にK-Foldより推定が安定している。","mlCrossValidationStatement_12":"テスト集合は複数回使ってモデルを選んでよい。","mlCrossValidationStatement_13":"訓練データだけで性能を測れば汎化性能が正確に分かる。","mlCrossValidationStatement_14":"K-FoldでKが大きいと検証回数は減る。","mlCrossValidationQuestionChoice_0":"交差検証の主な目的は？①汎化性能の推定 ②訓練の高速化 ③データ拡張","mlCrossValidationQuestionChoice_1":"データが少ないとき有利なのは？①Hold-out ②K-Fold ③Stratifiedのみ","mlCrossValidationQuestionChoice_2":"模試にたとえられるのは？①訓練 ②検証 ③テスト","mlCrossValidationQuestionChoice_3":"各Foldでクラス比率を保つのは？①Hold-out ②通常K-Fold ③Stratified K-Fold","mlCrossValidationQuestionChoice_4":"本番にたとえられるのは？①訓練 ②検証 ③テスト","mlCrossValidationQuestionChoice_5":"ハイパーパラメータを選ぶときに使う集合は？①訓練 ②検証 ③テスト","mlCrossValidationQuestionChoice_6":"複数回異なる分割で検証するのは？①Hold-out ②K-Fold ③テストのみ","mlCrossValidationQuestionChoice_7":"過学習を疑う状況は？①訓練・検証とも高 ②訓練高・検証低 ③訓練低・検証高","mlCrossValidationScenario_0":"1万件のデータがあり1回だけ分割して評価したい。","mlCrossValidationScenario_1":"500件しかなく複数回分割して検証推定を安定させたい。","mlCrossValidationScenario_2":"訓練80%・テスト20%で1回だけ分け、テストは最後に1回だけ使う。","mlCrossValidationScenario_3":"分類でクラス比率が90:10と不均衡なのでFoldごとに比率を保ちたい。","mlCrossValidationScenario_4":"5回交代で検証し平均精度を報告したい。","mlCrossValidationScenario_5":"1回だけ70:30に分けて使う。","mlCrossValidationScenario_6":"検証推定の分散を減らすためK回検証を繰り返す。","mlCrossValidationScenario_7":"二値分類で各Foldで陽性率を保ちたい。","mlCrossValidationStratified_0":"Stratified K-Foldの利点は？①クラス比率の維持 ②高速 ③省メモリ","mlCrossValidationStratified_1":"分類でクラスが不均衡なとき推奨されるのは？①Hold-outのみ ②Stratified K-Fold ③検証省略","mlCrossValidationStratified_2":"Stratifiedは主に何に使う？①回帰のみ ②分類（クラス比率維持） ③クラスタリング","mlEvaluationProblemPrompt":"以下の指示を読んで答えを求め、空欄(?)に入力してください。","mlEvaluationProblemSolvingLabel":"問題を解くための説明","mlEvaluationVisualIntro":"実際(行)と予測(列)で2×2の混同行列を埋めたあと、精度・適合率・再現率・F1を計算します。","mlEvaluationVisualStep0":"① 実際 vs 予測 — 行: 実際の陽性/陰性、列: 予測の陽性/陰性","mlEvaluationVisualStep1":"② 混同行列 — TP, TN, FP, FN の4マスを埋める","mlEvaluationVisualStep2":"③ 精度 — (TP+TN)/全体、正解の割合","mlEvaluationVisualStep3":"④ 適合率・再現率 — 適合率: TP/(TP+FP)、再現率: TP/(TP+FN)","mlEvaluationVisualStep4":"⑤ F1 — 適合率と再現率の調和平均","mlEvaluationVisualCaption":"混同行列で分類モデルの成績表を読み、目的に合った指標を選びます。","mlEvaluationVisualAriaLabel":"分類評価：混同行列 → 精度・適合率・再現率・F1","mlEvaluationVisualMatrixTitle":"混同行列 (2×2)","mlEvaluationVisualStepLineTP":"実際陽性・予測陽性 → TP","mlEvaluationVisualStepLineFN":"実際陽性・予測陰性 → FN","mlEvaluationVisualStepLineFP":"実際陰性・予測陽性 → FP","mlEvaluationVisualStepLineTN":"実際陰性・予測陰性 → TN","mlEvaluationVisualPredPos":"予測陽性","mlEvaluationVisualPredNeg":"予測陰性","mlEvaluationVisualActualPos":"実際陽性","mlEvaluationVisualActualNeg":"実際陰性","mlEvaluationVisualBadgeTP":"真の陽性 ✓","mlEvaluationVisualBadgeFN":"見逃し（実際陽性→予測陰性）","mlEvaluationVisualBadgeFP":"偽陽性（実際陰性→予測陽性）","mlEvaluationVisualBadgeTN":"真の陰性 ✓","mlEvaluationVisualBadgeFixed":"TP・FN・FP・TNの4マスを区別したあと、精度・適合率・再現率・F1を計算します。","mlEvaluationProblemPromptDefinition":"次の説明が**正しい**ときは**正**、**誤り**のときは**偽**を選んでください。\n\n{statement}","mlEvaluationProblemPromptDefinitionChoice":"次の質問に最も合う選択肢を選んでください。\n\n{question}","mlEvaluationProblemPromptScenario":"次のシナリオに最も適した選択肢を選んでください。\n\n{scenario}","mlEvaluationProblemPromptConfusionCount":"混同行列で TP={tp}, TN={tn}, FP={fp}, FN={fn} のとき、{cell} の値（整数）は？","mlEvaluationProblemPromptTotalCount":"混同行列で TP={tp}, TN={tn}, FP={fp}, FN={fn} のとき、全体個数 n（整数）は？","mlEvaluationProblemPromptAccuracy":"混同行列で TP={tp}, TN={tn}, FP={fp}, FN={fn} のとき、精度（%）（整数）は？","mlEvaluationProblemPromptPrecision":"混同行列で TP={tp}, TN={tn}, FP={fp}, FN={fn} のとき、適合率（%）（整数）は？","mlEvaluationProblemPromptRecall":"混同行列で TP={tp}, TN={tn}, FP={fp}, FN={fn} のとき、再現率（%）（整数）は？","mlEvaluationProblemPromptF1":"混同行列で TP={tp}, TN={tn}, FP={fp}, FN={fn} のとき、F1スコア（%）（整数）は？","mlEvaluationStatement_0":"混同行列は実際のクラス（行）と予測クラス（列）を2×2で表した表である。","mlEvaluationStatement_1":"精度は(TP+TN)を全体個数で割った値である。","mlEvaluationStatement_2":"適合率の分母はTP+FPである。","mlEvaluationStatement_3":"再現率の分母はTP+FNである。","mlEvaluationStatement_4":"F1は適合率と再現率の調和平均である。","mlEvaluationStatement_5":"TPは実際が陽性で予測も陽性の場合の数である。","mlEvaluationStatement_6":"FNは実際は陽性だが予測が陰性の場合（見逃し）である。","mlEvaluationStatement_7":"不均衡データでは精度だけ見ると誤解することがある。","mlEvaluationStatement_10":"適合率と再現率は常に等しい。","mlEvaluationStatement_11":"精度が高ければ常にモデルは実務に適している。","mlEvaluationStatement_12":"FPは実際が陽性で予測が陰性の場合である。","mlEvaluationStatement_13":"再現率の分母はTP+FPである。","mlEvaluationStatement_14":"TNは実際が陽性で予測も陽性の場合の数である。","mlEvaluationQuestionChoice_0":"精度の分子は？ ① TP+TN ② TP+FP ③ TP+FN","mlEvaluationQuestionChoice_1":"適合率の分母は？ ① TP+FN ② TP+FP ③ TN+FN","mlEvaluationQuestionChoice_2":"再現率が重要な状況は？ ① スパムを見逃すことを許容 ② 疾患を見逃してはいけないとき ③ 偽陽性を最小化したいとき","mlEvaluationQuestionChoice_3":"F1は何の調和平均か？ ① 精度と適合率 ② 適合率と再現率 ③ 再現率と精度","mlEvaluationQuestionChoice_4":"TPが意味するのは？ ① 実際陽性、予測陽性 ② 実際陰性、予測陽性 ③ 実際陽性、予測陰性","mlEvaluationQuestionChoice_5":"偽陽性（FP）は？ ① FP ② FN ③ TN","mlEvaluationQuestionChoice_6":"見逃し（FN）は？ ① FP ② FN ③ 適合率","mlEvaluationQuestionChoice_7":"全体個数nは？ ① TP+TN ② TP+TN+FP+FN ③ TP+FP+FN","mlEvaluationScenario_0":"スパムメールを見逃してはいけない場合（正常メールをスパム扱いするのはある程度許容）。重要な指標は？ ① 再現率 ② 適合率 ③ 精度","mlEvaluationScenario_1":"医療診断で「疾患があるのにないと言ってはいけない」とき。重要な指標は？ ① 精度 ② 再現率 ③ 適合率","mlEvaluationScenario_2":"広告クリック予測で「クリックと言ったもののうち本当のクリックの割合」を高めたいとき。重要な指標は？ ① 再現率 ② 適合率 ③ F1","mlEvaluationScenario_3":"不正取引検知で不正を見逃してはいけないとき。重要な指標は？ ① 適合率 ② 再現率 ③ 精度","mlEvaluationScenario_4":"適合率と再現率をバランスよく見たいとき使う指標は？ ① 精度 ② F1 ③ TP","mlEvaluationScenario_5":"クラスが99:1で不均衡なとき精度だけ見ると？ ① 信頼できる ② 誤解しうる ③ F1と等しい","mlEvaluationScenario_6":"検索結果上位10件のうち関連文書の割合を測る指標に近いのは？ ① 再現率 ② 適合率 ③ FN","mlEvaluationScenario_7":"実際の陽性のうちモデルが正解した割合を測るのは？ ① 適合率 ② 再現率 ③ 精度","mlRegularizationProblemPrompt":"問題を読み、下の選択肢から正解を選んでください。","mlRegularizationProblemSolvingLabel":"問題を解くための説明","mlRegularizationVisualIntro":"データの誤差だけでなく「モデルが複雑になりすぎること」にペナルティを加え、暗記ではなく一般化するモデルにします。","mlRegularizationVisualVs":"対","mlRegularizationVisualLabelNoReg":"正則化なし","mlRegularizationVisualLabelWithReg":"正則化あり","mlRegularizationVisualLabelOverfit":"過学習","mlRegularizationVisualLabelGeneral":"一般化","mlRegularizationVisualStep0":"① 正則化なし — 訓練損失だけを減らすと**過学習**","mlRegularizationVisualStep1":"② 正則化 — 損失 = データ損失 + λ×ペナルティ。**λが大きいと重みが抑制される**","mlRegularizationVisualStep2":"③ L2 — **ペナルティ $\\sum w_j^2$ で重みを小さく保つ**","mlRegularizationVisualStep3":"④ L1 — **ペナルティ $\\sum |w_j|$ で一部の重みを0に（スパース）**","mlRegularizationVisualStep4":"⑤ 一般化 — 適切なλで**訓練・検証ともによく当たるモデルを得る**","mlRegularizationVisualCaption":"正則化：損失+λ·ペナルティで過学習を抑え一般化を高める。","mlRegularizationVisualAriaLabel":"正則化の流れ：過学習→損失+ペナルティ→L1/L2→一般化","mlRecommendationProblemPrompt":"問題を読み、下の選択肢から正解を選んでください。","mlRecommendationProblemSolvingLabel":"問題を解くための説明","mlRecommendationSubjectivePrompt":"一言で理由を書いてみてください(採点なし)。","mlRecommendationSubjectivePlaceholder":"例: 類似するユーザーの評価を(類似度を重みとして)平均して空欄を予測するからです。","mlRecommendationVisualIntro":"ユーザー×アイテムの評価行列から類似ユーザー（近傍）を求め、その評価で空欄を予測します。","mlRecommendationVisualStep0":"① 評価行列 — 行:ユーザー、列:アイテム。既知の評価と空欄(?)","mlRecommendationVisualStep1":"② 類似度 — ユーザー間（またはアイテム間）の類似度を計算","mlRecommendationVisualStep2":"③ 近傍選択 — 最も類似したK人を選択","mlRecommendationVisualStep3":"④ 予測 — 近傍の評価の加重平均で空欄を予測","mlRecommendationVisualStep4":"⑤ 推薦 — 予測スコアの高いアイテムを推薦","mlRecommendationVisualHowItWorks":"① 近傍を探す → ② その評価を参照 → ③ 空欄を予測 → ④ 推薦","mlRecommendationVisualRowTitle":"この作品への近傍の評価 → 私の予測評価を埋める","mlRecommendationVisualCardNeighbor1":"近傍1（類似ユーザー）","mlRecommendationVisualCardNeighbor2":"近傍2（類似ユーザー）","mlRecommendationVisualCardItem":"この作品（まだ未視聴）","mlRecommendationVisualCardNeighbor1Short":"近傍1","mlRecommendationVisualCardNeighbor2Short":"近傍2","mlRecommendationVisualCardItemShort":"この作品","mlRecommendationVisualCalc":"平均予測: $\\hat{r}_{u,i}=\\frac{5+4}{2}=4.5\\approx4$ (近傍が★5と★4を評価) → 予測★4","mlRecommendationVisualBottomDesc":"類似の視聴がこの作品に ★5, ★4 → 平均で ★4 推薦！","mlRecommendationVisualCaption":"協調フィルタリング：類似ユーザーから$\\hat{r}_{u,i}$を予測。","mlRecommendationVisualAriaLabel":"推薦の流れ：評価行列→類似度→近傍→加重平均","ml00":{"chapter":"Chapter 00","title":"機械学習の出発点: データと特徴量(Feature)","description":"機械学習はデータから始まります。画像、テキスト、数値を**特徴量(Feature)**という数値の形に変え、モデルがパターンを学習できるようにします。基礎数学Ch00で学んだ「数と関数」の世界がここで現実になります。","sectionTitle":"データと特徴量(Feature)とは何か","whatIs":{"0":"**データは機械学習の材料です** — 基礎数学Ch00で学んだように、ディープラーニングと機械学習は画像、テキスト、音声をすべて**数値**に変換して受け入れます。この**数値化された入力**と**正解(Label)**のペアが**データ**です。例えば「猫の写真＋猫」が1つのデータとなり、こうしたペアが数千・数万個集まるとモデルが学習できる材料になります。","1":"**特徴量(Feature)はデータの本質を数値で抽出したものです** — 私たちが見る写真はコンピュータにとって数万個のピクセル数値の塊に過ぎません。その中から「耳の形」「目の大きさ」「毛色」など**判断に役立つ情報**だけを選び数値で表したのが**特徴量**です。数学的には**ベクトル**で表現され、**関数**を通じて元データから抽出されます。Ch00で言った「入出力の規則を定める関数」がこの変換を担います。","2":"**まとめると** — データは(入力、正解)の集合であり、特徴量はその入力をモデルが理解できる**数値ベクトル**に変換した結果です。良い特徴量を作ればモデルはよりよく学習し、悪い特徴量ではデータが多くても性能は上がりません。機械学習の出発は「どのデータを、どの特徴量に変えるか」を決めることです。"},"whyImportant":{"0":"**データがなければ学習は不可能です** — モデルのすべての決定は結局**数値と関数**の計算結果です。Ch00で学んだように、AIの計算過程を追うにはデータが**数値**で整理されている必要があります。データが不足していたり、誤った正解が混ざっていたりすると、モデルは間違ったパターンを学習します。","1":"**特徴量設計がモデルの限界を決めます** — 人が「どの情報を数値で抽出するか」を決めることを**特徴量エンジニアリング**といいます。株価予測で「昨日の終値」だけ使うのと「移動平均、出来高、変動性」まで使うのでは結果が大きく異なります。**ベクトルと行列**で多くの特徴量をまとめて一度に計算するのがCh00ロードマップの核心であり、この過程で特徴量の質がモデル性能を左右します。","2":"**次のチャプターへの橋渡し** — Ch02 KNN、Ch03 線形回帰、Ch05 ロジスティック回帰など、すべての機械学習アルゴリズムは**特徴量ベクトル**を入力として受け取ります。データと特徴量を理解して初めて「なぜこのモデルがこの予測をしたのか」を解釈でき、**微分**と**確率**を扱う以降のチャプターもこの基礎の上に立っています。"},"howUsed":{"0":"**入力 → 特徴量抽出 → モデル → 予測** — 機械学習パイプラインはCh00で言った**入力 → 数値変換 → 関数の反復 → 出力**の構造と同じです。特徴量抽出は「数値変換」の段階であり、モデル(線形回帰、KNNなど)は**関数**の集合です。**微分**は学習時に誤差を減らすのに、**確率**は「この画像が猫である確率90%」のように予測の不確実性を表すのに使われます。"},"problemSolving":{"0":"このチャプターでは**データ**と**特徴量(Feature)**が機械学習でどのような役割を果たすか、実際にどう使われるかをまとめました。データは(入力、正解)ペアの集合であり、特徴量はその入力をモデルが扱える**数値ベクトル**に変換した結果です。良い特徴量を選ぶ**特徴量エンジニアリング**が性能を大きく左右するため、次のチャプター(KNN、線形回帰など)に進む前に、この概念をしっかり押さえておくとよいです。","1":"| 区分 | データ・特徴量での役割 | 基礎数学との接続 |\n| --- | --- | --- |\n| **データ** | (入力、正解)ペアの集合。数値で表現 | 関数の定義域・値域 (Ch01) |\n| **特徴量** | 入力をベクトルに変換した結果。モデルの入力 | ベクトル、行列 (Ch00ロードマップ) |\n| **学習** | データでモデルパラメータを調整 | 微分、勾配 (Ch06~08) |\n| **予測** | 特徴量ベクトル → モデル → 予測値または確率 | 確率、分布 (Ch10~12) |"}},"ml01":{"chapter":"Chapter 01","title":"欠損値処理: データの空白を埋める戦略","description":"欠損値処理を実務パイプラインとして学びます。単一代入・多重代入、外れ値検知(Box Plot, Mahalanobis Distance, Isolation Forest, SVDD)、クラス不均衡対策(Tomek Links, SMOTE, ADASYN, 複合リサンプリング)まで一体で扱います。"},"ml02":{"chapter":"Chapter 02","title":"教師あり・教師なし・自己教師あり学習","description":"機械学習は、データの学び方によって**教師あり学習**、**教師なし学習**、**自己教師あり学習**に大別されます。**教師あり**は正解付きの問題集で学ぶようなもの、**教師なし**は正解なしでデータの特徴を観察し似たタイプをまとめる過程、**自己教師あり**はデータの一部を隠してその穴を推論で埋めながら学ぶ方式です。本章では三つの学び方の核心と数理、実務での使い方を整理します。","sectionTitle":"三つの学び方: 教師あり・教師なし・自己教師あり","whatIs":{"0":"**教師あり学習: 正解を基にした学習** — **入力 $\\mathbf{x}$** とそれに対応する **正解(ラベル) $y$** をペアでモデルに与えます。モデルは $y = f(\\mathbf{x})$ を近似するように学習し、新しい入力に対しても $y$ を予測できるようになります。数式では訓練データを $\\mathcal{D} = \\{(\\mathbf{x}_1, y_1), (\\mathbf{x}_2, y_2), \\ldots\\}$ とし、損失(MSEや交差エントロピー)を最小化する $f$ を求める**最適化**問題として定式化されます。Ch02 KNN、Ch03 線形回帰、Ch04 ロジスティック回帰はすべて教師ありです。\n* **例1 (分類)**: メール本文($\\mathbf{x}$)からスパムかどうか($y$)を判定するフィルタ。\n* **例2 (回帰)**: 面積・駅距離($\\mathbf{x}$)から物件価格($y$)を予測。\n* **例3 (医療)**: 患者の検査値($\\mathbf{x}$)と診断結果($y$)から診断支援。","1":"**教師なし学習: 隠れたパターンの発見** — 正解 $y$ はなく、**入力 $\\mathbf{x}$ だけ**が与えられます。直感的には「正解付きの答えがなく、問題だけがある状況」です。モデルは $\\mathbf{x}$ 同士の**距離・類似度**に基づき、近いものをまとめる(クラスタリング)、高次元を圧縮する(次元削減)、通常パターンから外れた**異常**を検知します。\n* **例1 (クラスタリング)**: 顧客の年齢・購買履歴($\\mathbf{x}$)から似た顧客群に分ける。\n* **例2 (異常検知)**: 通常の決済パターン($\\mathbf{x}$)を学習し、それと大きく異なる取引を検知。\n* **例3 (次元削減)**: 多数の特徴を2〜3個の数に減らして可視化やノイズ除去に利用。（具体的な方法は後で学びます。）","2":"**自己教師あり学習: データから擬似ラベルを生成** — 人が正解を付ける代わりに、データの構造を使って**擬似ラベル**を作り学習します。流れは三つ。(1)**マスク**: 入力の一部(単語・画像パッチなど)を隠す。(2)**予測**: 残りの文脈から隠した部分を当てるように学習。(3)**活用**: 得た表現をそのまま使い、少ない教師ありデータでQA・分類などダウンストリームに接続。BERT・GPT など大規模モデルの基盤です。\n* **例1 (言語)**: 「私は [MASK] を食べた」の穴を文脈から予測して言語規則を学ぶ LLM。\n* **例2 (ビジョン)**: 画像の一部を隠し、残りのピクセルからその領域を復元。\n* **例3 (対比学習)**: 同じ画像の回転・クロップ版を「同じ」、別画像を「異なる」として表現を近づける。"},"whyImportant":{"0":"**データの性質とコストに応じた選択** — 全データに正解を付けるには時間とコストがかかります。正解が十分なら教師ありが有効ですが、そうでない場合は教師なしや自己教師ありでラベルなしデータを活用する戦略が必要です。**解釈性**も異なります。教師ありは損失・経路で「なぜこの答えか」をある程度説明できますが、教師なし・自己教師ありは「どんな構造を捉えたか」を可視化やクラスタ名で別途解釈する必要があります。","1":"**事前学習とファインチューニング** — 大規模なラベルなしデータで**自己教師あり**の事前学習を行い、その後少数の正解データで**教師あり**のファインチューニングを行う構成が、現代のAI開発の標準です。**教師なし**は前処理・探索段階でよく使われます。例: K-Means で顧客をクラスタに分け、人がクラスタに意味を付与(「ロイヤル」「離脱リスク」など)したうえで、教師ありで離脱予測モデルを構築する。三つの学習方式を区別しておくと設計が明確になり、データ量とラベルコストに合った現実的なパイプラインを立てられます。"},"howUsed":{"0":"**教師あり** — Ch02 KNN、Ch03 線形回帰、Ch04 ロジスティック回帰は (入力, 正解) ペアで学習します。**分類**: スパムフィルタ、疾患予測、画像分類。**回帰**: 家賃・売上・気温の予測。Ch03/Ch04 で数式と最適化を扱います。","1":"**教師なし** — Ch08 K-Means はラベルなしでデータをクラスタにまとめます。**次元削減**（多くの特徴を2〜3個に減らすこと）も代表例です。**クラスタリング**: 顧客セグメント、トピック別文書グループ。**異常検知**: 正常領域を学習し、外れた点をフラグ。","2":"**自己教師あり** — BERT(マスク語予測)、GPT(次トークン予測)、ビジョンでの**対比学習**が広く使われています。事前学習後、少ないラベルでQA・要約・分類などに利用します。"},"problemSolving":{"0":"教師あり・教師なし・自己教師ありの見分けは、「ラベルが**人が付けたもの**か／**ない**か／**データから作った**か」だけ意識すると速いです。**教師あり**は $(\\mathbf{x},y)$ で $y=f(\\mathbf{x})$ を学び、**教師なし**はラベルなしで $\\mathbf{x}$ からクラスタ・構造を探し、**自己教師あり**はマスク語・次トークンなどデータ由来のターゲットで表現を学び、少量の教師ありで使う流れが典型です。","1":"**例（概念理解問題）**\n\nスパム判定のように **人が付けたラベル** で分類を学ぶのに近いのは？ ①教師あり ②教師なし ③自己教師あり\n\n人が正解を付けたデータで学ぶのが教師あり学習です。 → **正解 ①**\n\n---\n\n**例（○×問題）**\n\n「ラベルなしで顧客をまとめる学習は教師なし学習である。」正しければ1、誤りなら0。\n\nラベルなしでクラスタ・構造を探すのが教師なしの特徴です。 → **正解 1**\n\n---\n\n**例（応用問題）**\n\n隠した語を当てて表現を学ぶ方式に近いのは？ ①教師ありのみ ②クラスタのみ ③マスク言語モデル・対比学習\n\n入力から自らターゲットを作る流れが自己教師ありに近いです。 → **正解 ③**"},"mlSupervisedUnsupervisedSelfVisualIntro":"三つの学び方: 教師あり(入力–正解ペア)、教師なし(ラベルなし)、自己教師あり(自己生成ターゲット)。","mlSupervisedUnsupervisedSelfVisualStep0":"教師あり: (入力, 正解) ペアで予測関数を学習","mlSupervisedUnsupervisedSelfVisualStep1":"教師なし: ラベルなしで構造・クラスタを発見","mlSupervisedUnsupervisedSelfVisualStep2":"自己教師あり: データから作ったターゲットで表現を学習","mlSupervisedUnsupervisedSelfProblemSolvingLabel":"問題解法の説明","mlSupervisedUnsupervisedSelfVisualPhase0Title":"教師あり: 入力 x と正解 y がペアで与えられます","mlSupervisedUnsupervisedSelfVisualPhase0Caption":"ペア (x, y) が順に与えられるとモデルが規則を学びます","mlSupervisedUnsupervisedSelfVisualPhase1Title":"教師なし: 入力 x のみ（正解 y なし）","mlSupervisedUnsupervisedSelfVisualPhase1Caption":"y(正解)はなく x だけ。一部の x が点滅しても → モデルは構造・クラスタだけを求めます","mlSupervisedUnsupervisedSelfVisualPhase1NoLabelBadge":"ラベルなし","mlSupervisedUnsupervisedSelfVisualPhase2Title":"自己教師あり: 一部を隠してその穴を予測します","mlSupervisedUnsupervisedSelfVisualPhase2Caption1":"一部をマスクします","mlSupervisedUnsupervisedSelfVisualPhase2Caption2":"モデルが穴を予測します","mlSupervisedUnsupervisedSelfVisualPhase2Caption3":"予測した語で穴が埋まります","mlSupervisedUnsupervisedSelfVisualPhase2Prefix":"私は ","mlSupervisedUnsupervisedSelfVisualPhase2Suffix":" を食べた","mlSupervisedUnsupervisedSelfVisualPhase2Filled":"ごはん","mlSupervisedUnsupervisedSelfVisualPhase2Example":"例: 文の空欄を埋める → 表現学習 (BERTなど)","mlSupervisedUnsupervisedSelfVisualPhase2Step1":"マスク","mlSupervisedUnsupervisedSelfVisualPhase2Step2":"予測","mlSupervisedUnsupervisedSelfVisualPhase2Step3":"穴埋め","mlSupervisedUnsupervisedSelfVisualAutoCycle":"三つの方式が同時にアニメーションします","problemAnswerHint":"下の選択肢から合う学習方式を選んでください。","mcAnswerSupervised":"教師あり学習","mcAnswerUnsupervised":"教師なし学習","mcAnswerSelfSupervised":"自己教師あり学習","mcAnswerDistractor":"強化学習","problems":{"definition_1_0":"入力と正解(ラベル)がペアになったデータで学習する方式は？ ①教師あり ②教師なし ③自己教師あり","definition_1_1":"(入力 $\\mathbf{x}$、正解 $y$) のペアで $y=f(\\mathbf{x})$ を学ぶ学習は？ ①教師あり ②教師なし ③自己教師あり","definition_1_2":"先生が赤ペンで採点してくれるのに例えられる学習方式は？ ①教師あり ②教師なし ③自己教師あり","definition_1_3":"分類や回帰で人が付けたラベルを使う学習は？ ①教師あり ②教師なし ③自己教師あり","definition_1_4":"(入力, 正解) ペアで分類・回帰を学ぶ代表的な学習方式は？ ①教師あり ②教師なし ③自己教師あり","definition_1_5":"データに正解(ターゲット)が付いていて、その正解を当てるように学習する方式は？ ①教師あり ②教師なし ③自己教師あり","definition_2_0":"ラベルなしで入力だけから構造・パターン・クラスタを見つける学習は？ ①教師あり ②教師なし ③自己教師あり","definition_2_1":"正解 $y$ がなく $\\mathbf{x}$ だけのとき、データのグループを見つける方式は？ ①教師あり ②教師なし ③自己教師あり","definition_2_2":"ラベルなしで似たデータ同士をまとめるクラスタリングに当たる学習方式は？ ①教師あり ②教師なし ③自己教師あり","definition_2_3":"自分でタイプだけを見つけてまとめるのに例えられる学習は？ ①教師あり ②教師なし ③自己教師あり","definition_2_4":"次元削減・異常検知によく使うラベルなしの学習は？ ①教師あり ②教師なし ③自己教師あり","definition_2_5":"人が付けた正解なしでデータの構造だけを発見する方式は？ ①教師あり ②教師なし ③自己教師あり","definition_3_0":"データ自体から作った「擬似正解」で学習する方式は？ ①教師あり ②教師なし ③自己教師あり","definition_3_1":"マスクした語を当てる・次文予測のように自分でターゲットを作る学習は？ ①教師あり ②教師なし ③自己教師あり","definition_3_2":"文の一部を隠してその部分を当てながら学ぶ学習は？ ①教師あり ②教師なし ③自己教師あり","definition_3_3":"大量のラベルなしデータで表現(representation)を学ぶのに使う方式は？ ①教師あり ②教師なし ③自己教師あり","definition_3_4":"問題集を自分で作って解くのに例えられる学習は？ ①教師あり ②教師なし ③自己教師あり","definition_3_5":"自分で「同じ・違う」ペアを作って表現を学ぶ学習方式は？ ①教師あり ②教師なし ③自己教師あり","taskClassify_0":"スパム判定(スパム/正常のラベルあり)はどの学習に当たる？ ①教師あり ②教師なし ③自己教師あり","taskClassify_1":"顧客の購買データだけでラベルなしで似た顧客をまとめる作業は？ ①教師あり ②教師なし ③自己教師あり","taskClassify_2":"文で隠した単語を当てて単語表現を学ぶのは？ ①教師あり ②教師なし ③自己教師あり","taskClassify_3":"賃貸価格予測(広さ・駅距離→価格)は？ ①教師あり ②教師なし ③自己教師あり","taskClassify_4":"画像だけありラベルなしで似た画像同士をまとめるクラスタリングは？ ①教師あり ②教師なし ③自己教師あり","taskClassify_5":"大量テキストで事前学習し、少ないラベルで微調整する前段階の学習は？ ①教師あり ②教師なし ③自己教師あり","taskClassify_6":"医療画像と「疾患の有無」ラベルで疾患予測モデルを作るのは？ ①教師あり ②教師なし ③自己教師あり","taskClassify_7":"ラベルなしで「似た顧客同士をまとめる」だけの顧客セグメントは？ ①教師あり ②教師なし ③自己教師あり","taskClassify_8":"次文予測で文脈表現を学ぶのは？ ①教師あり ②教師なし ③自己教師あり","taskClassify_9":"試験得点予測(勉強時間→得点)は？ ①教師あり ②教師なし ③自己教師あり","taskClassify_10":"異常検知(正常のみで異常ラベルがほとんどないとき)に近いのは？ ①教師あり ②教師なし ③自己教師あり","taskClassify_11":"画像の一部を残りから予測して表現を学ぶのは？ ①教師あり ②教師なし ③自己教師あり","scenario_0":"病院で過去の患者データ(症状・検査値)と診断結果(ラベル)で「この患者はA病か？」を学習させる。これは？ ①教師あり ②教師なし ③自己教師あり","scenario_1":"ショッピングサイトで購買履歴だけでラベルなしに顧客をいくつかのグループに分ける。これは？ ①教師あり ②教師なし ③自己教師あり","scenario_2":"Wikipediaの文の15%の単語を隠し、その単語を当てる課題でモデルを学習する。これは？ ①教師あり ②教師なし ③自己教師あり","scenario_3":"天気・日付とアイス販売量(ラベル)で翌日の販売量を予測するモデルを作る。これは？ ①教師あり ②教師なし ③自己教師あり","scenario_4":"動画データにラベルなしで似たシーン同士をまとめてインデックスする。これは？ ①教師あり ②教師なし ③自己教師あり","scenario_5":"大量文書で「次文」を当てる課題で文脈表現を学び、少ないQAラベルで微調整する。前段階は？ ①教師あり ②教師なし ③自己教師あり","scenario_6":"犬・猫の写真とそれぞれの種(ラベル)で分類器を学習する。これは？ ①教師あり ②教師なし ③自己教師あり","scenario_7":"株価時系列だけでラベルなしにパターン区間を分ける。これは？ ①教師あり ②教師なし ③自己教師あり","scenario_8":"同じ文を別の言い方に変え「意味が同じ」をターゲットに表現を学習する。これは？ ①教師あり ②教師なし ③自己教師あり","scenario_9":"入社書類(経歴・学歴)と合格可否(ラベル)で合格予測モデルを作る。これは？ ①教師あり ②教師なし ③自己教師あり","scenario_10":"ニュース記事だけでトピックラベルなしに記事をトピック別にまとめる。これは？ ①教師あり ②教師なし ③自己教師あり","scenario_11":"音声の一部を隠して復元する課題で音声表現を学ぶ。これは？ ①教師あり ②教師なし ③自己教師あり","trueFalse_0":"「入力と正解がペアになったデータで学習する」は教師あり学習の説明である。これに当たる学習方式は？ ①教師あり ②教師なし ③自己教師あり","trueFalse_1":"「ラベルなしでデータの構造だけを見つける」は教師なし学習の説明である。これに当たる学習方式は？ ①教師あり ②教師なし ③自己教師あり","trueFalse_2":"「データから作ったターゲット(隠した語など)で学習する」は自己教師あり学習の説明である。これに当たる学習方式は？ ①教師あり ②教師なし ③自己教師あり","trueFalse_3":"(入力, 正解) ペアで何らかの値を予測する関数を当てはめる。これはどの学習？ ①教師あり ②教師なし ③自己教師あり","trueFalse_4":"ラベルなしでデータだけを見てK個のグループに分ける。これはどの学習？ ①教師あり ②教師なし ③自己教師あり","trueFalse_5":"文で隠した単語を当てながら学ぶ学習は？ ①教師あり ②教師なし ③自己教師あり","trueFalse_6":"人が付けた合格/不合格ラベルで学習する。これはどの学習？ ①教師あり ②教師なし ③自己教師あり","trueFalse_7":"「正解なしでデータだけを見て似たもの同士をまとめる」は教師なし学習の説明である。これに当たる学習方式は？ ①教師あり ②教師なし ③自己教師あり","trueFalse_8":"自分で作った「同じ/違う」ペアで表現を学ぶ。これはどの学習？ ①教師あり ②教師なし ③自己教師あり","trueFalse_9":"訓練時に(入力, 正解)ペアを使い、新入力に対して正解を予測する。これはどの学習？ ①教師あり ②教師なし ③自己教師あり","trueFalse_10":"異常検知で正常データだけで「正常領域」を学習するのは教師なしに近い。これに当たる学習方式は？ ①教師あり ②教師なし ③自己教師あり","trueFalse_11":"「次に来る文を当てて文脈を学ぶ」は自己教師ありに当たる。これに当たる学習方式は？ ①教師あり ②教師なし ③自己教師あり"}},"ml03":{"chapter":"Chapter 03","title":"K近傍法 (KNN): 類は友を呼ぶ","description":"**類は友を呼ぶ** — KNNは「最も近いK個の仲間」を探し、その人たちが何であるかで新しいデータの答えを決めます。特別な学習式はなく、**距離**を測るだけでよい、直感的な最初の分類アルゴリズムです。","sectionTitle":"K近傍法 (KNN): 類は友を呼ぶ","whatIs":{"0":"**KNNとは** — 新しく入ってきたデータ（点）について、**すでに正解ラベルが付いたデータ**のうち**最も近いK個**を選び、そのK個の**多数決**で新データのラベルを決める方法です。例：周り5件のうち4件が「スパム」なら、新しいメールもスパムと分類します。","1":"**距離で「近い」を決めます** — 「近い」とは**特徴空間**で2点間の**距離**が短いことです。よく使うのは**ユークリッド距離**: $d(\\mathbf{x}, \\mathbf y) = \\sqrt{\\sum_{i}(x_i - y_i)^2}$。特徴が2つなら平面上の2点間の直線距離と同じです。","2":"**Kは自分で決める値（ハイパーパラメータ）** — K=1なら最も近い1件と同じ判定、Kを大きくすると多くの近傍の投票で安定しますが境界が鈍くなることがあります。同点を避けるため**奇数**にすることが多いです。"},"whyImportant":{"0":"**学習段階がありません（Lazy Learning）** — KNNはデータを一括で要約した式を作るのではなく、予測のたびに保存したデータとの距離を計算します。そのため**モデルを訓練する時間**はほとんどかかりませんが、予測時の**計算量**は多くなることがあります。","1":"**解釈がしやすい** — 「このメールがスパムなのは、似た5件のうち4件がスパムだったから」のように、**なぜその予測になったか**を近傍を見せて説明できるため、説明可能AIでもよく使われます。","2":"**他のアルゴリズムの基準線（Baseline）**として使います — 深層学習や複雑なモデルの前に、まずKNNで精度を測れば「データがどれだけ分類可能か」を把握できます。"},"howUsed":{"0":"**分類（Classification）** — 近傍K個の**クラス（ラベル）**の多数決で新サンプルのクラスを決めます。画像分類、スパム検出、疾患リスク区分などに使われます。","1":"**回帰（Regression）** — 連続値を予測するときは、近いK個の近傍の**平均**を予測値にします。例：周辺5戸のマンション価格の平均で自宅の相場を推定。","2":"**距離の尺度** — 特徴のスケールが違うと距離が一方の特徴に引っ張られます。**正規化**や**標準化**で各特徴を似た範囲に揃えてから距離を測るのがよいです。"},"problemSolving":{"0":"**KNN** — 新しい点 $\\mathbf{x}$ と保存データとの**距離**を求め、最も近い**K個**のラベルで**分類は多数決・回帰は平均**とします。訓練で重みを保存しない**Lazy Learning**であり、特徴のスケールが違うときは**正規化・標準化**してから距離を測ります。","1":"**例（アルゴリズムの段階）**\n\n- **入力** — 新データの特徴ベクトル $\\mathbf{x}$\n- **保存データ** — (特徴、ラベル) の組 $(\\mathbf{x}_i, y_i)$\n- **1段階** — すべての $\\mathbf{x}_i$ について $d(\\mathbf{x}, \\mathbf{x}_i)$ を計算\n- **2段階** — 距離が小さい順にK個を選ぶ\n- **3段階（分類）** — K個のラベルの**多数決**で $\\hat y$\n- **3段階（回帰）** — K個の $y_i$ の**平均**で $\\hat y$\n\n---\n\n**例（距離）**\n\nA(0,0), B(3,4) のユークリッド距離（整数）は？\n\n$d=5$。→ **正解 5**\n\n---\n\n**例（多数決）**\n\nK=5 で近い5件のラベルが 1,1,2,2,2 のとき予測クラスは？\n\n2が3票で最多。→ **正解 2**\n\n---\n\n**例（回帰の平均）**\n\nK=3 で3近傍の目的値が 10,12,14 のとき $\\hat y$ は？\n\n$12$。→ **正解 12**\n\n---\n\n**例（スケール）**\n\n所得（大きい数）と年齢（小さい数）をそのまま使うと距離が一方に偏る。先にやる前処理に近いのは？ ①スケールを揃える ②Kを必ず1にする\n\n①。→ **正解 ①**"},"problemSolvingTable":"**アルゴリズムの段階**\n\n- **入力** — 新データの特徴ベクトル $\\mathbf{x}$\n- **保存データ** — (特徴、ラベル) の組 $(\\mathbf{x}_i, y_i)$\n- **1段階** — すべての $\\mathbf{x}_i$ について $d(\\mathbf{x}, \\mathbf{x}_i)$ を計算\n- **2段階** — 距離が小さい順にK個を選ぶ\n- **3段階（分類）** — K個のラベルの**多数決**で $\\hat y$\n- **3段階（回帰）** — K個の $y_i$ の**平均**で $\\hat y$"},"ml04":{"chapter":"Chapter 04","title":"線形回帰：データの流れを貫く直線","description":"データ点が散らばっているとき、その**流れを貫く直線**を見つけ、新しい入力に対する値を予測するのが線形回帰です。基礎数学の**関数**・**微分**・**偏微分**が、機械学習の「学習」にどうつながるかを直接確認できる最初の回帰モデルです。","sectionTitle":"線形回帰：データの流れを貫く直線","whatIs":{"0":"**線形回帰とは？** — 入力 $x$ と出力 $y$ の間に**直線関係** $y = w_1 x + w_0$（多変数のときは $y = \\mathbf{w}^\\top \\mathbf{x} + b$）を仮定し、データに最もよく合う**重み $w$ と切片 $b$**を求めるものです。基礎数学 Ch01 の**関数** $y = f(x)$ が、ここでは具体的に**一次関数**として定まります。","1":"**「最もよく合う」の意味** — 予測値 $\\hat y_i = w x_i + b$ と実測値 $y_i$ の**誤差**を最小化する $w$, $b$ を探します。この誤差を測る関数が**損失関数**で、Ch04 で学ぶ**MSE（平均二乗誤差）**が代表的です。","2":"**KNNとの違い** — KNN は「近傍の平均」で予測しましたが、線形回帰は**一つの式（直線）**を学習して保存します。予測時は近傍を探す必要がなく、$\\hat y = w x + b$ を計算するだけです。"},"whyImportant":{"0":"**微分と最適化の最初の適用** — 誤差を最小化するには**微分**（基礎数学 Ch06）を使います。損失関数を $w$, $b$ で微分した**勾配**に沿って下れば最小値に到達します。これが**勾配降下法**であり、ディープラーニングの学習原理と同じです。","1":"**解釈可能性** — 学習された $w$ は「入力 $x$ が 1 増えると $y$ がどれだけ変わるか」を示します。例：住宅面積($x$)と価格($y$)で $w > 0$ なら「広いほど高い」という直感と一致します。この**解釈可能性**は実務でモデルを信頼・改善する際に重要です。","2":"**他モデルの基礎** — ロジスティック回帰(Ch05)、ニューラルネットの一ニューロンは、すべて「線形変換＋非線形関数」の構造です。線形回帰を理解すれば、それらの**線形部分**の動きがすぐに分かります。"},"howUsed":{"0":"**回帰** — 住宅価格、売上、気温、スコアなど**連続的な数値**を予測するときに使います。特徴が複数なら $y = w_1 x_1 + w_2 x_2 + \\cdots + w_n x_n + b$ の**多重線形回帰**になります。","1":"**特徴の重要度** — $|w_i|$ が大きい特徴ほど予測への影響が大きいです。特徴工学(Ch01)でどの特徴を入れるか決める際、この値を参考にします。","2":"**正規方程式 vs 勾配降下** — 特徴が少ないときは**正規方程式**で一発で最適解を求められます。特徴が多い、またはデータが大きいときは**勾配降下法**で $w$ を反復更新します。基礎数学 Ch08 の**偏微分と勾配**がここで核心ツールになります。"},"visual":"線形回帰で直線が学習される過程の可視化です。","problemSolving":{"0":"**要約：誤差を減らす『試行錯誤』の過程** — 線形回帰は、散らばったデータ点を最もよく貫く**たった1本の直線**（$y=wx+b$）を探す探偵のようなものです。**モデル（仮定）**：最初は無作為に直線を1本引きます。当然、実データとは合わず**誤差**が大きいです。**学習**：この誤差を減らすため勾配降下法を使います。山の頂上から目隠しで、最も低い谷（誤差最小の地点）を一歩ずつ下って探すようなものです。**予測**：谷底に着けば、最適な傾き（$w$）と位置（$b$）を見つけたことになります。新しい質問（$x$）が来ても、完成した式に代入するだけで即座に答え（$\\hat y$）を予測できます。","1":"**データから法則を抽出する3段階** — 線形回帰は、複雑なデータの中から $y=wx+b$ という**単純な法則**を見つけ出す過程です。\n\n**① モデル構築** — 「入力（$x$）と正解（$y$）は直線関係だろう」と仮定してモデルを立てます。\n\n**② 最適化（学習）** — 予測値（$\\hat y$）と実測値（$y$）の差である**損失**を計算し、これを最小化するため勾配降下で $w$（傾き）と $b$（切片）を少しずつ更新します。これはディープラーニングの学習原理と完全に同じです。\n\n**③ 推論（予測）** — 学習された直線はデータのパターンを圧縮しています。新しいデータが来たら、複雑な計算なしに直線の式に代入して即座に結果を予測します。"}},"ml05":{"chapter":"Chapter 05","title":"損失関数 (MSE・クロスエントロピー・R²): 正解と予測の誤差を測る","sectionTitle":"損失関数 (MSE・クロスエントロピー・R²): 正解と予測の誤差を測る","description":"**損失関数**は、モデルの誤りを**一つの数**にまとめます。**回帰**（連続値の予測）では予測 $\\hat y$ と実測 $y$ の差から **平均二乗誤差（MSE）** を使うのが代表的で、さらに **$R^2$（決定係数）**で「モデルがどれだけ変動を説明できたか」を見ます。**分類**では、正解クラスに対する**予測確率**のずれを **クロスエントロピー** で測ります。下の図は損失のうち**回帰の例としてMSE**がどう小さくなるかを示します。","whatIs":{"0":"**回帰: MSE**\n\nモデルの誤りを**一つの損失**にまとめる必要があります。\n\n- **残差** — 実測 $y$ と予測 $\\hat y$ の差。\n- **SSE** — 各点の $(y-\\hat y)^2$ をすべて足した**二乗誤差の和**。\n- **MSE** — SSEをデータ数 $n$ で割った**平均二乗誤差**。\n\n$\\text{MSE} = \\frac{1}{n}\\sum (y - \\hat y)^2 = \\text{SSE}/n$ — 小さいほどよく当てはまります。","1":"**なぜ2乗？**\n\n- 残差 $+2$ と $-2$ はどちらも「同じ大きさのずれ」。そのまま足すと打ち消されます。\n- **2乗**すれば常に正になり、大きさだけを比べられます。\n- 大きな誤差ほど強く**罰**され、大きなミスを避けやすくなります。","2":"**線形回帰**\n\n直線 $\\hat y = wx + b$ がデータによく合うとは、**SSE**を $n$ で割った **MSE** が最小になるように $w$, $b$ を選ぶことです。\n\n**勾配降下法**は、このMSEを減らす方向に $w$, $b$ を少しずつ更新します。","3":"**回帰: MSEは残差の二乗平均**\n\nMSEは、残差 $y_i-\\hat y_i$ を二乗して平均を取った誤差スコアです。予測が真の値に近づくほど残差が小さくなり、MSEも小さくなります。","4":"**MSEの式を読み解く**\n\n$\\text{MSE} = \\frac{1}{n}\\sum_i (y_i - \\hat y_i)^2$\n\n- **$i$** — サンプル番号。\n- **$y_i$** — その点の**実測値**。\n- **$\\hat y_i$** — **予測値**。\n- **$y_i - \\hat y_i$** — **残差**。\n- **$(y_i - \\hat y_i)^2$** — その点の**二乗誤差**。\n- **$\\sum_i$** — すべての点を足すと **SSE**。\n- **$\\frac{1}{n}$** — **平均**してMSE。\n\n予測が実測に近いほど残差とMSEは小さくなります。","5":"---\n\n**分類: クロスエントロピー**\n\nクロスエントロピーは、分類で「正解クラスである確率」のずれに基づいて損失を決める方法です。\n\n**二値分類**は、下の **二値クロスエントロピーを読み解く**で $\\ell$ を要素ごとに解釈します。\n\n**二値クロスエントロピーを読み解く**\n\n$\\ell = -\\big(y\\log\\hat p + (1-y)\\log(1-\\hat p)\\big)$\n\n- **$y \\in \\lbrace 0,1 \\rbrace$** — ラベル。\n- **$\\hat p$** — クラス1の確率（0～1）。\n- **$\\log$** — 通常は**自然対数**。\n\n**$y=1$ のとき** — $(1-y)\\log(1-\\hat p)=0$ となり $\\ell = -\\log\\hat p$ です。$\\hat p$ が高いほど損失は小さくなります。\n\n**$y=0$ のとき** — $y\\log\\hat p=0$ となり $\\ell = -\\log(1-\\hat p)$。$1-\\hat p$ はクラス0の確率です。\n\n$y\\log\\hat p$ と $(1-y)\\log(1-\\hat p)$ では **どちらか一方だけ**が有効になり、正解側の確率を高める方向に学習が進みます。\n\n**多クラス** — 正解クラス $k$ については、1サンプルあたりの損失を通常\n\n$\\ell = -\\log \\hat p_k$\n\n（**ソフトマックス**の確率と組で使うことが多い）とします。正解クラスの予測確率 $\\hat p_k$ が低いほど損失が大きくなり、学習はその確率を押し上げます。","6":"$31"},"whyImportant":{"0":"**学習の方向** — 回帰で損失がMSEなら、**MSEが下がる方向**にだけ更新でき目標が明確です。","1":"**MSEは最適化しやすい** — 2乗は滑らかで微分しやすく、勾配降下に向きます。","2":"**RMSE** — MSEは二乗の単位；$\\sqrt{\\text{MSE}}$ で $y$ と同じ単位に戻して解釈できます。","3":"**タスクに合わせる** — 連続値は**MSE**、クラス確率は**クロスエントロピー**が自然で、**最尤**とも整合します。**Ch.05 ロジスティック回帰**でシグモイドの $\\hat p$ と損失のつながりを続けます。"},"howUsed":{"0":"**回帰の学習** — 価格・気温などで **MSE** を最小化。","1":"**モデル比較（回帰）** — **MSE** が小さい方が良いフィット。","2":"**DNNの回帰出力** — 数値予測の出力層でMSEをよく使います。","3":"**分類** — ロジスティック、ソフトマックス分類、ニューラル分類では **クロスエントロピー** を最小化するのが一般的です。"},"visual":"...","problemSolving":{"0":"**まとめ: MSE + クロスエントロピー**\n\n**① 共通** — 損失は誤りを**スカラー**にした値。回帰は多くの場合 **MSE**、分類・確率は **クロスエントロピー**。\n\n---\n\n**② 回帰: MSE** — 残差 $e_i = y_i - \\hat y_i$、**SSE** $= \\sum_i (y_i - \\hat y_i)^2$、**MSE** $= \\frac{1}{n}\\sum_i (y_i - \\hat y_i)^2 = \\text{SSE}/n$。単位を揃えるには **RMSE** $= \\sqrt{\\text{MSE}}$。\n\n---\n\n**③ 分類: CE（要点）** — 二値: $-\\big(y\\log\\hat p + (1-y)\\log(1-\\hat p)\\big)$；多クラス: 正解 $k$ で $-\\log \\hat p_k$。正解確率が高いほど損失は小さい。","1":"**例（SSE）**\n\n$n=2$、残差が 3 と −3 のとき、二乗誤差の和（SSE）は？\n\n$18$。→ **答 18**\n\n---\n\n**例（クロスエントロピーの考え方）**\n\n$y=1$、$\\hat p=0.9$ のとき損失はどちらに近い？ ①非常に大きい ②およそ $-\\log 0.9$（小さい） ③常に0\n\n②。→ **答 ②**\n\n---\n\n**例（$R^2$）**\n\nSSE < SST のとき、$R^2$ は？ ①常に負 ②0と1の間になりうる ③常に1\n\n②。→ **答 ②**"}},"ml06":{"chapter":"Chapter 06","title":"ロジスティック回帰 (Logistic Regression): 合格か不合格か？","description":"線形回帰が「予想スコア」を予測するのに対し、ロジスティック回帰は **はい / いいえ** を判別する分類モデルです。例えば「勉強時間に対する試験スコア」ではなく、「このスコアなら**合格(1)**か**不合格(0)**か？」を当てます。そのためにスコアを 0～1 の**確率**に変える**シグモイド関数**を使います。","sectionTitle":"ロジスティック回帰: 合格か不合格か？","whatIs":{"0":"**魔法のS字カーブ、シグモイド** — 線形回帰で計算したスコア $z$ はとても大きい数にも負の数にもなります。しかし確率は 0%～100%（0～1）の間でなければなりません。**シグモイド関数** $\\sigma(z) = \\frac{1}{1+e^{-z}}$ はどんな数が入っても **0 と 1 の間の値**に滑らかに圧縮します。","1":"**運命のカットライン（決定境界）** — シグモイドが「合格確率は 0.7（70%）です」と教えてくれても、モデルは最終判断を下す必要があります。通常 **0.5（50%）** を基準にし、確率が 0.5 以上なら **1（陽性）**、0.5 未満なら **0（陰性）** と分類します。","2":"**中身は線形回帰と同じ？** — ロジスティック回帰も内部では線形回帰と同様に $z = wx + b$ でスコアを計算します。このスコアをそのまま出さず、**シグモイド**という「確率変換器」に一度通す点だけが違います。","3":"**数式 $\\sigma(z) = \\frac{1}{1+e^{-z}}$ の読み方** — 分母 $1+e^{-z}$: $e$ は自然対数の底（約 2.718）で、$z$ が負だと $e^{-z}$ が大きくなり、$z$ が正だと $e^{-z}$ は 0 に近づきます。**$z$ が大きな負**のとき $\\sigma(z) \\approx 0$。**$z=0$** のとき $\\sigma(0)=0.5$。**$z$ が大きな正**のとき $\\sigma(z) \\approx 1$。よってこの式は任意の実数 $z$ を **0～1 の確率**に圧縮します。"},"whyImportant":{"0":"**世の中は「はい/いいえ」だらけ** — スパムか？（はい/いいえ）、病気か？（はい/いいえ）、顧客が買うか？（はい/いいえ）。現実の多くの問題は**二択**の二値分類です。ロジスティック回帰はその基礎となるモデルです。","1":"**確信を数字で示す** — 「合格です」だけでなく「合格確率 **98%** です」と言うと信頼が増します。ロジスティック回帰は単なる分類を超え、**どれだけ確信しているか（確率）**を示すので意思決定に役立ちます。","2":"**ディープラーニングへの架け橋** — ニューラルネットの1つのニューロンはロジスティック回帰とよく似た動きをします。この概念を押さえておくと、あとでディープラーニングを学ぶとき「ああ、あれか」と理解しやすくなります。"},"howUsed":{"0":"**スパムフィルター** — メールの題名や語を分析し「このメールがスパムである確率」を計算し、一定以上ならスパムフォルダへ。","1":"**医療診断AI** — 患者のレントゲンや血液検査値を入力し「特定疾患の確率」を予測して診断を支援。","2":"**マーケティング・レコメンド** — 「この顧客は今月解約するか？」「このユーザーは広告をクリックするか？」を予測し、クーポンや広告を出し分けます。"},"visual":"シグモイド出力と決定境界の可視化です。","problemSolving":{"0":"**ロジスティック回帰チャプター総括** — このチャプターでは**二値分類**（はい/いいえ、合格/不合格、陽性/陰性）のためのモデルを扱いました。線形回帰と同様にまず線形スコア $z = w_1 x_1 + w_2 x_2 + \\cdots + b$ を計算し、**シグモイド** $\\sigma(z) = \\frac{1}{1+e^{-z}}$ で 0～1 の**確率**に変換します。確率が 0.5 以上なら $\\hat y=1$、未満なら $\\hat y=0$ と予測します（$z=0$ が決定境界）。なぜ重要か：現実の多くの問題が二択なので分類の基礎となり、0/1 だけでなく**確率**で「どれだけ確信しているか」を解釈でき、ディープラーニングのニューロン・活性化関数の理解にもつながります。使われ方：スパムフィルター、医療診断支援、マーケ・レコメンド（離脱・クリック予測）で「～の確率」を計算し、基準（例 0.5）を超えれば一方のクラスと判定します。解法の流れは下の**問題を解くための説明**ブロックを参照してください。","1":"**例（○×）**\n\n「$z=0$ のとき $\\sigma(z)=0.5$」が正しければ1、誤りなら0。\n\n正しい。→ **答 1**\n\n---\n\n**例（判定）**\n\n$\\sigma(z)=0.7$、閾値0.5のときの予測クラスは？ ① 0 ② 1\n\n②。→ **答 ②**\n\n---\n\n**例（符号）**\n\n$z>0$ のとき通常の $\\hat y$ は？ ① 0 ② 1\n\n②。→ **答 ②**"}},"ml07":{"chapter":"Chapter 07","title":"決定木（Decision Tree）：二十の質問で答えを探す","description":"決定木は「二十の質問」ゲームと同じ仕組みで動くモデルです。データに質問（条件）を投げ、はい/いいえで枝をたどり、葉（リーフ）で予測を得ます。解釈がしやすく、ランダムフォレストなどのアンサンブルの基盤になります。","sectionTitle":"決定木：二十の質問で答えを探す","whatIs":{"0":"**基本構造** — 逆さの木を想像してください。一番上に**ルートノード**（最初の質問）があります。そこから条件（例：特徴 $x_1 \\le 3$？）に「はい」「いいえ」で**内部ノード**へ。これ以上分割できない**リーフノード**で**予測**（クラスまたは値）を出力します。","1":"**二十の質問と同じ** — 動物を当てるように「足は4本？」→「草食？」→「虎！」と、質問で答えの範囲を狭めます。決定木も同様にデータを二つに分けながら進みます。","2":"**良い質問：不純度の低減** — **不純度**はノード内のクラスの混ざり具合です。分割でノードをより「純」にすることが目標です。**ジニ** $G = 1 - \\sum p_i^2$ と**エントロピー** $H = -\\sum p_i \\log_2 p_i$。一クラス100%なら両方0、半々なら不純度は高くなります。","3":"**情報利得** — 分割前の不純度から分割後の（重み付き）不純度を引いた値が**情報利得**です。その質問でデータがどれだけ「きれい」になったかを表し、木は情報利得が最大の質問を選びます。","4":"**リーフでの予測** — **分類**ではそのリーフにいるサンプルの**多数クラス**、**回帰**では**平均値**を出力。新しいデータは経路をたどるだけで予測が得られます。","5":"**剪定（Pruning）** — 深すぎる木は**過学習**します。**剪定**で枝を切り、汎化性能を高めます。剪定された木がランダムフォレストなどの基盤になります。"},"whyImportant":{"0":"**説明可能なAI** — ブラックボックスではなく、どの質問の経路で結論に至ったかが分かります（例：年収・延滞で融資可否）。金融・医療で重視されます。","1":"**非線形な境界** — 線形モデルは一直線で切りますが、木は**階段状**に領域を分割し、複雑なパターンも表現できます。","2":"**アンサンブルの基盤** — 1本の木は不安定でも、数百本の**ランダムフォレスト**にすると強く安定します。Ch07の土台です。"},"howUsed":{"0":"**与信・融資** — 「年収≥5000万？」「1年以内延滞？」などの枝をたどり、可否を判定。","1":"**医療診断支援** — 血圧・コレステロール等から医学的な二十の質問でリスクを予測。","2":"**マーケ（離脱・購買）** — 「会員6ヶ月以上？」「直近ログイン≤3回？」でリスク顧客を特定。"},"problemSolving":{"0":"**決定木の解法** — (1)**経路**：ルートから 0=左（いいえ）、1=右（はい）。リーフの予測が答え。\n\n---\n\n(2)**ジニ**：$p_i$ を求め $G = 1 - \\sum_i p_i^2$、$100 \\times G$ の値（整数）。\n\n---\n\n(3)**エントロピー**：$H = -\\sum_i p_i \\log_2 p_i$、$100 \\times H$ の値（整数）。\n\n---\n\n(4)**リーフ多数決**：クラス0が $a$、1が $b$ なら $a \\ge b$ で0、そうでなければ1。下の**問題を解くための説明**を参照。","1":"**例（経路）**\n\nルートからビット列に沿ってリーフへ進み、そのリーフの**予測**を読む。\n\n---\n\n**例（ジニ）**\n\nあるクラスが100%（$p=1$）のとき、ジニ $G=1-\\sum p_i^2$ は？\n\n$0$。→ **答 0**\n\n---\n\n**例（リーフ多数決）**\n\nリーフにクラス0が2個、クラス1が5個あるとき予測クラスは？\n\n$1$。→ **答 1**"},"visual":"分岐しながら予測に至る決定木の可視化です。"},"ml08":{"chapter":"Chapter 08","title":"XGBoost, LightGBM, CatBoost","description":"ブースティング三本柱を比較し、実務での選択基準を学びます。","sectionTitle":"XGBoost, LightGBM, CatBoost","whatIs":{"0":"**XGBoost**は正則化と2次微分（ヘッセ行列）を活用して精度を高める定番ブースターです。","1":"**LightGBM**はleaf-wise成長とヒストグラム分割で、大規模データの学習速度に強みがあります。","2":"**CatBoost**は順序付きエンコーディングでカテゴリ変数を安定して扱え、前処理負担を下げます。"},"whyImportant":{"0":"3手法は同じ勾配ブースティング木でも、**速度・安定性・カテゴリ処理**の特性が異なります。","1":"実務では「最強1つ」を探すより、**データ量・特徴型・時間制約**に合う選択が重要です。"},"howUsed":{"0":"表形式の分類/回帰ではXGBoostを基準に置き、データが大きい場合はLightGBM、カテゴリ列が多い場合はCatBoostを優先検討します。","1":"検証スコア・学習時間・過学習の傾向を合わせて最終モデルを決めます。"},"problemSolving":{"0":"**モデル選択問題**はデータ特性に合う手法を選び、**O/X問題**は各手法の中核特性を判定し、**基礎計算問題**は与えられたラウンド数や木本数を読み取って解きます。","1":"**例題1（モデル選択）**\n\nカテゴリ変数が多く、one-hot前処理コストを抑えたい。まず検討するモデルは？ ① XGBoost ② LightGBM ③ CatBoost\n\nカテゴリ処理に強いCatBoostが有力です。→ **正答 ③**\n\n---\n\n**例題2（モデル選択）**\n\n非常に大規模な表形式データで学習速度が重要。先に試すモデルは？ ① XGBoost ② LightGBM ③ CatBoost\n\n速度面ではLightGBMを優先することが多いです。→ **正答 ②**\n\n---\n\n**例題3（定義O/X）**\n\n「XGBoostは正則化と2次情報を活用するブースティング系である。」正しければ1、誤りなら0。\n\n説明は正しいです。→ **正答 1**"},"visual":"XGBoost・LightGBM・CatBoostを、精度・速度・カテゴリ変数処理の観点で比較する可視化です。"},"ml09":{"chapter":"Chapter 09","title":"アンサンブルとランダムフォレスト：集団の知恵","description":"アンサンブルは複数のモデルの予測を合わせて、より良い一つの予測を得る方法です。バギング・ブースティング・スタッキング、そして多数の決定木で投票や平均をとるランダムフォレストまで、初心者にも集団の知恵の流れが分かるように説明します。","sectionTitle":"アンサンブルとランダムフォレスト：集団の知恵","whatIs":{"0":"**アンサンブルの基本** — 複数モデルをチームにして、それぞれの予測を合わせて最終結論を出します。陪審の評決のように、1つのモデルより誤答（分散）が減り予測が**安定**します。分類では**多数決**、回帰では**予測の平均**を使います。","1":"**なぜ多数が有利か（集団の知恵）** — 100人に牛の体重を目測させると、個人は外れても**平均**は本物に近くなります。モデルが**独立**に判定し結果を合わせると、個々の誤差は打ち消され**共通のシグナル**が残ります。","2":"**三つの代表手法：バギング・ブースティング・スタッキング** — (1)**バギング**：各モデルに無作為に異なるデータを渡し、公平に投票。(2)**ブースティング**：前のモデルが間違えた問題に次のモデルが集中し、**順次**弱点を補う。(3)**スタッキング**：基本モデルの報告をメタモデルがまとめて最終決定。","3":"**ランダムフォレスト** — バギング＋**決定木**を数百本。多様性のため、各分割で**特徴の無作為な一部**だけを使います。ある木は「年齢」、ある木は「収入」中心に判断します。","4":"**投票と平均の式** — 分類の多数決は「最も多くの木が選んだクラス」。回帰（例：家賃）では全木の予測の平均：**$\\hat y = \\frac{1}{B}\\sum_{b=1}^B \\hat y_b$**（$B$=木の数、$\\hat y_b$=b本目の予測）。例：3本が100,150,200なら最終は150。","5":"**OOB（Out-of-Bag）評価** — バギング/ランダムフォレストでは各木がデータの一部だけを使って学習します。**取り残されたサンプル（OOB）**で、そのサンプルを見ていない木の性能を評価でき、別途検証セットを用意しなくて済みます。"},"whyImportant":{"0":"**揺れない森** — 1本の木はデータが少し変わるだけで形が変わりますが、数百本の**森**なら数本が外れても全体の決定は安定します。","1":"**Ch06決定木の拡張** — 不純度・情報利得はそのまま。新しい規則ではなく「木をどう集めて投票するか」なので、前章の知識を100%使います。","2":"**現場・コンペの定番** — チューニングが少なくても性能が高く、**特徴重要度**でどの変数が効いているかも分かります。"},"howUsed":{"0":"**分類・回帰の汎用** — 「スパムか？」から「明日の株価は？」まで、ほぼあらゆるビジネス問題に使われます。","1":"**要因分析（特徴重要度）** — 融資モデルで木が共通して「年収」に依存していれば、年収が最重要変数だと分かります。","2":"**実用例** — 不正検知、推薦（Netflix等）、設備故障予測など、精度と安定性が重要な分野で中核です。"},"problemSolving":{"0":"**アンサンブル・ランダムフォレストの解法** — (1)**多数決**：クラス0の票数とクラス1の票数を比較し**多い方**が最終予測（0または1）。\n\n---\n\n(2)**票数**：勝ったクラスに集まった票数が答え。\n\n---\n\n(3)**回帰平均**：予測の合計÷木の数、（整数で出題）。\n\n---\n\n(4)**OOB**：そのサンプルが**何本の木のブートストラップに含まれなかったか**がOOB数。\n\n---\n\n(5)**式**：$\\hat y = \\frac{1}{B}\\sum_{b=1}^B \\hat y_b$ で $B$ は木の数。","1":"**例（多数決）**\n\nクラス0が3票、クラス1が5票のとき最終クラスは？ ① 0 ② 1\n\n②。→ **答 ②**\n\n---\n\n**例（回帰平均）**\n\n3本の木の予測が 6, 9, 12 のとき平均は？\n\n$9$。→ **答 9**\n\n---\n\n**例（OOB）**\n\n木が10本で、ある点が6本のブートストラップにしか含まれないとき、OOBの木の本数は？\n\n$4$。→ **答 4**\n\n---\n\n**例（式の平均）**\n\n$B=4$、予測の和が20のとき平均は？\n\n$5$。→ **答 5**"},"visual":"多数決/平均で最終予測を出すアンサンブル可視化です。"},"ml10":{"chapter":"Chapter 10","title":"K-meansクラスタリング：ラベルなしでグループ化","description":"正解ラベルなしでデータだけを見て似たもの同士をまとめる**教師なし学習**の代表アルゴリズムです。Ch01で学んだ「教師なし」が実際にどう動くか、**距離**でK個のグループ（クラスタ）を作るK-meansで、概念→直感→数式→実践の順に学びます。Ch02のKNNで使った距離の式を再利用し、繰り返しでまとまりがはっきりする様子を視覚化とともに習得します。","sectionTitle":"K-meansクラスタリング：ラベルなしでグループ化","whatIs":{"0":"**K-meansとは？** — ラベル$y$がなくデータ$\\mathbf{x}_1, \\mathbf{x}_2, \\ldots$だけのとき、**最も近いもの同士**でK個のグループに分けるアルゴリズムです。「近い」はCh02と同様**ユークリッド距離**$d(\\mathbf{x}, \\boldsymbol{\\mu}) = \\sqrt{\\sum_j (x_j - \\mu_j)^2}$で測ります。各グループは**代表点（セントロイド）**$\\boldsymbol{\\mu}_k$で要約され、「各点を最も近い中心に割り当て」→「各クラスタの点の平均で中心を更新」を収束まで繰り返します。","1":"**Kは「いくつのグループに分けるか」** — K-meansでは**クラスタ数K**を人が事前に決めます。K=2なら2つ、K=3なら3つに分かれます。正解ラベルがないため「どのクラスタが正解か」は分からず、「似たもの同士がまとまった結果」だけが得られます。","2":"**目的：クラスタ内距離の和（SSE）の最小化** — 最小化するのは**歪み（SSE）**$J = \\sum_{k=1}^K \\sum_{i \\in C_k} \\|\\mathbf{x}_i - \\boldsymbol{\\mu}_k\\|^2$です。中心の更新式$\\boldsymbol{\\mu}_k = \\frac{1}{|C_k|}\\sum_{i \\in C_k} \\mathbf{x}_i$は「そのクラスタに属する点の座標の平均」で、こう動かすとそのクラスタのSSEが減ります。","3":"**数式に抵抗がある場合** — 距離の式は「1点と1つの中心の間の長さ」を測るだけです。SSE $J$は「クラスタがどれだけまとまっているか」を1つの数にしたもので、中心の更新式は「そのクラスタの点の座標の平均」を求める式です。下の**数式の読み方**で記号ごとに説明しています。"},"whyImportant":{"0":"**Ch01教師なし学習の代表例** — K-meansは「ラベルなしで構造・クラスタを見つける」を実際に実装した代表アルゴリズムです。顧客セグメンテーション、文書・画像クラスタリング、異常検知の前処理などで最初に試す手法です。","1":"**顧客セグメンテーション** — 購買履歴だけがあり顧客タイプのラベルがないとき、K-meansで似た顧客をまとめ、人が各クラスタに意味（VIP・一般・離脱リスクなど）を付けて活用します。","2":"**直感的で実装が簡単** — 割り当て（最近傍の中心）と更新（平均）だけの反復なので実装しやすく、2次元で可視化すると「まとまる」過程が確認しやすいです。"},"howUsed":{"0":"**クラスタリング** — 顧客セグメンテーション、トピック・文書のまとめ、画像の色・領域圧縮、遺伝子発現のグループ化など。","1":"**前処理・特徴要約** — クラスタ番号を新特徴として教師ありモデルに入れたり、クラスタ代表だけ残してデータを圧縮したりする用途で使います。","2":"**Kの選択** — Kは利用者が決めます。複数のKでSSE・シルエットなどを見て、肘の位置や解釈しやすさで選びます。"},"problemSolving":{"0":"**K-Means** — ラベルなしデータに**K個の中心**を置き、**割り当て**（最近傍の中心）と**更新**（クラスタ内の平均で中心移動）を繰り返す。目的はSSE $J = \\sum_{k}\\sum_{i \\in C_k} \\|\\mathbf{x}_i - \\boldsymbol{\\mu}_k\\|^2$ を小さくすること。中心は $\\boldsymbol{\\mu}_k = \\frac{1}{|C_k|}\\sum_{i \\in C_k} \\mathbf{x}_i$。","1":"**例（用語の整理）**\n\n- **距離2乗** — $(x_2-x_1)^2+(y_2-y_1)^2$ など。比較なら平方根なしでも可\n- **割り当て** — 各中心までの距離（2乗）が**最小**のクラスタ番号\n- **中心更新** — 属する点の座標の**平均**が新中心\n- **SSE** — 点–中心の距離2乗の和；小さいほどまとまり\n\n---\n\n**例（割り当て）**\n\n中心 $\\mu_1=(0,0)$, $\\mu_2=(4,0)$、点 $(2,0)$ のクラスタ番号（同率なら1）？\n\n距離2乗はどちらも4 → **答 1**\n\n---\n\n**例（中心更新）**\n\nクラスタに $(1,2)$, $(3,4)$ のみあるとき新中心の $\\bar{x}$は？\n\n$(1+3)/2=2$。→ **答 2**\n\n---\n\n**例（距離2乗）**\n\n点 $(1,2)$ と中心 $(4,6)$ の距離2乗は？\n\n$3^2+4^2=25$。→ **答 25**\n\n---\n\n**例（SSEの考え方）**\n\n$J$ が小さいほどクラスタは？ ①ばらける ②まとまる\n\n②。→ **答 2**"},"visual":"K-Meansの割当と中心更新の反復可視化です。"},"ml11":{"chapter":"Chapter 11","title":"交差検証：模試と本番","description":"本番の前に**模試**で実力を確認し、**本番**では初見の問題で最終的な実力を測るように、機械学習では**訓練データ**だけで採点せず**検証**と**テスト**に分けてモデルの本当の実力を推定します。この過程を**交差検証**といい、Hold-out・K-Foldなどの方法で**過学習**を抑え汎化性能を信頼できるものにします。","sectionTitle":"交差検証：模試と本番","whatIs":{"0":"**交差検証とは** — 訓練に使ったデータだけで性能を測ると、そのデータに合わせた**過学習**かどうか分かりません。そこでデータを**訓練**・**検証**・**テスト**に分け、訓練だけで学習し**検証集合**で「模試」の性能を見て、最後に**テスト集合**で「本番」として1回だけ評価します。","1":"**訓練・検証・テスト** — **訓練集合**: モデルが重み・パラメータを学習するデータ。**検証集合**: ハイパーパラメータ選択やモデル比較に使う（模試）。**テスト集合**: 最終性能報告に1回だけ使う（本番）。典型的には訓練70〜80%、検証・テスト各10〜15%程度。","2":"**Hold-outとK-Fold** — **Hold-out**: データを1回だけ訓練/検証（または訓練/テスト）に分ける。実装は簡単だが1回の分割に左右されやすい。**K-Fold**: データをK個の区間に分け、1区間を検証・残りを訓練に使い、次は2区間を検証…とK回繰り返す。各Foldで検証スコア $S_1, \\ldots, S_K$ を得て**平均** $\\bar{S} = \\frac{1}{K}\\sum_{k=1}^K S_k$ を最終推定にする。","3":"**数式** — K-Foldの最終推定は $\\bar{S} = \\frac{1}{K}\\sum_{k=1}^K S_k$。$S_k$ は第 $k$ Foldを検証に使ったときのスコア。"},"whyImportant":{"0":"**過学習の検出** — 訓練スコアは高いが検証・テストが低いと**過学習**。交差検証で検証スコアを見れば「暗記した問題だけ解ける」状態に気づけます。","1":"**汎化性能の推定** — 実務では「一度も見ていないデータ」での性能が重要。テストを1回だけ使い、検証はK-Foldなどで複数回分ければ推定が安定します。","2":"**ハイパーパラメータ・モデル選択** — 学習率やK-NNのK、木の深さなどは検証スコアが良い設定を選ぶ。検証集合が訓練と分離していることが公平な比較に必要。"},"howUsed":{"0":"**実務パイプライン** — データを受け取ったらまず訓練/検証/テストに分割。訓練でモデルを学習し、検証でハイパーパラメータを選び、最後にテストで最終スコアを1回だけ報告。","1":"**K-Foldでモデル比較** — 複数モデルを同じK-Foldで回し、Foldごとの検証スコアの平均を比較すれば、どれが良いか公平に判断できる。"},"problemSolving":{"0":"**まとめ** — 交差検証は、訓練に使ったデータだけで性能を測ってはならないという前提に立つ。本番前に**模試**で実力を確認するように、機械学習でも**訓練データ**だけで採点すると「練習問題を覚えただけ」かどうか分からない。そこでデータを**訓練**・**検証**・**テスト**の3つに分ける。**訓練**でモデルがパターンを学習し、**検証**は学習中の実力確認やハイパーパラメータ選択に使う。**テスト**は学習がすべて終わったあと、実戦投入前に**1回だけ**使い最終性能を報告する。分割の仕方には**Hold-out**と**K-Fold**がある。Hold-outはデータを1回だけ訓練/テスト（または検証）に分ける方法。K-FoldはデータをK個の区間に分け、1区間ずつ検証に使い残りで訓練する。K-Foldでは全データが1度は検証に使われるため、1回だけの分割より推定が安定する。","1":"**例（用語・計算の整理）**\n\n- **訓練個数** — $n \\times (\\text{比率}/100)$ など\n- **テスト個数** — $n - \\text{訓練}$\n- **1 Foldサイズ** — $\\lfloor n / K \\rfloor$\n- **検証平均** — $(S_1+\\cdots+S_K)/K$\n- **Stratified** — Foldごとにクラス比率を維持\n\n---\n\n**例（O/X）**\n\n「テスト集合を何度も使ってモデルを選んでよい。」正しければ1、誤りなら0。\n\n最終報告用のテストは原則1回。→ **答 0**\n\n---\n\n**例（Hold-out 訓練）**\n\n100サンプル、訓練80%のとき訓練個数は？\n\n$80$。→ **答 80**\n\n---\n\n**例（Hold-out テスト）**\n\n同設定でテスト個数は？\n\n$20$。→ **答 20**\n\n---\n\n**例（K-Fold サイズ）**\n\n100サンプル、5-Foldで1区間のサイズは？\n\n$20$。→ **答 20**\n\n---\n\n**例（K-Fold 平均）**\n\n検証スコア80,80,90,80,90の平均(整数)は？\n\n$84$。→ **答 84**\n\n---\n\n**例（Stratified）**\n\nStratified K-Foldは各Foldでクラス比率を保つ？ ①はい ②いいえ（無作業のみ）\n\n①。→ **答 1**"},"visual":"データ分割とK-Fold評価の流れを示す可視化です。"},"ml12":{"chapter":"Chapter 12","title":"分類評価指標：モデルの詳細な成績表","description":"分類AIモデルが「試験」のあとにもらう**『詳細な成績表』**について学びます。「何問正解した？」（精度）だけでなく、「どの問題をどう間違えたか」をきちんと見る**混同行列(Confusion Matrix)**の考え方を身につけます。スパムフィルターやがん診断AIのように、**間違え方**が致命的になりうるビジネス場面で、**適合率・再現率・F1**といった多様な指標がモデルの本当の実力をどう証明するかを、直感的なたとえとともに説明します。","sectionTitle":"分類評価指標：混同行列とモデルの成績表","whatIs":{"0":"**混同行列(Confusion Matrix)とは？AIの詳細な成績表** — 試験で「正解数」だけ見ても、その生徒が数学が得意か英語が得意かはわかりません。分類モデルも同じです。モデルの**予測（列）**と**実際の正解（行）**を並べて2×2の表にしたものが**混同行列**です。4マスを見れば、モデルが何を正解し、どこで「混同」して足をすくわれているかが一目でわかります。","1":"**4マスの意味：TP, TN, FP, FN** — おなじみの「オオカミ少年」で考えましょう。ここでは「陽性」は少年がオオカミだと言うこと、「陰性」は平穏な状態です。\n* **TP（真陽性）：** 本当にオオカミが来た(1)、少年もオオカミだと言った(1)。村を救った最高の結末。\n* **TN（真陰性）：** オオカミは来なかった(0)、少年も静か(0)。平和。\n* **FP（偽陽性）：** オオカミは来ていない(0)のに少年がオオカミだと言った(1)。村人が武器を持って駆けつける無駄足（誤報）。\n* **FN（偽陰性・見逃し）：** 本当にオオカミが来た(1)のに少年は眠っていて何も言わない(0)。羊が食べられる最悪の事態（見逃し）。\n* 全体の個数は $n = \\mathrm{TP} + \\mathrm{TN} + \\mathrm{FP} + \\mathrm{FN}$ です。","2":"**精度(Accuracy)の危ない落とし穴** — 全問題のうち正解した割合です。式は $\\text{精度} = \\frac{\\mathrm{TP}+\\mathrm{TN}}{n}$。直感的ですが怖い落とし穴があります。100日のうち99日は平和で、オオカミが来るのは1日だけだとしましょう。毎日目を閉じて「オオカミなんて来ない！」とだけ叫ぶバカなロボットでも、精度は99%になります。本当に検知すべき陽性がごく少ない「不均衡データ」では、精度という数字一つを信じてはいけません。","3":"**適合率(Precision)と再現率(Recall)：追うべき二匹のウサギ** —\n* **適合率（慎重さの尺度）：** 「オオカミだと言ったとき、その何割が本当にオオカミだった？」モデルが**陽性と予測したもののうち、本当に陽性だった割合**です。$\\text{適合率} = \\frac{\\mathrm{TP}}{\\mathrm{TP}+\\mathrm{FP}}$。嘘(FP)をつかず、確かなときだけ言うほど上がります。\n* **再現率（敏感さの尺度）：** 「実際にオオカミが現れた出来事のうち、何回気づいて警告した？」 **実際の陽性のうち、モデルが当てた割合**です。$\\text{再現率} = \\frac{\\mathrm{TP}}{\\mathrm{TP}+\\mathrm{FN}}$。オオカミを一匹も見逃さないほど(FNが少ないほど)上がります。","4":"**F1スコア：適合率と再現率の黄金バランス** — 適合率と再現率はシーソーで、一方を無理に上げると他方がガクンと下がります。この二つを一つの数字にまとめたのが**F1スコア**です。普通の平均ではなく**調和平均**を使います。$\\text{F1} = \\frac{2 \\cdot \\mathrm{TP}}{2\\cdot\\mathrm{TP}+\\mathrm{FP}+\\mathrm{FN}}$。調和平均の性質で、適合率か再現率のどちらかがひどく低いとF1も底を打ちます。どちらかに偏らないバランスのよいモデルを探すときに主に使います。","5":"**AUC (Area Under the ROC Curve)：モデルのランキング判定** — モデルが「陽性/陰性」だけでなく「90%の確率でオオカミ」のように確率スコアを出すときの指標です。0～1の値で、**本当の陽性に本当の陰性よりおおむね高い確率スコアを付けられているか（識別力）**を見ます。1満点なら完璧な順位付け、0.5ならコイン投げと同じ。閾値をいじる前に、モデルそのものの「基礎体力」を比較するのに便利です。"},"whyImportant":{"0":"**精度99%のウソにだまされないために** — クレジットカードの不正検知AIを想像してください。10万件の決済のうち不正は1件だけ。AIが何もせず「全部正常決済です」とだけ出しても、精度は99.999%になります。でもこのAIは不正を一人も検知しない（再現率0%）役立たずです。混同行列を描き**適合率**と**再現率**を解剖して初めて、モデルが本当に役割を果たしているのか、手抜きをしているのかが明らかになります。","1":"**実務では「どのミスを許容するか」の熾烈な戦い** — ビジネス目的によって命をかける指標が違います。\n* **再現率（見逃し防止）が命の現場：** がん診断モデル。健康な人をがんと誤解(FP)して再検査させても、本当のがん患者を見逃し(FN)して治療時期を逃す大惨事だけは防がねばなりません。\n* **適合率（誤検知防止）が命の現場：** スパムフィルター。本物のスパムを一二通見逃して(FN)受信箱に入っても消せばいいですが、社長の重要メールをスパムと誤解(FP)して迷惑フォルダに放り込むと仕事に大打撃です。"},"howUsed":{"0":"**AIサービスの最終合否審査（二値分類評価）** — コロナ陽性/陰性判定、YouTubeの有害動画ブロック/許可、銀行の融資承認/拒否など、二者択一の実務AIプロジェクトは、リリース直前に混同行列を描き、適合率・再現率・F1を総合的に審査されます。","1":"**アラームの感度を調整する（閾値チューニング）** — AIは通常0～1の確率を出します。「何%以上でアラームを鳴らすか」という基準線（閾値）をいじり、ビジネスに合わせてモデルをならします。セキュリティが極めて厳しい機関なら基準をぐっと下げて少しでも怪しければアラーム（再現率最大化）にし、反対に通知が多すぎてユーザーがうんざりするアプリなら基準を厳しくして、かなり確実なときだけアラーム（適合率最大化）にします。"},"problemSolving":{"0":"**混同行列・指標** — TP/TN/FP/FN で2×2を埋め、$n=\\mathrm{TP}+\\mathrm{TN}+\\mathrm{FP}+\\mathrm{FN}$。**精度** $(\\mathrm{TP}+\\mathrm{TN})/n$、**適合率** $\\mathrm{TP}/(\\mathrm{TP}+\\mathrm{FP})$、**再現率** $\\mathrm{TP}/(\\mathrm{TP}+\\mathrm{FN})$、**F1**は調和平均。不均衡データでは精度だけに頼らない。","1":"**例（指標の整理）**\n\n- **精度(%)** — $100(\\mathrm{TP}+\\mathrm{TN})/n$\n- **適合率(%)** — $100\\,\\mathrm{TP}/(\\mathrm{TP}+\\mathrm{FP})$\n- **再現率(%)** — $100\\,\\mathrm{TP}/(\\mathrm{TP}+\\mathrm{FN})$\n- **F1(%)** — $100\\cdot 2\\mathrm{TP}/(2\\mathrm{TP}+\\mathrm{FP}+\\mathrm{FN})$\n\n---\n\n**例（精度）**\n\nTP=10, TN=70, FP=10, FN=10 → 精度(%)?\n\n$80$。→ **答 80**\n\n---\n\n**例（適合率）**\n\nTP=10, FP=10 → 適合率(%)?\n\n$50$。→ **答 50**\n\n---\n\n**例（再現率）**\n\nTP=10, FN=10 → 再現率(%)?\n\n$50$。→ **答 50**\n\n---\n\n**例（F1）**\n\nTP=10, FP=10, FN=10 → F1(%)?\n\n$50$。→ **答 50**"},"visual":"混同行列と評価指標計算の可視化です。"},"ml13":{"chapter":"Chapter 13","title":"正則化：暗記の限界を超えて","description":"モデルが問題集の答えを丸暗記する**「暗記王」**にならないようにするための核となる技術です。訓練データに合わせすぎると、少し違う新問が出ただけで崩れてしまいます。これが**過学習(Overfitting)**です。**正則化(Regularization)**は、データの誤差を減らしつつ、**「複雑で無理やりな式を作らせない」ためのペナルティ（罰則）**を加えます。枝葉を落とし本当に重要なパターンだけを学ばせることで、実戦（一般化）に強いモデルを作ります。","sectionTitle":"正則化：暗記の限界を超えて","whatIs":{"0":"**正則化とは？複雑さへの「罰則」**\n\nモデルが訓練データの細かいノイズや例外まで無理に合わせようとすると、式がぐにゃぐにゃして不要に複雑になります。正則化では**総損失(Loss)**を、「正解とどれだけ違うか（誤差）」だけでなく**「モデルがどれだけ複雑か（重みの大きさ）」**も足して罰則にします。罰則を避けたいモデルは、自然とより単純で整理された形を保ちます。","1":"**直感的な比喩：一夜漬け暗記王 vs 原理を掘る生徒**\n\n問題集（訓練データ）の数字まで丸暗記した一夜漬け生徒は模試では100点でも、本番（新しいデータ）では大敗します。一方、原理を理解した生徒は模試で一二問間違えても、本番では崩れず高得点です。正則化はモデルに**「枝葉（過剰な重み）を切り落とし、太い幹（本質的なパターン）だけ見ろ」**と強制し、実戦でのしなやかさを育てる先生のような役割をします。","2":"**数式の形：二つの「魔法の式」（L1とL2）**\n\n正則化は、モデルに罰則を課すやり方で大きく二種類に分かれます。\n\n- **L2（Ridge）**：重みの**二乗**を罰則に使います。目的関数は $J = \\text{MSE} + \\lambda \\sum_{j} w_j^2$ です。重みが大きくなりすぎるのを、まんべんなく穏やかに押さえます。\n- **L1（Lasso）**：重みの**絶対値**を罰則に使います。目的関数は $J = \\text{MSE} + \\lambda \\sum_{j} |w_j|$ です。重要でない特徴の重みを**0**にし、重要な特徴だけ残す（スパース）性質があります。","3":"**身近な例：スパムフィルタと医療診断**\n\nスパムフィルタでは、訓練スパムに偶然含まれていた普通の語（「こんにちは」など）に高い重みをつけると、正常メールまでスパム扱いする大失敗をします。正則化をかけると、一つの語に固執する（重みが爆発する）のを防げます。医療診断でも、多数の患者データのうち「患者服の色」のような無意味な情報にAIが騙されないようにするのに役立ちます。","4":"**数式の読み方：初心者向け解剖**\n\n- **総損失（L2の例）**：$J = \\text{MSE} + \\lambda \\sum_{j} w_j^2$\n - **$J$**：最終的にできるだけ小さくしたい**「最終成績表」**です。小さいほど良いモデルです。\n - **$\\text{MSE}$**：予測と正解がどれだけ違うかを示す**「誤差の点数」**です。\n - **$\\lambda$（ラムダ）**：私たちが決める**「罰則の強さ」**です。大きくすると厳しい先生のように複雑なモデルに重い罰則を課し、小さくするとほとんど課しません。\n - **$\\sum_{j} w_j^2$（L2ペナルティ）**：モデルが持つ全重み$w$を二乗して足した値です。重みが少しでも大きくなるとこの値が一気に増えて$J$が大きくなるので、モデルは重みを小さく保とうとします。\n\n- **L1ペナルティ（$\\lambda \\sum_{j} |w_j|$）**\n - L2が二乗を使うのに対し、L1は重みの**絶対値$|w_j|$**を使います。L1は厳しい整理整頓係のように、不要な重みを容赦なく**0**にします。"},"whyImportant":{"0":"**実戦（一般化）性能が本当の目標だから**\n\n機械学習の真価が発揮されるのは練習中ではなく、**「初めて見るデータ（テストデータ）」**に会ったときです。正則化をかけると訓練データでの精度は少し落ちることがありますが、実戦での精度は上がります。こうした未知データにもうまく対応する力を**一般化(Generalization)**といいます。","1":"**バランスの美学：バイアス・分散トレードオフ**\n\nモデルが単純すぎると問題を解けない**バイアス（未学習）**が大きくなり、複雑すぎるとノイズまで覚える**分散（過学習）**が大きくなります。この二つはシーソーで、一方が下がれば一方が上がります。正則化の強さ$\\lambda$を調節するのは、このシーソーの**水平（バランス点）**を探す作業です。","2":"**人間の役割：$\\lambda$（ハイパーパラメータ）を決める**\n\n$\\lambda$はモデルが自分で学習する値ではなく、**人が直接セットするダイヤル（ハイパーパラメータ）**です。ダイヤルを強くしすぎるとモデルが役立たずになり、弱すぎるとまた暗記王に戻ります。だから複数の$\\lambda$を試し、実戦で一番成績の良い値を見つけることが欠かせません。"},"howUsed":{"0":"**基本モデルに翼をつける（Ridge & Lasso）**\n\nよく使う**線形回帰**や**ロジスティック回帰**の式の末尾に、今学んだL1・L2の罰則をちょっと足すだけです。\n\n- 線形回帰 + L2 = **Ridge回帰**\n- 線形回帰 + L1 = **Lasso回帰**\n\n計算機が罰則込みの総損失を減らす方向（勾配降下など）で学習し、重みを調整してくれます。","1":"**実務での3段階パイプライン**\n\n実務では次の順で正則化を扱います。\n\n**1. データ分割**：データを［訓練用／検証用／テスト用］に分けます。\n\n**2. $\\lambda$オーディション**：$\\lambda$を0.01, 0.1, 1, 10などいろいろ変え、訓練データで複数モデルを作ります。\n\n**3. 勝者選出と実戦投入**：検証データで試験し、一番点数の高い$\\lambda$のモデルを本採用にします。最後にテストデータで一度だけ最終実力を評価します。"},"problemSolving":{"0":"**正則化** — 損失に**データ損失**＋**λ×ペナルティ**を足し重みを抑え**過学習**を減らす。**L2(Ridge)**は $\\sum_j w_j^2$、**L1(Lasso)**は $\\sum_j|w_j|$ でスパース化。λは**ハイパーパラメータ**。","1":"**例（式の整理）**\n\n- **L2** — $w=(2,3,1)$ → $14$\n- **総損失** — MSE=20, λ=2, ペナルティ=5 → $J=30$\n- **L1** — $w=(2,-3,1)$ → $6$\n\n---\n\n**例（定義）**\n\n主目的は？ ①過学習緩和 ②速度のみ\n\n①。→ **答 1**\n\n---\n\n**例（O/X）**\n\n「正則化は訓練誤差だけ最小化すればよい。」正しければ1、誤りなら0。\n\n0 — ペナルティ項が必要。→ **答 0**\n\n---\n\n**例（λ）**\n\n$J=\\text{MSE}+\\lambda\\cdot(\\text{ペナルティ})$ でλは？ ①強度 ②学習率\n\n①。→ **答 1**\n\n---\n\n**例（L2）**\n\n$w_1=2,w_2=3,w_3=1$ のとき $\\sum_j w_j^2$は？\n\n$14$。→ **答 14**\n\n---\n\n**例（総損失）**\n\nMSE=20, λ=2, L2ペナルティ=5 → $J$は？\n\n$30$。→ **答 30**\n\n---\n\n**例（L1）**\n\n$w=(2,-3,1)$ のとき $\\sum_j|w_j|$は？\n\n$6$。→ **答 6**\n\n---\n\n**例（L1 vs L2）**\n\n重みをちょうど0にしやすいのは？ ①L1 ②L2\n\n①。→ **答 1**"},"visual":"正則化で過学習を抑える過程の可視化です。","problems":{"definition_0":"正則化の主な目的は？①過学習の緩和 ②訓練の高速化 ③データ拡張","definition_1":"重みへのペナルティを加えてモデルを単純にする方法は？①正則化 ②正規化 ③アンサンブル","definition_2":"過学習を抑えるため損失にλ·(ペナルティ)を足す技法は？①正則化 ②勾配降下 ③K-Fold","definition_3":"L2正則化のペナルティ項は？①$\\sum w_j$ ②$\\sum w_j^2$ ③$\\sum |w_j|$","definition_4":"L1正則化のペナルティ項は？①$\\sum w_j$ ②$\\sum w_j^2$ ③$\\sum |w_j|$","definition_5":"λが大きいほどモデルは？①複雑になる ②単純になる ③変わらない","definition_6":"一部の重みを0にしてスパースにする正則化は？①L1 ②L2 ③両方","definition_7":"重みを小さく保つが0になりにくい正則化は？①L1 ②L2 ③両方","definition_8":"Ridge回帰はどの正則化？①L1 ②L2 ③なし","definition_9":"Lasso回帰はどの正則化？①L1 ②L2 ③なし","definition_10":"Elastic Netはどの正則化？①L1のみ ②L2のみ ③L1とL2","trueFalse_0":"正則化を使うと訓練誤差は増えても一般化が良くなることがある。正しければ1、誤りなら0。","trueFalse_1":"λ=0なら正則化なし。λが大きいとペナルティが増え重みが抑制される。正しければ1、誤りなら0。","trueFalse_2":"L2のペナルティは重みの絶対値の和である。正しければ1、誤りなら0。","trueFalse_3":"L1は一部の重みをちょうど0にする傾向がある。正しければ1、誤りなら0。","trueFalse_4":"正則化強度λは通常交差検証で選ぶ。正しければ1、誤りなら0。","trueFalse_5":"過学習のときλを増やすと改善することがある。正しければ1、誤りなら0。","trueFalse_6":"訓練損失だけを最小化すれば検証性能は常に良い。正しければ1、誤りなら0。","trueFalse_7":"総損失＝データ損失＋λ×ペナルティが正則化の基本形である。正しければ1、誤りなら0。","trueFalse_8":"L2ではL1より重みが0になることが多い。正しければ1、誤りなら0。","choice_0":"J=MSE+λ·(ペナルティ)でλの役割は？①正則化強度 ②学習率 ③バッチサイズ","choice_1":"L2ペナルティ$\\sum w_j^2$が大きいとモデルは？①より複雑 ②重みが大きい ③ペナルティだけ大きく重みは学習で小さくなる","choice_2":"RidgeとLassoの共通点は？①どちらもL1のみ ②どちらも重みにペナルティ ③分類のみ","choice_3":"正則化なし(λ=0)だと起こりやすいのは？①未学習 ②過学習 ③学習不能","choice_4":"λを選ぶとき比較するのは？①訓練損失のみ ②検証(またはCV)性能 ③テストを繰り返す","choice_5":"$$\\lambda \\sum w_j^2$でλ=0なら？①正則化なし ②最大の正則化 ③L1と同じ","l2Penalty_0":"重み$w_1=1$, $w_2=2$, $w_3=2$のときL2ペナルティ$\\sum_j w_j^2$の値(整数)は？","l2Penalty_1":"重み$w_1=0$, $w_2=3$, $w_3=4$のときL2ペナルティ$\\sum_j w_j^2$の値(整数)は？","l2Penalty_2":"重み$w_1=2$, $w_2=2$のときL2ペナルティ$w_1^2+w_2^2$の値(整数)は？","l2Penalty_3":"重み$w_1=1$, $w_2=1$, $w_3=1$, $w_4=1$のときL2ペナルティ$\\sum_j w_j^2$の値(整数)は？","l2Penalty_4":"重み$w_1=3$, $w_2=4$のときL2ペナルティの値(整数)は？","totalLoss_0":"MSE=10, λ=1, L2ペナルティ=6のとき総損失J=MSE+λ·(ペナルティ)の値(整数)は？","totalLoss_1":"MSE=16, λ=2, L2ペナルティ=5のときJ(整数)は？","totalLoss_2":"MSE=8, λ=4, ペナルティ=2のときJ(整数)は？","totalLoss_3":"MSE=12, λ=3, ペナルティ=4のときJ=MSE+λ·ペナルティ(整数)は？","totalLoss_4":"MSE=20, λ=2, ペナルティ=10のときJ(整数)は？","l1Penalty_0":"重み$w_1=2$, $w_2=-3$, $w_3=1$のときL1ペナルティ$\\sum |w_j|$の値(整数)は？","l1Penalty_1":"重み$w_1=1$, $w_2=2$, $w_3=3$のときL1ペナルティの値(整数)は？","l1Penalty_2":"重み$w_1=-1$, $w_2=2$のときL1ペナルティ$|w_1|+|w_2|$の値(整数)は？","l1Penalty_3":"重み$w_1=4$, $w_2=0$, $w_3=3$のときL1ペナルティの値(整数)は？","l1Penalty_4":"重み$w_1=5$, $w_2=5$のときL1ペナルティの値(整数)は？","concept_0":"正則化での「一般化」の意味は？①訓練だけよく当てる ②未知データでもよく当てる ③データを増やす","concept_1":"バイアス・分散のトレードオフで正則化を強めると？①分散が増える ②分散が減る ③バイアスだけ増える","concept_2":"損失にペナルティを足すと最適化で重みは？①制限なく大きくなる ②大きすぎると損失が増え抑制される ③常に0","concept_3":"Lasso(L1)を実務で使う理由の一つは？①L2より計算が速い ②スパースで解釈しやすい ③常にL2より良い","concept_4":"Ridge(L2)とLasso(L1)を同時に使う正則化は？①Elastic Net ②Dropout ③Batch Norm","concept_5":"λを変えたとき比較する指標は主に？①訓練損失 ②検証(またはCV)性能 ③パラメータ数","concept_6":"過学習がひどいときまず試すのは？①λ減 ②λ増またはデータ増 ③モデルを複雑に","concept_7":"「暗記型」の比喩で暗記型は？①訓練に過学習したモデル ②一般化の良いモデル ③λが大きいモデル","concept_8":"J=MSE+λ·(L2ペナルティ)でλ=0なら？①ペナルティのみ ②正則化なし(通常の最小二乗と同じ) ③L1と同じ","concept_9":"検証誤差が訓練誤差よりずっと大きいときは？①未学習 ②過学習 ③適切な適合"}},"ml14":{"chapter":"Chapter 14","title":"協調フィルタリング：推薦の基礎","description":"Netflixで「こんな作品はいかが？」と表示されたことはありますか。**協調フィルタリング**は、自分と趣味が近い他ユーザーが高く評価したものを推薦する方式です。この章では評価行列・類似度・近傍ベース予測の概念から式、実務での活用までを扱います。","sectionTitle":"推薦の基礎：協調フィルタリング","whatIs":{"0":"**協調フィルタリングとは** — 他ユーザーの**行動（評価・クリック・購入）**を利用し、自分に合うアイテムを推薦する方法です。「趣味が近い人が好きなものは自分も好きになりやすい」という直感に基づきます。動画・EC・音楽アプリなどで広く使われています。","1":"**直感：近傍の選択を借りる** — 映画推薦で、自分と同じA・Bを高く評価した人がCも高く評価していれば、自分もCを好きになる可能性が高いです。この「似た人」を**近傍**といい、近傍の評価で**予測**するのが協調フィルタリングの核心です。","2":"**数式：評価行列と予測** — ユーザー$u$とアイテム$i$の評価を$r_{u,i}$とすると、**評価行列**は（ユーザー×アイテム）の大きさです。多くのマスは空（疎）です。**ユーザー基盤**ではユーザー$u$と**類似した近傍**$N_u$を決め、未評価のアイテム$i$について近傍の評価の**加重平均**で予測値$\\hat{r}_{u,i}$を求めます。類似度は**コサイン類似度**や**ピアソン相関**などで測ります。","3":"**実務と限界** — **コールドスタート**（新規ユーザー・新規アイテムには近傍がない）、**疎性**の問題があるため、**コンテンツベース**推薦や**行列分解**などと組み合わせることが多いです。"},"whyImportant":{"0":"**推薦はビジネスとUXの要** — きちんとした推薦があると、ユーザーは欲しいものに早くたどり着き、サービスは売上・滞在時間を伸ばせます。協調フィルタリングは**パーソナライズ**の代表的な方法で、データが蓄積されていればメタデータ（ジャンル・タグ）が少なくても推薦できます。","1":"**機械学習の応用分野** — 推薦は分類・回帰とは異なる形の問題です。正解ラベルがユーザーごとに違い、**行列の空欄を埋める**という視点で扱います。協調フィルタリングを理解すると、その後の**行列分解・深層学習推薦**へ自然に広げられます。"},"howUsed":{"0":"**ユーザー基盤とアイテム基盤** — **ユーザー基盤**：自分と似たユーザーを探し、その人が高く評価したアイテムを推薦。**アイテム基盤**：今見ているアイテムに似たアイテムを探して推薦（「この商品を見た人はこれも見ています」）。どちらも「類似度」と「近傍」の概念を使い、式の構造も似ています。","1":"**類似度と予測式** — 類似度$s_{u,v}$（ユーザー$u$と$v$の間）を求め、予測は$\\hat{r}_{u,i} = \\bar{r}_u + \\frac{\\sum_{v \\in N_u} s_{u,v}(r_{v,i}-\\bar{r}_v)}{\\sum_{v \\in N_u} |s_{u,v}|}$の形で書けます。近傍の**平均**や**加重平均**だけでも構いません。評価指標には**MAE**・**RMSE**などを使います。","2":"**行列分解（MF）** — 発展では評価行列を**低ランク行列の積**で近似する**行列分解**を使い、空欄予測の精度を上げたり、コールドスタートを緩和するためにコンテンツ・文脈情報を合わせる**ハイブリッド**がよく使われます。"},"problemSolving":{"0":"**協調フィルタリング** — 他ユーザーの**行動**で**近傍**を見つけ、空欄 $\\hat{r}_{u,i}$ を**単純**または**加重**平均で埋める。**評価行列**は行=ユーザー・列=アイテムで**疎**になりやすい。コールドスタート・疎性はコンテンツ・MF・ハイブリッドで補う。","1":"**例（要点の整理）**\n\n- **定義** — 他ユーザー**行動**が基準\n- **行列** — 行×列＝マス数\n- **単純平均** — $\\hat{r}=\\frac{1}{K}\\sum r$\n- **加重平均** — $\\hat{r}=\\frac{\\sum s\\,r}{\\sum|s|}$\n\n---\n\n**例（定義）**\n\n協調フィルタリングに最も近いのは？ ①他ユーザー行動 ②ジャンルのみ ③無作為\n\n①。→ **答 1**\n\n---\n\n**例（単純平均）**\n\n評価3,4,5の平均は？\n\n$4$。→ **答 4**\n\n---\n\n**例（マス数）**\n\nユーザー3、アイテム4のときマス数は？\n\n$12$。→ **答 12**\n\n---\n\n**例（加重平均）**\n\n評価4,5,3、重み2,1,1の加重平均は？\n\n$4$。→ **答 4**"},"visual":"評価行列ベース推薦フローの可視化です。","problems":{"definition_0":"協調フィルタリングとは？① 他ユーザーの行動（評価・クリック）に基づく推薦 ② アイテム特徴（ジャンル等）に基づく推薦 ③ 無作為推薦","definition_1":"「似た趣味のユーザー」が好きなものを推薦する方式は？① 協調フィルタリング ② 教師あり学習 ③ K-Means","definition_2":"ユーザー基盤協調フィルタリングで「近傍」とは？① 自分と趣味が似たユーザー ② 同じ地域のユーザー ③ 同じ年齢層のユーザー","definition_3":"評価行列の行と列は？① 行=ユーザー、列=アイテム ② 行=アイテム、列=ユーザー ③ 行=時間、列=評価","definition_4":"コールドスタートとは？① 新規ユーザー・アイテムは近傍がなく推薦が難しい ② サーバーが止まる ③ 評価が多すぎる","definition_5":"協調フィルタリングで類似度を求める目的は？① 類似ユーザー（またはアイテム）を見つける ② 評価の正規化 ③ 行列の圧縮","definition_6":"近傍の評価で空欄を埋める予測は？① 協調フィルタリングの核心 ② 前処理 ③ 評価指標","definition_7":"コサイン類似度・ピアソン相関は？① ユーザー（またはアイテム）間の類似度 ② 損失関数 ③ 活性化関数","definition_8":"アイテム基盤協調フィルタリングでは？① 類似アイテムを探して推薦 ② 類似ユーザーのみ ③ 評価行列を使わない","definition_9":"疎性とは？① 評価がほとんどなく行列の多くが空 ② 評価が多すぎる ③ ユーザーが多すぎる","definition_10":"MAE・RMSEは推薦では？① 予測精度の評価指標 ② 類似度 ③ 行列の大きさ","definition_11":"ハイブリッド推薦は？① 協調+コンテンツ等を組み合わせる ② 協調のみ ③ 推薦しない","trueFalse_0":"協調フィルタリングは他ユーザーの評価を利用して推薦する。正しければ1、誤りなら0。","trueFalse_1":"近傍が多いほど(Kが大きいほど)予測は常に正確になる。正しければ1、誤りなら0。","trueFalse_2":"評価行列は通常疎である（ほとんどのマスが空）。正しければ1、誤りなら0。","trueFalse_3":"コールドスタートは新規ユーザーへの推薦が難しい問題を指す。正しければ1、誤りなら0。","trueFalse_4":"ユーザー基盤とアイテム基盤はどちらも類似度と近傍の概念を使う。正しければ1、誤りなら0。","trueFalse_5":"予測は近傍の単純平均でしか求められない。正しければ1、誤りなら0。","trueFalse_6":"行列分解は推薦で空欄予測に使われる。正しければ1、誤りなら0。","trueFalse_7":"協調フィルタリングだけでコールドスタートを完全に解消できる。正しければ1、誤りなら0。","trueFalse_8":"Netflix・ECで協調フィルタリングは広く使われる。正しければ1、誤りなら0。","choice_0":"協調フィルタリングの核心は？① 類似ユーザーの行動を借りる ② アイテム説明のみ ③ 無作為選択","choice_1":"評価行列の1マスが表すのは？① 1ユーザーが1アイテムに付けた評価 ② ユーザー数 ③ アイテム数","choice_2":"近傍K人の評価で予測するとき使う基本式は？① 平均（または加重平均） ② 最大値 ③ 最小値","choice_3":"類似度を重視する理由は？① 類似した近傍を選ぶため ② 評価を正規化するため ③ 行列を圧縮するため","choice_4":"疎な行列で起きる問題は？① 類似度推定が不安定 ② 計算が速すぎる ③ ユーザーがいない","choice_5":"推薦の質を数値で測る指標は？① MAE・RMSE ② 類似度 ③ 行列の大きさ","choice_6":"アイテム基盤で「類似アイテム」を探すときに使うのは？① アイテム間類似度 ② ユーザー数 ③ 評価の合計","choice_7":"コールドスタート緩和に一緒に使う方法は？① コンテンツベース・ハイブリッド ② 協調のみ ③ 推薦しない","scenario_0":"新規登録ユーザーに最初の推薦が難しい理由は？① コールドスタート（近傍・評価なし） ② 評価が多すぎる ③ 類似度が1","scenario_1":"「この商品を見た人はこれも見ています」に近い方式は？① アイテム基盤協調フィルタリング ② ユーザー基盤のみ ③ 無作為","scenario_2":"評価がほとんどない新作映画を推薦しづらい理由は？① コールドスタート（アイテム側） ② 近傍が多すぎる ③ 類似度が0","scenario_3":"協調フィルタリングとジャンル・タグを組み合わせる方式は？① ハイブリッド ② 協調のみ ③ コンテンツのみ","scenario_4":"Netflixのような「あなたへのおすすめ」の基になるのは？① パーソナライズ（協調・コンテンツ等） ② 全員同じ ③ 広告のみ","scenario_5":"行列が非常に疎なとき推薦の質を高めるには？① 行列分解・ハイブリッド等で補う ② 近傍数を増やすだけ ③ 評価を削除","concept_0":"近傍K人を選ぶときKは？① ユーザーが決めるハイパーパラメータ ② 常に1 ③ 常に全ユーザー","concept_1":"加重平均予測で重みとして使うのは？① 類似度 ② 評価のみ ③ 無作為","concept_2":"行列分解の目的は？① 空欄予測・次元削減 ② 評価削除 ③ 類似度除去","concept_3":"評価行列の大きさ（マス数）は？① (ユーザー数)×(アイテム数) ② ユーザー数のみ ③ アイテム数のみ","concept_4":"近傍の評価が3, 4, 5のとき単純平均予測値（整数）は？① 4 ② 5 ③ 3","concept_5":"ユーザー基盤で予測に使うデータは？① 近傍のそのアイテムの評価 ② 自分の過去の評価のみ ③ アイテム説明のみ","concept_6":"MAEが小さいほど意味するのは？① 予測が実際に近い ② 予測が悪い ③ 無関係","concept_7":"コンテンツベース推薦は？① アイテム特徴（ジャンル・タグ）に基づく ② 協調のみ ③ 無作為","concept_8":"コールドスタートを緩和する方法は？① コンテンツ・人気アイテム・ハイブリッド ② 近傍数を増やすだけ ③ 推薦中止","neighborPredict_0":"近傍3人の評価が3, 4, 5のとき平均予測値（整数）は？","neighborPredict_1":"近傍3人の評価が2, 4, 6のとき平均予測値（整数）は？","neighborPredict_2":"近傍3人の評価が4, 4, 4のとき平均予測値（整数）は？","neighborPredict_3":"近傍3人の評価が1, 3, 5のとき平均予測値（整数）は？","neighborPredict_4":"近傍4人の評価が2, 2, 4, 4のとき平均予測値（整数）は？","neighborPredict_5":"近傍3人の評価が5, 5, 5のとき平均予測値（整数）は？","matrixCells_0":"ユーザー3人、アイテム4つのとき評価行列のマス数（整数）は？","matrixCells_1":"ユーザー5人、アイテム6つのときマス数（整数）は？","matrixCells_2":"ユーザー2人、アイテム10のときマス数（整数）は？","matrixCells_3":"ユーザー4人、アイテム5つのときマス数（整数）は？","matrixCells_4":"ユーザー6人、アイテム5つのときマス数（整数）は？","weightedPredict_0":"評価4, 5, 3で重み2, 1, 1のとき加重平均予測値（整数）は？","weightedPredict_1":"評価3, 5で重み1, 1のとき加重平均予測値（整数）は？","weightedPredict_2":"評価5, 3, 4で重み2, 2, 2のとき加重平均予測値（整数）は？","weightedPredict_3":"評価2, 4で重み1, 1のとき加重平均予測値（整数）は？","weightedPredict_4":"評価5, 5, 1で重み1, 1, 2のとき加重平均予測値（整数）は？"}}},"mlCh01":{"chapter":"Chapter 01","title":"欠損値処理：データの空白を埋める戦略","description":"実務データには表のセルのように値が空いた**欠損値**がよく現れます。放置すると学習が止まったり偏った結果になったりします。本章では空白の埋め方から、極端な値（**外れ値**）の検出、クラスが偏った**クラス不均衡**の補正まで、機械学習の土台となる**データ品質パイプライン**をわかりやすく整理します。","sectionTitle":"欠損値処理：空白を減らし信頼を高める前処理","whatIs":{"0":"**欠損値とは？** データ表で値が空いている状態です。パズルでピースが抜けたようなものです。実務では未回答、センサー欠損、転送中のロストなど様々な原因で生じます。","1":"**欠損メカニズム(MCAR/MAR/MNAR)**は「なぜ空いたか」を問う枠組みです。**MCAR**(完全無作為欠損 · Missing Completely At Random)はコーヒーをこぼして消えたように偶然だけの欠損。**MAR**(無作為欠損 · Missing At Random)は「男性」回答者だけ化粧品支出が空、のように**他の観測変数**と結びつく欠損。**MNAR**(非無作為欠損 · Missing Not At Random)は低所得の人が所得欄を空けるように、**欠損そのものに意味**が乗る場合です。","2":"**処理の型**は大きく三つです。**リストワイズ削除**、一つの値で埋める**単一代入**、複数回埋めて統合する**多重代入**です。失うデータ量と速度・統計的厳密さのトレードオフが違うため、状況に合わせて選びます。","3":"**単一代入と多重代入**：**単一代入**は平均・最頻値などで一度だけ埋める速い方法ですがリスクがあります。**多重代入**はもっともらしい完成データを複数作り（並行世界）、結果を統合して結論を出す慎重な方法です。","4":"**外れ値の二つの見方**：一変数だけ見る**単変量(Box Plot)**と、変数の組み合わせがおかしい点を見る**多変量(Mahalanobis/Isolation Forest/SVDD)**は別の問いに答えます。実務では両方確認するのが安全です。","5":"**クラス不均衡の補正**：一方のクラスに偏ると少数を「ないもの」として学習しがちです。Tomek Links(境界の整理)、SMOTE/ADASYN(少数の合成)、SMOTE+Tomek(合成後の整理)などを組み合わせます。","6":"**要点**：欠損処理は単独テクニックではなく、外れ値・不均衡とつながった**一つの品質パイプライン設計**です。"},"whyImportant":{"0":"**機械は空欄を嫌います。** 放置すると計算できずエラーになります。OMRのようにマークがなければ採点できないのと同じです。","1":"**誤った補完は危険です。** すべてを0や平均で埋めると分布が壊れ、モデルが補完値を本物と信じ込み**過度に自信過剰な予測**をします。","2":"**前処理はセットメニューです。** 欠損を埋めただけでは終わりません。外れ値の除去・不均衡の調整まで一気通貫で設計し、本番でも破綻しないようにします。","3":"**公平性・安全性にも直結します。** グループによって欠損が偏る(MAR/MNAR)と、悪い代入は群間の性能差を広げます。前処理で偏りを点検します。","4":"**モデル選びより先に効きます。** 同じアルゴリズムでも前処理で結果は大きく変わります。「良いモデル」より「良いデータの流れ」が効くことも多いです。","5":"**運用(デプロイ後)も安定します。** 欠損・外れ値・不均衡のルールを決めておけば、新データも同じ基準で扱え、再学習や監視がしやすくなります。"},"howUsed":{"0":"**実務の流れ**：EDA → 欠損の仮説 → 代入 → 極端な値の検出(**外れ値**：Box Plot 等) → クラス比率の調整(**不均衡**：SMOTE 等) → 学習・評価の順です。","1":"**単一代入の式**：平均で埋めるなら $x_{miss} \\leftarrow \\bar{x}$、中央値なら $x_{miss} \\leftarrow \\mathrm{median}(x)$ と書きます。","2":"**多重代入の考え方**：$m$個の完成データセット（並行世界）を作り、それぞれの推定量 $\\theta_k$ を統合します。$\\bar{\\theta}=\\frac{1}{m}\\sum_{k=1}^{m}\\theta_k$","3":"**IQR に基づく Box Plot 規則**：下側 $Q_1-1.5\\times IQR$ から上側 $Q_3+1.5\\times IQR$ を柵とし、その外は外れ値**候補**とみなします。","4":"**共分散**：二変数が**一緒に**どれだけ動くかを数値化したものです。直感は「背が高いほど体重も大きいか」のような**同調**です。式は $\\mathrm{cov}(X,Y)=\\mathbb{E}[(X-\\mu_X)(Y-\\mu_Y)]$。変数を並べた**共分散行列** $\\Sigma$ が多変量の雲（楕円）の向きと伸びを決めます。","5":"**Mahalanobis 距離**：単なる直線距離ではなく、共分散（分布の形）で距離を測ります。$D_M(\\mathbf{x})=\\sqrt{(\\mathbf{x}-\\boldsymbol\\mu)^\\top\\Sigma^{-1}(\\mathbf{x}-\\boldsymbol\\mu)}$（$\\Sigma^{-1}$ が要です）。","6":"**Isolation Forest**：外れ値はクラスタから「遠い」より**早く孤立**する、という発想です。無作為分割を繰り返すと、少数回で切り離される点は外れ値候補（経路長が短い）。高次元でも比較的強く、分布仮定も弱めです。","7":"**SVDD(One-class)**：正常データだけで**境界**（最小体積の球やカーネル境界）を学習し、外側を外れ値とみなします。ワンクラス異常検知に多用されます。","8":"**クラス不均衡**：陽性が極端に少ないと「多数だけ当てる」でも精度が高く見えます。正解率だけでなく Recall・Precision・F1・PR-AUC を見て、必要ならリサンプリングします。","9":"**Tomek Links**：異なるクラス同士が互いに最近傍になる境界付近のペアです。重なりを減らすため主に多数側を削除して**掃除**する（アンダーサンプリング型のクリーニング）手法です。","10":"**SMOTE**：少数サンプル $\\mathbf{x}$ と近傍 $\\mathbf{x}_{nn}$ の間を補間して合成します。$\\mathbf{x}_{new}=\\mathbf{x}+\\lambda(\\mathbf{x}_{nn}-\\mathbf{x})$, $\\lambda\\sim U(0,1)$。複製より過学習を抑えられますが、境界が汚いと悪い合成も増えます。","11":"**複合リサンプリング(例: SMOTE+Tomek)**：まず SMOTE で少数を**増やし(oversample)**、次に Tomek で境界の曖昧なペアを**掃除(clean)**。**増やす→掃除**の順で覚えるとよいです。","12":"**ADASYN**：SMOTE を押し進め、「難しい」(周囲が多数に囲まれた) 少数付近により多くの合成を割り当て、境界を厚くします。分布が複雑なほど効くことがあります。"},"summary":"**一行サマリ**\n- 欠損処理に万能の正解はなく、まずデータが**なぜ空いたか(MCAR/MAR/MNAR)**を押さえることが肝心です。\n- **単一代入**は速いが不確実性を無視し、**多重代入**は統計的に堅いが計算コストが大きいです。\n- 外れ値は**単変量(Box Plot)**と**多変量(Mahalanobis/Isolation Forest/SVDD)**の両方を見ると取りこぼしが減ります。\n- 不均衡は **Tomek(整理)**、**SMOTE/ADASYN(合成)**、**SMOTE+Tomek(複合)**を目的に合わせて選びます。\n- 前処理の前後で Recall・F1・PR-AUC 等を比べ、本当に良くなったか検証します。","problemSolving":{"0":"欠損・代入・外れ値・クラス不均衡の問題は、「**なぜ欠けたか**(MCAR・MAR・MNAR) / **1回で埋めるか複数回か**(単一・多重代入) / **1変数だけ見るか共分散まで見るか**(単変量・多変量の外れ値) / **クラス比率と境界をどう扱うか**(評価指標・リサンプリング)」と考えれば切り分けやすいです。**MCAR**は欠損の発生が**観測・非観測を問わず**他の情報と**独立**（無作為に近い）な欠損、**MAR**は**観測済みの他変数**と欠損のメカニズムが結びつきうる場合、**MNAR**は**観測されない値そのもの**(感受性など)が観測の有無を変える場合です。**単一代入**は $x_{\\mathrm{miss}} \\leftarrow \\bar{x}$ のように一度埋め、**多重代入**は $m$ 個の完成データセットから得た $\\hat\\theta_k$ を $\\bar{\\theta}=\\frac{1}{m}\\sum_{k=1}^{m}\\hat\\theta_k$ でまとめる流れが代表的です。**単変量**の外れ値は $Q_1-1.5\\,\\mathrm{IQR}$, $Q_3+1.5\\,\\mathrm{IQR}$ の柵（ボックスプロット）、**多変量**は $D_M(\\mathbf{x})=\\sqrt{(\\mathbf{x}-\\boldsymbol\\mu)^\\top\\Sigma^{-1}(\\mathbf{x}-\\boldsymbol\\mu)}$ の Mahalanobis や Isolation Forest・SVDD がキーワードです。**不均衡**では正解率だけでなく Recall・F1・PR-AUC を併用し、**SMOTE** で少数を増やしたあと **Tomek** で境界の対を整理する **oversample → clean** がよく出ます。","1":"**例（概念：欠損）**\n\nデリケートな設問ほど未回答が増える。最も近いのは? ① MCAR ② MAR ③ MNAR ④ IQR\n\n**値の大きさ・感度**が観測可否を左右する典型は **MNAR** です。 → **正解 ③**\n\n---\n\n**例（〇×：単一 vs 多重）**\n\n「多重代入は、すべての欠損を代表値1つだけで埋める前処理である。」正=1、誤=0。\n\n**複数の補完データ**を作って推定を統合するので誤りです。 → **正解 0**\n\n---\n\n**例（単変量外れ値）**\n\n$Q_1-1.5\\times IQR$ と $Q_3+1.5\\times IQR$ の柵の外を候補にする規則は? ① Mahalanobis ② Box Plot・IQR ③ SMOTE ④ SVDD\n\nIQR柵は **単変量**のボックスプロット規則です。 → **正解 ②**\n\n---\n\n**例（多変量距離）**\n\n$D_M(\\mathbf{x})=\\sqrt{(\\mathbf{x}-\\boldsymbol\\mu)^\\top\\Sigma^{-1}(\\mathbf{x}-\\boldsymbol\\mu)}$ は? ① ユークリッドのみ ② Mahalanobis ③ Tomek ④ 平均代入\n\n$\\Sigma^{-1}$ で共分散を反映するのが **Mahalanobis** です。 → **正解 ②**\n\n---\n\n**例（不均衡：指標）**\n\n少数クラスを取り逃すと損失が大きいが、**全体精度**だけ高く見えることがある。より直接的なのは? ① 精度のみ ② 精度固定のみ ③ Recall・F1・PR-AUC ④ MCAR\n\n不均衡では **Recall・F1・PR-AUC** が実務的です。 → **正解 ③**\n\n---\n\n**例（応用：リサンプリング）**\n\n先に **SMOTE** で少数を増やし、続けて **Tomek** で境界近くのペアを除いて整理する。最も近いのは? ① SVDD のみ ② SMOTE のみ ③ SMOTE+Tomek ④ MCAR のみ削除\n\n**oversample → clean** が SMOTE+Tomek 系です。 → **正解 ③**"},"sectionLabels":{"whatIs":"概念","whyImportant":"直感","howUsed":"数理","summary":"実務適用","problemSolving":"問題解説"},"problemSolvingLabel":"問題の解き方","imputationTable":{"title":"単一代入でよく使う代表値・手法","caption":"主要な単一代入を、定義と簡単な式でまとめた表です。","headers":{"method":"補完値・手法","definition":"定義（簡単な式）"},"rows":{"0":{"method":"平均値(Mean)","definition":"標本平均で補完: $x_{miss} \\leftarrow \\bar{x}=\\frac{1}{n}\\sum_{i=1}^{n}x_i$"},"1":{"method":"中央値(Median)","definition":"中央値で補完: $x_{miss} \\leftarrow \\mathrm{median}(x)$"},"2":{"method":"最頻値(Mode)","definition":"最も頻度の高い値で補完: $x_{miss} \\leftarrow \\arg\\max_v\\,\\mathrm{count}(x=v)$"},"3":{"method":"回帰・KNN・Hot-deck","definition":"回帰: $\\hat{x}=f(\\mathbf{z})$, KNN: $x_{miss}\\leftarrow\\frac{1}{k}\\sum_{j\\in N_k}x_j$, Hot-deck: $x_{miss}\\leftarrow x_{donor}$"}}},"practiceProblemsTitle":"演習問題","practiceProblemsIntro":"60問の問題プールから無作為に10問。難易度は易4・中3・難3です。","practiceProblemsInstruction":"①〜④のいずれかを選び、「答え合わせ」を押してください。","checkAnswer":"答え合わせ","correctAnswer":"正解です！","wrongAnswer":"不正解です。もう一度試してください。","testCodeLabel":"Test code","visualIntro":"欠損処理から外れ値・不均衡補正までつながるデータ品質パイプライン","visualStep0":"欠損の検出：欠損率とパターン","visualStep1":"欠損処理：削除／単一・多重代入","visualStep2":"外れ値検知：Box Plot、Mahalanobis、Isolation Forest、SVDD","visualStep3":"不均衡補正：Tomek、SMOTE、ADASYN、SMOTE+Tomek","visualStep4":"⑤ 学習と検証：汎化性能の確認","visualAriaLabel":"欠損値処理とデータ品質改善の流れの図","problemSolvingFallback":"MCAR/MAR/MNAR の見立て → 単一/多重代入の選択 → Box Plot・Mahalanobis・Isolation Forest・SVDD で外れ値確認 → Tomek/SMOTE/ADASYN/ハイブリッド再サンプリングの順で解きます。","visualDiagram":{"hintStep0":"観察: まず欠損パターンを見る","hintStep1":"選択: 単一代入 vs 多重代入","hintStep2":"点検: 外れ値（単変量/多変量）","hintStep3":"補正: 不均衡（合成→整理）","clickMechanismCards":"下の MCAR · MAR · MNAR カードを押してパターンを変えてみましょう。","pipelineNavAria":"パイプラインの段階","chipPattern":"欠損パターン","chipImpute":"代入","chipOutlier":"外れ値","chipImbalance":"不均衡","panelDetectTitle":"欠損検出（パターン）","badgeMcar":"MCAR（無作為）","badgeMar":"MAR（条件付き）","badgeMnar":"MNAR（値に依存）","legendObserved":"観測","legendMissing":"欠損","gridColorHint":"セルの色は「なぜ空欄か」のヒントです","tooltipObserved":"観測","tooltipMissing":"欠損","mcarLine1":"MCAR","mcarLine2":"完全に無作為の欠損 · Missing Completely At Random","mcarLine3":"ばらけた模様 → 「完全な偶然」の可能性","marLine1":"MAR","marLine2":"無作為欠損 · Missing At Random","marLine3":"縦の帯のように特定列・グループに集中 → 「条件が揃うと欠ける」","mnarLine1":"MNAR","mnarLine2":"非無作為欠損 · Missing Not At Random","mnarLine3":"値の裾野に集中 → 「欠け方自体に意味」","panelImputeTitle":"欠損処理: 単一代入 vs 多重代入","imputePhase0":"空欄の確認","imputePhase1":"単一代入","imputePhase2":"多重代入","imputePhase3":"結合","singleTitle":"単一代入（1回）","singleLead":"空欄ごとに同じ一つの値が入る","singleFoot":"一度で埋めると **速い** が、データが「あまり揺れない」錯覚（分散の過小評価）を生むことがあります。","multiTitle":"多重代入（m回）","multiLead":"複数の「ありうる埋め方」→ 最後に平均・不確実性を反映","multiFoot":"何度も埋めて候補を作り → 最後に **結合（平均/分散）** して不確実性を反映","boxTitle":"単変量外れ値: Box Plot（IQR）","boxPhase0":"箱（Q1〜Q3）","boxPhase1":"柵（1.5×IQR）","boxPhase2":"柵の外の点＝候補","boxChip1":"箱","boxChip2":"柵","boxChip3":"外の点","boxPlotStagesAria":"箱ひげ図の段階","fenceLower":"下限","fenceUpper":"上限","boxSummary":"一行要約: **Q1·Q3 → IQR → 1.5×IQR の柵** の外側を外れ値候補とみなす","mvTitle":"多変量外れ値: 「組み合わせ」がおかしい点","mvPhase0":"距離（共分散）","mvPhase1":"孤立（短い経路）","mvPhase2":"境界（正常領域）","mahalPara1":"軸が一緒に動く（共分散）と点は **楕円の雲** になります。楕円の内側はよくある組み合わせ、**楕円から大きく外れた組み合わせ** を疑います。","mahalPara2":"相関（共分散）を反映した距離で判断","mahalBadge":"楕円基準で遠い → 候補","ifPara1":"無作為に切ると **すぐに孤立する点** は「隠れにくい点」として覚えましょう。","ifPara2":"無作為分割で「早く」孤立する点","ifBadge":"短い経路で孤立 → 候補","svddPara1":"正常だけを集め **風船のような境界** を描きます。内側＝馴染みのデータ、**外側＝見慣れないデータ**。","svddPara2":"正常データを包む「境界」を学習","svddBadge":"境界の外 → 候補","imbTitle":"クラス不均衡: SMOTE/ADASYN + Tomek Links","imbIntro":"**Tomek Links** は「クラスが異なる二点が互いに最も近い近傍」となるペアを見つけ、境界を曖昧にする側（多くは **多数** 側）を除いて境界を整理します。","imbSmoteAdasynIntro":"**SMOTE** は少数サンプルと近傍の間を補間して合成点を作り、**ADASYN** は多数に囲まれた「難しい」少数領域ほど多く合成して、境界付近をより密にします。","imbPhase0":"境界で少数クラスが押される","imbPhase1":"合成で隙間を埋める","imbPhase2":"Tomek で境界整理","imbWhyTitle":"なぜ問題か","imbWhyBody":"不均衡が強いと、モデルが「多数だけ当てる」方向でもスコアが良く見えることがあります。再現率/F1 なども見て、データ自体も補正します。","imbMajor":"多数（85%）","imbMinor":"少数（15%）","imbHowTitle":"どう直すか？（可視化）","imbHowLead":"直線ではなく **曲がった境界** と考えると、境界付近のノイズを SMOTE・Tomek で扱うイメージが自然です。","imbChip0":"境界がごちゃつく","imbChip1":"合成で埋める","imbChip2":"Tomek で整理","imbChip2Title":"異なるクラス同士で互いに最近傍のペアから、多数側を除いて境界を整えます。","imbTomekCallout":"黄色のリング: 境界に食い込んだ **多数（灰）** の点が Tomek 候補です。整理されると薄くなり境界がすっきりします。","chartDenseTop":"上: 多数が密集","chartSparseBottom":"下: 少数（+合成）","imbBoundaryMsg":"境界付近は誤分類ノイズが増えやすい","imbFlow1":"流れ: SMOTE/ADASYN で少数の **周りを密に** → **Tomek Links** で境界に付いた **異クラス最近傍ペア** の多数側を除いて境界を整理","imbFlow2":"一行の直感: 合成で点が増えたあと、「異なるクラスなのに最も近い」同士をペアにすると、その中で境界を汚す **多数側の点** を除きます。","legMinor":"少数","legMajor":"多数","legSyn":"合成（SMOTE/ADASYN）","legCurve":"曲線境界","pointTitleMajor":"多数","pointTitleMajorTomek":"境界に食い込んだ多数（整理候補）","pointTitleSyn":"合成（SMOTE/ADASYN）"}},"mlCh07":{"chapter":"Chapter 07","title":"XGBoost, LightGBM, CatBoost — 表形式データの最強格","description":"スプレッドシートのような**表形式（構造化）データ**では、ときに深層学習を上回る存在が**勾配ブースティング**です。弱い学習器を順番に重ね、前段の**誤差（残差）**を次が埋めていく—そんな**協調的な学習器の列**が、実務とKaggleの現場を支えています。\n\n本章では **XGBoost / LightGBM / CatBoost** の違いを整理し、**自分のデータにどれを選ぶか**の基準をはっきりさせます。","sectionTitle":"CH07 ブースティング三本柱 — 残差を木で埋める技法","whatIs":{"0":"**1. ブースティングの核: 間違いノートのリレー**\n\n**概念:** 決定木を**順番に**足していき、これまでのアンサンブルの**残差**を次の木が学習します。\n\n**直感:** 模試の**間違いノート**だけを次のメンバーが徹底し、また残った弱点をその次が埋める—勉強会がラウンドを重ねるほどチーム全体の正答率が上がります。\n\n**更新式:** $F_t(x)=F_{t-1}(x)+\\eta h_t(x)$\n\n- $F_t(x)$: 段階 $t$ までの予測\n- $F_{t-1}(x)$: 直前までの予測\n- $h_t(x)$: **残り誤差**を減らすために追加する新しい木\n- $\\eta$: **学習率**（新しい木の意見をどれだけ混ぜるか。小さいほど慎重だが、木の本数が必要になりがち）\n\n**実務:** 与信デフォルト、離反、CTR など**表データ**では、依然として最強クラスのベースラインのひとつです。","1":"**2. XGBoost: 正則化込みの安定枠**\n\n**概念:** 近代的ブースティング普及の中心。損失に加え**複雑さペナルティ**を明示的に入れた設計で、挙動が読みやすく安定しやすい場面が多いです。\n\n**直感:** 「進度」も大事だが、**丸暗記（過学習）**には厳しくペナルティを課す先生のイメージです。","2":"**3. LightGBM: 大規模データのスピード枠**\n\n**概念:** 数百万行を超えると学習が重い問題への回答。**ヒストグラム（ビン）**で計算を圧縮し、木は多くの場合**リーフワイズ**—損失が最も減る葉から分割を深掘りします。\n\n**直感:** 既にわかっている章は飛ばし、試験に出そうな章だけ徹底する**効率特化**の勉強スタイル。ただし**小規模データ**では掘りすぎて過学習しやすいです。\n\n**注意:** `max_depth` や `min_data_in_leaf` などで深掘りを制御しましょう。","3":"**4. CatBoost: カテゴリ変数の扱いに強い**\n\n**概念:** Yandex 由来で、名前は **Cat**egory + **Boost**。**高カーディナリティのカテゴリ**（職種、地域コードなど）を上手に扱うことに強みがあります。\n\n**直感:** 試験では、前の問題を解くときに**後ろの答えを先に見てはいけない**のと同じです。学習中に未来情報が混ざると**リーク**でスコアが水増しされます。CatBoost の Ordered statistics などの設計は、この「先読み」を防いでリークのリスクを抑えるのに役立ちます。だから**デフォルト**でも安定して強いことが多いです。","4":"**5. 数式をやさしく読むコツ（記号の意味 + ミニ計算）**\n\nBoosting/XGBoost で頻出の3式です。各式は **(a) 記号の意味** → **(b) 小さな数値例** の順で読むと理解しやすくなります。\n\n---\n\n**(1) 予測を足し合わせて更新**\n\n$F_t(x)=F_{t-1}(x)+\\eta h_t(x)$\n\n- $F_{t-1}(x)$: 新しい木を入れる前の予測\n- $h_t(x)$: 新しく追加した木の補正量\n- $\\eta$: 学習率（補正をどの強さで反映するか）\n\n**解釈:** 以前の予測に補正を少しずつ足して、段階的に誤差を減らします。\n\n**数値例:** 以前の予測が10、新しい木の出力が+4、$\\eta=0.25$なら\n$F_t=10+0.25\\times4=11$ です。\n\n---\n\n**(2) 目的関数 = 当てはまり + 複雑さペナルティ**\n\n$\\mathcal{L}=\\sum_i l(y_i,\\hat y_i)+\\Omega(f)$\n\n- $\\sum_i l(y_i,\\hat y_i)$: サンプル全体の予測誤差\n- $\\Omega(f)$: モデルが複雑になりすぎるのを抑える正則化項\n\n**解釈:** 精度だけでなく、過学習を防ぐため複雑さにも罰則を与えます。\n\n**数値例:** 当てはまり誤差が18、正則化が3なら\n$\\mathcal{L}=18+3=21$ です。\n\n---\n\n**(3) 分割利得に使う導関数**\n\n$g_i=\\partial_{\\hat y}l$, $h_i=\\partial^2_{\\hat y}l$\n\n- $g_i$: 1階微分（勾配）— どちら向きにどれだけ直すと誤差が減るか\n- $h_i$: 2階微分（曲率）— 変化の急さ。更新の安定化に効く\n\n**解釈:** XGBoost系は $g_i$ と $h_i$ を一緒に使い、分割利得をより安定して計算します。\n\n**直感ポイント:**\n- $|g_i|$ が大きいほど、そのサンプルはまだ外している可能性が高い\n- $h_i$ は更新を急にしすぎないための緩衝材として働きます。","5":"$32"},"whyImportant":{"0":"**実務表データの「安定受け」**\n\n画像・生テキストではない**DBテーブル/CSV**では、深層学習よりブースティングの方が**速くて十分当たる**ことがよくあります。巨大モデルを設計する前の**第一ベースライン**に選ばれます。","1":"**データの性格に合わせて選ぶ**\n\n- **安定性**と中規模なら **XGBoost**\n- **規模と速度・メモリ**が最重なら **LightGBM**\n- **カテゴリ列が多く**前処理を減らしたいなら **CatBoost**","2":"**ハイパラはハンドル**\n\n`learning_rate`、深さ/葉、`n_estimators`、early stopping は、**性能とコスト**のバランスを決めます。関係を押さえると当てずっぽうが減ります。"},"howUsed":{"0":"**① パイプラインの型**\n\n欠損・カテゴリ処理 $\\rightarrow$ **学習/検証分割** $\\rightarrow$ 学習 $\\rightarrow$ **SHAP** 等で説明 $\\rightarrow$ デプロイと監視。","1":"**② アーリーストッピング**\n\n木を増やし続けると**暗記**に寄ります。検証損失が頭打ち/悪化したら**そこで止める**のが実務の常識です。","2":"**③ ビジネス指標に合わせる**\n\n- **分類:** 精度だけでなく **AUC** や **F1** も。\n- **回帰:** **RMSE** / **MAE** を金額・件数の感覚で追う。"},"summary":"**チートシート**\n\n| モデル | キーワード | 長所 | 注意 |\n| :--- | :--- | :--- | :--- |\n| **XGBoost** | 正則化・安定 | 汎用に強く、再現性を取りやすい | 超大規模では相対的に遅めのことも |\n| **LightGBM** | 速度・リーフ | 高速・省メモリ寄り | 少数データでは過学習しやすい |\n| **CatBoost** | カテゴリ・既定値 | 前処理負担を下げやすい | 重く、モデルが大きくなりがち |\n\n共通点は **残差を段階的に減らしながら多数の木を合成する**ことです。","problemSolving":{"0":"**演習のコツ**\n\n- 練習問題はすべて**四択**。計算問題も**選択肢の文字列**のうち正しいものを選びます。\n- **LightGBM / リーフワイズ**は `max_depth`、`min_data_in_leaf`、`num_leaves` など**制約**とセットで出ます。\n- **モデル選択**は**データ量・カテゴリ比率・レイテンシ**を手がかりに、上表へ対応づけます。\n- 理論は $F_t=F_{t-1}+\\eta h_t$、$\\Omega(f)$、ヒストグラム、ordered statistics の**定義確認**から。"},"sectionLabels":{"whatIs":"概念","whyImportant":"重要性","howUsed":"使い方","summary":"まとめ","problemSolving":"演習・実戦のコツ"},"problemSolvingLabel":"解答・解説のヒント","practiceProblemsTitle":"練習問題","practiceProblemsIntro":"全60問からランダム10問を出題します（易→中→難、4-3-3）。","practiceProblemsInstruction":"問題文を読み、①〜④のいずれかを選んでから「正解を確認」を押してください。","boostingTestCodeLabel":"テストコード","boostingVisualIntro":"前段の誤差を次の木が順次補正します。","boostingVisualIntroPanels":"ライブラリごとに木の伸ばし方が違います。レベルワイズ／リーフワイズ／対称（オブリビアス）成長を順にアニメーションで見比べます。","boostingVisualAriaLabel":"XGBoost のレベルワイズ、LightGBM のリーフワイズ、CatBoost の対称ツリー成長の比較図","boostingVisualTitleXgb":"XGBoost","boostingVisualTitleLgb":"LightGBM","boostingVisualTitleCat":"CatBoost","boostingVisualCaptionXgb":"Level-wise\n深さごとに層を揃えてから次へ","boostingVisualCaptionLgb":"Leaf-wise\n損失減少が大きいリーフから分割","boostingVisualCaptionCat":"Oblivious\n同じ深さで同一分割（対称）","boostingVisualPhaseCaption0":"① XGBoost — レベルワイズで深さごとに揃えてから次の層へ。","boostingVisualPhaseCaption1":"② LightGBM — リーフワイズで損失減少が大きい葉から分割。","boostingVisualPhaseCaption2":"③ CatBoost — オブリビアス（同じ深さで同一分割・対称）。","boostingVisualPhaseCaption3":"並べて見ると、伸ばし方の違いがはっきり分かります。","boostingVisualStep0":"① 初期モデルの誤差","boostingVisualStep1":"② 残差を順次補正","boostingVisualStep2":"③ 難しいパターンを追加補正","boostingVisualStep3":"④ 最終アンサンブル出力","checkAnswer":"答えを確認","correctAnswer":"正解です！","wrongAnswer":"もう一度試してください。"},"mathChapters":{"mathCumulativeVisualTitle":"基礎数学の概念の流れ","mathCumulativeVisualLabel":"基礎数学チャプター別概念ビジュアル","sectionLabels":{"whatIs":"どのような概念か","whyImportant":"なぜ重要か","howUsed":"どのように使われるか","problemSolving":"問題を解くための説明"},"mathSymbolPaletteTitle":"数学記号一覧","mathSymbolPaletteDescription":"ギリシャ文字・演算子・集合記号など、数学記号と読み方を確認できます。クリックでコピーできます。","mathSymbolPaletteSearchPlaceholder":"記号名・キーワードで検索（例：アルファ、シグマ、偏微分）","mathSymbolPaletteNoResults":"該当なしです。","mathSymbolPaletteHint":"クリックでコピーできます。","mathSymbolCategoryGreekLower":"ギリシャ文字（小文字）","mathSymbolCategoryGreekUpper":"ギリシャ文字（大文字）","mathSymbolCategoryOperators":"演算子","mathSymbolCategoryRelations":"関係","mathSymbolCategoryArrows":"矢印","mathSymbolCategorySets":"集合・数体系","mathSymbolCategoryLogic":"論理","mathSymbolCategoryCalculus":"微積分","mathSymbolCategoryMisc":"その他","math00":{"chapter":"Chapter 00","title":"基礎数学とAI：AIの言語を学ぶ","description":"ディープラーニング・機械学習を理解するために、なぜ数学が必要か、どんな数学の道具が使われるか、その地図を一緒に描いていきます。","sectionTitle":"ディープラーニング・機械学習を理解するために、なぜ数学が必要か","visualIntro":"AI入力が数学を経て予測に至る流れを可視化します。","visualInputLabel":"入力","visualInputTypes":"画像・文・音","visualMathLabel":"基礎数学","visualMathTopics":"関数・ベクトル・行列","whatIs":{"0":"**AIを理解するには数学というメガネが必要です** — ディープラーニングと機械学習は、私たちが与える画像・文・音をすべて**数**に変えて受け止めます。その数が**関数**という通り道を経て、**かけ算と足し算**を繰り返しながら答えを探します。この過程のすべてが数学で書かれているので、数学を知ればAIの**内部の動き**をはっきり読めます。","1":"**どんな数学の道具を使うか** — 入力と出力の規則を定める**関数**、たくさんのデータをまとめて一度に扱う**ベクトルと行列**、モデルが自分で学び答えに近づくのを支える**微分**、そして結果の起こりやすさを測る**確率と分布**を学びます。これらの道具が集まって、賢いAIができ上がります。","2":"**まとめると** — AIは数と関数という土台の上で動いています。AIがなぜその結果を出したかを解釈し、より良いモデルを作るには、**関数**・**極限**・**微分**・**確率**といった基礎体力が欠かせません。このコースは、その基礎を一つずつ積み上げる旅です。"},"whyImportant":{"0":"**AIの判断の根拠を知るために** — AIの判断はすべて、結局**数と関数**の計算の結果です。関数や微分を学ぶ理由は、AIの計算の流れを追い、**なぜその答えになったか**を論理的に理解するためです。","1":"**AIモデルの中で数学が働く場所** — モデルの各**層（レイヤー）**は、重みをかけ足しする**関数**の集まりです。また、AIが学習して誤差を減らしていく過程では、**勾配（グラディエント）**という微分の考えを使います。確率は、AIが自分の予測をどれだけ信じているかを示す指標になります。","2":"**私たちが一緒に進むロードマップ（Ch01～Ch12）** — このコースは、データの流れを扱う**関数（Ch01～03）**、変化の基礎を扱う**極限と連続（Ch04～05）**、学習の要である**微分（Ch06～08）**、蓄積と確率の基礎となる**積分（Ch09）**、そして不確実性を扱う**確率と分布（Ch10～12）**の順で進みます。"},"howUsed":{"0":"**現実と数学をつなぐ輪** — AIモデルは**入力→数を変換→関数を繰り返す→出力**という構造です。**関数**はその土台のブロック、**微分**はもっと賢くなるためにブロックを削るのみ、**確率**はでき上がった建物の安定を確かめる道具です。この基礎数学を身につけると、ディープラーニングの複雑な式が、意味のある文として見え始めます。"},"problemSolving":{"0":"| 区分 | AIにおける役割 | 核心数学概念 |\n| --- | --- | --- |\n| **入力と出力** | データを入れ答えを得る基本枠 | 関数、指数、対数 |\n| **学習(Training)** | 誤差を減らし正解に近づく過程 | 極限、微分、連鎖律 |\n| **予測と判断** | 不確実な結果の中から最善を選ぶこと | 確率、統計、正規分布 |"}},"math01":{"chapter":"Chapter 01","title":"関数：入出力をつなぐAIの基本単位","description":"関数は入力一つに出力一つが対応する規則です。AIが入力を出力に変える仕組みもこの関数の考え方に直結しています。","sectionTitle":"関数とは何か","visualIntro":"入力 $x$ を入れると出力 $y$ が一つ決まる規則です。下で $x$ → $f$ → $y$ の流れを示します。","visualCaption":"例: $x=3$ のとき $f(x)=2x+1$ では 7","whatIs":{"0":"**関数**は、二つの集合の間の厳密な**対応（写像）**です。入力の集合である**定義域**のどの元も、出力の集合である**値域**の元に**ただ一つだけ**対応しなければなりません。自販機のボタンを押して飲み物が出ない、または二つ出るなら故障なのと同じで、関数も一つの入力には必ず一つの出力が対応します。","1":"数学では $y = f(x)$ と書きます。$x$ は**独立変数（原因）**、$y$ は**従属変数（結果）**です。AIの視点では $x$ は私たちが与える**データ**（画像ピクセル、文、センサ値）であり、$y$ はAIが計算した**予測**（猫かどうか、次単語、株価予測）です。関数 $f$ はこのデータを正解に変える**変換器**の役割を果たします。","2":"**AIモデル**そのものが巨大な**合成関数**です。入力データが最初の関数（層）を通って変換され、その結果がまた次の関数（層）に入っていく過程が何十回も繰り返されます。数学で $y = f(g(h(x)))$ のように関数を重ねるのと同様、ディープラーニングは無数の関数を層のように積み重ね、複雑なデータのパターンを読み取ります。"},"whyImportant":{"0":"**現実世界のモデル化**ができるからです。「勉強すれば成績が上がる」という漠然とした関係を $y = ax + b$ という**一次関数**で表せば、勉強時間（$x$）に対する予想成績（$y$）を計算できます。AIはこれよりはるかに複雑な非線形関係（画像と物体名など）を関数で近似し、問題を解きます。","1":"**最適化**の対象になるからです。AI学習の目標は正解と予測の誤差を最小にすることです。その誤差を計算するのも**損失関数**という関数であり、その最小値を求めるために微分を使います。関数で定義されていなければ、AIを学習させる数学的根拠がなくなります。","2":"**変化**を扱う言語だからです。入力が少し変わったとき出力がどれだけ変わるか（傾き）を知らなければ、AIは正解に向かって少しずつ進めません。関数は入力と出力の**因果関係**を数式で明確にするので、AIがなぜその判断をしたか分析できます。"},"howUsed":{"0":"**AI**のすべてのニューロンは小さな**関数**です。入力信号（$x$）に重み（$w$）をかけて足し（$wx+b$）、**活性化関数**を通して次のニューロンに送ります。ReLUやSigmoidといった関数が信号をオンにするかオフにするかを決め、そうした小さな関数の集まりが人間の脳のように複雑な判断を下します。","1":"**データ変換**に使われます。私たちの見る写真は、コンピュータには数万個の数（$x$）の塊です。AIはこの数を関数に通して次元を減らしたり増やしたりし、「耳の形」「目の形」のような重要特徴（$y$）だけ残します。これは高次元ベクトルを低次元空間に写す関数演算です。","2":"**確率**を計算します。分類問題の最後で使う**ソフトマックス**関数は、AIが出力する生の数を「和が1の確率」に変えます。そのおかげで「この画像は90%の確率で犬です」と言えます。関数は生データを私たちが理解できる情報に加工します。"},"problemSolving":{"0":"| 関数 | 例（入力 → 出力） |\n| --- | --- |\n| $f(x)=x+1$ | 3 → 4、10 → 11 |\n| $g(x)=2x$ | 3 → 6、10 → 20 |\n| $h(x)=x^2$ | 3 → 9、$-2$ → 4 |","1":"下のビジュアルのように $f(x) = 2x + 1$ に $x = 3$ を入れると 7、$x = 10$ で 21 です。問題の空欄を埋めなさい。"}},"math02":{"chapter":"Chapter 02","title":"指数と指数関数：成長と活性化の数学","description":"指数は同じ数を何回かけたかを表し、指数関数はその規則を変数にした関数です。ディープラーニングの活性化・損失の設計で使われます。","sectionTitle":"指数と指数関数とは何か","visualIntro":"底 $a$ を決めておき、指数 $x$ に応じて $a^x$ の値が一つ決まります。以下は $2^x$ の例です。","visualCaption":"例: $2^0=1$, $2^1=2$, $2^2=4$, $2^3=8$","whatIs":{"0":"**指数**は、ある数（底）を何回かけたかを表す演算です。紙を42回折ると地球から月に届くという話のように、足し算（$+$）ではなくかけ算（$\\times$）でつながるため、**爆発的に増える（指数関数的成長）**性質があります。","1":"**指数関数**は、その累乗の回数を変数 $x$ にした関数 $y = a^x$ です。多項関数（$x^2$）では変数が底にありますが、指数関数では変数が肩にあります。これは**「現在の大きさに比例して成長する」**という意味です。$a>1$ なら $x$ が増えると値は天井知らずに伸び（**指数関数的成長**）、$00$）**が重要です。0 や負の対数は定義されません。そのため AI のコードでは $\\log(0)$ でエラーにならないよう、ごく小さい数（$\\epsilon$）を足すテクニックをよく使います。また底が $e$ の**自然対数（$\\ln$）**は微分をきれいにし、ディープラーニングの標準として使われます。"},"whyImportant":{"0":"**アンダーフロー防止**が不可欠だからです。AI が確率 $0.1$ を 100 回かけると $0.1^{100}$ になり、コンピュータは「小さすぎて表現できない 0」として扱います。しかし対数をとると $\\log(0.1^{100}) = 100 \\times \\log(0.1) = -100$ となり、**意味のある数**として扱えます。","1":"**情報量（エントロピー）**を測る物差しだからです。確率が低いほど（珍しいほど）対数値の大きさは増します（絶対値で）。「明日太陽が西から昇る」のような稀な事象は情報量が大きく、「明日朝が来る」のような当たり前の事象は情報量が 0 に近い。AI はこの対数に基づく情報量で**「どれだけ驚く情報を学んだか」**を測ります。","2":"**間違いに厳しくペナルティ**をかけるためです。$y=\\ln x$（$00$, $\\cos\\theta<0$\n2) $\\tan\\theta=\\frac{\\sin\\theta}{\\cos\\theta}<0$\n\nよって **答えは負**。\n\n---\n\n**例（周期計算型）**\n\n$y=\\sin(8x)$ の周期（度）を求めよ。\n\n**解法**\n\n1) 周期公式は $\\frac{360}{k}$\n2) $k=8$ なので $\\frac{360}{8}=45$\n\nよって **答えは 45**。\n\n---\n\n**例（ML適用型、$\\pi$ 直接計算なし）**\n\n$hour=6$ のとき、24時間を360度とみなすと角度は何度で、$\\sin\\theta$ はいくつか？\n\n**解法**\n\n1) 24時間 = 360度なので 1時間 = 15度\n2) 6時間は $6\\times15=90^\\circ$\n3) $\\sin90^\\circ=1$\n\nよって **答えは 1**。\n\n（式で書くと $\\theta=2\\pi\\cdot\\frac{6}{24}=\\frac{\\pi}{2}$ と同じ。）"},"summary":"**一言まとめ:** 三角関数は角度から比を計算するだけでなく、円運動と波を統一的に説明する言語です。単位円の直感から、周期データ処理や位置エンコーディングまで一本につながります。","problemSolvingLabel":"問題を解くための説明","practiceProblemsTitle":"練習問題","practiceProblemsIntro":"問題バンク60問から毎回ランダム10問を出題します。出題時はタイプ重複をできるだけ避け、難易度は易しい→普通→難しいの順で配置されます。","problemPromptQuadrantSign":"第{quadrant}象限で {func} の符号を求めなさい。（正=1、負=-1）","problemPromptPeriodDeg":"の周期（度）を求めなさい。","problemPromptIntSum":"整数の和の問題: {a} + {b} = ?","problemPromptUnitCircleCoord":"単位円で θ={deg}° のとき {axis} の値を求めなさい。","problemPromptCoterminalAngle":"{deg}? ???????? 0?~360? ?????????","problemPromptQuadrantFromAngle":"? ?={deg}? ??????????1~4?","cosineVisualTitle":"??????????????","cosineVisualHint":"2??????????????cos ?? 1 ???????","cosineVisualNow":"??????????:","cosineVisualHigh":"??????","cosineVisualMedium":"???????","cosineVisualLow":"??????"}}},"now":"$undefined","timeZone":"UTC","children":["$L33","$L34","$L35"]}]