9:["$","$L18",null,{"formats":"$undefined","locale":"zh","messages":{"meta":{"title":"姆豆AI","description":"免费AI教育：按章学习基础数学、深度学习与机器学习。从内积、神经网络、反向传播到KNN、回归、集成。深度学习入门·机器学习课程·AI学习。","keywords":"深度学习, 机器学习, AI教育, 基础数学, 深度学习入门, 机器学习课程, AI学习, 神经网络, 反向传播, KNN, 线性回归, 免费课程","learnTitle":"学习","learnPageSeoTitle":"基础深度学习 | 学习","learnDescription":"分章深度学习：内积、矩阵乘法、神经网络、反向传播。通过可视化与题目学习概念，并在迷你神经网络乐园中动手实践。","learnKeywords":"深度学习, 内积, 矩阵乘法, 神经网络, 反向传播, 线性层, 激活函数, AI学习, 分章学习","learnMathTitle":"基础数学与AI | 学习","learnMathDescription":"面向AI的基础数学：函数、向量、矩阵、指数对数、均匀与正态分布。为深度学习与机器学习打基础。","learnMathKeywords":"基础数学, 函数, 向量, 矩阵, AI数学, 正态分布, 深度学习数学","learnMlTitle":"机器学习 | 学习","learnMlDescription":"机器学习从入门到实战：KNN、线性与逻辑回归、决策树、集成、K均值、交叉验证、推荐系统。按章学习。","learnMlKeywords":"机器学习, KNN, 线性回归, 逻辑回归, 决策树, 集成, K均值, 交叉验证, 推荐系统, 机器学习课程","learnMidMlTitle":"中级机器学习 | 学习","learnMidMlDescription":"面向实务数据的前处理（缩放、编码、缺失值填补）、PCA、SVM、提升基础、DBSCAN·GMM·异常检测、管道与超参数调优，按章学习。","learnMidMlKeywords":"中级机器学习, 缩放, 编码, 缺失值, PCA, SVM, 提升, AdaBoost, GBM, DBSCAN, GMM, 管道, Optuna","learnAdvDlTitle":"进阶深度学习 | 学习","learnAdvDlDescription":"从Transformer、BERT、GPT、FlashAttention、ViT、自监督学习、提示工程、LoRA、QLoRA、RLHF、DPO、RAG、LLM智能体、GNN、XAI、自编码器、VAE、GAN、扩散、VLM、语音、知识蒸馏到部署，按章学习大模型与生成式AI。","learnAdvDlKeywords":"进阶深度学习, Transformer, BERT, GPT, FlashAttention, ViT, LoRA, QLoRA, RLHF, DPO, RAG, LLM智能体, GNN, Grad-CAM, VAE, GAN, 扩散模型, Stable Diffusion, CLIP, Whisper, 知识蒸馏, TensorRT, vLLM","learnMidDlTitle":"中级深度学习 | 学习","learnMidDlDescription":"从权重初始化、Adam、学习率调度、正则化、批/层归一化、数据增强、CNN、池化、ResNet、轻量CNN、迁移学习、目标检测、图像分割、分词、词嵌入、1D CNN、RNN、LSTM、GRU、编码器-解码器、注意力，按章学习稳定训练与非结构化数据处理。","learnMidDlKeywords":"中级深度学习, 权重初始化, Xavier, He, Adam, RMSprop, 学习率调度, 正则化, Dropout, 批归一化, 层归一化, 数据增强, CNN, 池化, ResNet, MobileNet, 迁移学习, YOLO, SSD, U-Net, 分词, BPE, Word2Vec, GloVe, RNN, LSTM, GRU, 注意力","learnMidMathTitle":"进阶数学 | 学习","learnMidMathDescription":"向量·矩阵·线性变换·特征值·梯度·雅可比·海森·泰勒·凸优化·条件概率·贝叶斯·协方差·多元正态·MLE·熵·交叉熵，按章学习处理多变量与不确定性的进阶数学。","learnMidMathKeywords":"进阶数学, 向量空间, 内积, 矩阵, 线性变换, 逆矩阵, 行列式, 秩, 特征值, 特征向量, 梯度, 雅可比, 海森, 泰勒级数, 凸优化, 条件概率, 贝叶斯定理, 协方差, MLE, 熵, KL散度","learnAdvMathTitle":"高级数学 | 学习","learnAdvMathDescription":"SVD、张量、拉格朗日、马尔可夫、蒙特卡洛、MCMC、EM、MAP、变分推断、Wasserstein、MDP、傅里叶、图拉普拉斯、SDE、朗之万、信息几何等，按章学习支撑生成模型与深度优化的高级数学。","learnAdvMathKeywords":"高级数学, SVD, 伪逆, 张量, 拉格朗日, KKT, 马尔可夫, 蒙特卡洛, MCMC, EM, MAP, 变分推断, Wasserstein, MDP, 贝尔曼, 傅里叶, 图拉普拉斯, SDE, 朗之万, 得分匹配, 信息几何","learnAdvMlTitle":"高级机器学习 | 学习","learnAdvMlDescription":"特征工程、PCA、t-SNE、SVM、核方法、提升、XGBoost、不平衡数据、异常检测、DBSCAN、GMM、超参数调优、交叉验证、XAI、SHAP、时间序列、推荐系统：面向非线性、复杂数据、优化与可解释性的高级机器学习，按章学习。","learnAdvMlKeywords":"高级机器学习, 特征工程, PCA, t-SNE, UMAP, SVM, 核, 提升, XGBoost, LightGBM, SMOTE, 异常检测, DBSCAN, GMM, 超参数, Optuna, XAI, SHAP, LIME, 时间序列, ARIMA, Prophet, 矩阵分解, FM","playgroundTitle":"迷你神经网络乐园","playgroundDescription":"在浏览器中绘制并探索神经网络结构。","communityTitle":"IT新闻","communityDescription":"了解 AI·IT 最新资讯与开发动态。新帖持续更新，可通过搜索发现。","communityKeywords":"IT新闻, AI新闻, 人工智能新闻, 机器学习, 深度学习, LLM, AI开发动态, 科技新闻","studiesTitle":"学习小组","studiesDescription":"深度学习学习小组与学习资源。","curriculumTitle":"读书","curriculumDescription":"创建与分享基于书籍的学习路线与读书。","supportTitle":"支持与联系","supportDescription":"姆豆AI使用说明、Chrome扩展、学习与社区相关咨询及支持信息。","privacyTitle":"隐私政策","privacyDescription":"姆豆AI个人信息的收集、使用与保管说明。","termsTitle":"服务条款","termsDescription":"姆豆AI服务条款。","refundTitle":"退款政策","refundDescription":"姆豆AI「学习」付费订阅退款政策。","aboutTitle":"姆豆AI是什么？","aboutDescription":"AI研究者打造的基础数学·深度学习教育平台。基于K联赛AI竞赛3名、金融AI挑战赛22名等经历，传递基础理解的重要性。"},"support":{"title":"支持与联系","intro":"关于姆豆AI（mdooai.com）的使用方法、错误反馈与建议，请参考以下内容。","serviceTitle":"服务介绍","serviceContent":"姆豆AI是帮助从本质理解深度学习与AI的教育平台。提供学习（分章可视化，部分章节付费订阅）、读书（基于书籍的路线）、社区（学习资料分享）、Chrome扩展（新标签页打开学习页）等服务。","extensionTitle":"Chrome扩展","extensionContent":"点击工具栏图标即可在新标签页中打开学习页面（https://mdooai.com/learn）。安装与使用问题可通过本支持页或Chrome网上应用店扩展页面联系我们。","extensionInstallCta":"在Chrome网上应用店安装","contactTitle":"联系我们","contactContent":"服务相关的咨询、错误反馈与建议，请通过mdooai.com站内联系或公开联系方式发送。我们将尽快回复。","linksTitle":"相关链接","learnLink":"学习","privacyLink":"隐私政策","termsLink":"服务条款","refundLink":"退款政策","supportUrlLabel":"支持URL"},"about":{"title":"姆豆AI是什么？","intro1":"您好。我是AI研究者李钟贤。我攻读计算机工程，目前在延世大学人工智能硕士课程中研究机器学习和深度学习。","intro2":"我参加过多种AI竞赛，并亲自开发过企业使用的各类模型。在这一过程中得到一个重要体会：技巧固然重要，但决定性能差异的关键在于对基础的理解。如今虽可用vibe coding快速实现模型，但当性能未达预期时，分析原因并改进仍非易事。若缺乏数学基础与对AI原理的理解，便难以从结构上把握瓶颈出在哪里。","intro3":"","intro4Before":"因此，我根据自己学习整理的内容，独立开发并公开了这套学习平台。如需讲座或培训，欢迎随时通过 ","intro4After":" 联系，我会为您介绍。","curriculumTitle":"课程构成","curriculumIntro":"平台由从基础数学到深度学习核心结构的阶梯式课程构成。","part1Title":"📘 Part 1. 基础数学与AI","part1Ch0":"Ch.00 基础数学与AI：学习AI的语言","part1Ch1":"Ch.01 函数：连接输入输出的AI基本单位","part1Ch2":"Ch.02 指数与指数函数：成长与激活的数学","part1Ch3":"Ch.03 对数函数：乘法变加法、设计损失的语言","part1Ch4":"Ch.04 极限与ε-δ：定义「无限接近」","part1Ch5":"Ch.05 连续性：无断点的曲线，打开微积分之门","part1Ch6":"Ch.06 微分与导数：瞬时斜率，学习的指南针","part1Ch7":"Ch.07 链式法则：解开嵌套函数，反向传播的核心","part1Ch8":"Ch.08 偏导数与梯度：多变量世界，梯度下降的方向","part1Ch9":"Ch.09 积分：面积与累积，通往概率的桥梁","part1Ch10":"Ch.10 随机变量与概率分布：用数字承载不确定性","part1Ch11":"Ch.11 均值与方差：分布的中心与离散","part1Ch12":"Ch.12 均匀分布与正态分布：从初始化到预测","part2Title":"📗 Part 2. 深度学习结构理解","part2Ch0":"Ch.00 深度学习第一步：AI如何思考？","part2Ch1":"Ch.01 向量内积：在数据间找相似","part2Ch2":"Ch.02 矩阵乘法：一次性计算的魔法","part2Ch3":"Ch.03 线性层：决定重要性的权重","part2Ch4":"Ch.04 激活函数：为AI增添判断力","part2Ch5":"Ch.05 人工神经元：汇集信息、发送信号的单位","part2Ch6":"Ch.06 批处理：批量学习","part2Ch7":"Ch.07 权重连接：构成智能的无数链条","part2Ch8":"Ch.08 隐藏层：看不见的思考深度","part2Ch9":"Ch.09 深度神经网络：解决更复杂问题的能力","part2Ch10":"Ch.10 宽度与神经元：一次发现更多特征","part2Ch11":"Ch.11 Softmax：将结果转化为置信","part2Ch12":"Ch.12 梯度与反向传播：从错误中学习","part2Ch13":"Ch.13 总览：一眼看懂AI地图","curriculumNote":"不是简单概念罗列，而是按运算流程逐步跟随，理解「为何这样运作」。以可视化与交互为核心。","approachTitle":"学习方式","approachContent":"不是罗列概念总结，而是按运算流程逐步跟随，理解「为何这样运作」。以可视化与交互为核心，可直接计算并通过AI教练即时反馈纠正误解。","roadmapTitle":"未来计划","roadmapContent":"计划持续扩展包括机器学习在内的各类AI教育内容。感兴趣的朋友欢迎随时通过 ","roadmapContactAfter":" 联系为盼。","feedbackNote":"尚属早期版本，但持续改进中。欢迎反馈，将积极采纳。","ctaLearn":"开始学习","ctaDeveloper":"查看开发者简介","chromeExtensionTitle":"添加到Chrome网上应用店","chromeExtensionDesc":"安装Chrome扩展后，可在新标签页中直接打开学习页面。"},"terms":{"title":"服务条款","effectiveDate":"生效日期：2026年3月2日（修订时将在本页公布）。","intro":"感谢使用姆豆AI（mdooai.com）。本条款适用于您对服务的使用。","section1Title":"1. 适用范围","section1Content":"本条款适用于姆豆AI网站及相关服务（学习、读书、社区等）。仅学习部分章节为付费订阅。使用服务即视为同意本条款。","section2Title":"2. 服务使用","section2Content":"注册或登录后即可使用服务。学习含免费与付费订阅章节，读书、社区等其余服务免费。学习的付费与退款条件见结算及退款政策页。","section3Title":"3. 禁止行为","section3Content":"禁止盗用他人账户、干扰服务、违反法律或未经授权的商业性复制等。违规可能导致使用受限。","section4Title":"4. 条款变更","section4Content":"条款变更时将在本页公布；重大变更将注明生效日期。变更后继续使用即视为接受新条款。","section5Title":"5. 联系我们","section5Content":"关于本条款或服务使用的咨询，请通过mdooai.com或站内支持/联系与我们联系。","termsUrlLabel":"服务条款URL"},"refund":{"title":"退款政策","effectiveDate":"生效日期：2026年3月2日（修订时将在本页公布）。","intro":"姆豆AI「学习」付费订阅为按月订阅，每月4 USD。本政策说明支付与退款事宜。","section1Title":"1. 订阅费与支付","section1Content":"学习付费订阅费为每月4 USD，自付款日起每月自动续期并扣款。支付由Paddle等支付服务商处理，将按结账时显示的金额、货币与计费周期收费。","section2Title":"2. 退款","section2Content":"若首次付款日起7日内对服务不满意，可申请全额退款。超过7日或自第二次付款起，当月已使用部分不予退款。请通过站内支持/联系或Paddle客服申请退款。","section3Title":"3. 取消订阅","section3Content":"可随时取消订阅。取消后当月仍可继续使用学习付费章节至期末，下一计费日起不再扣款。已支付的当月费用不予退款。","section4Title":"4. 适用与联系","section4Content":"退款与取消流程以付款时适用的政策及Paddle政策为准。退款、支付或取消相关问题，请使用mdooai.com支持页或Paddle客服。","refundUrlLabel":"退款政策URL"},"privacy":{"title":"隐私政策","effectiveDate":"生效日期：2026年3月2日（修订时将在本页公布）。","section1Title":"1. 适用范围","section1Content":"本隐私政策适用于姆豆AI（mdooai.com）网站及相关服务（学习、读书、社区、Chrome扩展等）。仅学习部分章节为付费订阅。","section2Title":"2. 收集的信息","section2Intro":"使用服务时，我们可能会收集并使用以下信息。","section2List1":"账户信息：注册、登录时的邮箱、密码、显示名等","section2List2":"使用记录：学习进度、社区发帖与评论、读书路线等","section2List3":"设备与环境：浏览器、访问日志等（用于服务改进与安全）","section2List4":"学习付费与订阅信息：支付由Paddle等支付服务商处理，我们不保存卡号。学习的订阅与支付记录用于付费章节提供及退款、取消处理。","section2Extension":"Chrome扩展不收集或传输用户数据，仅在点击图标时于新标签页打开学习页。","section3Title":"3. 信息使用目的","section3Content":"所收集信息用于提供服务与改进、用户咨询回复、安全与反欺诈及法律合规等。","section4Title":"4. 保存与删除","section4Content":"个人信息在达成使用目的或法定保存期限届满后安全删除。用户请求删除或注销时，将按既定程序处理。","section5Title":"5. 第三方提供","section5Content":"未经用户同意，不会向第三方出售或提供个人信息。仅在法律要求或用户同意的情况下可能提供。","section6Title":"6. 政策变更","section6Content":"隐私政策变更时将更新本页并予以说明。重大变更将注明生效日期并公布。","section7Title":"7. 联系我们","section7Content":"关于个人信息处理的咨询，请通过mdooai.com或站内联系与我们联系。","privacyUrlLabel":"隐私政策URL"},"common":{"appName":"姆豆AI","headerBrand":"I am Doo AI","loading":"加载中…","close":"关闭","back":"返回","backToHome":"← 首页","chapterSelect":"选择章节","chapterSearchNoResults":"没有找到结果。","chapterListEmpty":"暂无章节。","chapters":"学习","curriculum":"读书","community":"社区","itNews":"IT新闻","language":"语言","openMenu":"打开菜单","closeMenu":"关闭菜单","menu":"菜单","communityComingSoon":"社区专区正在准备中。","searchPlaceholder":"搜索章节、概念…","globalSearchPlaceholder":"搜索全部章节…","globalSearchNoResults":"没有找到结果。","answer":"答案","wrongAnswerGuideButton":"为什么错了？","signIn":"登录","signUp":"注册","myAccount":"我的账户","signOut":"退出登录","aboutLink":"姆豆AI是什么？","myAchievements":"我的成就","moreServices":"更多","allServices":"全部服务"},"community":{"title":"IT新闻","subtitle":"了解 AI·IT 最新资讯与开发动态。","allPosts":"全部帖子","viewFullCommunity":"查看全部社区","sortNewest":"最新","sortOldest":"最早","newPost":"新帖","createPost":"发帖","uploadMaterial":"上传资料","uploadTitle":"标题","category":"分类","categoryAll":"全部","categoryPlaceholder":"选择分类","category_ai_news":"AI 新闻","category_ai_basics":"AI 基础","category_machine_learning":"机器学习","category_deep_learning":"深度学习","category_nlp":"自然语言处理","category_computer_vision":"计算机视觉","category_llm":"大语言模型","category_prompt_engineering":"提示工程","category_ai_ethics":"AI 伦理","category_ai_tools":"AI 工具","category_study_material":"学习资料","priceTypeFree":"免费","priceTypePaid":"付费","price":"金额","pricePlaceholder":"例：100元","uploadTitlePlaceholder":"例：内积练习表","uploadDescription":"说明","uploadDescriptionPlaceholder":"请描述资料内容与使用方式。","uploadFile":"附件（选填）","uploadSubmit":"发布","uploading":"发布中…","download":"下载","postedAt":"发布于","noPosts":"暂无帖子。来发第一篇吧！","searchPlaceholder":"搜索标题或说明","prevPage":"上一页","nextPage":"下一页","pageOf":"第 {current} / {total} 页","scrollToTop":"回到顶部","signInToPost":"请先登录后再上传资料。","errorLoad":"加载帖子失败。","errorPublish":"发布失败，请重试。","errorPriceRequired":"付费时请填写金额。","backToFeed":"返回动态","postedAnUpdate":"发布了动态","postLabel":"帖子","inThisPost":"本贴中出现","replyPlaceholder":"回复 {name} 的帖子","replyComingSoon":"回复功能即将推出。","errorPostNotFound":"找不到该帖子。","deletePost":"删除帖子","deleteConfirm":"确定要删除这篇帖子吗？","errorDelete":"删除失败。","editPost":"编辑帖子","comments":"评论","commentPlaceholder":"写评论","commentSubmit":"发送","commentSubmitting":"发送中…","commentEdit":"编辑","commentDelete":"删除","commentDeleteConfirm":"确定要删除这条评论吗？","commentCancel":"取消","commentSave":"保存","noComments":"暂无评论。","errorComment":"评论发送失败。","errorCommentEdit":"更新失败。","errorCommentDelete":"删除失败。","removeFile":"移除","editForbidden":"您没有编辑权限。","backToPost":"返回帖子","currentFile":"当前","removeFileLabel":"移除附件"},"curriculum":{"title":"读书","listTitle":"读书","listSubtitle":"创建与分享基于书籍的学习路线，浏览推荐读书。","createNew":"新建读书","newTitle":"创建读书","subtitle":"搜索教材，按此学习路线即可达成学习目标的读书。","searchBooks":"搜索书籍","autocompleteLabel":"自动完成","searchResults":"从搜索结果中选择","searchResultsEmpty":"搜索书籍后结果会显示在这里。","requiredBookTitle":"请输入书名。（必填）","aiAutoLabel":"AI 自动生成","generateHint":"输入书名后点击按钮，AI 将自动生成学习路线。","generateWithAI":"AI 自动生成读书","fillRequiredToGenerate":"输入书名后即可使用此按钮。","resultEmptyHint":"点击上方「AI 自动生成读书」后，内容会显示在此。可编辑后保存。","requiredToSave":"请同时填写书名和读书内容后再保存。","searchPlaceholder":"按书名、作者、主题搜索…","searchButton":"搜索","searching":"搜索中…","noBooks":"暂无结果，请换其他关键词。","selectBook":"用此书生成读书","editBookInfo":"书籍信息（可编辑）","searchOrManualHint":"可搜索书籍选择，或在下栏直接填写。没有对应书籍时仅填书名也可生成读书。","bookTitle":"书名","bookTitlePlaceholder":"例：深度学习入门","bookImageUrl":"封面图片 URL","isbnPubdate":"ISBN / 出版日期","bookInfo":"书籍信息","bookDescription":"书籍介绍","isbn":"ISBN","pubdate":"出版日期","generating":"正在生成读书…","generateError":"读书生成失败，请重试。","searchError":"书籍搜索失败。","optionalRequest":"附加要求（选填）","optionalRequestPlaceholder":"例：面向初学者、2周课程、侧重理解ML…","resultTitle":"生成的学习路线","shortDescription":"简短说明（在列表中显示）","shortDescriptionPlaceholder":"例：从基础到进阶的阶段性学习路线","shortDescriptionHint":"在列表中作为预览显示。留空则使用正文摘要。","editCurriculum":"可编辑下方内容后保存。","save":"保存","saving":"保存中…","saveSuccess":"已保存。","saveError":"保存失败。","signInToSave":"请先登录后再保存。","author":"作者","publisher":"出版社","sortNewest":"最新","sortOldest":"最早","sortPopular":"推荐","curriculaSearchPlaceholder":"搜索标题或摘要","prevPage":"上一页","nextPage":"下一页","pageOf":"第 {current} / {total} 页","scrollToTop":"回到顶部","noCurricula":"暂无已保存读书。去创建一个吧！","notFound":"找不到该读书。","like":"推荐","likes":"推荐数","createdBy":"开设者","anonymous":"匿名","edit":"编辑","delete":"删除","deleteConfirm":"确定要删除此读书吗？","editCurriculumMenu":"菜单","editTitle":"编辑读书","cancel":"取消","backToCurriculum":"返回读书","backToDetail":"返回详情","editForbidden":"仅作者可编辑。"},"auth":{"loading":"加载中…","signIn":{"title":"登录","subtitle":"请输入邮箱或用户名和密码。","identifierLabel":"邮箱或用户名","identifierPlaceholder":"输入邮箱或用户名","passwordLabel":"密码","passwordPlaceholder":"输入密码","submit":"继续","submitting":"登录中…","noAccount":"还没有账号？","signUpLink":"注册"},"signUp":{"title":"创建账号","subtitle":"请填写以下信息完成注册。","usernameLabel":"用户名","usernamePlaceholder":"4～64 个字符，仅限英文字母与数字","usernameRules":"4～64 个字符，仅支持拉丁字母。不可使用特殊字符 ^ $ ! . ` # + ~。","emailLabel":"邮箱地址","emailPlaceholder":"输入邮箱地址","passwordLabel":"密码","passwordPlaceholder":"输入密码","submit":"继续","submitting":"处理中…","hasAccount":"已有账号？","signInLink":"登录"},"verifyEmail":{"title":"邮箱验证","subtitleSignIn":"请输入发送到您邮箱的验证码。","subtitleSignUp":"请输入发送到您邮箱的验证码。","codeLabel":"验证码","codePlaceholder":"输入验证码","submit":"确认","submitting":"验证中…","verifyButton":"验证","back":"上一步","backSignIn":"其他方式登录"},"errors":{"generic":"请求处理失败，请重试。","username_length":"用户名需为 4～64 个字符。","username_non_number":"用户名需包含至少一个非数字字符（如英文字母）。","username_latin_only":"用户名仅支持英文字母。注册后可在账户中设置中文显示名。","password_length":"请确认密码长度要求。","form_identifier_exists":"该邮箱或用户名已被使用。","form_identifier_not_found":"未找到匹配的账号。","form_password_incorrect":"密码错误。","form_code_incorrect":"验证码错误。","form_password_compromised":"检测到密码安全问题，请使用邮箱验证等其他方式登录。","user_locked":"登录已暂时锁定，请稍后再试。","display_name_min_length":"显示名至少需要4个字符。"}},"landing":{"heroTitle":"轻松学 AI 的地方","heroSubtext":"一步一步，扎实学习。","heroTagline":"人人学 AI 的地方。","forEveryone":"从概念到计算，动手练、即时反馈，助你成长的 AI 教育平台。","heroCurriculum":"创建并与其他学习者分享基于书籍的学习路线。","heroCommunity":"在社区中分享与下载 AI 学习资料。","ctaAbout":"姆豆AI是什么？","ctaExplore":"开始深度学习","ctaMath":"开始数学","ctaMl":"开始机器学习","ctaBrowse":"浏览读书","ctaBrowseCommunity":"浏览社区","trendingLabel":"快捷入口","homeOfTitle":"AI 学习中心","homeOfSubtitle":"循序渐进地发现、动手练习、在 AI 反馈中学习。","featurePlatformTitle":"学习平台","featurePlatformDesc":"按章节学习基础数学、深度学习与机器学习，无限制地一起学习。","featureFasterTitle":"更快成长","featureFasterDesc":"概念梳理、练习题与 AI 即时反馈，助你理解更透彻。","featureExploreTitle":"从基础到进阶","featureExploreDesc":"基础数学、深度学习、机器学习循序渐进。持续根据反馈改进中。","featureBadgeTitle":"成就与证明","featureBadgeDesc":"完成章节即可获得成就并申请修业证明。","featurePortfolioTitle":"一起成长","featurePortfolioDesc":"分享学习、获取最新开发动态，与其他学习者交流。","signUpCta":"注册","problemTitle":"为什么要自己动手算？","problemBody":"只调 API 的话，很难解释模型为什么给出那样的结果。\n\n内积、矩阵乘法、梯度——不亲手算一遍，就很难抓住性能为什么下降、哪里出了错。\n\n多数读书只展示结果和公式，很少让你有机会一步步验算。","solutionSectionLabel":"这样学","solutionTitle":"轻松学概念、做题练习。卡住了可以问 AI","solutionIntro":"从内积、矩阵乘法到梯度，深度学习核心计算，12 章系统掌握。","solutionList":"每章有概念梳理和练习题。做错或卡住时可以向 AI 提问。","solutionBody":"有疑问或做错时，可以向 AI 教练提问。","ctaStartLearning":"开始学习深度学习","globalPlatform":"韩·英·日·中","learnShortDesc":"12章从内积到梯度：概念、习题与即时批改。","heroImageAlt":"AI学习背景","dlCardTitle":"基础深度学习","advMathCardTitle":"高级数学","learnAdvMathShortDesc":"SVD、张量、马尔可夫、MCMC、变分推断、Wasserstein、SDE、信息几何等。按章学习支撑生成模型与深度优化的高级数学。","ctaAdvMath":"高级数学","advMlCardTitle":"高级机器学习","learnAdvMlShortDesc":"特征工程、PCA、SVM、提升、XGBoost、不平衡、异常检测、DBSCAN、XAI、SHAP、时间序列、推荐系统等。按章学习高级机器学习。","ctaAdvMl":"高级机器学习","mlCardTitle":"基础机器学习","learnMlShortDesc":"从数据与特征、KNN、线性与逻辑回归到推荐系统。按章节学习基础机器学习核心。","midDlCardTitle":"中级深度学习","learnMidDlShortDesc":"从权重初始化、Adam、正则化、CNN、ResNet、迁移学习、目标检测、分词、RNN、LSTM、注意力。按章学习稳定训练与非结构化数据。","ctaMidDl":"中级深度学习","advDlCardTitle":"进阶深度学习","learnAdvDlShortDesc":"从 Transformer、BERT、GPT、LoRA、QLoRA、RLHF、RAG、智能体、GAN、扩散、VLM、知识蒸馏到部署。按章学习大模型与生成式 AI。","ctaAdvDl":"进阶深度学习","learnMathShortDesc":"从函数、向量、矩阵到均匀与正态分布。打好理解 AI 的基础。","mathCardTitle":"基础数学","midMathCardTitle":"进阶数学","learnMidMathShortDesc":"向量·矩阵·线性变换·特征值·梯度·雅可比·海森·凸优化·贝叶斯·MLE·熵。按章学习多变量与不确定性的数学。","ctaMidMath":"进阶数学","quickAccessTitle":"数学 · 深度学习 · 机器学习","curriculumShortDesc":"以书籍为基础设计专属学习路线，与其他学习者一起成长。","communityShortDesc":"分享 AI·深度学习资料，发布最新开发动态，与学习者交流的空间。","itNews":"IT新闻","itNewsShortDesc":"了解 AI·IT 最新资讯与开发动态。","coupangBannerText":"在酷澎发现丰富商品"},"home":{"introButton":"服务介绍","intro":"面向初学者的AI教育平台，帮助你在概念和公式前不卡壳。动手计算，通过AI教练的反馈纠正误解，逐步理解AI如何学习和推理。","problem":"题目","problemPrompt":"求下列向量的内积 __DOT_FORMULA__ 。","problemPromptMatrix":"求下列矩阵积 __MATRIX_AB__ 中空格(?)处应填的数。","problemPromptLinearLayer":"求下列线性层 __LINEAR_FORMULA__ 中空格(?)处应填的数。","problemPromptActivation":"根据给定的激活函数（Sigmoid、ReLU、Tanh₃）求 X 对应的 Y，并填入空格(?)处。","problemPromptArtificialNeuron":"人工神经元：根据指定的激活函数（ReLU、Sigmoid、Tanh）得到 Y，并填入空格(?)处。","problemPromptBatch":"在批运算（权重乘加偏置、加、减、乘、减均值、求和、平均等）中填入空格(?)处。","prev":"上一题","next":"下一题","inputSectionTitle":"解题输入","askSectionTitle":"提问","practicePadTitle":"练习本","fabMenuLabel":"提问菜单","practicePadSeeMain":"请在主界面做题。","drawMode":"手写输入","keyboardMode":"键盘输入","drawHint":"在下方区域手写作答。写完后点击「AI批改」即可获得反馈。","keyboardHint":"在下方输入你的解答或答案。输入后点击「AI批改」即可获得反馈。","askDrawHint":"在下方手写输入你的疑问。写完后点击「提问」即可获得回答。","askKeyboardHint":"在下方输入你的疑问。点击「提问」即可获得回答。","askPlaceholder":"例如：这个公式为什么是这样？","askSubmit":"提问","asking":"发送中…","askResponseTitle":"回答","drawQuestionLabel":"（用图画提问）","askEmptyAlert":"请先画出或输入你的问题，再点击「提问」。","errorAsk":"提交问题时出错，请重试。","errorAskRequest":"提问请求失败","askErrorEmptyQuestion":"请画出或输入您的问题。","solutionErrorNoContent":"无法生成解答。","solutionErrorServer":"生成解答时发生错误。","ariaAskInput":"输入问题","placeholder":"输入解题过程或最终答案。例如：a·b = 3×5 = 15","ariaKeyboardInput":"键盘输入作答","clear":"清除","grade":"AI批改","gradeShort":"批改","grading":"批改中…","correctAnswer":"答对了！","wrongAnswer":"答错了，请再试一次。","tryAgain":"请再试一次。","checkAnswer":"确认答案","chapterCompleteTitle":"章节完成！","chapterCompleteBadge":"获得 {chapterName} 成就","chapterCompleteLoginHint":"登录后本章将自动记为已完成，无需再次答题。","chapterCompleteSignInCta":"登录并保存完成记录","chapterCompleteTryAgain":"再练一次","chapterCompleteNextChapter":"下一章","badgeSaved":"成就已保存。","certificateTitle":"修业证明","certificateSubtitlePrefix":"兹证明下列人员在姆豆AI（https://mdooai.com）学习课程中完成以下项目 ","certificateSubtitleEnd":"。","certificateHolder":"持证人","certificateHolderEditHint":"可直接输入姓名。","certificateHolderModalTitle":"请输入持证人姓名","certificateHolderModalConfirm":"确认","certificateHolderModalPrint":"打印","certificateHolderEdit":"修改","certificateCompleted":"完成项目","certificateIssuer":"签发方","certificateIssuerName":"姆豆AI","certificateIssuerUrl":"https://mdooai.com","certificateDate":"签发日期","certificatePrint":"打印证明","certificateNoBadges":"暂无完成章节。完成章节后可申请证明。","certificateSignInRequired":"请登录后申请证明。","certificateIssue":"申请证明","profileTitle":"我的学习","profileBadgesSection":"已获成就","profileNoBadges":"暂无完成章节。","profileCertificateLink":"申请修业证明","profileMyBadges":"我的成就","profileBadgesCta":"查看我的成就 / 申请证明","badgesPageTitle":"我的成就与证明","badgesPageDesc":"查看已完成的章节成就与修业证明。","badgesAdminMode":"(管理员预览)","badgesAdminModeDesc":"显示全部成就，打印时输出完整证明。","mathFunctionsProblemPrompt":"设 f(x) = ax + b，填入空白(?)处。","mathFunctionsProblemPromptInput":"设 f(?) = value，求 x 并填入空白。","mathFunctionsProblemPromptCompare":"选择较大的一方并输入1或2。","mlKnnProblemPrompt":"请先阅读下方说明，求出答案后填入空白(?)处。","mlLinearRegressionProblemPrompt":"请先阅读下方说明，求出答案后填入空白(?)处。","mlLinearRegressionProblemPromptPredict":"线性回归模型 $\\hat{y} = w x + b$ 中 $w={w}$、$b={b}$ 时，求 $x={x}$ 对应的预测值 $\\hat{y}$，以整数作答。","mlLinearRegressionProblemPromptSlope":"求过点 ({x1}, {y1}) 与 ({x2}, {y2}) 的直线斜率 $w = \\frac{y_2-y_1}{x_2-x_1}$，以整数作答。","mlLinearRegressionProblemPromptIntercept":"斜率为 $w={w}$ 的直线过点 ({x}, {y})，求截距 $b = y - w x$，以整数作答。","mlLinearRegressionProblemPromptTwoPointPredict":"过点 ({x1}, {y1}) 与 ({x2}, {y2}) 的直线，求 $x={x}$ 时直线上对应的 $y$ 值，以整数作答。","mlLinearRegressionProblemPromptResidual":"用直线 $\\hat{y}={w}x+{b}$ 预测时，实际观测点为 ({x}, {y})，求残差 $y - \\hat{y}$，以整数作答。","mlLinearRegressionProblemPromptResidualSum":"点 {points}，直线 $\\hat{y}={w}x+{b}$ 预测，求残差之和 $\\sum_i (y_i - \\hat{y}_i)$，以整数作答。","mlMseProblemPrompt":"阅读下列说明并求出答案，在空白(?)处填入。","mlMseProblemPromptSquaredError":"实际值 $y={y}$、预测值 $\\hat{y}={yHat}$ 时，求误差平方 $(y - \\hat{y})^2$，以整数作答。","mlMseProblemPromptSse":"下列（实际值，预测值）对，求误差平方和 $\\sum_i (y_i - \\hat{y}_i)^2$。{pairs} 以整数作答。","mlMseProblemPromptMse":"下列（实际值，预测值）对，求均方误差 MSE $= \\frac{1}{n}\\sum_i (y_i - \\hat{y}_i)^2$。{pairs} 以整数作答。","mlMseProblemPromptMseFromLine":"点 {points}，直线 $\\hat{y}={w}x+{b}$ 预测，求 MSE，以整数作答。","mlMseProblemPromptMissingSquaredError":"MSE $= {mse}$，$n = {n}$，$n-1$ 个误差平方为 {squaredErrors}，求剩余一个误差平方，以整数作答。","mlMseProblemPromptRmse":"MSE $= {mse}$ 时，求 RMSE $= \\sqrt{\\text{MSE}}$，以整数作答。","mlMseProblemSolvingTable":"**解题步骤**\n\n| 项目 | 说明 |\n| :--- | :--- |\n| **残差** | $e_i = y_i - \\hat{y}_i$。单点实际值与预测值之差。 |\n| **平方误差** | $(y - \\hat{y})^2$。单点损失。 |\n| **SSE**（平方误差和, Sum of Squared Errors） | $\\sum_i (y_i - \\hat{y}_i)^2$。各点平方误差之和。 |\n| **MSE**（均方误差, Mean Squared Error） | $\\frac{1}{n}\\sum_i (y_i - \\hat{y}_i)^2 = \\text{SSE}/n$。平方误差和除以数据个数。 |\n| **RMSE**（均方根误差, Root Mean Squared Error） | $\\sqrt{\\text{MSE}}$。MSE 的平方根。与 $y$ 同单位的平均误差。 |\n\n---\n\n**例1（平方误差）**\n\n实际值 $y=5$，预测值 $\\hat{y}=3$ 时，求 $(y-\\hat{y})^2$。\n\n**解**\n\n残差 $= y - \\hat{y} = 5 - 3 = 2$。平方误差 $= 2^2 = 4$。→ **答案 4**\n\n---\n\n**例2（SSE）**\n\n(实际, 预测) 对为 (4, 3), (6, 5) 时，求 SSE。\n\n**解**\n\n残差 1, 1。平方误差 1, 1。SSE $= 2$。→ **答案 2**\n\n---\n\n**例3（MSE）**\n\n$n=2$ 时 MSE $= \\text{SSE}/n = 2/2 = 1$。→ **答案 1**\n\n---\n\n**例4（由直线求MSE）**\n\n点 (1, 2), (2, 4), (3, 6)，直线 $\\hat{y}=2x$ 预测时求 MSE。\n\n**解**\n\n预测 2, 4, 6；残差 0, 0, 0。平方误差 0, 0, 0。SSE $= 0$，MSE $= 0/3 = 0$。→ **答案 0**\n\n---\n\n**例5（RMSE）**\n\nMSE $= 4$ 时求 RMSE $= \\sqrt{\\text{MSE}}$。\n\n**解**\n\n$\\sqrt{4} = 2$。→ **答案 2**","mlLogisticProblemPrompt":"请阅读下列说明，求出答案并填入空白(?)处。","mlLogisticProblemPromptLinearScore":"逻辑回归的线性分数 $z = wx + b$ 中，当 $w={w}$、$x={x}$、$b={b}$ 时，求 $z$ 的整数值。","mlLogisticProblemPromptMultiScore":"线性分数 $z = w_1 x_1 + w_2 x_2 + b$ 中，权重为 {weights}、特征为 {features}、$b={b}$ 时，求 $z$ 的整数值。","mlLogisticProblemPromptClassifyFromZ":"当线性分数 $z = {z}$ 时，根据决策边界（$z>0 \\Rightarrow \\hat{y}=1$，$z \\le 0 \\Rightarrow \\hat{y}=0$）求预测类别 $\\hat{y}$。（0 或 1）","mlLogisticProblemPromptClassifyFromProb":"当概率 $p = {p}$、阈值 $= {threshold}$ 时，若 $p \\ge$ 阈值则 $\\hat{y}=1$，否则 $\\hat{y}=0$。求预测类别 $\\hat{y}$。（0 或 1）","mlLogisticProblemPromptCountClassOne":"对下列线性分数，$z>0$ 时判为 class 1。求被分为 class 1 的样本个数（整数）。$z$ 列表：{zList}","mlLogisticProblemPromptCountMisclassified":"真实标签为 {labels}，各样本的线性分数 $z$ 为 {zList} 时，按 $\\hat{y}_i = 1$（若 $z_i>0$）否则 $0$ 预测。求误分类样本个数。","mlLogisticProblemSolvingTable":"**解题步骤**\n\n| 项目 | 说明 |\n| :--- | :--- |\n| **线性分数** | $z = w x + b$ 或 $z = w_1 x_1 + w_2 x_2 + b$。权重与特征相乘后相加。 |\n| **Sigmoid** | $\\sigma(z) = \\frac{1}{1+e^{-z}}$。将 $z$ 变为 0～1 的概率。 |\n| **决策边界** | $z>0 \\Rightarrow \\hat{y}=1$，$z \\le 0 \\Rightarrow \\hat{y}=0$。（或 $\\sigma(z)\\ge 0.5$ 时判为 1） |\n| **按概率分类** | 给定概率 $p$ 与阈值：$p \\ge$ 阈值则 $\\hat{y}=1$，否则 0。 |\n| **误分类数** | 各样本中预测 $\\hat{y}_i$ 与真实标签 $y_i$ 不同的个数。 |\n\n---\n\n**例1（线性分数）**\n\n$z = 2 \\times 3 + (-1) = 5$。→ **答案 5**\n\n---\n\n**例2（由 z 分类）**\n\n$z = -2$ 时 $z \\le 0$，故 $\\hat{y}=0$。→ **答案 0**\n\n---\n\n**例3（按概率分类）**\n\n$p=0.7$，阈值 $0.5$ 时 $0.7 \\ge 0.5$，故 $\\hat{y}=1$。→ **答案 1**\n\n---\n\n**例4（class 1 个数）**\n\n$z$ 列表为 $-1, 2, 0, 3$ 时，$z>0$ 的为 2 和 3，共两个。→ **答案 2**\n\n---\n\n**例5（误分类数）**\n\n标签 [1, 0, 1]，$z$ [2, -1, -3]。预测：$z>0$ 为 1，故 [1, 0, 0]。与 [1,0,1] 比较仅第三项不同。→ **答案 1**","mlDecisionTreeProblemPrompt":"阅读下列指示并求出答案，填入空白(?)处。","mlDecisionTreeProblemPromptCountNodes":"决策树中内部节点有 {internal} 个、叶节点有 {leaves} 个时，求节点总数。","mlDecisionTreeProblemPromptCountLeaves":"决策树中叶节点有 {leaves} 个时，求叶节点个数。","mlDecisionTreeProblemPromptTreeDepth":"决策树的最大深度（根=0）为 {depth} 时，求深度值。","mlDecisionTreeProblemPromptFollowPath":"决策树中路径为 {path}（0=否/左，1=是/右）时，求到达的叶节点的预测类别（0 或 1）。","mlDecisionTreeProblemPromptLeafMajority":"某叶节点中类 0 有 {c0} 个、类 1 有 {c1} 个。按多数决求预测类别（0 或 1）。","mlDecisionTreeProblemPromptGini":"类别个数为 {counts} 时，计算基尼不纯度 $G = 1 - \\sum_i p_i^2$，求 $100 \\times G$ 四舍五入后的整数。","mlDecisionTreeProblemPromptEntropy":"类别个数为 {counts} 时，计算熵 $H = -\\sum_i p_i \\log_2 p_i$，求 $100 \\times H$ 四舍五入后的整数。","mlDecisionTreeProblemPromptInformationGain":"父节点类别个数 {parentCounts}、左子 {leftCounts}、右子 {rightCounts} 时，求信息增益(IG)的 $100 \\times \\text{IG}$ 四舍五入后的整数。","mlDecisionTreeProblemPromptWeightedGini":"分割后左子类别个数 {leftCounts}、右子类别个数 {rightCounts} 时，求加权基尼 $(n_L/n)G_L + (n_R/n)G_R$ 的 $100 \\times$ 值四舍五入后的整数。","mlEnsembleProblemPrompt":"阅读下列指示并求出答案，填入空白(?)处。","mlEnsembleProblemSolvingLabel":"解题说明","mlEnsembleProblemPromptMajorityVote":"随机森林中类 0 得 {votes0} 票、类 1 得 {votes1} 票。按多数决求最终预测类别（0 或 1）。","mlEnsembleProblemPromptCountVotes":"共有 {totalTrees} 棵树，类 0 得 {votes0} 票、类 1 得 {votes1} 票。求获胜类别得到的票数。","mlEnsembleProblemPromptRegressionMean":"回归集成中 {B} 棵树的预测分别为 {predictions} 时，计算平均 $\\hat{y} = \\frac{1}{B}\\sum_{b=1}^B \\hat{y}_b$ 并四舍五入为整数。","mlEnsembleProblemPromptNumTrees":"随机森林中有 {B} 棵树时，求树的棵数 $B$。","mlEnsembleProblemPromptOobCount":"共有 {nTrees} 棵树，某样本仅出现在其中 {nInBag} 棵的 bootstrap 中。求该样本未被用于训练的树的棵数（OOB 数）。","mlEnsembleProblemPromptFormulaMean":"集成中 {B} 棵树的预测之和为 {sum} 时，计算平均 $\\hat{y} = \\frac{1}{B}\\sum_{b=1}^B \\hat{y}_b$ 并四舍五入为整数。","mlEnsembleProblemPromptDefinition":"若下列叙述正确则求 1，否则求 0。{statement}","mlEnsembleProblemPromptFeatureImportance":"各特征重要性为 {importances} 时，求重要性最大的特征编号（从 1 开始）。","mlEnsembleProblemPromptWeightedVote":"有 2 棵树：第一棵对类 {c1} 赋权重 {w1}，第二棵对类 {c2} 赋权重 {w2}。求权重较大一方作为最终预测（0 或 1）。","mlEnsembleStatement_0":"装袋中每个基模型独立学习。","mlEnsembleStatement_1":"随机森林是装袋与决策树的结合形成的集成。","mlEnsembleStatement_2":"分类集成中最终预测通常由多数决（投票）决定。","mlEnsembleStatement_3":"提升中对前一个模型判错的样本加重权顺序学习。","mlEnsembleStatement_4":"OOB（Out-of-Bag）指用未参与某样本训练的树对该样本进行预测。","mlEnsembleStatement_5":"堆叠中使用以多个基模型预测为输入的元模型。","mlEnsembleStatement_6":"回归集成的最终预测通常是多棵树预测的平均。","mlEnsembleStatement_7":"随机森林中每次分裂只随机使用部分特征。","mlEnsembleStatement_8":"集成是将多个模型的预测合并为一个预测的方法。","mlEnsembleStatement_9":"随机森林往往比单棵决策树更能降低方差。","mlEnsembleStatement_10":"提升中每个基模型独立学习。","mlEnsembleStatement_11":"回归集成中最终预测由多数决（投票）决定。","mlEnsembleStatement_12":"使用 OOB 评估必须另有验证集。","mlEnsembleStatement_13":"随机森林中每棵树用全部训练数据学习。","mlEnsembleStatement_14":"堆叠的元模型只使用基模型的原始输入特征。","mlEnsembleProblemSolvingTable":"**集成解题指南**\n\n| 类型 | 解法 | 答案形式 |\n| :--- | :--- | :--- |\n| **多数决** | 比较类 0 与类 1 的票数，多的一方为最终预测；同票取 0。 | 0 或 1 |\n| **票数** | 获胜类别得到的票数。 | 整数 |\n| **回归平均** | 预测之和÷树数，必要时四舍五入。 | 整数 |\n| **树数** | 题目给出的 $B$。 | 整数 |\n| **OOB 数** | 总树数 − 该样本参与训练的树数。 | 整数 |\n| **公式平均** | 和÷$B$，四舍五入。 | 整数 |\n| **定义** | 正确为 1，错误为 0。 | 0 或 1 |\n| **特征重要性** | 重要性最大的特征编号（从 1 开始）。 | 整数 |\n| **加权投票** | 权重较大一方的类别为最终预测。 | 0 或 1 |","mlDecisionTreeProblemSolvingTable":"**决策树解题指南**\n\n| 类型 | 解法 | 答案形式 |\n| :--- | :--- | :--- |\n| **节点数** | 内部节点数 + 叶节点数。 | 整数 |\n| **叶数** | 题目给出的叶节点个数。 | 整数 |\n| **深度** | 最大深度（根=0）。 | 整数 |\n| **沿路径** | 从根起 0=左、1=右，叶节点的预测即为答案。 | 0 或 1 |\n| **基尼** | 由类数求 $p_i$，算 $G = 1 - \\sum_i p_i^2$，对 $100 \\times G$ 四舍五入。 | 整数 |\n| **熵** | $H = -\\sum_i p_i \\log_2 p_i$，对 $100 \\times H$ 四舍五入。 | 整数 |\n| **加权基尼** | $(n_L/n)G_L + (n_R/n)G_R$，对 $100 \\times$ 四舍五入。 | 整数 |\n| **叶多数决** | 类 0 有 $a$ 个、类 1 有 $b$ 个时，$a \\ge b$ 则 0，否则 1。 | 0 或 1 |","mathExponentialProblemPrompt":"求指数式的值并填入空白(?)处。","mathExponentialProblemPromptExponent":"求指数(?)并填入空白。","mathExponentialProblemPromptCompare":"选择较大的一方并输入1或2。","mathExponentialProblemPromptProduct":"同底幂相乘：求指数和(?)。","mathExponentialProblemPromptQuotient":"同底幂相除：求指数差(?)。","mathExponentialProblemPromptPowerOfPower":"求幂的幂的值。","mathLogProblemPrompt":"求对数的值并填入空白(?)处。","mathLogProblemPromptInput":"求真数(?)并填入空白。","mathLogProblemPromptCompare":"选择较大的一方并输入1或2。","mathLogProblemPromptSum":"对数和：$\\log_a(b) + \\log_a(c) = \\log_a(b \\cdot c)$。填入空白(?)处。","mathLogProblemPromptDiff":"对数差：$\\log_a(b) - \\log_a(c) = \\log_a(b/c)$。填入空白(?)处。","mathLimitProblemPrompt":"求极限并填入(?)处。（多项式、常数、x→∞、ε-δ 等）","mathLimitProblemPromptDirect":"求多项式的极限并填入(?)处。","mathLimitProblemPromptConstant":"求常数函数的极限。","mathLimitProblemPromptLinear":"求一次式的极限。","mathLimitProblemPromptAtInfinity":"求 x → ∞ 时的极限。","mathLimitProblemPromptEpsilon":"根据 ε-δ 定义输入对应编号。","mathLimitProblemEpsilonQuestion":"ε-δ 中 δ 的含义是？","mathLimitProblemEpsilonHint":"(1=距离, 2=误差)","mathContinuityProblemPrompt":"连续性：求极限或是否连续，并填入 (?)。","mathContinuityProblemPromptLimitPoly":"多项式连续，故极限=函数值。填入 (?)。","mathContinuityProblemPromptLimitLinear":"求一次式的极限（等于函数值）。","mathContinuityProblemPromptYesNo":"该点连续填 1，不连续填 0。","mathContinuityProblemPromptLimitAtHole":"求有洞点处的极限值。","mathContinuityProblemAtPoint":" 在 ","mathContinuityProblemContinuousQ":" 处连续吗？","mathContinuityProblemLimitAtHoleIntro":"在","mathContinuityProblemLimitAtHoleQ":"处有洞的函数的极限值是？","mathDerivativeProblemPrompt":"导数：求给定点处的导数值（切线斜率）并填入 (?)。","mathDerivativeProblemPromptPower":"幂函数求导 $(x^n)' = n x^{n-1}$。求给定点处 $f'(x)$ 的值。","mathDerivativeProblemPromptLinear":"一次函数 $(mx+b)' = m$。求给定点处 $f'(x)$ 的值。","mathDerivativeProblemPromptPoly2":"二次函数求导。求给定点处 $f'(x)$ 的值。","mathDerivativeProblemPromptConstMul":"常数倍·幂函数 $(c \\cdot x^n)' = c \\cdot n \\cdot x^{n-1}$。求给定点处 $f'(x)$ 的值。","mathDerivativeProblemAtPoint":" 时","mathChainRuleProblemPrompt":"链式法则：在给定点求 $f'(x)$ 的值并填入 (?)。（类型：幂、指数、三角、根号、对数、二次式等）","mathPartialGradientProblemPrompt":"偏导数与梯度：在给定函数与点处求偏导数或梯度分量并填入 (?)。","mlKnnProblemSolvingTable":"**解题步骤**\n\n| 步骤 | 说明 |\n| :--- | :--- |\n| **输入** | 新数据的特征向量 $\\mathbf{x}$ |\n| **已存数据** | (特征, 标签) 对 $(\\mathbf{x}_i, y_i)$ |\n| **1** | 计算 $\\mathbf{x}$ 与各 $\\mathbf{x}_i$ 的距离 $d(\\mathbf{x}, \\mathbf{x}_i)$ |\n| **2** | 按距离取最小的 K 个 |\n| **3（分类）** | 用 K 个标签**多数表决**得到预测 |\n| **3（回归）** | 用 K 个值的**平均**作为预测 |\n\n---\n\n**例题（距离平方）**\n\n平面上两点 A(0, 0) 与 B(3, 4)，求距离平方 $(x_2-x_1)^2 + (y_2-y_1)^2$ 的值。\n\n**解答**\n\n$(3-0)^2 + (4-0)^2 = 9 + 16 = 25$，故**答案为 25**。","mlLinearRegressionProblemSolvingTable":"$19","mathIntegralProblemPrompt":"积分：求定积分或原函数值并填入 (?)。","mathIntegralProblemPromptDefiniteConst":"求常数函数的定积分。","mathIntegralProblemPromptDefiniteLinear":"求一次式的定积分。","mathIntegralProblemPromptAntiderivative":"求原函数在给定点处的值。","mathRandomVariableProblemPrompt":"按下列指示作答。","mathRandomVariableProblemPromptProbSumSix":"求空白 c，使三个概率之和为 1。","mathRandomVariableProblemPromptExpectedValueScale6":"求 6×E[X] = Σ(取值×分子)。","mathRandomVariableProblemPromptVarianceShort":"求下列分布的方差的 36 倍。","mathRandomVariableProblemVarianceHowToCalc":"方差 = 取值相对平均的离散程度。方差 = E[X²]−(E[X])²，36×方差 = 6×Σ(nᵢ·xᵢ²) − (Σ nᵢ·xᵢ)²","mathRandomVariableProblemVarianceLabel":"36×方差","mathRandomVariableProblemPromptVarianceScale36":"同一分布中 Var(X)=E[X²]-E[X]²。求 36×Var(X)。（6×Σ(nᵢ·xᵢ²) − (Σ nᵢ·xᵢ)²）","mathRandomVariableProblemPromptVarianceIntro":"同一分布中 ","mathRandomVariableProblemPromptVarianceMid":"。求 ","mathRandomVariableProblemPromptVarianceEnd":"。（6×Σ(nᵢ·xᵢ²) − (Σ nᵢ·xᵢ)²）","mathRandomVariableProblemPromptVarianceAsk":"。","mathRandomVariableProblemPromptVarianceFormula":"（6×Σ(nᵢ·xᵢ²) − (Σ nᵢ·xᵢ)²）","mathRandomVariableProblemProbSumHint":"c","mathRandomVariableProblemExpectationHint":"取值×分子的总和","mathRandomVariableProblemVarianceHint":"36×Var(X)","mathRandomVariableProblemPromptMode":"概率最大的 X 取值（众数）是？","mathRandomVariableProblemPromptExpectedValueInt":"求期望值 E[X]（平均取值）。","mathRandomVariableProblemPromptCumulativeNumerator":"当 X 不超过某值的概率写成 ?/6 时，求 ?（分子）。","mathRandomVariableProblemModeLabel":"概率最大的 X","mathRandomVariableProblemExpectedValueIntLabel":"E[X]","mathRandomVariableProblemCumulativeLabel1":"P(X≤1) = ?/6 → ?","mathRandomVariableProblemCumulativeLabel2":"P(X≤2) = ?/6 → ?","mathMeanVarianceProblemPrompt":"按下列指示作答。","mathMeanVarianceProblemPromptProbSumSix":"求空白 c，使三个概率之和为 1。","mathMeanVarianceProblemPromptMeanScale6":"求 6×E[X] = Σ(取值×分子)。","mathMeanVarianceProblemPromptVarianceShort":"求下列分布的方差的 36 倍。","mathMeanVarianceProblemVarianceHowToCalc":"方差 = 取值相对平均的离散程度。36×方差 = 6×Σ(nᵢ·xᵢ²) − (Σ nᵢ·xᵢ)²","mathMeanVarianceProblemVarianceLabel":"36×方差","mathMeanVarianceProblemPromptVarianceScale36":"同一分布中求 36×Var(X)。","mathMeanVarianceProblemProbSumHint":"c","mathMeanVarianceProblemMeanScale6Label":"6×均值","mathMeanVarianceProblemMeanIntegerLabel":"均值 E[X]","mathMeanVarianceProblemPromptMeanInteger":"求均值（期望）E[X]。","mathMeanVarianceProblemPromptMode":"求概率最大的 X 取值（众数）。","mathMeanVarianceProblemPromptCumulativeNumerator":"当 X 不超过某值的概率写成 ?/6 时，求 ?（分子）。","mathMeanVarianceProblemModeLabel":"概率最大的 X","mathMeanVarianceProblemCumulativeLabel1":"P(X≤1) = ?/6 → ?","mathMeanVarianceProblemCumulativeLabel2":"P(X≤2) = ?/6 → ?","mathUniformNormalProblemPrompt":"请按下列要求计算。","mathUniformNormalProblemPromptUniformMean":"求区间 [a,b] 上均匀分布的均值 (a+b)/2。","mathUniformNormalProblemPromptUniformVar12":"均匀分布 U[a,b] 的 12×方差 = (b−a)²。","mathUniformNormalProblemPromptUniformLength":"求区间 [a,b] 的长度 b−a。","mathUniformNormalProblemPromptNormalPct68":"正态分布中，μ±σ 范围内大约占百分之几？答整数。","mathUniformNormalProblemPromptNormalPct95":"正态分布中，μ±2σ 范围内大约占百分之几？答整数。","mathIntegralProblemAntiderivativeIntro":"已知","mathIntegralProblemAntiderivativeAt":" x = ","mathIntegralProblemAntiderivativeQ":"处的值为？","mathPartialGradientProblemAtPoint":"处","mathPartialGradientProblemGradientFirst":"第一分量","mathPartialGradientProblemGradientSecond":"第二分量","wrongAnswerGuideButton":"为什么错了？","wrongAnswerGuideTitle":"错答引导","wrongAnswerGuideSubmittedAnswer":"您提交的答案：","wrongAnswerGuideHint":"AI 会推断您为何那样解题，并只引导正确方向、不透露答案。","wrongAnswerGuideApiQuestion":"用户做题时提交的答案为「{answer}」，被判为错误。请推断用户可能为何那样解题，并只引导正确方向、不要给出正确答案。","wrongAnswerGuideAsking":"获取引导中…","wrongAnswerQuestionPrompt":"我回答了 {answer}，为什么错了？","getSolution":"查看解题过程","loadingSolution":"加载中…","feedbackTitle":"AI批改反馈","solutionTitle":"解答","alertDrawFirst":"请先手写作答再批改。","alertInputFirst":"请先输入作答再批改。","errorGrade":"批改时出错，请重试。","errorSolution":"加载解答时出错，请重试。","errorGradeRequest":"批改请求失败","errorSolutionRequest":"解答请求失败","errorStream":"无法读取数据流。","errorDefault":"无法生成反馈。","placeholderChapter":"本章节即将上线。","conceptVisualPlaceholder":"该概念的可视化即将上线。","conceptComingSoon":"该概念的学习内容将在后续更新中提供。","conceptMatrixMulIntro":"A的一行 × B的一列（内积）→ 结果矩阵的一个元素","conceptMatrixMulCell":"该元素","conceptLinearLayerIntro":"输入 X 乘以权重矩阵 W 再加偏置 b 得到输出 Y。__LINEAR_FORMULA__","conceptLinearLayerLegendRow0":"W 第1行·X + b[0] → Y[0]","conceptLinearLayerLegendRow1":"W 第2行·X + b[1] → Y[1]","conceptArtificialNeuronIntro":"人工神经元先计算加权和 __WEIGHTED_SUM_FORMULA__ ，再经 ReLU、Sigmoid、Tanh 等激活函数得到输出 Y。","conceptArtificialNeuronCalcCaption":"计算顺序：(W·X) 相乘 + b 相加 = Z → ReLU(Z) = Y","conceptBatchIntro":"将多个样本按列排成矩阵即为批。用同一组 W、b 一次计算 __LINEAR_FORMULA__ 。","conceptBatchCaption":"一列 = 一个样本。同一组 W、b 对所有列一次计算。","conceptBatchExampleTitle":"例：一列（样本）的计算过程","conceptBatchFormulaRow":"Z{n} = (W 第{row}行·该列)+b[{bi}] = ({calc})+({b}) = {result}","conceptConnectionIntro":"连接表示一层中的神经元与下一层神经元如何相连。只有非零权重才有实际连接；下图只画出这些部分连接。","conceptConnectionGraphCaption":"连接结构（权重为0的连接不显示）","conceptConnectionCalcCaption":"每个输出：(W 该行·X) 相乘 + b 相加 = Y","conceptConnectionFormulaRow1":"Y₁ = (W 第1行·X) + b₁ = ({calc}) + {b} = {wx} + {b} = {y}","conceptConnectionFormulaRow2":"Y₂ = (W 第2行·X) + b₂ = ({calc}) + {b} = {wx} + {b} = {y}","conceptActivationTitleSigmoid":"Y = Sigmoid(X)","conceptActivationTitleRelu":"Y = ReLU(X)","conceptActivationTitleTanh":"Y = Tanh₃(X)","conceptActivationTableHeader":"X ~ Y","conceptDotProductIntro":"a = [{a1}, {a2}], b = [{b1}, {b2}] → a·b = {samePositionSum}","conceptDotProductSamePositionSum":"同位置分量乘积之和","problemPromptConnection":"在连接 __LINEAR_FORMULA__ 中，求空白(?)处的值。W 为 0 的输入与该输出无连接。","conceptHiddenIntro":"隐藏层对输入做线性变换(__LINEAR_CORE__)和 ReLU 得到中间表示 H，再做一次线性变换和 ReLU 得到最终输出 Y。","conceptHiddenGraphCaption":"输入 → 隐藏(H) → 输出(Y)","problemPromptHidden":"在带隐藏层的前向传播 X → (W₁·X+b₁) → ReLU → H → (W₂·H+b₂) → ReLU → Y 中填入空白(?)处。","conceptDeepIntro":"深度网络由多个隐藏层堆叠而成。每一层做 Linear(W·输入+b) 和 ReLU，得到中间表示再传入下一层。","conceptDeepFormulaCaption":"每层: Linear & ReLU","conceptDeepFormulaWithSymbols":"线性 = W·(前层输出) + b → ReLU","conceptDeepGraphCaption":"输入(X) → 隐藏(A,B,C,D) → 输出(Y)","problemPromptDeep":"在多层连续前向传播（每层 Linear & ReLU）中填入空白(?)处。","conceptWideIntro":"宽度指一层中神经元数量多。层越宽，能同时表达的特征越多；每层用 Linear & ReLU 计算。","conceptWideFormulaCaption":"每层: Linear & ReLU（层变宽）","conceptWideGraphCaption":"输入(X) → 隐藏(A,B) → 输出(Y) — 1→2→4→8 神经元","problemPromptWide":"在层逐渐变宽的前向传播（每层 Linear & ReLU）中填入空白(?)处。","conceptSoftmaxIntro":"Softmax 把数变成 0～1 之间且和为 1。先算 __WEIGHTED_SUM_FORMULA__，再算 __SOFTMAX_EXP__，再除以总和 __SOFTMAX_SUM__ 就得到类似概率的输出。","conceptSoftmaxFormulaCaption":"Z = W·X + b → e^Z (e≈3) → Y = e^Z / Σ","conceptSoftmaxGraphCaption":"多分类最后一层常用。","problemPromptSoftmax":"按 __SOFTMAX_FLOW__ 顺序计算后填入空白(?)处。","conceptSoftmaxEHint":"本题中为便于计算取 e = 3，即 __E_Z_3Z__。（例：Z=1 → 3，Z=2 → 9）","conceptGradientIntro":"梯度是表示函数变化方向和快慢的向量。要减小损失，就沿梯度反方向更新参数。前向 __GRADIENT_FORWARD__，反向 __GRADIENT_BACKWARD__。","conceptGradientForwardLabel":"前向","conceptGradientBackwardLabel":"反向","conceptGradientFormulaCaption":"前向 Z = W·X → 反向 dZ = dW·X","conceptGradientGraphCaption":"线性层、隐藏层等也用同样方式计算梯度。","conceptGradientBlankHint":"题目中空白(?)出现在**X**的一格或**Z**（前向）/ **dZ**（反向）的一格。","conceptGradientForwardDesc":"前向: Z = W·X（W 每行与 X 的内积）","conceptGradientBackwardDesc":"反向: dZ = dW·X（结构相同，值为梯度）","conceptInputX":"输入 X","conceptLinear":"线性","conceptLinearReLULayer1":"Linear & ReLU（第 1 层）","conceptLinearReLULayer2":"Linear & ReLU（第 2 层）","conceptSoftmaxFlowCaption":"分数(__Z__) → __3Z__ → 除以和 → 概率(__Y__)","conceptSoftmaxZLabel":"Z（分数）","conceptSoftmaxExpLabel":"3^Z","conceptSoftmaxSumLabel":"和","conceptSoftmaxProblemFlow":"分数(__Z__) → __3Z__ → 除以和(__SIGMA__) → 概率(__Y__)","conceptSoftmaxProbability":"概率","conceptSoftmaxExampleTitle":"例：一步计算过程","conceptSoftmaxStepZ":"Z{n} = (W第{row}行·X)+b[{bi}] = {calc}+{b} = {result}","conceptSoftmaxStepExp":"3^Z{n} = 3^{z} = {result}","conceptSoftmaxStepSum":"Σ = {items} = {result}","conceptSoftmaxStepY":"Y{n} = 3^Z{n}/Σ = {num}/{den} = {result}","conceptWideLinearReLU1":"Linear & ReLU（第 1 层，宽度 2）","conceptWideLinearReLU2":"Linear & ReLU（第 2 层，宽度 4）","conceptWideLayer1Formula":"第 1 层（宽度 2）: H = ReLU(W₁·X + b₁)","conceptWideLayer2Formula":"第 2 层（宽度 4）: Y = ReLU(W₂·H + b₂)","conceptMatrixMulCellDot":"A 第{row}行 · B 第{col}列（一次内积）","conceptMatrixMulARow":"A 第{row}行","conceptMatrixMulBCol":"B 第{col}列","conceptBatchLinear":"将表中数字乘权重加偏置后填入空白。","conceptBatchLinearRelu":"乘权重加偏置后，负数变为 0，再填入空白。","conceptBatchAdd":"将每行加上右侧数值后填入空白。","conceptBatchSubtract":"将每行减去右侧数值后填入空白。","conceptBatchMultiply":"将每行乘右侧数值后填入空白。","conceptBatchCenter":"从每行减去该行均值后填入空白。","conceptBatchSum":"求每行数字之和后填入空白。","conceptBatchMean":"求每行数字的平均（整数）后填入空白。","conceptBatchRowMeanHint":"（行均值→0）","conceptBatchRowSumHint":"（行和）","conceptBatchRowMeanIntHint":"（行均值，整数）","conceptRowN":"第{n}行","conceptDeepLayer1Title":"第1层: A₁, A₂, A₃ (W₁ 各行·X + b₁)","conceptDeepLayer2Title":"第2层: B₁, B₂, B₃ (W₂ 各行·A + b₂)","conceptDeepFormulaA":"A{n} = (W₁ {row}·X)+b₁[{bi}] = ({calc})+({b}) = {linear} → ReLU = {result}","conceptDeepFormulaAZero":"A{n} = (W₁ {row}·X)+b₁[{bi}] = ({calc})+({b}) = {linear} → ReLU(-1)=0 → {result}","conceptDeepFormulaB":"B{n} = (W₂ {row}·A)+b₂[{bi}] = ({calc})+({b}) = {linear} → ReLU = {result}","conceptHiddenLayer1Title":"第1层: H = ReLU(W₁·X + b₁)","conceptHiddenLayer2Title":"第2层: Y = ReLU(W₂·H + b₂)","conceptHiddenLinear1":"线性₁","conceptHiddenLinear2":"线性₂","conceptHiddenFormulaL1":"{linearLabel} = (W₁ {row}·X)+b₁[{bi}] = ({calc}) + ({b}) = {linear} → ReLU = {result}","conceptHiddenFormulaL2":"{linearLabel} = (W₂ {row}·H)+b₂[{bi}] = ({calc}) + ({b}) = {linear} → ReLU = {result}","conceptWideFormulaH1":"H₁ = (W₁ {row}·X)+b₁[0] = {calc} = {linear} → ReLU = {result}","conceptWideFormulaH2":"H₂ = (W₁ {row}·X)+b₁[1] = {calc} = {linear} → ReLU = {result}","conceptWideFormulaY1":"Y₁ = (W₂ {row}·H)+b₂[0] = {calc} = {linear} → ReLU = {result}","conceptWideFormulaY2":"Y₂ = (W₂ {row}·H)+b₂[1] = {calc} = {linear} → ReLU = {result}","conceptWideFormulaY3":"Y₃ = (W₂ {row}·H)+b₂[2] = {calc} = {linear} → ReLU = {result}","conceptWideFormulaY4":"Y₄ = (W₂ {row}·H)+b₂[3] = {calc} = {linear} → ReLU = {result}","conceptGradientZLine":"Z{n} = (W {row})·X = {calc} = {z}","conceptGradientDZLine":"dZ{n} = (dW {row})·X = {calc} = {dz}","problemPromptGradient":"在 __GRADIENT_FORWARD__ 或 __GRADIENT_BACKWARD__ 中填入空白(?)处。","tinyNNTitle":"按章节的深度学习图示","tinyNNDescription":"每完成一章，下方图示会逐步填满。这是目前的结构。","tinyNNComplete":"到最后一章，你会看到完整流程：前向 → 损失 → 反向 → 更新。","tinyNNAriaLabel":"按章节的深度学习图示进度","mathDiagramTitle":"按章节的数学图示","mathDiagramDescription":"选择章节后，下方图示会切换为该章节内容。可一览基础数学的脉络。","midMathDiagramTitle":"按章节的数学图示","midMathDiagramDescription":"选择章节后，下方图示会切换为该章节内容。可一览中级数学的脉络。","mathDiagramComplete":"看到 Ch01 函数为止，即可看到完整的输入→函数→输出结构。","mathDiagramAriaLabel":"按章节的数学图示","mlDiagramTitle":"按章节的机器学习图示","mlDiagramDescription":"选择章节后，下方图示会切换为该章节内容。可一览机器学习脉络。","mlDiagramAriaLabel":"按章节的机器学习图示","linkToPlayground":"在神经网络中这样使用该计算","introRoadmapHeading":"Ch01～Ch12 所学内容","mathIntroRoadmapIntro":"理解深度学习与机器学习，需要**函数**、**指数与对数**、**极限·微分·积分**、**概率与分布**等基础数学，Ch01～Ch12 所学的就是这些。**函数**是输入→输出的基础；**微分与梯度**是模型学习时决定参数**改哪里、改多少**的依据；**概率与分布**则用于预测与不确定性。","premiumBadge":"Premium","premiumTitle":"这是高级章节","premiumDescription":"此章节为付费会员专属内容。订阅后可无限使用所有章节的概念讲解、习题练习和AI教练辅导。","premiumFeature1":"解锁全部 Chapter 04~12","premiumFeature2":"AI学习教练无限提问","premiumFeature3":"新章节抢先体验","premiumMonthly":"月","premiumCTA":"订阅高级版","premiumComingSoon":"支付即将推出","premiumLogin":"已经订阅了？","premiumLoginLink":"登录","premiumLoginFirst":"登录后即可订阅高级版。","freeChaptersNote":"Chapter 01~03 可免费使用。"},"playground":{"title":"迷你神经网络游乐场","configTitle":"模型设置","inputNodes":"输入节点数","hiddenNeurons":"隐藏层神经元数","activation":"激活函数","createModel":"生成模型","inputTarget":"输入与目标","runForward":"执行前向","forwardSteps":"前向步骤","training":"训练","oneStep":"单步","epochs50":"50 轮","weightsAndGradients":"权重与梯度","linkFromProblem":"在神经网络中这样使用该计算","fromDotBanner":"已与点积练习关联。下方模型的第一个神经元计算输入与权重的点积。请运行「前向」查看。","inputXLabel":"输入 X（逗号分隔）","targetLabel":"目标（逗号分隔）","trainingInProgress":"训练中…","weightsW1":"W₁（隐藏层权重）","weightsW2":"W₂（输出层权重）","gradientsDW1":"dW₁（梯度）","gradientsDW2":"dW₂（梯度）","createModelHint":"请在上方选择设置后点击「生成模型」。","lossGraphEmpty":"运行训练后将显示每轮损失曲线。","lossGraphTitle":"每轮损失 (Loss)","epochLabel":"轮次","lastLossLabel":"最后损失: {value}（共 {count} 轮）"},"tinyNN":{"batchPhase0":"样本 1、2、3 各自独立。","batchPhase1":"合并成一张表 → 用相同的 W、b 一次算完。","batchPhase2":"相同的 W、b 一次作用到每一列（样本）。","batchPhase3":"所以 输出 Y 也以一张表一次得出。","batchInputSeparate":"输入（样本分开）","batchInputTable":"输入表 X","batchSample1":"样本 1","batchSample2":"样本 2","batchSample3":"样本 3","batchOneColOneSample":"一列 = 一样本","batchMergeHint":"合并成一张表","batchSameWb":"相同 W, b","batchComputeOnce":"一次计算","batchResultY":"输出 Y","batchResultCaption":"← 由相同 W、b 一次得到的结果","batchFooter1":"把样本拼成一张矩阵，就能用相同的 W、b 一次计算。","batchFooter2":"所以把输入合并成一张表，输出 Y 也会以一张表一次得出。","batchFooter3":"整张表经过同一组 W、b。每列不同的只有输入，计算规则(W、b)都相同。","connDescription":"层与层之间的每条线都是权重(w)。输入乘权重相加，再加上偏置(b)得到下一层 Y。","connWeightLabel":"权重(w)","connBiasLabel":"+偏置(b)","connFooter":"圆是值，线是权重(w)。加权和加上偏置(b)得到下一层 Y。","hiddenDescription":"我们只看到输入(X)和输出(Y)。中间那层只在网络内部使用，所以是隐藏层。","hiddenVisibleInput":"可见: 输入","hiddenHiddenH":"不可见: 隐藏(H)","hiddenVisibleOutput":"可见: 输出","hiddenBoxLabel":"隐藏层（从外不可见）","hiddenFooter":"数值沿输入→隐藏层→输出流动。隐藏层是我们看不到的内部表示。","deepDescription":"深＝隐藏层（中间步骤）多。深度学习里的「深」就是指这个深度。","deepLayerN":"第{n}层","deepFooter":"步骤越多网络越深。越深越能学习更精细的模式。","wideWidthN":"宽度 {count}","wideNeuronsN":"{count} 个神经元","wideFooter":"一层的神经元个数就是宽度。越宽该层能同时表示的特征越多。","softmaxScoreToProb":"分数→概率","softmaxExample":"（例：e≈3）","softmaxScore":"分数","softmaxMid":"中间","softmaxPowerOf3":"3的幂","softmaxProb":"概率","softmaxDivideBySum":"除以和","softmaxRaise":"做幂得","softmaxPowerLabel":"（3的{n}次方）","activationDescription":"输出 Y 随输入 X 非线性变化的典型激活函数。（3 级量化版）","activationSigmoid":"Sigmoid(X)","activationRelu":"ReLU(X)","activationTanh":"Tanh₃(X)","hiddenLayer1Formula":"W₁·X+b₁ → ReLU","hiddenLayer2Formula":"W₂·H+b₂ → ReLU","captionDotProduct":"左侧 X1,X2,X3 与右侧 Y1,Y2,Y3 用线相连。右侧每个节点是左侧与权重的内积。","captionMatrixMul":"左侧是矩阵 A 的一行，右侧 Y1～Y3 是与矩阵 B 各列的内积结果，合起来就是 A·B 矩阵积。","captionLinearLayer":"这一段是线性层。用 Y=W·X+b 把输入一次算到下一层。","captionActivation":"节点值经过 ReLU 或 σ 后非线性变化。最后一层 Y1,Y2,Y3 就是这样得到的。","captionArtificialNeuron":"虚线圆内是一个人工神经元。输入(X)乘权重加偏置(w·x+b)，经 ReLU 得到输出(Y)。","captionBatch":"表中一列＝一样本。同一 W、b 一次作用到所有列，计算 Y=W·X+b。","captionConnection":"层与层之间的线是权重(w)。值沿这些线传到下一层。","captionHidden":"我们只看到输入(X)和输出(Y)，中间层 H 只在网络内部使用，所以是隐藏层。数据按输入→隐藏→输出流动。","captionDeep":"深即隐藏层（中间步骤）多。像 X→A→B→C→…→Y 这样步骤越多越深，越深越能学更精细的模式。","captionWide":"一层的神经元个数是宽度。1 个表示 1 个特征，256 个可同时表示 256 个。每层可以不同(如 1→2→4→8 或 256→128→64)。","captionSoftmax":"最后一层 Y1,Y2,Y3 除以某数使和为 1，就是 softmax。可以当概率用。","captionGradient":"梯度(∇)从右向左流动，为减小损失逐层微调。","captionSummary":"Ch01～Ch12 内容汇总成一张网络图：前向、反向、权重、激活、梯度都在其中。","labelWeightedSum":"加权和","labelWeightBias":"权重·输入+偏置","labelWeight":"权重","labelProbSum":"（概率，和=1）","labelResult":"结果","labelMatrixResult":"矩阵积结果","labelNeuron":"神经元"},"categories":{"math":{"title":"基础数学","navTitle":"数学"},"midMath":{"title":"进阶数学"},"advMath":{"title":"高级数学"},"dl":{"title":"基础深度学习","navTitle":"深度学习"},"midDl":{"title":"中级深度学习"},"advDl":{"title":"进阶深度学习"},"ml":{"title":"基础机器学习","navTitle":"机器学习"},"midMl":{"title":"中级机器学习"},"advMl":{"title":"高级机器学习"},"comingSoon":"敬请期待","completed":"已完成","preparing":"（敬请期待）"},"concepts":{"sectionLabels":{"whatIs":"是什么概念","whyImportant":"在深度学习中为何重要","howUsed":"如何被使用","problemSolving":"解题说明"},"intro":{"sectionTitle":"什么是深度学习？","whatIs":["**深度学习就像会自己学习的聪明计算器** — 不是由人一条条定规则，而是让计算机通过大量数据自己发现规则。从人脑**神经元**彼此传递信号获得灵感，把小型计算单元堆叠成**多层（Layer）**，所以叫**深（Deep）学习**。","**深度学习遍布我们的生活** — 从你每天用的**ChatGPT**、**Gemini**等对话式AI，到用摄像头读路的**自动驾驶汽车**，到比你还懂你口味的**Netflix、YouTube推荐系统**，都是深度学习的产物。把复杂图像和声音变成**数字**，再对这些数字做加减乘除找出答案，是其中的核心原理。","**掌握基础才能做出更强大的AI** — 若不止于使用现成模型，而要按自己的目的修改、活用模型，就需要了解其内部发生的**基础数学**。理解数字如何被组织与计算，就能清楚把握AI为何做出某种判断，并加以调优以提升性能。","**深度学习的一层在做什么** — 每一层对输入数字乘上**权重**（重要度）并相加，再传给下一层。层数越深，AI会从数据中的点、线，逐步分辨出眼睛、鼻子、嘴巴，最终分辨**高层特征**如狗与猫。此时用于精细调整权重、逼近正确答案的指南就是**梯度**。","**本课程的学习路线图** — 深度学习本质上是高效的乘法与加法的重复。通过**Ch01 内积**与**Ch02 矩阵乘法**学习数据如何流动，经过**Ch03～05 人工神经元与激活函数**，掌握**Ch06～10 又深又宽的神经网络结构**，最后在**Ch11～12**中一步步掌握AI自学核心——梯度。","请按下方**路线图**查看各章目标。一步步跟下来，你就能具备解读顶尖AI系统内部所用数学语言的能力。"],"whyImportant":[],"howUsed":[],"problemSolving":[]},"dotProduct":{"sectionTitle":"深度学习中的内积","whatIs":["**内积**是两个向量**同位置分量**相乘后全部相加，得到一个数。例如 [2, 3] · [4, 1] = 2×4 + 3×1 = 11。","内积还能衡量两个向量的**方向是否一致**：内积越大说明**方向越相似**，为零说明**完全无关（垂直）**，为负说明**方向相反**。所以它很适合用来度量「相似度」。","公式：**a · b = a₁×b₁ + a₂×b₂ + … + aₙ×bₙ**。两个向量的**元素个数必须相同**，内积才有意义。"],"whyImportant":["在深度学习中，**一个神经元的输出就是权重与输入的内积**。把同位置的值相乘再求和，得到的就是该神经元对输入的「响应分数」。","内积是深度学习中**最基础的运算**，因为**矩阵乘法不过是把许多次内积打包在一起**。线性层、注意力、嵌入比较等操作的核心都是内积。","内积还是**相似度**的衡量方式：例如 Netflix 将用户向量与电影向量做内积得到「匹配分数」。这就是**余弦相似度**的基本原理。"],"howUsed":["**推荐系统（Netflix、YouTube）**：将用户向量与内容向量做内积，得到「该用户有多喜欢该内容」的分数。分数越高推荐越靠前。","**搜索引擎和聊天机器人**：把查询和文档都转成向量，按内积（相似度）排序。ChatGPT 找到与你问题最相关的信息用的也是同一原理。","**注意力机制**：在翻译和聊天机器人中，词向量之间做内积算出「相关度分数」，模型会把更多注意力分配给分数高的词。"],"problemSolving":["**计算方法**：把**同位置的元素**相乘，再把乘积全部相加。例如：[1, 2, 3] · [4, 5, 6] = 1×4 + 2×5 + 3×6 = 4 + 10 + 18 = 32。","**填空策略**：如果已知内积总值和其他乘积，先把已知乘积求和，用总值减去该和即可得到缺失的乘积，再除以已知元素就能求出空白值。","**注意事项**：两个向量的**元素个数必须相同**。确保每一对元素都计算到了——逐对打勾可以有效避免遗漏。"],"paragraphs":["**内积**是两个向量**同位置分量**相乘后全部相加的结果，记为 a·b = a₁b₁ + a₂b₂ + … 。","在深度学习中，线性变换的一步就是**权重向量**与**输入向量**的内积，得到**一个神经元**的输出。多个神经元时，用**权重矩阵**与输入的乘积（**矩阵乘法**）一次算完，其中每个元素就是一次内积。","两向量内积越大可以理解为**方向越接近**，因此常用于**注意力**、**相似度**、**嵌入比较**等「有多像」用一个数衡量的场景。"]},"matrixMul":{"sectionTitle":"深度学习中的矩阵乘法","whatIs":["**矩阵乘法**把两个数表（矩阵）合并成一个新数表。取前矩阵的**某一行**与后矩阵的**某一列**做**内积**，得到的数填入结果矩阵对应位置。","对**所有「行×列」的组合**重复上述过程，结果矩阵就填满了。例如 2×3 矩阵乘以 3×2 矩阵，得到 2×2 的结果。","能做矩阵乘法的条件：前矩阵的**列数**必须等于后矩阵的**行数**。记住这一点，就能判断任意两个矩阵能否相乘。"],"whyImportant":["深度学习中的**线性层**用权重矩阵乘输入——这就是矩阵乘法。假设有 10 个神经元，本需做 10 次内积，矩阵乘法一次就能**全部算完**。","**GPU** 专门为**大规模并行矩阵乘法**而设计。正因如此，数百万次乘法能在瞬间完成，才有了实时图像识别和聊天机器人。","深度学习中**几乎所有操作**都可以归结为矩阵乘法——注意力、卷积、循环网络无一例外。理解矩阵乘法就是理解深度学习的骨架。"],"howUsed":["**图像识别**：像素值排成矩阵，与权重矩阵相乘来提取「是狗还是猫？」等特征。这个过程在多层中反复进行。","**聊天机器人与翻译**：ChatGPT 和 Google 翻译将句子转为数值矩阵，再与庞大的权重矩阵相乘数十到数百次来生成回答。计算量中大部分就是矩阵乘法。","**推荐系统与自动驾驶**：Netflix 一次性为数千用户算推荐分数，自动驾驶汽车从摄像头画面识别障碍物——背后都是大规模矩阵乘法。"],"problemSolving":["**求某个元素**：结果的 **(i, j)** 元素 = **A 的第 i 行**与 **B 的第 j 列**的内积。逐元素相乘再求和即可。","**填空策略**：如果空白在结果中，只需算对应行与列的内积。如果空白在 A 或 B 中，利用已知的结果值和其他元素反推即可。","**检查维度**：相乘前确认 A 的**列数**等于 B 的**行数**。结果矩阵大小为 (A 的行数) × (B 的列数)。"],"paragraphs":["**矩阵乘法**用前矩阵的**每一行**与后矩阵的**每一列**做**内积**，将结果填入新矩阵的对应位置。","深度学习中的**线性层**对输入乘**权重矩阵**再加**偏置**，其中的乘法就是**矩阵乘法**。（m 个神经元、n 维输入即 m×n 矩阵乘 n 维输入得到 m 个输出。）","**GPU**针对大规模**并行**矩阵乘法做了优化，深度学习中的大部分计算都是**矩阵乘法**。"]},"linearLayer":{"sectionTitle":"深度学习中的线性层","whatIs":["**线性层**对输入乘**权重 (W)** 再加**偏置 (b)** 得到输出：**Y = W·X + b**。其中 W·X 是矩阵乘法，b 用来上下平移基线。","可以类比为成绩计算公式：「数学×0.3 + 理科×0.5 + 英语×0.2 + 10」。其中 0.3、0.5、0.2 是**权重 (W)**，10 是**偏置 (b)**，各科成绩是**输入 (X)**。","一个线性层决定「**各输入缩放多少、整体偏移多少**」。如果有多个输出，每个输出用不同的权重和偏置，一次算出多个分数。"],"whyImportant":["**几乎所有深度学习模型**都把线性层当基本组件。ChatGPT、翻译器、图像分类器都在反复执行数百到数千次「W·X + b」。线性层是深度学习的**砖块**。","**模型大小（参数量）** 取决于每个线性层「多少个输入 → 多少个输出」。参数量决定了模型能学到多复杂的东西（**容量**），也影响**过拟合**（只记住训练数据而非真正学会）的风险。","但是，只堆叠线性层等于做了**一次线性运算**（只能画直线）。所以每个线性层后面总要加**激活函数**（弯折函数），才能表达**曲线和复杂模式**。"],"howUsed":["**ChatGPT 与翻译器**：句子转成数值向量后，经过数十到上百个线性层，每层都做 W·X + b 再接激活函数，从而理解语境并生成回答。","**图像识别**：图片的特征向量送入线性层，同时算出「狗分数」「猫分数」「鸟分数」。最后一个线性层的输出就是各类别的分数。","**推荐系统**：将用户信息和商品信息拼成一个向量，经过线性层得到「该用户有多喜欢该商品」的分数。层数越多推荐越精准。"],"problemSolving":["**公式**：输入 **X** 乘**权重矩阵 W**、加**偏置 b** 得到**输出 Y**，即 **Y = W·X + b**。线性层题目会给出 **X、W、b**，让你求 **Y**，如下方紫色框中的示例。","**数值例子**：X = [2, 1]，W = [[1,0],[1,1]]，b = [1, -1] 时，W·X = (2, 3)，加上偏置 b 得 **Y = (2+1, 3-1) = [3, 2]**。偏置会**抬高或压低**各输出的基准。**Y 的每一格**等于 **W 的对应行**与 **X** 的内积再加 **b 的对应格**。","**填空策略**：空白在 **Y** 中就用该行算 W·X + b；空白在 **W 或 b** 中就用已知的 Y 和 X 列方程反推。算完后**代回 Y = W·X + b 验算**即可。"],"paragraphs":["**线性层**对输入向量 x 乘**权重矩阵** W、加**偏置**向量 b，得到 y = Wx + b。","每个输出**神经元**就是其权重行与整个输入的一次**内积**。因此**内积**与**矩阵乘法**是线性层的基本单元。","仅靠线性无法很好表达**非线性**函数，所以线性层后通常会接**激活函数**引入非线性。"]},"activation":{"sectionTitle":"深度学习中的激活函数","whatIs":["**激活函数**把神经元的原始输出（加权和）转换到**特定范围或形状**。最常见的有 **ReLU**（负值变 0，正值不变）、**Sigmoid**（压缩到 0～1）和 **Tanh**（压缩到 −1～1）。","可以类比为**水龙头**：水（信号）流入后，要么「只放过超过阈值的部分（ReLU）」，要么「流量太大时自动减弱（Sigmoid、Tanh）」。这种转换使输出更适合传给下一层。","**ReLU** 最流行，因为计算简单（正值保留、负值归零），训练速度快。**Sigmoid** 用于需要类似概率输出的场景，**Tanh** 用于需要以零为中心的场景。"],"whyImportant":["**无论堆叠多少次「乘加」（线性）运算，结果都等于做了一次「乘加」。** 正如把直线接直线还是直线，仅靠线性运算**永远无法表达曲线和复杂模式**。","激活函数加入了**弯折（非线性）**。有了弯折，多层堆叠才能组合出**曲线和复杂边界**，模型才能学习图像、语音、文本中的规律。","没有激活函数的话，网络再深也**只能做一条直线能做的事**。激活函数是让深度学习真正「深」起来的**关键成分**。"],"howUsed":["**图像识别**：每层做完 W·X + b 后，**ReLU** 把无关特征（负值）清零，保留有用特征（正值）传给下一层，逐步提取「眼睛」「耳朵」「轮子」等。","**聊天机器人与翻译**：隐藏层用 **ReLU** 或 **GELU**（更平滑的变体）引入非线性，最后一层用 **Sigmoid**（是/否判断）或 **Softmax**（多选一）来生成答案。","**语音识别与自动驾驶**：声波或摄像头图像转为数值后，经过多层「线性 + 激活」来判断「这是什么词」或「这是什么物体」。没有激活函数就无法做出如此复杂的判断。"],"problemSolving":["表里先看 X 在哪个区间，Y 就定了。","函数 | 规则","ReLU | 小于等于 0 就是 0，大于 0 就是 X","Sigmoid | 小→0，中间→0.5，大→1","Tanh₃ | 小→-1，中间→0，大→1","注意 | 区间边界以题目表格为准"],"paragraphs":["**激活函数**将神经元的线性输出（**加权和**）变为**非线性**。**ReLU**、**sigmoid**、**tanh** 等常见。","只堆**线性层**等价于一个大的线性变换，需要在层间加入**非线性**激活，**深度网络**才能学习复杂模式。","「在哪里用哪种**激活**」是**模型设计**中的重要选择。"],"problemDiagramCaption":"节点值经 ReLU 或 σ 后会非线性变化。最终层 Y1、Y2、Y3 就是这样得到的。","solutionIntro":"激活函数题目中，Y 由 X 落在哪个区间决定。下面是 ReLU、Sigmoid、Tanh₃ 各自的解题方法。","solutionRelu":"**ReLU**：X ≤ 0 → Y = 0，X > 0 → Y = X。Y 为空白时看 X 正负即可。","solutionSigmoid":"**Sigmoid**：X < -1.5 → 0，-1.5～1.5 → 0.5，X > 1.5 → 1。从表/图找 X 所在区间，填对应 Y。边界以题目表格为准。","solutionTanh":"**Tanh₃**：X ≤ -1 → -1，-1 < X < 1 → 0，X ≥ 1 → 1。从表找 X 区间，填 Y（-1、0、1）。边界值看题目归哪一侧。","solutionCaption":"不同题目的区间边界可能不同，请务必先看题目给出的表格（或图形）。"},"artificialNeuron":{"sectionTitle":"深度学习中的人工神经元","whatIs":["**人工神经元**是深度学习的**最小计算单元**。它只做两件事：① 计算**加权和** Z = W·X + b，② 经过**激活函数** Y = ReLU(Z) 或 Sigmoid(Z)。","它的灵感来自生物神经元：真正的神经元接收多个信号，给每个信号不同的权重，求和后如果超过阈值就发放脉冲。人工神经元是这一过程的**数学简化版**。","总结：**输入 (X)** → **权重与偏置 (Z = W·X + b)** → **激活 (Y = f(Z))** → **输出 (Y)**。这就是人工神经元做的全部事情。"],"whyImportant":["ChatGPT、图像分类器、推荐系统等 AI 模型，都是由**数千到数十亿个这样的神经元**串联而成。理解一个神经元，就能**读懂整个模型的行为**。","**训练**就是逐步调整每个神经元的**权重 (W) 和偏置 (b)**，让输出越来越接近正确答案。理解 W 和 b 如何影响输出，是理解学习过程的关键。","一个神经元把**内积 + 偏置 + 激活**合为一体，串联了前面学过的所有知识：**内积、矩阵乘法、线性层、激活函数**在这里融汇贯通。"],"howUsed":["**生活类比——考试通过预测**：算出「数学×0.4 + 理科×0.4 + 英语×0.2 + 5 = 75」（加权和），再判断「≥ 60 → 通过(1)，否则不通过(0)」（激活）。这就是一个神经元的操作。","**图像识别中的一个神经元**：它读取一小块像素区域，算出加权和再加偏置，经 ReLU 得到「这里是否有一条横线？」的分数。成千上万个这样的神经元配合起来才能判断「是狗还是猫」。","**聊天机器人、翻译、语音识别**：句子或声音的每个部分被转为数值，神经元算出「有哪些模式存在」的分数，分数传给下一层的神经元，逐层理解越来越复杂的含义。"],"problemSolving":["**第一步——加权和 (Z)**：计算 Z = W·X + b。用 W 的该行与 X 做内积再加 b。如果空白在 Z 中，在这一步填入。","**第二步——激活 (Y)**：对 Z 应用题目给定的激活函数。**ReLU**：Z > 0 则 Y = Z，Z ≤ 0 则 Y = 0。**Sigmoid**：查表看 Z 落在哪个区间。","**空白在 W 或 b 中**：如果 Y 和 X 已知，先反推激活得到 Z，再从 Z = W·X + b 解出空白。关键是**一步一步倒推**。"],"paragraphs":["**人工神经元**对输入做**加权**和（**加权和**），再经**激活函数**得到单一输出。","加权和阶段就是输入向量与权重向量的**内积**，再接**非线性**激活。","**深度学习模型**由大量这样的**神经元**连接而成，分多步将输入变换为输出。"]},"batch":{"sectionTitle":"深度学习中的批","whatIs":["**批**是指把**多个输入（样本）组成一张表（矩阵），用同一组权重一次算完**。表中每一**列 = 一个样本**。","想象一下老师批改试卷：**一张一张地改** vs. **把 30 张试卷同时送进批改机**——机器快得多。批处理也一样：GPU 同时处理多个输入，**速度成倍提升**。","关键点：对所有样本使用的 **W（权重）和 b（偏置）完全相同**，唯一不同的是每个样本的**输入 X**。正因如此，一次矩阵乘法就能同时算出所有样本的结果。"],"whyImportant":["**速度**：GPU 擅长**同时处理成千上万个数**，而不是逐个计算。批处理能发挥 GPU 的全部性能，速度比逐样本计算快**几十到几百倍**。","**训练稳定性**：只看 1 个样本就更新权重，噪声很大。用**小批量（mini-batch）**（如 32 或 64 个样本）来平均梯度，学习更加**稳定**。批大小是训练的关键参数。","**内存管理**：假设有 100 万条数据，一次全部装入 GPU 显存会爆。所以分成**小批**（如每次 64 条），处理完一批、更新权重后再处理下一批。"],"howUsed":["**Netflix 和 YouTube 推荐**：不再逐用户计算，而是把**数千用户的数据打包**同时打分。这样才能实现实时推荐服务。","**ChatGPT 与翻译器**：当多个用户同时提问时，多条查询会被**打包成一个批**送入 GPU 一次处理。这就是数百万用户都能快速得到回复的秘密。","**图像训练**：用 10 万张图片训练时，分成每批 32 张，共 3,125 次迭代。每一批都做 Z = W·X + b、算误差（损失）、微调权重。"],"problemSolving":["**X 有多列**：每一列是一个样本。对每列使用**同样的 W 和 b**。找到空白所在的行和列，只用**那一列的数**来计算即可。","**加减乘和求均值操作**：这些运算作用于**相同位置（同行同列）**。求均值（如零中心化）时，按**每列**计算平均值。填空白只需用该列的数。","**验算技巧**：每列之间相互独立，一列的结果不会影响另一列。**逐列检查**能轻松发现错误。"],"paragraphs":["**批**是指将多个**样本**一起组成**矩阵**，用同一组**权重**一次前向计算的方式。","一次**矩阵运算**处理多个样本比逐样本计算更能利用**GPU**，速度更快。","训练时通常按**小批量**计算**梯度**并**更新**权重。"]},"connection":{"sectionTitle":"深度学习中的连接","whatIs":["**连接**描述**前一层的神经元如何连到下一层的神经元**。每条连接有一个**权重（数值）**，决定「这个输入对这个输出的影响有多大」。","**全连接**：前一层**每个**神经元都连到后一层**每个**神经元。我们学过的线性层（Y = W·X + b）就是全连接层——W 的每个位置都有值。","**部分连接**：W 中有些位置为**零**，表示「没有连接」。该输入对该输出**毫无影响**。CNN 只连接相邻像素，就是部分连接的经典例子。"],"whyImportant":["**连接结构决定了模型的特性。** 全连接考虑所有输入（信息更全但参数更多），部分连接只看需要的部分（高效快速但可能遗漏信息）。","**AI 训练就是调整连接强度（权重）的过程。** 「把这条连接调强、那条调弱」——反复微调使输出越来越接近正确答案。大模型拥有数十亿条这样的连接。","**看 W 中哪里是零**就能知道模型忽略了什么。训练后权重接近零的连接说明「这条信息不重要」。利用这一点可以做**剪枝**来让模型更轻量。"],"howUsed":["**图像识别（CNN）**：使用**部分连接**，只连接相邻像素。远处的像素关系不大，这样减少参数，又快又高效。","**聊天机器人与翻译（Transformer）**：**注意力机制**决定「哪些词与哪些词相关」——它从数据中**动态学习**哪些连接要加强。","**推荐与语音识别**：将用户特征与商品特征之间的连接权重直接作为推荐分数。语音识别中，模型学习每个频率特征如何连接到下一层的特征。"],"problemSolving":["**W = 0 表示无连接**：例如 W(2,1) = 0，则第 1 个输入对第 2 个输出的影响为**零**。计算时可以**直接跳过**。","**求某个输出**：找出与该输出**有连接**（W ≠ 0）的输入，只对这些位置做 W × X 并求和，再加 b 即可。零的位置乘出来也是零，跳过结果一样。","**填空策略**：先**找出 W 中的零**，再只用非零连接列方程。空白在 W 中就用 Y 和 X 反推；空白在 Y 中就从 W 和 X 正算。"],"paragraphs":["**连接**表示一层（Layer）中的**神经元**与下一层神经元**如何相连**的结构。","常分为**全连接**（Fully connected）、**部分连接**（Partially connected）、**循环/递归连接**（Recurrent）。全连接时该层所有神经元与下一层所有神经元相连，通常表示为 **Linear layer**；部分连接时只有部分神经元与下一层相连（如 CNN 中按滤波器只将部分输入连到下一层）；循环连接指输出再作为自身或前一时刻的输入。","每条连接都有**权重（Weight）**，用来调节输入信号的**影响**。权重矩阵 W 的 (i,j) 元素表示第 j 个输入到第 i 个输出神经元的连接强度，由**学习**得到。","深度学习中连接权重可达数百万至数十亿。在 Y = W·X + b 中，W 为 0 的位置表示该输入对该输出无贡献的**部分连接**。"]},"hidden":{"sectionTitle":"深度学习中的隐藏层","whatIs":["**隐藏层**是**输入与输出之间的中间阶段**。用户只看到输入（如照片）和输出（如「狗」），但在中间，隐藏层创造出**「隐藏特征」**。","流程：**X → Linear(W₁·X+b₁) → ReLU → H（隐藏表示）→ Linear(W₂·H+b₂) → ReLU → Y（输出）**。H 是隐藏层的结果，包含压缩后的输入「关键特征」。","**类比**：你看到一张照片说出「狗」，大脑经历了「颜色 → 边缘 → 眼睛/鼻子/耳朵 → 狗！」这些**中间思考过程**就是隐藏层。隐藏层的神经元数（宽度）决定了能捕捉多少种不同特征。"],"whyImportant":["隐藏层**逐步汇总和变换**输入数据。**浅层**捕捉简单特征（亮度、边缘），**深层**捕捉复杂特征（眼睛、轮子、字母）。","**没有隐藏层**，模型只能从输入直接映射到输出，只能表达非常简单的（线性）关系。**有了隐藏层**，就能学习复杂关系（曲线、多条件组合）。","隐藏层的**神经元数（宽度）** 和**层数（深度）** 决定模型的**表达能力**。太小 = 信息瓶颈、效果差；太大 = 过拟合（死记硬背而非真正学会）。"],"howUsed":["**图像识别**：「像素 → 边缘 → 纹理 → 物体部件（眼睛、轮子）→ 整体物体（狗、汽车）」这些阶段全是隐藏层。越深的层提取越抽象的特征。","**聊天机器人与翻译**：文本转为数值后，经过多个隐藏层逐步精炼「词义 → 句意 → 回答方向」。ChatGPT 经过数十个隐藏层（Transformer 块）来生成回答。","**语音识别**：「声波 → 频率特征 → 音素 → 词 → 句子」每个阶段的转换都经过隐藏层。"],"problemSolving":["**按顺序计算**：X → (W₁·X+b₁) → ReLU → H → (W₂·H+b₂) → ReLU → Y。**逐步**计算每一步。如果空白在 H 中，只需算完第一段「线性+ReLU」。如果在 Y 中，先算 H 再算第二段。","**ReLU 注意点**：当线性结果（W·输入+b）为**负数时，ReLU 会将其变为 0**。到下一层时该值为 0，对应项**完全不起作用**——可以直接忽略。这是隐藏层题目的常见关键点。","**空白在 W 或 b 中**：隐藏层题目有**两段**（两次线性+激活）。先确认空白属于哪一段，如果已知那一段的输入和输出，就可以只用那一段的方程来求解。"],"paragraphs":["**隐藏层**位于**输入层**与**输出层**之间，学习不直接可见的「隐藏」**表示**。","隐藏层的作用是将输入逐步变为**更高层次的特征**；**低层**承载简单模式，**高层**更抽象。","隐藏层的**神经元数**与**层数**是决定模型**容量**与**表达能力**的关键因素。"]},"deep":{"sectionTitle":"深度学习中的深度","whatIs":["**深**意味着有**很多隐藏层（中间阶段）**。**「深度学习」中的「深度」指的就是这个！** 每层做 Linear（W·输入+b）+ 激活（ReLU），再把结果传给下一层。","**X → A → B → C → … → Y**——阶段越多，网络越深。类比：**1 层**只能「画一条线」，**10 层**能「画简单图形」，**100 层**能「画一张人脸」。深度越大 = **越能表达精细、复杂的模式**。","但并非越深越好。层数太多会导致**梯度消失**（学习信号传不到浅层）或**过拟合**（死记训练数据而非学到通用规律）。"],"whyImportant":["**更多层能表达更复杂的函数。** 每层的激活加入「弯折」，层层叠加就能**组合出非常复杂的曲线和决策边界**。","在图像识别中：**第 1～2 层**学到「线条、边缘」，**第 3～5 层**学到「眼睛、鼻子、轮子」，**第 6 层以上**学到「狗、汽车」。这一切都有赖于**深度**。","**ResNet** 和 **Transformer** 等著名架构可以深达**数十到数百层**且依然训练得好。秘诀是**跳跃连接（残差连接）**：梯度可以跳过若干层直达浅层。这些技巧克服了「深度的极限」。"],"howUsed":["**ChatGPT**：GPT-4 由**数十到上百个** Transformer 块组成。每个块更深入地理解上下文，最后一层生成答案。","**自动驾驶**：摄像头图像经过**深度网络**（如 ResNet-152，152 层！）来精准区分障碍物、车道线和交通标志。深度使其能应对复杂路况。","**语音识别与翻译**：语音转文字、中文转英文也要经过**深度网络**，每层逐步捕捉「音素 → 词 → 语境 → 语义」。"],"problemSolving":["**例题**：输入 X = [3, 1, 2]。第 1 层：W₁·X+b₁ = [4, -1, 2]（线性），ReLU 后 A = [4, 0, 2]。第 2 层：W₂·A+b₂ = [2, 1, 5]，ReLU 后 B = [2, 1, 5]。若 **A₂ 为空白**？","**解法**：第 1 层线性输出的第二项为 -1，故 ReLU(-1) = 0。因此 **A₂ = 0**。中间层空白时，先算该层 **线性（W·输入+b）**，再应用 **ReLU（负→0）** 即可。","**一般步骤**：无论空白在哪一层的第几个神经元，先**按顺序算到该层输入**，再用该层 **W 的对应行**与输入做内积并加上 **b 的对应项**得线性值，最后 ReLU 即得答案。"],"paragraphs":["**深**指**隐藏层**多、**层数**多的**网络**。「**深度学习**」的「深度」即此意。","越深越能经过多段**非线性变换**表达**复杂函数**，但**训练难度**、**过拟合**与**计算成本**也会增加。","**ResNet**、**Transformer** 等结构旨在让很深的网络也能**稳定训练**。"]},"wide":{"sectionTitle":"深度学习中的宽度","whatIs":["**宽度**指**一层中有多少个神经元**。神经元越多（越宽）= 该层能**同时表达更多特征**。例如 1 个神经元 = 1 个特征；256 个神经元 = 一次捕捉 256 个特征。","类比：**考试只有 1 题**只能考查一项能力，**100 题**就能同时考查多种能力。同样地，更宽的层在一步内能**处理更多样的信息**。","不同层可以有不同宽度。例如「1 → 2 → 4 → 8」（逐渐变宽）或「256 → 128 → 64」（逐渐变窄）都是常见的设计，取决于具体用途。"],"whyImportant":["**深度（层数）** 和**宽度（每层神经元数）** 共同决定模型的**总规模（参数量）**。同样的参数量，可以选择「**又深又窄**」或「**又浅又宽**」——这一选择对性能影响很大。","宽度越大意味着每层**同时处理更多特征**，但也增加**计算量和显存开销**。过宽则有**过拟合**（死记训练数据）的风险。","实际中常用**瓶颈**设计：输入和输出保持窄，中间变宽。这样**宽层提取关键特征**，其余部分保持压缩。ResNet 和 Transformer 都用了这种技巧。"],"howUsed":["**图像识别（CNN）**：每层的**通道数**（特征图数量）就是宽度。从 3 通道（RGB）开始，逐层增宽到 64 → 128 → 256 → 512 通道，提取**越来越多样的特征**。","**聊天机器人与翻译（Transformer）**：**隐藏维度**（如 768、1024、4096）是每层同时处理的数的个数（即宽度）。GPT-4 等大模型的维度达数千——非常宽。","**推荐系统**：「用户向量 256 维」意味着宽度 256，包含 256 个特征（年龄、偏好、观看记录等转为数值），维度越高推荐越精准。"],"problemSolving":["**逐渐变宽时每层公式不变**：Linear（W·输入+b）→ ReLU。确定空白所属的层和神经元，用**该层的输入**和 **W 的对应行、b 的对应项**来计算。","**注意 W 的维度**：层间宽度变化时，**W 的大小也会变**。W 为（当前层宽度 × 上一层宽度），找到空白对应神经元的那一**行**，与上一层输出做内积再加 b。","**逐层计算**：和深度题一样，**先把前面层的输出算完**再算下一层。别忘了每层的 ReLU（负值变 0）。"],"paragraphs":["**宽度**指一层中**神经元**（或**通道**）的数量。**更宽的层**能在同一阶段表达更多**特征**。","**深度**（层数）与**宽度**（每层神经元数）的搭配决定模型**容量**与**效率**。相同**参数**数也可选择更深或更宽。","实际模型中常按层调整**宽度**，在需要处增加**表达能力**。"]},"softmax":{"sectionTitle":"深度学习中的 Softmax","whatIs":["**Softmax** 是一个把**多个分数（数值）转换成概率**的函数。所有值变为 **0 到 1 之间**，且**加起来恰好等于 1**。因此可以当概率来读。","公式为 __SOFTMAX_FORMULA__。由于用了 **e 的幂次（e ≈ 2.718）**，最大的分数会被**显著放大**，其余的相对缩小。第一名和第二名的差距会更加悬殊。","例如：分数 [3, 1, 0] → e³≈20，e¹≈2.7，e⁰=1 → 总和 ≈ 23.7 → 概率 ≈ [0.84, 0.11, 0.04]。分数 3 本来只是 1 的 3 倍，概率却变成了约 8 倍！"],"whyImportant":["Softmax 用在**几乎所有分类模型的最后一层**。「这张照片 70% 是狗、25% 是猫、5% 是鸟」——让你看到**各类别的概率**以及模型有**多确信**。","与**交叉熵损失**搭配训练时，梯度推导**干净又稳定**。模型自然会学到「提高正确类别的概率、降低其余类别的概率」。","Softmax「所有值为正且和为 1」的性质恰好符合**概率分布**的定义。从统计学和理论上看，它都是把分数转为概率的**最自然的方式**。"],"howUsed":["**图像分类**：模型最后一层输出分数（logits），如 [5.2, 2.1, 0.8, ...]。Softmax 将其转为 [0.70, 0.25, 0.05, ...]——**各类别的概率**。概率最高的类别就是最终答案。","**聊天机器人与翻译**：ChatGPT 选择下一个词时，对词表中所有词（数万个！）打分，经 Softmax 转为概率后按概率采样。高概率的词常被选中，但偶尔也会选低概率的词增加多样性。","**注意力机制**：在翻译中，「关注哪些输入词」的相关度分数经 Softmax 变为概率（权重）。这些权重用来做**加权平均**，突出最相关的部分。"],"problemSolving":["**计算顺序**：① 算 __WEIGHTED_SUM_FORMULA__（logits）→ ② 算 __SOFTMAX_EXP__（题目用 __E_APPROX_3__）→ ③ 算 __SOFTMAX_SUM__（总和）= 所有 __SOFTMAX_EXP__ 相加 → ④ __SOFTMAX_Y_DIV__（各项除以总和）。按此顺序来。","**填空策略**：空白在 Y 中就算「该 __SOFTMAX_EXP_DIV_SUM__」。空白在 __SOFTMAX_EXP__ 中就算「__Y_TIMES_SUM__」。空白在 Z 中就从 __SOFTMAX_EXP__ 反推。空白在 __SOFTMAX_SUM__ 中就把所有 __SOFTMAX_EXP__ 加起来。","**验算**：算完后检查所有 Y 值是否在 **0 到 1 之间**且**和为 1**。如果不是，说明计算有误。另外确认题目用的是 __E_APPROX_3__ 还是 __E_APPROX_2718__。"],"paragraphs":{"0":"**Softmax**将实数向量变为 **(0,1) 之间且和为 1** 的值，可解释为**概率分布**。","1":"**分类**任务中在最后一层输出上做 softmax 得到各**类**的**概率**，常与**交叉熵损失**一起使用。","2":"公式为 __SOFTMAX_FORMULA__，**指数**会**放大**最大值。"}},"gradient":{"sectionTitle":"深度学习中的梯度","whatIs":["**梯度**告诉你**「如果稍微调整一个权重（参数），损失（误差）会怎样变化、朝哪个方向变」**。可以把它想象成一个**指南针**，指向「往哪走能减小误差」。","**类比**：想象你蒙着眼睛下山。你用脚感受**地面的坡度（梯度）**，然后朝下坡方向迈步。**沿着梯度的反方向走**就能到达谷底（最小损失）。这就是**梯度下降**。","**反向传播**把梯度**从输出一层一层向输入传递回去**。利用微积分的**链式法则**，一次遍历就能高效地计算出每一层每个权重的梯度。"],"whyImportant":["**AI 的训练 = 看梯度来更新权重。** 没有梯度就不知道「该往哪个方向调」，**学习就不可能进行**。梯度是深度学习训练的**心脏**。","**学习率**控制「每次走多远」。太大 → 越过谷底（发散）；太小 → 走得太慢。**Adam** 等优化器会根据梯度大小**自动调节步幅**。","如果梯度**过大（梯度爆炸）**，训练不稳定；如果**过小（梯度消失）**，浅层几乎学不到东西。**梯度裁剪**、**批归一化**、**跳跃连接**等技术就是为了防止这些问题。"],"howUsed":["**所有经过训练的 AI 模型**：ChatGPT、图像识别、推荐系统——**每个模型**都靠计算梯度来更新权重。前向传播 → 算损失 → 反向传播求梯度 → 更新权重。重复这 4 步数百万次就是训练。","**前向与反向**：前向计算 Z = W·X 是**从左到右**；反向传播 dW、dX 是**从右到左**。两者总是成对出现。","**微调**：把 ChatGPT 适配到特定用途时，用新数据计算梯度并微调权重。有了梯度，**预训练模型**就能快速适应新任务。"],"problemSolving":["**题目形式**：式为**前向 Z = W·X**或**反向 dZ = dW·X**之一。空白(?)只出现在**X 的一个分量**或**Z（或 dZ）的一个分量**。W 与 dW 均全部给出。","**前向(Z = W·X)**：Z 的每一格 = **W 的该行**与**X**的内积。空白在**Z**时，用该行 W 与 X 做内积；空白在**X**时，用其他 Z 与 W 的行列出方程求该 X 分量。","**反向(dZ = dW·X)**：与**前向计算结构相同**。dZ 的每一格 = **dW 的该行**与**X**的内积。空白在**dZ**时做该行与 X 的内积，空白在**X**时由方程解出该分量。"],"paragraphs":["**梯度**是**损失**对各**参数**的**偏导数**组成的向量，表示「参数微调时损失如何变化、朝哪**方向**变」。","**训练**通常沿梯度**反方向**小幅更新参数（**梯度下降**），梯度由**反向传播**高效计算。","**学习率**、**优化器**、**梯度裁剪**等是决定如何使用梯度的**关键设置**。"]},"summary":{"sectionTitle":"整体小结","whatIs":["下图将**Ch01～Ch12**所学汇总为**一个网络**：输入 X → 隐藏层(A,B,C,D) → 输出 Y，以及**权重(W)**、**激活(ReLU 等)**、**批**、**梯度(∇)**如何参与。","实际训练反复进行**前向**（计算）→**损失**→**反向**（梯度）→**更新权重**。学完本读书即可在计算上跟上这一流程。"],"whyImportant":[],"howUsed":[],"problemSolving":[]}},"locale":{"ko":"한국어","ja":"日本語","en":"English","zh":"中文"},"chapters":{"intro":{"chapter":"Chapter 00","title":"深度学习第一步：AI 如何思考？","description":"一览了解深度学习是什么，以及 Ch01～Ch12 将学到的内容。"},"dotProduct":{"chapter":"Chapter 01","title":"向量内积：在数据间找相似","description":"将两个向量的方向与大小相乘得到一个值的最基本运算。"},"matrixMul":{"chapter":"Chapter 02","title":"矩阵乘法：一次算完的魔法","description":"两矩阵的积由前行矩阵的行与后矩阵的列做内积填满新矩阵。"},"linearLayer":{"chapter":"Chapter 03","title":"线性层：决定重要性的权重","description":"线性层（线性变换层）。对输入乘以权重矩阵并加上偏置的层。"},"activation":{"chapter":"Chapter 04","title":"激活函数：为 AI 增添判断力","description":"激活函数。使神经元输出变为非线性的函数。"},"artificialNeuron":{"chapter":"Chapter 05","title":"人工神经元：汇集信息、发出信号的单元","description":"人工神经元。接收输入、计算加权和并施加激活函数的单元。"},"batch":{"chapter":"Chapter 06","title":"批处理：打包一次学","description":"批。将多个样本打包在一起一次计算的单位。"},"connection":{"chapter":"Chapter 07","title":"权重连接：构成智能的无数链条","description":"连接。层与层、神经元与神经元之间的权重连接。"},"hidden":{"chapter":"Chapter 08","title":"隐藏层：看不见的思维深度","description":"隐藏。位于输入层与输出层之间的层。"},"deep":{"chapter":"Chapter 09","title":"深层网络：解决更复杂问题的能力","description":"深度。隐藏层多的网络称为深层网络。"},"wide":{"chapter":"Chapter 10","title":"宽度与神经元：一次找出更多特征","description":"宽度。单层神经元数量多称为宽层。"},"softmax":{"chapter":"Chapter 11","title":"Softmax：把结果变成确信","description":"Softmax（概率分布化）。将输出变为 0～1 且和为 1。"},"gradient":{"chapter":"Chapter 12","title":"梯度与反向传播：从错误中学习","description":"梯度。指示为减少损失应沿哪个方向调整参数。"},"summary":{"chapter":"Chapter 13","title":"总整理：一览 AI 地图","description":"将 Ch01～Ch12 所学内容在一张神经网络图中一览。"}},"midMathChapters":{"midMath00":{"chapter":"Chapter 00","title":"进阶数学与人工智能：多变量空间与不确定性的扩展"},"midMath01":{"chapter":"Chapter 01","title":"向量与向量空间：超越标量的大小与方向"},"midMath02":{"chapter":"Chapter 02","title":"向量的内积与投影：数据间的角度与相似度"},"midMath03":{"chapter":"Chapter 03","title":"矩阵与数据捆：多向量的结构性表示"},"midMath04":{"chapter":"Chapter 04","title":"矩阵乘法与线性变换：操纵空间的数学"},"midMath05":{"chapter":"Chapter 05","title":"逆矩阵与行列式：变换的逆运算与空间体积变化"},"midMath06":{"chapter":"Chapter 06","title":"线性独立与秩：数据的冗余与实质维度"},"midMath07":{"chapter":"Chapter 07","title":"特征值与特征向量：变换中不变的主轴"},"midMath08":{"chapter":"Chapter 08","title":"方向导数与梯度：多维空间中的最陡上升"},"midMath09":{"chapter":"Chapter 09","title":"雅可比矩阵：多变量向量函数的一阶微分"},"midMath10":{"chapter":"Chapter 10","title":"海森矩阵：二阶微分与曲面的曲率"},"midMath11":{"chapter":"Chapter 11","title":"泰勒级数：用多项式近似复杂函数"},"midMath12":{"chapter":"Chapter 12","title":"凸优化：求最小值的条件"},"midMath13":{"chapter":"Chapter 13","title":"条件概率与依赖性：变量间的概率关系"},"midMath14":{"chapter":"Chapter 14","title":"贝叶斯定理：用观测数据更新概率"},"midMath15":{"chapter":"Chapter 15","title":"协方差与相关系数：两变量线性相关性的度量"},"midMath16":{"chapter":"Chapter 16","title":"多元正态分布：多变量联合概率模型"},"midMath17":{"chapter":"Chapter 17","title":"最大似然估计（MLE）：由观测反推模型参数"},"midMath18":{"chapter":"Chapter 18","title":"熵：基于信息论的不确定性量化"},"midMath19":{"chapter":"Chapter 19","title":"交叉熵与KL散度：两概率分布之差的度量"},"midMath20":{"chapter":"Chapter 20","title":"进阶数学总整理：线性代数与概率论的结合"}},"midMathCh10":{"chapter":"Chapter 10","title":"黑塞矩阵：读曲面的弯曲程度","description":"黑塞矩阵是由标量函数的二阶偏导数构成的方阵，表示某点处曲面的曲率，用于判断极小、极大与鞍点，也是牛顿法、置信域方法的基础。","sectionTitle":"黑塞矩阵：读曲面的弯曲程度","sectionLabels":{"whatIs":"是什么概念","whyImportant":"为什么重要","howUsed":"怎么用","problemSolving":"解题说明"},"whatIs":{"intro":"**黑塞矩阵是什么？** — 可以理解为：在你所站的点上，用数字写出「各个方向曲面弯了多少」的一张表。由函数二阶微分得到的值排成的方阵，且沿对角线左右对称，即**对称矩阵**。","plain":"想象闭着眼下山。脚底感觉到的「这边更陡」是一阶微分（梯度）。而「再迈一步，地面会凹下去还是平坦？」这种预感就是二阶微分，也就是黑塞。有了它就能避开悬崖，找到像碗底那样的真正最低点。","definition":"更准确地说，把函数 $f$ 在 $x_i$、$x_j$ 两个方向各微分两次得到的 $\\frac{\\partial^2 f}{\\partial x_i \\partial x_j}$ 填进表里，就是黑塞 $\\mathbf{H}$。这张表的**特征值**是关键：全正→该点是碗底一样的**极小点**，全负→像山顶的**极大点**，有正有负→一边升一边降的**鞍点**。","inAI":"机器学习里，训练就是在找「误差最小的谷」。只靠梯度一点点往下走很慢。用黑塞知道曲率后，可以用**牛顿法**朝谷底大步跳，学习会快很多。"},"whyImportant":{"fakeBottom":"往下走时会遇到梯度为 0 的平坦处。那不一定就是真正的谷底，可能是鞍点——暂时平坦，但一边升一边降。这时看黑塞的**特征值**就能区分：是真最小点还是鞍点。变量很多（如 AI）时，不踩进这种「假谷底」非常重要。","smartStep":"窄路小步、平地大步才又快又稳。黑塞告诉你「各方向有多陡」，所以能自动调好步长（学习率），少走冤枉路、高效下降。"},"howUsed":{"newton":"牛顿法用下面公式一步走很多：$\\mathbf{x}_{k+1} = \\mathbf{x}_k - \\mathbf{H}^{-1} \\nabla f(\\mathbf{x}_k)$。其中 $\\mathbf{x}_k$ 是当前位置，$\\nabla f(\\mathbf{x}_k)$ 是该点梯度，$\\mathbf{H}$ 是该点黑塞矩阵，$\\mathbf{H}^{-1}$ 是其逆矩阵。也就是「同时看梯度和曲率（黑塞），朝谷底大步跳到 $\\mathbf{x}_{k+1}$」。比只靠梯度小步走能更快接近答案。","quasiNewton":"变量一多，精确算黑塞成本太大。实务中更多用**拟牛顿法**（如 BFGS）：不完整算黑塞，只用至今的梯度信息去「猜个大概形状」来用。"},"summary":"黑塞矩阵是由标量函数二阶偏导构成的对称矩阵，承载某点的曲率与极值性质。在梯度为零的点，特征值全正则为极小，全负则为极大，有正有负则为鞍点。在机器学习中，它是损失最小点搜索与验证、牛顿法、置信域、拟牛顿等二阶优化的基础。","problemSolving":{"focus":"下表只整理解题所需的 **公式与符号含义**。表下方的 **解题示例** 中有完整解题过程，请对照参考。","examplesHeading":"解题示例","examplesTable":"**例1 — 元素个数**\n\n问题：$f(x_1, x_2)$ 的黑塞有多少个元素？\n\n解：变量为 2 个时，黑塞为 $2 \\times 2$ 矩阵，故共有 **4** 个元素。对称故 $H_{12}=H_{21}$，彼此不同的元素只有 $H_{11}$、$H_{12}$、$H_{22}$ 共 **3** 个。\n\n→ 问总数则答 **4**，问独立元素数则答 **3**。\n\n---\n\n**例2 — 极小判定**\n\n问题：黑塞特征值为 2 和 5 时，该点是极小、极大还是鞍点？\n\n解：特征值**均为正**时，该点处曲面各方向向下弯，呈碗形，故为**极小点**。\n\n→ 在 ①极小 ②极大 ③鞍点中选 **1（极小）**。\n\n---\n\n**例3 — 极大判定**\n\n问题：黑塞特征值为 $-1$ 与 $-3$ 时，该点是？\n\n解：**均为负**时，该点处曲面各方向向上弯，呈倒扣的碗，为**极大点**。\n\n→ 选 **2（极大）**。\n\n---\n\n**例4 — 鞍点判定**\n\n问题：黑塞特征值为 $2$ 与 $-1$ 时，该点是？\n\n解：特征值**有正有负**时，一方上升、一方下降，为**鞍点**。\n\n→ 选 **3（鞍点）**。\n\n---\n\n**例5 — 二阶导数值**\n\n问题：$f(x)=3x^2+2x+1$ 时，$f''(x)$ 为多少？\n\n解：二次式 $ax^2+bx+c$ 中 $x^2$ 的系数为 $a=3$。二阶导数为 $f''(x)=2a=2 \\times 3 = 6$，与 $x$ 无关的常数。\n\n→ 答案 **6**。\n\n---\n\n**例6 — 牛顿法（一维）**\n\n问题：$f(x)=x^2$，$x_0=4$ 时，一步牛顿迭代后的 $x_1$ 为？\n\n解：一维牛顿步为 $x_1 = x_0 - f'(x_0)/f''(x_0)$。$f'(x)=2x$，$f''(x)=2$，故 $f'(4)=8$，$f''(4)=2$，得 $x_1 = 4 - 8/2 = 0$。\n\n→ 答案 **0**。\n\n---\n\n**例7 — 定义（对/错）**\n\n问题：「黑塞特征值全为正时，该点为极小点。」对则 1，错则 0。\n\n解：说法正确。特征值全为正时，曲面各方向向下弯，故为极小点。\n\n→ 答案 **1**。"},"problemSolvingLabel":"解题说明","problemSolvingTable":"$1a","problemSolvingExample1":"**例（元素个数）**\n\n$f(x_1,x_2)$ 的黑塞为 $2\\times2$，故共 4 个元素；独立 3 个。→ **答案 4**（总数）或 **3**（独立，依题意）","problemSolvingExample2":"**例（极值判定）**\n\n某点黑塞特征值为 2 和 5（均为正），则该点为极小点。→ **答案 1**（极小）或题目要求的数","problemSolvingExample3":"**例（牛顿法）**\n\n$f(x)=x^2$ 时 $f'(x)=2x$，$f''(x)=2$。在 $x_0=4$ 处一步：$x_1 = x_0 - f'(x_0)/f''(x_0) = 4 - 8/2 = 0$。→ **答案 0**","visualShort":"黑塞：二阶偏导→曲率与极值","visualIntroShort":"一阶导告诉你「哪边是下坡」，二阶（黑塞）告诉你「接下来会凹下去，还是一边升一边降（鞍点）」。请跟着下方动画理解。","visualWhyHessian":"黑塞是 **二阶导数** 构成的矩阵，所以下图中的「弯曲程度」就是黑塞所描述的内容。","visualIntro":"黑塞矩阵是函数 $f$ 在点 $\\mathbf{x}$ 处的二阶偏导排成的矩阵，用于读曲率并判断极小、极大与鞍点。","visualConceptTitle":"概念结构","visualConceptStep0":"输入：标量函数 $f(\\mathbf{x})$，点 $\\mathbf{x}$","visualConceptStep1":"计算 $\\frac{\\partial^2 f}{\\partial x_i \\partial x_j}$","visualConceptStep2":"构成黑塞矩阵 $\\mathbf{H}$（对称）","visualConceptStep3":"特征值→极小（全正）、极大（全负）、鞍（混合）","visualFlowTitle":"学习流程","visualFlowStep0":"概念：二阶偏导矩阵","visualFlowStep1":"直观：曲面的弯曲程度（曲率）","visualFlowStep2":"数学：$H_{ij}$、对称性、特征值","visualFlowStep3":"应用：牛顿法、极值、置信域","visualCaption":"左：碗形（只向下弯）→极小。倒扣的碗（只向上弯）→极大。鞍点：一方上升一方下降→既非极小也非极大。","visualStep1":"输入：标量函数 $f(\\mathbf{x})$，点 $\\mathbf{x}$","visualStep2":"计算二阶偏导 $\\frac{\\partial^2 f}{\\partial x_i \\partial x_j}$","visualStep3":"构成黑塞矩阵 $\\mathbf{H}$（对称）","visualStepsLabel":"阅读顺序","visualBowlTitle":"碗形：只向下弯→极小点","visualSaddleTitle":"鞍点：这边值↑上升，那边值↓下降","visualCurveDown":"↓ 弯曲","visualFppMin":"f″=2>0→极小","visualMinPoint":"极小点","visualValueUp":"值↑","visualValueDown":"值↓","visualSaddleOrangeGreen":"橙方向值上升 · 绿方向值下降","visualSaddleNeither":"鞍点：既非极小也非极大","visualSummary1":"碗形只向下弯→此处为极小","visualSummary2":"倒扣的碗只向上弯→此处为极大","visualSummary3":"鞍点一方上升一方下降→既非极小也非极大","problemPromptIntro":"请阅读下方说明，求出答案（整数）并填入空格（?）。","promptDefinition":"若下列叙述正确请输入 1，错误请输入 0。\n\n（与黑塞、二阶导、极值判定相关的叙述）","promptDefinitionChoice":"请选择与下列问题相符的选项。①极小 ②极大 ③鞍点中选一个编号（1、2、3）输入。\n\n（与黑塞特征值、定义相关的问题）","promptElementCount":"当 $f(\\mathbf{x})$ 为 {n} 元标量函数时，黑塞矩阵的元素个数（整数）为？","promptIndependentCount":"$$n={n}$ 变量对称黑塞的独立元素个数（整数）为？","promptMatrixSize":"$$n={n}$ 变量函数的黑塞矩阵的行（或列）个数（整数）为？","promptEigenvalueType":"黑塞特征值为 $\\lambda_1={ev1}$、$\\lambda_2={ev2}$ 时，该点是？①极小 ②极大 ③鞍点。请输入编号（1、2、3）。","promptNewton1D":"在 $f(x)={a}x^2{bVal}x+{c}$ 中 $x_0={x0}$ 时，牛顿法一步后的 $x_1$（整数）为？","promptScalarSecondDeriv":"$$f(x)={a}x^2+bx+c$ 的二阶导数（黑塞元）$f''(x)$ 的值为？（整数）","promptDefault":"请输入答案（整数）。"},"advMathChapters":{"advMath00":{"chapter":"Chapter 00","title":"高级数学与人工智能：生成理论与复杂系统建模的骨架"},"advMath01":{"chapter":"Chapter 01","title":"奇异值分解（SVD）与伪逆：数据潜在模式提取"},"advMath02":{"chapter":"Chapter 02","title":"张量代数与爱因斯坦记号"},"advMath03":{"chapter":"Chapter 03","title":"拉格朗日乘子与KKT条件：约束优化"},"advMath04":{"chapter":"Chapter 04","title":"马尔可夫链：状态转移与概率过程"},"advMath05":{"chapter":"Chapter 05","title":"蒙特卡洛积分：数值近似法"},"advMath06":{"chapter":"Chapter 06","title":"MCMC：复杂概率分布采样"},"advMath07":{"chapter":"Chapter 07","title":"EM算法：含潜在变量的推断"},"advMath08":{"chapter":"Chapter 08","title":"MAP估计：贝叶斯优化与正则化"},"advMath09":{"chapter":"Chapter 09","title":"共轭先验：解析贝叶斯推断"},"advMath10":{"chapter":"Chapter 10","title":"JS散度与互信息"},"advMath11":{"chapter":"Chapter 11","title":"变分推断：难处理概率的近似"},"advMath12":{"chapter":"Chapter 12","title":"重参数化技巧：随机性的微分"},"advMath13":{"chapter":"Chapter 13","title":"最优传输与Wasserstein距离"},"advMath14":{"chapter":"Chapter 14","title":"MDP与贝尔曼方程：强化学习的数学骨架"},"advMath15":{"chapter":"Chapter 15","title":"傅里叶变换与频谱分析"},"advMath16":{"chapter":"Chapter 16","title":"图拉普拉斯：网络结构的数学化"},"advMath17":{"chapter":"Chapter 17","title":"随机微分方程（SDE）入门：噪声的连续注入"},"advMath18":{"chapter":"Chapter 18","title":"朗之万动力学与得分匹配"},"advMath19":{"chapter":"Chapter 19","title":"信息几何与自然梯度"},"advMath20":{"chapter":"Chapter 20","title":"高级数学总整理：生成模型与深度优化的数学结合"}},"midDlChapters":{"midDl00":{"chapter":"Chapter 00","title":"中级深度学习：稳定学习与非结构化数据理解"},"midDl01":{"chapter":"Chapter 01","title":"权重初始化（Weight Initialization）：学习的正确起点"},"midDl02":{"chapter":"Chapter 02","title":"优化算法：惯性与自适应学习率"},"midDl03":{"chapter":"Chapter 03","title":"学习率调度（Learning Rate Scheduling）"},"midDl04":{"chapter":"Chapter 04","title":"损失函数深化：类别不平衡与度量学习"},"midDl05":{"chapter":"Chapter 05","title":"过拟合防止与正则化（Regularization）"},"midDl06":{"chapter":"Chapter 06","title":"归一化层（Batch & Layer Normalization）"},"midDl07":{"chapter":"Chapter 07","title":"数据增强（Data Augmentation）与噪声鲁棒性"},"midDl08":{"chapter":"Chapter 08","title":"卷积神经网络（CNN）基础：空间特征提取"},"midDl09":{"chapter":"Chapter 09","title":"池化（Pooling）与多通道（Multi-Channel）"},"midDl10":{"chapter":"Chapter 10","title":"残差连接（Skip Connection）与 ResNet"},"midDl11":{"chapter":"Chapter 11","title":"轻量卷积：运算效率化架构"},"midDl12":{"chapter":"Chapter 12","title":"视觉迁移学习（Transfer Learning）"},"midDl13":{"chapter":"Chapter 13","title":"视觉任务1：目标检测（Object Detection）"},"midDl14":{"chapter":"Chapter 14","title":"视觉任务2：图像分割（Image Segmentation）"},"midDl15":{"chapter":"Chapter 15","title":"自然语言处理预处理与分词（Tokenization）"},"midDl16":{"chapter":"Chapter 16","title":"词嵌入（Word Embedding）"},"midDl17":{"chapter":"Chapter 17","title":"1D 卷积（1D CNN）用于序列处理"},"midDl18":{"chapter":"Chapter 18","title":"循环神经网络（RNN）：顺序信息的状态保持"},"midDl19":{"chapter":"Chapter 19","title":"长短期记忆（LSTM）与 GRU：长期依赖控制"},"midDl20":{"chapter":"Chapter 20","title":"编码器-解码器与注意力（Attention）机制"},"midDl21":{"chapter":"Chapter 21","title":"中级深度学习总整理：架构设计与管道"}},"midMlChapters":{"midMl00":{"chapter":"Chapter 00","title":"中级机器学习：现实数据的局限与模型优化"},"midMl01":{"chapter":"Chapter 01","title":"数据缩放与分布变换"},"midMl02":{"chapter":"Chapter 02","title":"类别变量编码"},"midMl03":{"chapter":"Chapter 03","title":"缺失值处理与插补"},"midMl04":{"chapter":"Chapter 04","title":"不平衡数据处理基础"},"midMl05":{"chapter":"Chapter 05","title":"高级交叉验证"},"midMl06":{"chapter":"Chapter 06","title":"多分类评估与ROC-AUC"},"midMl07":{"chapter":"Chapter 07","title":"SVM基础：决策边界与间隔"},"midMl08":{"chapter":"Chapter 08","title":"核技巧：非线性SVM"},"midMl09":{"chapter":"Chapter 09","title":"降维1（PCA）"},"midMl10":{"chapter":"Chapter 10","title":"集成学习：Bagging与Pasting"},"midMl11":{"chapter":"Chapter 11","title":"提升基础：AdaBoost"},"midMl12":{"chapter":"Chapter 12","title":"梯度提升机（GBM）"},"midMl13":{"chapter":"Chapter 13","title":"密度聚类（DBSCAN）"},"midMl14":{"chapter":"Chapter 14","title":"层次聚类与树状图"},"midMl15":{"chapter":"Chapter 15","title":"高斯混合模型（GMM）"},"midMl16":{"chapter":"Chapter 16","title":"异常检测基础"},"midMl17":{"chapter":"Chapter 17","title":"管道构建"},"midMl18":{"chapter":"Chapter 18","title":"超参数调优1：网格与随机搜索"},"midMl19":{"chapter":"Chapter 19","title":"超参数调优2：贝叶斯优化（Optuna）"},"midMl20":{"chapter":"Chapter 20","title":"中级机器学习总整理"}},"advMlChapters":{"advMl00":{"chapter":"Chapter 00","title":"高级机器学习：最优性能模型与可解释性"},"advMl01":{"chapter":"Chapter 01","title":"XGBoost算法"},"advMl02":{"chapter":"Chapter 02","title":"LightGBM算法"},"advMl03":{"chapter":"Chapter 03","title":"CatBoost：类别型数据提升"},"advMl04":{"chapter":"Chapter 04","title":"t-SNE流形可视化"},"advMl05":{"chapter":"Chapter 05","title":"UMAP：拓扑几何"},"advMl06":{"chapter":"Chapter 06","title":"Isolation Forest"},"advMl07":{"chapter":"Chapter 07","title":"One-Class SVM"},"advMl08":{"chapter":"Chapter 08","title":"特征选择与重要性"},"advMl09":{"chapter":"Chapter 09","title":"XAI 1：部分依赖图（PDP）"},"advMl10":{"chapter":"Chapter 10","title":"XAI 2：LIME"},"advMl11":{"chapter":"Chapter 11","title":"XAI 3：SHAP"},"advMl12":{"chapter":"Chapter 12","title":"时间序列预处理与平稳性"},"advMl13":{"chapter":"Chapter 13","title":"ARIMA与SARIMA"},"advMl14":{"chapter":"Chapter 14","title":"Prophet：结构时间序列"},"advMl15":{"chapter":"Chapter 15","title":"推荐1：基于内容过滤"},"advMl16":{"chapter":"Chapter 16","title":"推荐2：矩阵分解"},"advMl17":{"chapter":"Chapter 17","title":"推荐3：因子分解机"},"advMl18":{"chapter":"Chapter 18","title":"关联规则与Apriori"},"advMl19":{"chapter":"Chapter 19","title":"AutoML基础：PyCaret与FLAML"},"advMl20":{"chapter":"Chapter 20","title":"高级机器学习总整理：SOTA管道与XAI"}},"advDlChapters":{"advDl00":{"chapter":"Chapter 00","title":"进阶深度学习：大模型与生成式AI范式"},"advDl01":{"chapter":"Chapter 01","title":"Transformer 1：自注意力与并行化"},"advDl02":{"chapter":"Chapter 02","title":"Transformer 2：位置编码与前馈"},"advDl03":{"chapter":"Chapter 03","title":"Transformer 谱系：编码器（BERT）vs 解码器（GPT）"},"advDl04":{"chapter":"Chapter 04","title":"注意力优化：FlashAttention 与稀疏注意力"},"advDl05":{"chapter":"Chapter 05","title":"视觉 Transformer（ViT）与图像块"},"advDl06":{"chapter":"Chapter 06","title":"自监督学习（Self-Supervised Learning）"},"advDl07":{"chapter":"Chapter 07","title":"提示工程与上下文学习（In-Context Learning）"},"advDl08":{"chapter":"Chapter 08","title":"参数高效微调 1：PEFT 与 LoRA"},"advDl09":{"chapter":"Chapter 09","title":"参数高效微调 2：QLoRA 与量化调优"},"advDl10":{"chapter":"Chapter 10","title":"价值对齐与人类反馈强化学习（RLHF）"},"advDl11":{"chapter":"Chapter 11","title":"直接偏好优化（DPO）：无强化学习的对齐"},"advDl12":{"chapter":"Chapter 12","title":"检索增强生成（RAG）：幻觉控制架构"},"advDl13":{"chapter":"Chapter 13","title":"LLM 智能体（Agents）与工具使用（Tool Use）"},"advDl14":{"chapter":"Chapter 14","title":"图神经网络（GNN）与消息传递"},"advDl15":{"chapter":"Chapter 15","title":"深度学习中的可解释 AI（XAI）：Grad-CAM"},"advDl16":{"chapter":"Chapter 16","title":"自编码器（Autoencoder）与无监督降维"},"advDl17":{"chapter":"Chapter 17","title":"变分自编码器（VAE）：基于概率分布的生成空间"},"advDl18":{"chapter":"Chapter 18","title":"生成对抗网络（GAN）基础"},"advDl19":{"chapter":"Chapter 19","title":"条件 GAN（cGAN）与应用"},"advDl20":{"chapter":"Chapter 20","title":"扩散模型（Diffusion Model）1：前向与逆过程"},"advDl21":{"chapter":"Chapter 21","title":"扩散模型（Diffusion Model）2：潜在扩散（Latent Diffusion）"},"advDl22":{"chapter":"Chapter 22","title":"视觉-语言模型（Vision-Language Model）与 CLIP"},"advDl23":{"chapter":"Chapter 23","title":"语音识别（Speech-to-Text）与音频处理"},"advDl24":{"chapter":"Chapter 24","title":"模型压缩与知识蒸馏（Knowledge Distillation）"},"advDl25":{"chapter":"Chapter 25","title":"推理优化与服务部署（Deployment）"},"advDl26":{"chapter":"Chapter 26","title":"进阶深度学习总整理：AI 架构设计与未来"}},"mlChapters":{"mlSectionLabels":{"whatIs":"是什么概念","whyImportant":"为何重要","howUsed":"如何被使用","problemSolving":"总结"},"mlKnnProblemSolvingLabel":"解题说明","mlKnnVisualIntro":"先选出离新数据(?)最近的 K=3 个邻居，再按它们的标签多数表决得到预测。","mlKnnVisualCaption":"虚线圆：按距离。K=3 邻居(紫)标签: 1, 2, 2 → 多数表决为 2","mlKnnVisualStep0":"① 训练数据 — 特征空间中的点（标签 1 或 2）","mlKnnVisualStep1":"② 新数据(?)出现 — 预测该点的标签","mlKnnVisualStep2":"③ 按距离找到最近的 K=3 个（虚线圆）","mlKnnVisualStep3":"④ 与 K=3 邻居连线 — 按距离顺序","mlKnnVisualStep4":"⑤ 多数表决：标签 1, 2, 2 → 预测为 2","mlLinearRegressionVisualIntro":"找出与数据点最拟合的直线 $\\hat{y} = w x + b$。","mlLinearRegressionVisualStep0":"① 训练数据 — (x, y) 散点图","mlLinearRegressionVisualStep1":"② 错误的初始直线 — 梯度下降前","mlLinearRegressionVisualStep2":"③ 直线学习并移向最优位置","mlLinearRegressionVisualStep3":"④ 学习完成 — 用新输入 $x$ 预测 $\\hat{y}$","mlLinearRegressionVisualCaption":"$$y \\approx 0.7x + 1.1$ — 梯度下降学习 $w$, $b$","mlLinearRegressionVisualLearningBadge":"学习中...","mlLinearRegressionVisualPlay":"观看直线学习过程","mlLinearRegressionVisualReplay":"重新播放","mlLinearRegressionProblemSolvingLabel":"解题说明","mlMseVisualIntro":"预测 $\\hat{y}$ 与实际 $y$ 的差平方后取平均即为 MSE。","mlMseVisualStep0":"① 数据点与预测直线 $\\hat{y} = w x + b$","mlMseVisualStep1":"② 各点到直线的残差（误差）","mlMseVisualStep2":"③ 误差平方 $(y_i - \\hat{y}_i)^2$","mlMseVisualStep3":"④ MSE $= \\frac{1}{n}\\sum_i (y_i - \\hat{y}_i)^2$","mlMseVisualCaption":"MSE $= \\frac{1}{n}\\sum_i (y_i - \\hat{y}_i)^2$ — 损失越小，直线对数据拟合越好。","mlMseVisualSquaresLabel":"平方误差 = 面积（边长 = |残差|）","mlMseProblemSolvingLabel":"解题说明","mlLogisticProblemSolvingLabel":"解题说明","mlLogisticVisualIntro":"线性分数 $z$ 越大，$\\sigma(z)$ 越接近 1，越判为 class 1。$z=0$ 为决策边界。","mlLogisticVisualCaption":"Sigmoid：$\\sigma(z) = \\frac{1}{1+e^{-z}}$。$z>0$ 时 $\\hat{y}=1$，$z \\le 0$ 时 $\\hat{y}=0$。","mlLogisticVisualFormulaExplain":"**公式读法** — $z$ 为很大负数时 $e^{-z}$ 很大，$\\sigma(z) \\approx 0$。$z=0$ 时 $\\sigma(0)=0.5$。$z$ 为很大正数时 $e^{-z} \\approx 0$，$\\sigma(z) \\approx 1$。即该公式把任意 $z$ 压成 0～1 之间的概率。","mlLogisticVisualXAxisLabel":"z (线性分数)","mlLinearRegressionProblemSolvingTable":"$1b","mlKnnProblemSolvingTable":"| 步骤 | 说明 |\n| :--- | :--- |\n| **输入** | 新数据的特征向量 $\\mathbf{x}$ |\n| **已存数据** | (特征, 标签) 对 $(\\mathbf{x}_i, y_i)$ |\n| **1** | 计算 $\\mathbf{x}$ 与各 $\\mathbf{x}_i$ 的距离 $d(\\mathbf{x}, \\mathbf{x}_i)$ |\n| **2** | 按距离取最小的 K 个 |\n| **3（分类）** | 用 K 个标签的**多数表决**得到预测 $\\hat{y}$ |\n| **3（回归）** | 用 K 个 $y_i$ 的**平均**作为预测 $\\hat{y}$ |","mlDataFeature":{"chapter":"Chapter 00","title":"机器学习的起点: 数据与特征(Feature)","description":"机器学习从数据开始。我们将图像、文字、数字转化为**特征(Feature)**这种数字形式，让模型能够学习模式。基础数学Ch00中学习的「数字与函数」世界在这里成为现实。","sectionTitle":"数据与特征(Feature)是什么","whatIs":{"0":"**数据是机器学习的原料** — 如基础数学Ch00所学，深度学习与机器学习将我们提供的图像、文字、声音都转化为**数字**。这些**数字化的输入**与**标签(Label)**的配对就是**数据**。例如「猫的照片＋猫」构成一个数据，这样的配对积累数千、数万条，就成为模型可学习的原料。","1":"**特征(Feature)是将数据的核心提取为数字的结果** — 我们看到的照片对计算机而言只是数万个像素数字的集合。从中选出「耳朵形状」「眼睛大小」「毛色」等**有助于判断的信息**并以数字表示，就是**特征**。数学上以**向量**表示，通过**函数**从原始数据中提取。Ch00中提到的「规定输入输出规则的函数」正是承担这一转换的角色。","2":"**总结** — 数据是(输入、标签)的集合，特征是将该输入转化为模型可理解的**数字向量**的结果。好的特征能让模型学得更好，坏的特征即使数据再多也难以提升性能。机器学习的起点就是决定「用什么数据、转化为哪些特征」。"},"whyImportant":{"0":"**没有数据就无法学习** — 模型做出的所有决策归根结底都是**数字与函数**的计算结果。如Ch00所学，要追踪AI的计算过程，数据必须以**数字**形式整理。数据不足或混入错误标签，模型就会学到错误的模式。","1":"**特征设计决定模型的上限** — 人决定「提取哪些信息为数字」的过程称为**特征工程**。股价预测中只用「昨日收盘价」与加入「移动平均、成交量、波动率」相比，结果大不相同。用**向量与矩阵**将众多特征打包一次性计算，是Ch00路线图的核心，在此过程中特征的质量左右模型性能。","2":"**通往下一章的桥梁** — Ch02 KNN、Ch03 线性回归、Ch05 逻辑回归等所有机器学习算法都以**特征向量**为输入。理解数据与特征，才能解释「模型为何做出这样的预测」，而涉及**微分**与**概率**的后续章节也建立在这一基础之上。"},"howUsed":{"0":"**输入 → 特征提取 → 模型 → 预测** — 机器学习流水线与Ch00中的**输入 → 数字转换 → 函数重复 → 输出**结构相同。特征提取是「数字转换」阶段，模型(线性回归、KNN等)是**函数**的集合。**微分**用于学习时减小误差，**概率**用于表达预测的不确定性，如「这张图是猫的概率90%」。"},"problemSolving":{"0":"本章总结了**数据**与**特征(Feature)**在机器学习中的角色以及在实际中的用法。数据是(输入、标签)配对的集合，特征则是将输入转化为模型可用的**数字向量**的结果。做好**特征工程**、选好特征会极大影响效果，因此在进入下一章（KNN、线性回归等）之前，建议先扎实掌握这些概念。","1":"| 区分 | 在数据·特征中的角色 | 与基础数学的关联 |\n| --- | --- | --- |\n| **数据** | (输入、标签)配对的集合，以数字表示 | 函数的定义域·值域 (Ch01) |\n| **特征** | 将输入转化为向量的结果，模型的输入 | 向量、矩阵 (Ch00路线图) |\n| **学习** | 用数据调整模型参数 | 微分、梯度 (Ch06~08) |\n| **预测** | 特征向量 → 模型 → 预测值或概率 | 概率、分布 (Ch10~12) |"}},"mlSupervisedUnsupervisedSelf":{"chapter":"Chapter 01","title":"监督学习、无监督学习与自监督学习","description":"根据数据的使用方式，机器学习常分为**监督学习**、**无监督学习**和**自监督学习**。**监督学习**像对照答案学习；**无监督学习**像在没有标签的情况下发现模式、将相似项分组；**自监督学习**像遮住数据的一部分，通过预测缺失部分来学习。本章概括这三种范式的核心思想、数学与实战用法，为后续算法打好基础。","sectionTitle":"三种学习方式：监督、无监督、自监督","whatIs":{"0":"**监督学习：从输入–标签对学习** — 模型被给予**输入 $\\mathbf{x}$** 与对应的**标签(目标) $y$** 成对出现。目标是近似函数 $y = f(\\mathbf{x})$，训练后可为新输入预测 $y$。形式上将训练集记为 $\\mathcal{D} = \\{(\\mathbf{x}_1, y_1), (\\mathbf{x}_2, y_2), \\ldots\\}$，通过**最小化损失**（如 MSE、交叉熵）得到 $f$。Ch02 KNN、Ch03 线性回归、Ch04 逻辑回归均为监督学习。\n* **例1（分类）**：垃圾邮件过滤——邮件内容($\\mathbf{x}$) → 是否垃圾($y$)。\n* **例2（回归）**：房价预测——面积、位置($\\mathbf{x}$) → 价格($y$)。\n* **例3（医疗）**：患者检查指标($\\mathbf{x}$)与诊断结果($y$)用于辅助诊断。","1":"**无监督学习：发现隐藏结构** — 只提供**输入 $\\mathbf{x}$**，**没有标签 $y$**。可理解为「只有题目、没有答案」。目标是利用 $\\mathbf{x}$ 之间的**距离与相似度**发现**结构、模式或聚类**：把相似点归为一类（聚类）、压缩到更少维度（降维）、或标记偏离正常模式的**异常**。\n* **例1（聚类）**：用顾客年龄与购买历史($\\mathbf{x}$)做客户分群。\n* **例2（异常检测）**：学习正常交易模式($\\mathbf{x}$)，标记异常交易。\n* **例3（降维）**：将很多特征压成 2～3 个数，便于可视化或去噪。（具体方法会在后面学到。）","2":"**自监督学习：从数据构造目标** — 不依赖人工标签，模型从数据本身构造**伪标签**。典型流程：(1)**遮住**输入的一部分（如词、图像块）；(2)**预测**被遮部分；(3)**利用**学到的表示，用少量监督数据做下游任务。BERT、GPT 及很多视觉模型都是在大规模无标注数据上这样预训练的。\n* **例1（语言）**：「我吃了 [MASK]」——根据上下文预测被遮词（LLM）。\n* **例2（视觉）**：遮住图像一块，用其余像素重建该块。\n* **例3（对比）**：同一图像的不同增强视为「相同」、不同图像视为「不同」，学习表示。"},"whyImportant":{"0":"**数据性质与成本** — 为全部数据打标签成本高。标签充足时**监督**有效；标签稀缺时用**无监督**或**自监督**利用无标签数据，再用少量监督微调。**可解释性**也不同：监督可通过损失和决策路径做一定解释；无监督/自监督需要另做解释（如聚类命名、可视化）。","1":"**预训练与微调** — 现代流程常在大规模无标签数据上做**自监督**预训练，再在少量有标签数据上做**监督**微调。**无监督**常用于预处理与探索，例如先用 K-Means 对客户聚类，由人为聚类赋予含义（如「忠诚」「流失风险」），再建监督流失预测模型。选对范式能使流程清晰，并在数据量与标注成本下更现实。"},"howUsed":{"0":"**监督** — Ch02 KNN、Ch03 线性回归、Ch04 逻辑回归从(输入, 标签)对学习。**分类**：垃圾邮件、疾病预测、图像分类。**回归**：房价、销量、温度等，Ch03/Ch04 会讲数学与优化。","1":"**无监督** — Ch08 K-Means 在无标签下聚类；**降维**（把很多特征压成 2～3 个数）也是常用工具。**聚类**：客户细分、主题分组。**异常检测**：学习「正常」区域，标记区域外样本。","2":"**自监督** — BERT（掩码词预测）、GPT（下一词预测）、视觉**对比学习**等广泛使用。预训练后用少量标签做 QA、摘要、分类等。"},"problemSolving":{"0":"**小结** — (1)**监督**：从 $(\\mathbf{x},y)$ 对学习 $y=f(\\mathbf{x})$。(2)**无监督**：仅从 $\\mathbf{x}$ 发现结构/聚类。(3)**自监督**：从伪标签（如掩码词）学习表示，再用少量监督数据做下游任务。","1":"| | 监督 | 无监督 | 自监督 |\n| :--- | :--- | :--- | :--- |\n| **标签** | 有($y$) | 无 | 自建目标 |\n| **目标** | 预测$y$（分类/回归） | 结构、聚类、降维 | 表示学习 |\n| **例子** | KNN、线性/逻辑回归 | K-Means、降维 | BERT、对比学习 |","2":"**按题型** — **定义**：监督=(x,y)对；无监督=无标签；自监督=自建目标。**任务**：有人工标签？→监督。无标签、仅分组/降维？→无监督。标签由数据派生（如掩码词）？→自监督。**场景**：垃圾邮件分类(监督)、客户聚类(无监督)、掩码词预测(自监督)。","3":"**一行比较** — 监督：「用(题目, 答案)对学习。」无监督：「没有答案，只看数据做分组或降维。」自监督：「遮住一部分数据，预测空缺以学习表示。」做题时看有没有标签、以及标签是人给的还是数据衍生的，即可快速判断类型。"},"mlSupervisedUnsupervisedSelfVisualIntro":"三种学习范式：监督(输入–标签对)、无监督(无标签)、自监督(自建目标)。","mlSupervisedUnsupervisedSelfVisualStep0":"监督：从(输入, 标签)对学习预测函数","mlSupervisedUnsupervisedSelfVisualStep1":"无监督：在无标签下发现结构与聚类","mlSupervisedUnsupervisedSelfVisualStep2":"自监督：从自建目标学习表示","mlSupervisedUnsupervisedSelfProblemSolvingLabel":"解题说明","mlSupervisedUnsupervisedSelfVisualPhase0Title":"监督学习：输入 x 与标签 y 成对出现","mlSupervisedUnsupervisedSelfVisualPhase0Caption":"当按顺序给出 (x, y) 对时，模型学习规则","mlSupervisedUnsupervisedSelfVisualPhase1Title":"无监督学习：只有输入 x（无标签 y）","mlSupervisedUnsupervisedSelfVisualPhase1Caption":"没有 y(标签)，只有 x。部分 x 闪烁 → 模型仍发现结构与聚类","mlSupervisedUnsupervisedSelfVisualPhase1NoLabelBadge":"无标签","mlSupervisedUnsupervisedSelfVisualPhase2Title":"自监督学习：遮住部分数据并预测空缺","mlSupervisedUnsupervisedSelfVisualPhase2Caption1":"遮住部分输入","mlSupervisedUnsupervisedSelfVisualPhase2Caption2":"模型预测被遮部分","mlSupervisedUnsupervisedSelfVisualPhase2Caption3":"用预测词填满空缺","mlSupervisedUnsupervisedSelfVisualPhase2Prefix":"我吃了","mlSupervisedUnsupervisedSelfVisualPhase2Suffix":"","mlSupervisedUnsupervisedSelfVisualPhase2Filled":"饭","mlSupervisedUnsupervisedSelfVisualPhase2Example":"例：填空 → 表示学习（如 BERT）","mlSupervisedUnsupervisedSelfVisualPhase2Step1":"遮住","mlSupervisedUnsupervisedSelfVisualPhase2Step2":"预测","mlSupervisedUnsupervisedSelfVisualPhase2Step3":"填满","mlSupervisedUnsupervisedSelfVisualAutoCycle":"三种方式同时播放动画","problemAnswerHint":"答案为监督学习输入1，无监督输入2，自监督输入3。","problems":{"definition_1_0":"用输入与标签(答案)成对的数据进行学习的方式是？①监督 ②无监督 ③自监督","definition_1_1":"从(输入 $\\mathbf{x}$，标签 $y$)对学习 $y=f(\\mathbf{x})$ 的是哪种学习？①监督 ②无监督 ③自监督","definition_1_2":"可以用「老师用红笔批改答案」来比喻的学习方式是？①监督 ②无监督 ③自监督","definition_1_3":"在分类或回归中使用人工标注标签的学习是？①监督 ②无监督 ③自监督","definition_1_4":"从(输入, 标签)对学习分类或回归的代表性学习方式是？①监督 ②无监督 ③自监督","definition_1_5":"数据带有目标值、模型被训练去拟合该目标的学习方式是？①监督 ②无监督 ③自监督","definition_2_0":"仅凭输入、无标签地发现结构、模式或聚类的是哪种学习？①监督 ②无监督 ③自监督","definition_2_1":"没有标签 $y$、只有 $\\mathbf{x}$ 时，在数据中找分组的方式是？①监督 ②无监督 ③自监督","definition_2_2":"无标签地把相似数据聚成簇，对应哪种学习方式？①监督 ②无监督 ③自监督","definition_2_3":"可以用「自己发现类型并归类」来比喻的学习是？①监督 ②无监督 ③自监督","definition_2_4":"常用于降维或异常检测、无标签的学习是？①监督 ②无监督 ③自监督","definition_2_5":"在无人为答案的情况下只发现数据结构的方式是？①监督 ②无监督 ③自监督","definition_3_0":"用数据自身生成的「伪标签」来学习的方式是？①监督 ②无监督 ③自监督","definition_3_1":"像「遮词填空、下一句预测」那样自己构造目标的学习是？①监督 ②无监督 ③自监督","definition_3_2":"通过遮住句子一部分并预测该部分来学习的是？①监督 ②无监督 ③自监督","definition_3_3":"用大量无标签数据学习表示(representation)的范式是？①监督 ②无监督 ③自监督","definition_3_4":"可以用「自己出题自己做」来比喻的学习是？①监督 ②无监督 ③自监督","definition_3_5":"自己构造「相同/不同」对来学习表示的学习方式是？①监督 ②无监督 ③自监督","taskClassify_0":"垃圾邮件分类(有垃圾/正常标签)属于哪种学习？①监督 ②无监督 ③自监督","taskClassify_1":"仅有客户购买数据、无标签地把相似客户聚在一起是？①监督 ②无监督 ③自监督","taskClassify_2":"通过预测句中遮住的词来学习词表示的是？①监督 ②无监督 ③自监督","taskClassify_3":"根据面积·位置预测房价是？①监督 ②无监督 ③自监督","taskClassify_4":"只有图像、无标签地把相似图像聚在一起(聚类)是？①监督 ②无监督 ③自监督","taskClassify_5":"用大量文本预训练后再用少量标签微调，前一阶段是？①监督 ②无监督 ③自监督","taskClassify_6":"用医学影像和「有无疾病」标签做疾病预测模型是？①监督 ②无监督 ③自监督","taskClassify_7":"无标签、只做「相似客户聚类」的客户细分是？①监督 ②无监督 ③自监督","taskClassify_8":"通过下一句预测学习上下文表示的是？①监督 ②无监督 ③自监督","taskClassify_9":"根据学习时间预测考试成绩是？①监督 ②无监督 ③自监督","taskClassify_10":"异常检测(只有正常数据、几乎无异常标签)最接近？①监督 ②无监督 ③自监督","taskClassify_11":"通过用其余部分预测图像被遮住部分来学习表示的是？①监督 ②无监督 ③自监督","scenario_0":"医院用历史患者数据(症状、检查值)和诊断结果(标签)学习「该患者是否患A病」。这是？①监督 ②无监督 ③自监督","scenario_1":"商城仅凭购买记录、无额外标签把客户分成若干组。这是？①监督 ②无监督 ③自监督","scenario_2":"用维基百科句子中遮住15%的词、并预测这些词的任务训练模型。这是？①监督 ②无监督 ③自监督","scenario_3":"用天气、日期和冰淇淋销量(标签)预测明日销量。这是？①监督 ②无监督 ③自监督","scenario_4":"对视频数据无标签地按相似场景聚类做索引。这是？①监督 ②无监督 ③自监督","scenario_5":"在大规模文档上以「下一句」预测学习上下文表示，再用少量QA标签微调。前一阶段是？①监督 ②无监督 ③自监督","scenario_6":"用狗/猫图片和各自类别(标签)训练分类器。这是？①监督 ②无监督 ③自监督","scenario_7":"仅有股价序列、无标签地划分模式区间。这是？①监督 ②无监督 ③自监督","scenario_8":"同一句子换一种说法，以「含义相同」为目标学习表示。这是？①监督 ②无监督 ③自监督","scenario_9":"用应聘资料(经历、学历)和是否录用(标签)建录用预测模型。这是？①监督 ②无监督 ③自监督","scenario_10":"仅有新闻正文、无主题标签地按主题聚类。这是？①监督 ②无监督 ③自监督","scenario_11":"通过遮住并还原部分语音来学习语音表示。这是？①监督 ②无监督 ③自监督","trueFalse_0":"「用输入与标签成对的数据学习」描述的是监督学习。这是哪种类型？①监督 ②无监督 ③自监督","trueFalse_1":"「无标签地只发现数据结构」描述的是无监督学习。这是哪种类型？①监督 ②无监督 ③自监督","trueFalse_2":"「用从数据构造的目标(如遮住的词)学习」描述的是自监督学习。这是哪种类型？①监督 ②无监督 ③自监督","trueFalse_3":"用(输入, 标签)对拟合一个预测值的函数。是哪种学习？①监督 ②无监督 ③自监督","trueFalse_4":"仅凭数据、无标签地把数据分成K组。是哪种学习？①监督 ②无监督 ③自监督","trueFalse_5":"通过预测句中遮住的词来学习。是哪种学习？①监督 ②无监督 ③自监督","trueFalse_6":"用人工标注的合格/不合格标签学习。是哪种学习？①监督 ②无监督 ③自监督","trueFalse_7":"「无答案、仅凭数据把相似项归类」描述的是无监督学习。这是哪种类型？①监督 ②无监督 ③自监督","trueFalse_8":"用自己构造的「相同/不同」对学习表示。是哪种学习？①监督 ②无监督 ③自监督","trueFalse_9":"训练时使用(输入, 标签)对，对新输入预测标签。是哪种学习？①监督 ②无监督 ③自监督","trueFalse_10":"异常检测中仅用正常数据学习「正常区域」最接近无监督。这是哪种类型？①监督 ②无监督 ③自监督","trueFalse_11":"「通过预测下一句学习上下文」属于自监督。这是哪种类型？①监督 ②无监督 ③自监督"}},"mlKnn":{"chapter":"Chapter 02","title":"K近邻 (KNN)：物以类聚","description":"**物以类聚** — KNN 找出「最近的 K 个邻居」，用他们的标签（多数表决）来预测新数据。没有复杂的学习公式，只要算**距离**即可，是直观的第一个分类算法。","sectionTitle":"K近邻 (KNN)：物以类聚","whatIs":{"0":"**KNN 是什么** — 对于新来的数据点，在**已有标签的数据**中选出**距离最近的 K 个**，用这 K 个的**多数表决**决定新数据的标签。例：若 5 个最近邮件中有 4 个是「垃圾邮件」，则新邮件也判为垃圾邮件。","1":"**用距离定义「近」** — 「近」是指在**特征空间**里两点间的**距离**小。最常用的是**欧氏距离**：$d(\\mathbf{x}, \\mathbf{y}) = \\sqrt{\\sum_{i}(x_i - y_i)^2}$。若只有两个特征，就是平面上的直线距离。","2":"**K 是超参数** — K=1 时只看最近 1 个；K 越大越平滑，但边界可能变钝。常用**奇数**避免平票。"},"whyImportant":{"0":"**没有显式训练（惰性学习）** — KNN 不学一个紧凑模型，预测时再算到所有已存点的距离。训练成本低，预测成本可能较高。","1":"**可解释** — 可以用「因为 5 个相似邮件里 4 个是垃圾邮件」这样的近邻来说明预测，便于可解释 AI。","2":"**常作基线** — 在试复杂模型前，先用 KNN 看数据能被分得多好。"},"howUsed":{"0":"**分类** — 用 K 个近邻的**类别（标签）**多数表决。用于图像分类、垃圾邮件检测、风险分层等。","1":"**回归** — 预测 K 个近邻目标值的**平均**（如用周边 5 套房价格平均估计自家房价）。","2":"**距离与尺度** — 特征尺度不同时，距离会被某一维主导。建议先**归一化**或**标准化**再算距离。"},"problemSolving":{"0":"KNN 的做法是：对新来的数据，从已存数据中选出**距离最近的 K 个**，**分类**时用这 K 个的标签**多数表决**，**回归**时用这 K 个取值的**平均**作为预测。没有单独的「训练」步骤，只算距离即可，因此很直观；但若特征尺度不一，某一维会主导距离，所以先做**归一化(Scaling)**再算距离很重要。","1":"| 步骤 | 说明 |\n| :--- | :--- |\n| **输入** | 新数据的特征向量 $\\mathbf{x}$ |\n| **已存数据** | (特征, 标签) 对 $(\\mathbf{x}_i, y_i)$ |\n| **1** | 计算 $\\mathbf{x}$ 与各 $\\mathbf{x}_i$ 的距离 $d(\\mathbf{x}, \\mathbf{x}_i)$ |\n| **2** | 按距离取最小的 K 个 |\n| **3（分类）** | 用 K 个标签的**多数表决**得到预测 $\\hat{y}$ |\n| **3（回归）** | 用 K 个 $y_i$ 的**平均**作为预测 $\\hat{y}$ |"},"problemSolvingTable":"| 步骤 | 说明 |\n| :--- | :--- |\n| **输入** | 新数据的特征向量 $\\mathbf{x}$ |\n| **已存数据** | (特征, 标签) 对 $(\\mathbf{x}_i, y_i)$ |\n| **1** | 计算 $\\mathbf{x}$ 与各 $\\mathbf{x}_i$ 的距离 $d(\\mathbf{x}, \\mathbf{x}_i)$ |\n| **2** | 按距离取最小的 K 个 |\n| **3（分类）** | 用 K 个标签的**多数表决**得到预测 $\\hat{y}$ |\n| **3（回归）** | 用 K 个 $y_i$ 的**平均**作为预测 $\\hat{y}$ |"},"mlLinearRegression":{"chapter":"Chapter 03","title":"线性回归：贯穿数据趋势的直线","description":"当数据点分散时，**线性回归**找出**贯穿其趋势的直线**，并对新输入进行预测。这是第一个能直接看到基础数学中的**函数**、**微分**、**偏微分**如何通向机器学习「训练」的回归模型。","sectionTitle":"线性回归：贯穿数据趋势的直线","whatIs":{"0":"**什么是线性回归？** — 假设输入 $x$ 与输出 $y$ 之间存在**线性关系** $y = w_1 x + w_0$（多变量时为 $y = \\mathbf{w}^\\top \\mathbf{x} + b$），并寻找与数据最拟合的**权重 $w$ 和截距 $b$**。基础数学 Ch01 的**函数** $y = f(x)$ 在这里具体化为**一次函数**。","1":"**「最拟合」的含义** — 最小化预测值 $\\hat{y}_i = w x_i + b$ 与真实值 $y_i$ 之间的**误差**。衡量该误差的函数是**损失函数**，Ch04 将学习的**MSE（均方误差）**是最常用的。","2":"**与 KNN 的区别** — KNN 用「近邻的平均」预测，而线性回归学习并保存**一个公式（直线）**。预测时无需搜索近邻，只需计算 $\\hat{y} = w x + b$。"},"whyImportant":{"0":"**微分与优化的首次应用** — 要最小化误差，需使用**微分**（基础数学 Ch06）。沿损失函数对 $w$、$b$ 的**梯度**下降即可到达最小值。这正是**梯度下降法**，与深度学习训练的原理相同。","1":"**可解释性** — 学到的 $w$ 表示「$x$ 增加 1 时 $y$ 变化多少」。例如房屋面积($x$)与价格($y$)，$w > 0$ 表示「面积越大越贵」，符合直觉。这种**可解释性**在实际中信任和改进模型时很重要。","2":"**其他模型的基础** — 逻辑回归(Ch05)、神经网络中的单个神经元，都是「线性变换 + 非线性函数」结构。理解线性回归，就能理解它们的**线性部分**如何工作。"},"howUsed":{"0":"**回归** — 用于预测**连续数值**：房价、销量、温度、分数等。多特征时为 $y = w_1 x_1 + w_2 x_2 + \\cdots + w_n x_n + b$ 的**多元线性回归**。","1":"**特征重要性** — $|w_i|$ 越大的特征对预测影响越大。做特征工程(Ch01)时，可用这些值决定保留或剔除哪些特征。","2":"**正规方程 vs 梯度下降** — 特征较少时可用**正规方程**一步求得最优解。特征多或数据量大时，用**梯度下降法**迭代更新 $w$。基础数学 Ch08 的**偏微分与梯度**是这里的核心工具。"},"visual":"","problemSolving":{"0":"**概要：不断减小误差的「试错」过程** — 线性回归像侦探一样，在散落的数据点间寻找**唯一一条**最能贯穿它们的**直线**（$y=wx+b$）。**模型（假设）**：起初随机画一条线，自然与真实数据不符，**误差**很大。**学习**：为减小误差使用梯度下降——就像蒙眼从山顶一步步往下走，寻找最低的谷底（误差最小处）。**预测**：到达谷底就找到了最优斜率（$w$）和位置（$b$）。之后新问题（$x$）一来，只需代入这条完成的公式，即可立刻预测答案（$\\hat{y}$）。","1":"**从数据中提取法则的三步** — 线性回归是在复杂数据中找出 $y=wx+b$ 这条**简单法则**的过程。\n\n**① 建立模型** — 假设「输入（$x$）与目标（$y$）呈线性关系」，据此设定模型。\n\n**② 优化（训练）** — 计算预测值（$\\hat{y}$）与实际值（$y$）之差即**损失**，用梯度下降逐步更新 $w$（斜率）和 $b$（截距）以最小化损失。这与深度学习的学习原理完全相同。\n\n**③ 推理（预测）** — 学到的直线压缩了数据的模式。新数据到来时，无需复杂运算，直接代入直线公式即可立刻得到预测结果。"}},"mlMse":{"chapter":"Chapter 04","title":"损失函数 (MSE)：衡量预测与真值的误差","sectionTitle":"损失函数 (MSE)","description":"线性回归中找「最拟合直线」时，需要用一个数来衡量预测与真值的差距。各点上预测 $\\hat{y}$ 与实际 $y$ 的差（误差）平方后求和，得到 **平方误差和 SSE（Sum of Squared Errors）**，再除以数据个数即得 **均方误差 MSE（Mean Squared Error）**。MSE **越接近 0** 说明模型拟合越好，梯度下降要最小化的正是这个 MSE。","whatIs":{"0":"**误差的尺子** — 需要有一个**损失函数**来概括模型错得有多厉害。每点上实际值 $y$ 与预测值 $\\hat{y}$ 的差称为**残差（误差）**。将各残差平方后全部相加，得到 **平方误差和 SSE（Sum of Squared Errors）**；再除以数据个数 $n$，即得 **均方误差 MSE（Mean Squared Error）**：$\\text{MSE} = \\frac{1}{n}\\sum (y - \\hat{y})^2 = \\text{SSE}/n$。该值越小，说明模型拟合得越好。","1":"**为何平方？** — 残差 $+2$ 与 $-2$ 都表示「差 2」。直接相加会相互抵消，**平方**后恒为正，且大误差惩罚更重。","2":"**与线性回归的联系** — Ch03 的直线 $\\hat{y}=wx+b$「最拟合数据」是指：让平方误差和 **SSE** 除以数据个数得到的 **MSE** 达到最小，从而确定斜率 $w$ 和截距 $b$。梯度下降就是沿减小 MSE 的方向更新 $w$, $b$。"},"whyImportant":{"0":"**定义学习目标** — 机器学习常概括为「最小化损失」。回归中损失取为 MSE 时，模型只朝降低 MSE 的方向更新，**目标明确**。","1":"**便于求导** — 平方函数求导形式简单，梯度下降易算；深度学习中也广泛使用平方误差类损失。","2":"**RMSE：恢复原有单位** — MSE 是对误差**平方**再求平均，所以单位是「$y$ 的平方」（例如价格预测时是「元²」）。实际中常希望用「平均差多少元、多少度」这种**原单位**表达，这时会对 MSE 开平方，得到 **RMSE（Root Mean Squared Error, 均方根误差）**：$\\sqrt{\\text{MSE}}$，与 $y$ 同单位。理解 MSE 后，RMSE 就很容易理解。"},"howUsed":{"0":"**回归模型训练** — 线性回归、神经网络回归等在训练数据上计算 MSE，并沿减小 MSE 的方向更新参数。","1":"**模型比较** — 比较哪条直线（或模型）更拟合数据时，分别算 MSE，**数值更小**的更好。","2":"**验证与测试** — 训练后在未见数据上算 MSE，可得**泛化性能**的客观指标。"},"visual":"...","problemSolving":{"0":"**损失函数（MSE）小结**\n\n**① 概念脉络** — 实际值 $y$ 与预测值 $\\hat{y}$ 之差称为**残差（误差）** $e_i = y_i - \\hat{y}_i$。将各点残差平方后求和得**平方误差和（SSE）** $= \\sum_i (y_i - \\hat{y}_i)^2$，再除以数据个数 $n$ 得**均方误差（MSE）** $= \\frac{1}{n}\\sum_i (y_i - \\hat{y}_i)^2 = \\text{SSE}/n$。需要与 $y$ 同单位时使用 **RMSE** $= \\sqrt{\\text{MSE}}$。\n\n---\n\n**② 为何用平方？** — 误差为 $+3$ 或 $-3$ 都表示「差 3」。直接相加会正负相抵，**平方**后恒为正，并对大误差施加更大惩罚，促使模型减少严重错误。\n\n---\n\n**③ 在学习中的作用** — MSE 是**指南针**：「往使该值变小的方向更新」。梯度下降沿减小 MSE 的方向更新 $w$、$b$。平方函数光滑、易求导，便于用梯度下降找到最小值。\n\n---\n\n**④ 使用场景** — 回归（价格·气温·股价预测等）训练、模型比较（MSE 越小越优）、深度学习输出层损失。解题步骤与数值例题见下方**解题说明**区块。"}},"mlLogistic":{"chapter":"Chapter 05","title":"逻辑回归 (Logistic Regression)：及格还是不及格？","description":"线性回归预测「分数」，**逻辑回归**则专门做 **是/否** 分类——例如「这个分数算**及格(1)**还是**不及格(0)**？」。它用 **Sigmoid 函数**把分数变成 0～1 的**概率**。","sectionTitle":"逻辑回归：及格还是不及格？","whatIs":{"0":"**S 形曲线：Sigmoid** — 线性模型算出的分数 $z$ 可正可负、可很大。概率必须在 0～1 之间。**Sigmoid** $\\sigma(z) = \\frac{1}{1+e^{-z}}$ 把任意 $z$ 映射到 (0, 1)。","1":"**决策边界** — Sigmoid 给出「及格概率 0.7」后，需要规则。通常取 **0.5**：概率 ≥ 0.5 预测 **1（是）**，否则 **0（否）**。","2":"**内核与线性回归相同** — 逻辑回归仍先算分数 $z = wx + b$，区别只是多了一步：把 $z$ 通过 **Sigmoid** 变成概率。","3":"**如何读 $\\sigma(z) = \\frac{1}{1+e^{-z}}$** — $z$ 很大且为负时 $e^{-z}$ 很大，$\\sigma(z) \\approx 0$。$z=0$ 时 $\\sigma(0)=0.5$。$z$ 很大且为正时 $e^{-z} \\approx 0$，$\\sigma(z) \\approx 1$。因此任意 $z$ 都被压成 [0,1] 内的概率。"},"whyImportant":{"0":"**现实里大量是非题** — 是否垃圾邮件？是否患病？用户会不会买？**二分类**无处不在，逻辑回归是标准基线。","1":"**用数字表示置信度** — 说「及格概率 98%」比只说「及格」更有用。逻辑回归给出**概率**，便于决策。","2":"**通往深度学习的桥梁** — 神经网络中单个神经元的行为与逻辑回归非常相似。掌握它有助于后续理解深度学习。"},"howUsed":{"0":"**垃圾邮件过滤** — 根据特征算「该邮件是垃圾邮件的概率」，超过阈值则判为垃圾。","1":"**医疗 AI** — 根据影像或化验值预测「患病概率」，辅助诊断。","2":"**营销与推荐** — 预测「用户是否会流失」「是否会点击」等，用于定向与广告。"},"visual":"","problemSolving":{"0":"**逻辑回归小结** — 用于**二分类**（是/否、及格/不及格）。先算线性分数 $z = w_1 x_1 + w_2 x_2 + \\cdots + b$，再用 **Sigmoid** $\\sigma(z) = \\frac{1}{1+e^{-z}}$ 得到概率；概率 ≥ 0.5 预测 $\\hat{y}=1$，否则 $\\hat{y}=0$（$z=0$ 为决策边界）。重要原因：很多实际任务是二分类；同时给出**置信度（概率）**，也是理解深度学习神经元的基础。应用：垃圾邮件过滤、医疗辅助、营销（流失、点击预测）。**解题流程**：算 $z$ → $\\sigma(z)$ → $z>0$ 则 $\\hat{y}=1$，否则 $\\hat{y}=0$。具体例题见下方**解题说明**区块。"}},"mlDecisionTree":{"chapter":"Chapter 06","title":"决策树（Decision Tree）：用二十个问题找答案","description":"决策树像「二十个问题」游戏一样工作：对数据提问（条件），按是/否沿分支走，在叶节点得到预测。易于解释（能看到每条决策的理由），也是随机森林等集成方法的基础。","sectionTitle":"决策树：用二十个问题找答案","whatIs":{"0":"**基本结构** — 想象一棵倒过来的树。顶端是**根节点**（第一个问题）。从那里根据条件（如「特征 $x_1 \\le 3$？」）的「是」「否」进入**内部节点**。无法再分割时到达**叶节点**，输出**预测**（类别或数值）。","1":"**与二十个问题相同** — 像猜动物一样「四条腿吗？」→「食草吗？」→「老虎！」用问题逐步缩小答案范围。决策树也一样，用问题把数据分成两组。","2":"**好问题的标准：降低不纯度** — **不纯度**衡量节点内类别的混杂程度。希望分割后节点更「纯」。常用公式：**基尼** $G = 1 - \\sum p_i^2$ 和**熵** $H = -\\sum p_i \\log_2 p_i$。一类占100%时两者为0，各半时不纯度较高。","3":"**信息增益** — 分割前不纯度减去分割后（加权）不纯度即为**信息增益**，表示该问题让数据变「干净」了多少。树在每个节点选择信息增益最大的问题。","4":"**叶节点上的预测** — 在**叶节点**输出：**分类**时取该叶样本的**多数类**，**回归**时取**目标值平均**。新数据只需沿路径走到底即可得到预测。","5":"**剪枝** — 树过深会**过拟合**。**剪枝**通过砍掉部分分支限制深度、提高泛化。剪枝后的树是随机森林等集成的基础。"},"whyImportant":{"0":"**可解释 AI** — 不像黑箱模型，能清楚看到是哪些问题路径导致结论（如「年龄<30 且收入≥3000万→批准」）。在金融、医疗中很受重视。","1":"**非线性边界** — 线性模型用一条直线划分，决策树可以**阶梯状**多次划分，表达更复杂的模式。","2":"**集成的基础** — 单棵树可能不稳定，但几百棵**随机森林**就稳定且强大。Ch06 是 Ch07 的铺垫。"},"howUsed":{"0":"**信贷与贷款** — 「年收入≥5000万？」「一年内是否逾期？」等分支最终给出是否批准。","1":"**医疗决策辅助** — 血压、胆固醇等数据经一系列「二十问」预测患病风险、辅助诊断。","2":"**营销（流失、购买）** — 「注册超6个月？」「近一月登录≤3次？」等用于识别高风险客户、定向营销。"},"problemSolving":{"0":"**决策树解题** — (1)**沿路径**：从根节点起 0=否/左、1=是/右，叶节点的预测即为答案。\n\n---\n\n(2)**基尼**：由类数求 $p_i$，算 $G = 1 - \\sum_i p_i^2$，再对 $100 \\times G$ 四舍五入。\n\n---\n\n(3)**熵**：$H = -\\sum_i p_i \\log_2 p_i$，对 $100 \\times H$ 四舍五入。\n\n---\n\n(4)**叶节点多数决**：类0有 $a$ 个、类1有 $b$ 个时，$a \\ge b$ 预测0，否则预测1。详见下方**解题说明**表。"},"visual":""},"mlDecisionTreeProblemSolvingLabel":"解题说明","mlDecisionTreeVisualIntro":"从根节点按每个问题的「是/否」沿分支走，叶节点给出预测。","mlDecisionTreeVisualStep0":"① 根节点 — 第一个问题（如：特征 $x_1 \\le 3$？）","mlDecisionTreeVisualStep1":"② 否(0)/是(1) 向左/右子节点移动","mlDecisionTreeVisualStep2":"③ 在内部节点重复提问","mlDecisionTreeVisualStep3":"④ 叶节点 — 不再分割，输出预测（类别或数值）","mlDecisionTreeVisualPathCaption0":"① 根节点 — 提出第一个问题。按是/否沿分支向下。","mlDecisionTreeVisualPathCaption1":"④ 沿路径：是(1) → 叶0","mlDecisionTreeVisualPathCaption2":"⑤ 沿路径：否(0) → 叶1","mlDecisionTreeVisualStep0Description":"① 根节点 — 在第一个问题处按是/否分叉，沿左或右分支向下。","mlDecisionTreeVisualLabelRoot":"根","mlDecisionTreeVisualLabelYes":"是(1)","mlDecisionTreeVisualLabelNo":"否(0)","mlDecisionTreeVisualLabelQuestion":"问题","mlDecisionTreeVisualLabelLeaf0":"叶0","mlDecisionTreeVisualLabelLeaf1":"叶1","mlDecisionTreeVisualDiagramAriaLabel":"决策树结构：根—问题—叶","mlEnsemble":{"chapter":"Chapter 07","title":"集成与随机森林：群体智慧","description":"集成（Ensemble）将多个模型的预测合并为一个更好的预测。本章介绍装袋、提升、堆叠以及由多棵决策树投票或求平均的随机森林，便于初学者理解“集体智慧”的思路。","sectionTitle":"集成与随机森林：群体智慧","whatIs":{"0":"**集成的基本思想** — 把多个模型组成「团队」，把各自的预测汇总成最终结论。像陪审团投票一样，比单模型更少出错（方差更小）、预测更**稳定**。分类用**多数决**，回归用**预测的平均**。","1":"**为什么多数更好（群体智慧）** — 让100人目测牛的体重，个人会偏，但**平均**往往很接近真实值。模型**独立**判断再汇总，个体误差会相互抵消，**共同信号**保留下来。","2":"**三种代表方法：装袋、提升、堆叠** — (1)**装袋(Bagging)**：各模型用随机抽样的不同数据，再公平投票。(2)**提升(Boosting)**：下一个模型重点学上一个错的样本，**顺序**补足弱点。(3)**堆叠(Stacking)**：用基模型的输出作为元模型的输入做最终决策。","3":"**随机森林** — 装袋 + **决策树**成百上千棵。为保持多样性，每次分裂只**随机用部分特征**。有的树主要看「年龄」，有的主要看「收入」。","4":"**投票与平均的公式** — 分类的多数决就是「得票最多的类别」。回归（如房价）时对所有树的预测求平均：**$\\hat{y} = \\frac{1}{B}\\sum_{b=1}^B \\hat{y}_b$**（$B$=树的数量，$\\hat{y}_b$=第 $b$ 棵的预测）。例：三棵预测100、150、200则最终为150。","5":"**OOB（Out-of-Bag）评估** — 装袋/随机森林中每棵树只用部分数据训练。**未被抽到的样本（OOB）**可用来评估「没看过该样本」的树的性能，无需单独留验证集。"},"whyImportant":{"0":"**稳如森林** — 单棵决策树数据稍变形状就变，但几百棵**森林**里几棵错了也不影响整体决策，实战中非常稳定。","1":"**Ch06 决策树的直接扩展** — 不纯度、信息增益照用。不是学新规则，而是「怎样把树聚起来投票」，前章知识 100% 用上。","2":"**业界与竞赛常用** — 调参不多也能有很好表现，且**特征重要性**能说明哪些变量重要。"},"howUsed":{"0":"**分类与回归通用** — 从「是否垃圾邮件？」到「明天股价？」几乎各种业务问题都会用到。","1":"**找主因（特征重要性）** — 贷款模型里若树都最依赖「年收入」，就说明年收入是最重要变量，便于筛掉无关特征。","2":"**实际应用** — 欺诈检测、推荐（如 Netflix）、设备故障预测等，凡需精度与稳定性的场景都会用到。"},"problemSolving":{"0":"**集成·随机森林解题** — (1)**多数决**：比较类0与类1的票数，**多的一方**为最终预测（0或1）。\n\n---\n\n(2)**票数**：获胜类别得到的票数即为答案。\n\n---\n\n(3)**回归平均**：所有树预测之和÷树数，必要时四舍五入。\n\n---\n\n(4)**OOB**：该样本**未出现在多少棵树的 bootstrap 中**即为 OOB 数。\n\n---\n\n(5)**公式**：$\\hat{y} = \\frac{1}{B}\\sum_{b=1}^B \\hat{y}_b$ 中 $B$ 为树数。和除以 $B$ 得平均。详见下方**解题说明**表。"},"visual":""},"mlEnsembleVisualIntro":"将多棵模型（树）的预测通过投票或平均得到最终预测。","mlEnsembleVisualStep0":"① 从训练数据中抽取 bootstrap 样本，训练多棵树","mlEnsembleVisualStep1":"② 每棵树独立预测","mlEnsembleVisualStep2":"③ 分类：多数决，回归：平均 → 最终预测","mlEnsembleVisualStep3":"④ 最终预测确定","mlEnsembleVisualLabelData":"数据","mlEnsembleVisualLabelVote":"投票/平均","mlEnsembleVisualLabelPrediction":"预测","mlEnsembleVisualLabelTree1":"树1","mlEnsembleVisualLabelTree2":"树2","mlEnsembleVisualLabelTree3":"树3","mlEnsembleVisualAriaLabel":"集成流程：数据→树→投票/平均→预测","mlKmeansProblemSolvingLabel":"解题说明","mlKmeansVisualIntro":"将各点分配到最近的中心，再将中心更新为所属点的均值，反复进行。","mlKmeansVisualStep0":"① 数据 — 无标签的点分布在特征空间中","mlKmeansVisualStep1":"② 初始化K个中心 — 放置K个中心点","mlKmeansVisualStep2":"③ 分配 — 将各点分配到最近的中心（用颜色区分）","mlKmeansVisualStep3":"④ 更新中心 — 将各簇点的坐标均值作为新中心","mlKmeansVisualStep4":"⑤ 重复 — 直到分配与中心不再变化","mlKmeansVisualCaption":"K均值：重复“分配→更新”以最小化SSE（畸变）。","mlKmeansVisualAriaLabel":"K均值流程：数据→初始中心→分配→更新→收敛","mlKmeansVisualMeanLabel":"均值","mlKmeansVisualPointDataLabel":"点: 数据","mlKmeansVisualLineCaption":"线: 从各点到其所属中心(μ)","mlKmeansVisualCenterMoveCaption":"中心向簇均值移动","mlCrossValidationProblemSolvingLabel":"解题说明","mlCrossValidationVisualIntro":"将数据分为训练/验证/测试，K折中轮流验证并用平均分数估计性能。","mlCrossValidationVisualTitle":"① 5折","mlCrossValidationVisualFoldLabel":"第{n}折","mlCrossValidationVisualTrainLabel":"训练","mlCrossValidationVisualValLabel":"验证","mlCrossValidationVisualScoreLabel":"验证分数","mlCrossValidationVisualMeanLabel":"平均 μ","mlCrossValidationVisualStep0":"① 全部数据 — 用于训练与验证的样本","mlCrossValidationVisualStep1":"② 训练/验证/测试划分 — 训练学习、验证调参、测试最终评估","mlCrossValidationVisualStep2":"③ K折 — 分成K份，每次一份作验证、其余训练","mlCrossValidationVisualStep3":"④ 各折验证分数 — 得到 $S_1, \\ldots, S_K$","mlCrossValidationVisualStep4":"⑤ 平均 $\\bar{S} = \\frac{1}{K}\\sum_{k=1}^K S_k$ — 最终估计","mlCrossValidationVisualCaption":"交叉验证：模拟考（验证）估实力，正式考（测试）做最终确认。","mlCrossValidationVisualAriaLabel":"交叉验证流程：数据→划分→K折→各折分数→平均","mlCrossValidationProblemPrompt":"阅读下列指示后在（?）处输入答案。","mlCrossValidationProblemPromptDefinition":"若下列叙述正确输入1，否则输入0。{statement}","mlCrossValidationProblemPromptDefinitionChoice":"选择符合题意的选项。输入1、2或3。\n\n{question}","mlCrossValidationProblemPromptHoldoutTrain":"共{n}个样本、训练比例{trainRatio}时训练个数为？（整数）","mlCrossValidationProblemPromptHoldoutTest":"共{n}个样本、训练比例{trainRatio}时测试个数为？（整数）","mlCrossValidationProblemPromptKfoldSize":"共{n}个样本、{K}折时单折（验证集）大小为？（整数商）","mlCrossValidationProblemPromptKfoldScoreMean":"K折验证分数(%)为{scores}时，求平均(整数)。","mlCrossValidationProblemPromptScenario":"选择最符合情境的方法。输入1=留出法 2=K折 3=分层K折。{scenario}","mlCrossValidationProblemPromptStratified":"选择符合题意的选项。输入1、2、3或1/0表示O/X。\n\n{question}","mlCrossValidationStatement_0":"交叉验证不单用训练数据打分，而是划分验证/测试来估计性能。","mlCrossValidationStatement_1":"验证集像模拟考，用于超参选择或模型比较。","mlCrossValidationStatement_2":"K折将数据分K份，轮流作验证，用验证分数平均作为最终估计。","mlCrossValidationStatement_3":"测试集仅用于最终性能报告一次。","mlCrossValidationStatement_4":"留出法是将数据一次性分为训练/验证（或训练/测试）的方法。","mlCrossValidationStatement_5":"训练分数高而验证/测试分数低时可怀疑过拟合。","mlCrossValidationStatement_6":"训练集是模型学习权重、参数时使用的数据。","mlCrossValidationStatement_7":"K折中单折大小通常取 n/K 的整数商。","mlCrossValidationStatement_10":"在验证集上训练后可以直接用验证集报告最终性能。","mlCrossValidationStatement_11":"留出法一定比K折估计更稳定。","mlCrossValidationStatement_12":"测试集可以多次使用来选模型。","mlCrossValidationStatement_13":"仅用训练数据测性能就能准确反映泛化能力。","mlCrossValidationStatement_14":"K折中K越大验证次数越少。","mlCrossValidationQuestionChoice_0":"交叉验证的主要目的是？①估计泛化 ②加快训练 ③数据增强","mlCrossValidationQuestionChoice_1":"数据少时更有利的是？①留出法 ②K折 ③仅分层","mlCrossValidationQuestionChoice_2":"相当于模拟考的是？①训练 ②验证 ③测试","mlCrossValidationQuestionChoice_3":"在各折中保持类别比例的是？①留出法 ②普通K折 ③分层K折","mlCrossValidationQuestionChoice_4":"相当于正式考的是？①训练 ②验证 ③测试","mlCrossValidationQuestionChoice_5":"选超参时用的是？①训练 ②验证 ③测试","mlCrossValidationQuestionChoice_6":"用多种划分多次验证的是？①留出法 ②K折 ③仅测试","mlCrossValidationQuestionChoice_7":"可能过拟合的情况是？①训练验证都高 ②训练高验证低 ③训练低验证高","mlCrossValidationScenario_0":"有1万条数据，想一次划分快速评估。","mlCrossValidationScenario_1":"只有500条，想多次划分得到稳定验证估计。","mlCrossValidationScenario_2":"一次划分80%训练、20%测试，测试最后只用一次。","mlCrossValidationScenario_3":"分类中类别90:10不平衡，希望每折保持该比例。","mlCrossValidationScenario_4":"想进行5轮验证并报告平均准确率。","mlCrossValidationScenario_5":"一次划分70:30使用。","mlCrossValidationScenario_6":"为降低验证估计方差进行K轮验证。","mlCrossValidationScenario_7":"二分类中希望每折保持正例比例。","mlCrossValidationStratified_0":"分层K折的优点是？①保持类别比例 ②更快 ③省内存","mlCrossValidationStratified_1":"分类类别不平衡时推荐？①仅留出法 ②分层K折 ③不做验证","mlCrossValidationStratified_2":"分层主要用于？①仅回归 ②分类（保持类别比） ③聚类","mlEvaluationProblemPrompt":"请阅读下列指示并求出答案，在空白(?)处输入。","mlEvaluationProblemSolvingLabel":"解题说明","mlEvaluationVisualIntro":"用实际(行)与预测(列)填好2×2混淆矩阵后，计算准确率、精确率、召回率和F1。","mlEvaluationVisualStep0":"① 实际 vs 预测 — 行：实际正例/负例，列：预测正例/负例","mlEvaluationVisualStep1":"② 混淆矩阵 — 填满 TP、TN、FP、FN 四个格子","mlEvaluationVisualStep2":"③ 准确率 — (TP+TN)/总数，正确比例","mlEvaluationVisualStep3":"④ 精确率·召回率 — 精确率: TP/(TP+FP)，召回率: TP/(TP+FN)","mlEvaluationVisualStep4":"⑤ F1 — 精确率与召回率的调和平均","mlEvaluationVisualCaption":"通过混淆矩阵读懂分类模型的成绩单，并选择与目标相符的指标。","mlEvaluationVisualAriaLabel":"分类评估：混淆矩阵 → 准确率、精确率、召回率、F1","mlEvaluationVisualMatrixTitle":"混淆矩阵 (2×2)","mlEvaluationVisualStepLineFP":"实际负例 · 预测正例 → FP","mlEvaluationVisualStepLineFN":"实际正例 · 预测负例 → FN","mlEvaluationVisualStepLineTP":"实际正例 · 预测正例 → TP","mlEvaluationVisualStepLineTN":"实际负例 · 预测负例 → TN","mlEvaluationVisualPredPos":"预测正例","mlEvaluationVisualPredNeg":"预测负例","mlEvaluationVisualActualPos":"实际正例","mlEvaluationVisualActualNeg":"实际负例","mlEvaluationVisualBadgeTP":"真正例 ✓","mlEvaluationVisualBadgeFN":"漏检（实际正例→预测负例）","mlEvaluationVisualBadgeFP":"假正例（实际负例→预测正例）","mlEvaluationVisualBadgeTN":"真负例 ✓","mlEvaluationVisualBadgeFixed":"区分 TP·FN·FP·TN 四格后，计算准确率、精确率、召回率和 F1。","mlEvaluationProblemPromptDefinition":"若下列叙述正确请输入 1，否则输入 0。\n\n{statement}","mlEvaluationProblemPromptDefinitionChoice":"请选择与问题相符的选项。请输入 ① ② ③ 中的一个编号。\n\n{question}","mlEvaluationProblemPromptScenario":"请选择最符合下列情境的选项。以 ① ② ③ 编号输入。\n\n{scenario}","mlEvaluationProblemPromptConfusionCount":"混淆矩阵中 TP={tp}，TN={tn}，FP={fp}，FN={fn} 时，{cell} 的值（整数）是？","mlEvaluationProblemPromptTotalCount":"混淆矩阵中 TP={tp}，TN={tn}，FP={fp}，FN={fn} 时，总个数 n（整数）是？","mlEvaluationProblemPromptAccuracy":"混淆矩阵中 TP={tp}，TN={tn}，FP={fp}，FN={fn} 时，准确率（%）（整数）是？","mlEvaluationProblemPromptPrecision":"混淆矩阵中 TP={tp}，TN={tn}，FP={fp}，FN={fn} 时，精确率（%）（整数）是？","mlEvaluationProblemPromptRecall":"混淆矩阵中 TP={tp}，TN={tn}，FP={fp}，FN={fn} 时，召回率（%）（整数）是？","mlEvaluationProblemPromptF1":"混淆矩阵中 TP={tp}，TN={tn}，FP={fp}，FN={fn} 时，F1 分数（%）（整数）是？","mlEvaluationStatement_0":"混淆矩阵是将实际类别(行)与预测类别(列)用2×2表示的表。","mlEvaluationStatement_1":"准确率是(TP+TN)除以总个数得到的值。","mlEvaluationStatement_2":"精确率的分母是 TP+FP。","mlEvaluationStatement_3":"召回率的分母是 TP+FN。","mlEvaluationStatement_4":"F1 是精确率与召回率的调和平均。","mlEvaluationStatement_5":"TP 是实际为正例且预测也为正例的个数。","mlEvaluationStatement_6":"FN 是实际为正例但预测为负例的情况（漏检）。","mlEvaluationStatement_7":"在类别不平衡的数据上仅看准确率可能产生误解。","mlEvaluationStatement_10":"精确率与召回率始终相等。","mlEvaluationStatement_11":"准确率高则模型一定适合实际应用。","mlEvaluationStatement_12":"FP 是实际为正例但预测为负例的情况。","mlEvaluationStatement_13":"召回率的分母是 TP+FP。","mlEvaluationStatement_14":"TN 是实际为正例且预测也为正例的个数。","mlEvaluationQuestionChoice_0":"准确率的分子是？ ① TP+TN ② TP+FP ③ TP+FN","mlEvaluationQuestionChoice_1":"精确率的分母是？ ① TP+FN ② TP+FP ③ TN+FN","mlEvaluationQuestionChoice_2":"召回率重要的情境是？ ① 允许漏掉垃圾邮件 ② 不能漏诊疾病时 ③ 最小化假正例时","mlEvaluationQuestionChoice_3":"F1 是哪两者的调和平均？ ① 准确率与精确率 ② 精确率与召回率 ③ 召回率与准确率","mlEvaluationQuestionChoice_4":"TP 表示？ ① 实际正例、预测正例 ② 实际负例、预测正例 ③ 实际正例、预测负例","mlEvaluationQuestionChoice_5":"假正例(False Positive)是？ ① FP ② FN ③ TN","mlEvaluationQuestionChoice_6":"漏检(False Negative)是？ ① FP ② FN ③ 精确率","mlEvaluationQuestionChoice_7":"总个数 n 是？ ① TP+TN ② TP+TN+FP+FN ③ TP+FP+FN","mlEvaluationScenario_0":"不能漏掉垃圾邮件的情况（正常邮件误判为垃圾邮件可一定程度接受）。重要指标是？ ① 召回率 ② 精确率 ③ 准确率","mlEvaluationScenario_1":"医疗诊断中「有病不能说成无病」时。重要指标是？ ① 准确率 ② 召回率 ③ 精确率","mlEvaluationScenario_2":"广告点击预测中想提高「预测为点击中真正点击的比例」时。重要指标是？ ① 召回率 ② 精确率 ③ F1","mlEvaluationScenario_3":"欺诈检测中不能漏掉欺诈时。重要指标是？ ① 精确率 ② 召回率 ③ 准确率","mlEvaluationScenario_4":"想平衡看待精确率与召回率时使用的指标是？ ① 准确率 ② F1 ③ TP","mlEvaluationScenario_5":"类别 99:1 严重不平衡时仅看准确率？ ① 可信 ② 可能误解 ③ 等于 F1","mlEvaluationScenario_6":"与「检索结果前10条中相关文档比例」最接近的指标是？ ① 召回率 ② 精确率 ③ FN","mlEvaluationScenario_7":"衡量「实际正例中被模型预测对的比例」的指标是？ ① 精确率 ② 召回率 ③ 准确率","mlKmeans":{"chapter":"Chapter 08","title":"K均值聚类：无标签分组","description":"在没有任何标签的情况下，仅根据数据将相似样本聚成K类的**无监督学习**代表算法。通过K均值，从概念→直观→公式→应用，理解Ch01中“无监督”如何落地，以及如何用**距离**构造K个簇。结合Ch02的KNN距离公式，通过可视化理解“按类聚集”的迭代过程。","sectionTitle":"K均值聚类：无标签分组","whatIs":{"0":"**K均值是什么？** — 当没有标签$y$、只有数据$\\mathbf{x}_1, \\mathbf{x}_2, \\ldots$时，按**最近中心**将点划分成K个簇。距离采用Ch02中的**欧氏距离**$d(\\mathbf{x}, \\boldsymbol{\\mu}) = \\sqrt{\\sum_j (x_j - \\mu_j)^2}$。每个簇由一个**中心（质心）**$\\boldsymbol{\\mu}_k$表示，反复执行“各点归入最近中心”和“各簇点坐标求平均作为新中心”，直到收敛。","1":"**K表示“分成几类”** — K均值中**簇数K**由用户事先给定。K=2即两类，K=3即三类。因无真实标签，“哪一类是正确答案”不可知，只能得到“相似样本聚在一起”的结果。实践中常结合领域知识、肘部法或轮廓系数等选择K。","2":"**目标：最小化簇内距离和（SSE）** — 算法最小化**畸变（SSE）**$J = \\sum_{k=1}^K \\sum_{i \\in C_k} \\|\\mathbf{x}_i - \\boldsymbol{\\mu}_k\\|^2$。中心更新式$\\boldsymbol{\\mu}_k = \\frac{1}{|C_k|}\\sum_{i \\in C_k} \\mathbf{x}_i$表示“该簇内点的坐标平均”，这样更新会使该簇的SSE下降。","3":"**若觉得公式难懂** — 距离公式就是在量“一个点和一个中心之间的长度”；SSE $J$ 是把“簇有多紧”用一个数表示；中心更新式就是“该簇内点坐标的平均”。下面**公式说明**中会按符号逐一解释。"},"whyImportant":{"0":"**Ch01无监督学习的具体实现** — K均值是“无标签、找结构/聚类”的典型算法，常用于客户分群、文档/图像聚类、异常检测预处理等。","1":"**客户细分** — 仅有购买记录、无客户类型标签时，用K均值将相似客户聚成若干群，再由人为各群赋予含义（如VIP、流失风险），用于后续Ch09、Ch12等任务。","2":"**直观且实现简单** — 仅需“分配”和“求平均”两步迭代，便于实现，且在二维上可直观看到“聚成几团”的过程。"},"howUsed":{"0":"**聚类** — 客户细分、主题/文档聚合、图像颜色或区域压缩、基因表达分组等。","1":"**预处理与特征摘要** — 将簇编号作为新特征输入监督模型，或仅保留簇中心以压缩数据。","2":"**K的选择** — K由用户指定；可对多个K比较SSE或轮廓等指标（如肘部法）再选定。"},"problemSolving":{"0":"**小结**\n\n(1) **输入**：无标签点、簇数 $K$。\n\n(2) **初始化**：放置 $K$ 个中心（随机或启发式）。\n\n(3) **分配**：各点归入最近中心所属簇。\n\n(4) **更新**：各簇点的坐标均值作为新中心。\n\n(5) **重复**：3–4 步直至分配与中心不再变化。\n\n**目标**：最小化 SSE（畸变）$J = \\sum_{k}\\sum_{i \\in C_k} \\|\\mathbf{x}_i - \\boldsymbol{\\mu}_k\\|^2$。\n\n**中心更新式**：$\\boldsymbol{\\mu}_k = \\frac{1}{|C_k|}\\sum_{i \\in C_k} \\mathbf{x}_i$\n\n解题步骤与例题见下表。","1":"**术语说明**\n\n| 项目 | 说明 |\n| :--- | :--- |\n| **距离平方** | 两点 $(x_1,y_1)$、$(x_2,y_2)$ 的欧氏距离平方：$(x_2-x_1)^2+(y_2-y_1)^2$。仅比较时可不必开方。 |\n| **分配** | 给定点和 $K$ 个中心时，计算到各中心的距离（或距离平方），**最小者对应的中心编号**（从1开始）即为该点所属簇。 |\n| **中心更新** | 簇 $k$ 内点的 $x$、$y$ 坐标分别求平均得新中心 $(\\bar{x}_k, \\bar{y}_k)$；需取整时再四舍五入。 |\n| **SSE** | 簇内 $J = \\sum_{i \\in C_k} \\lVert\\mathbf{x}_i - \\boldsymbol{\\mu}_k\\rVert^2$，即各点到中心的距离平方和。 |\n\n---\n\n**例（分配）**\n\n中心 $\\mu_1=(0,0)$、$\\mu_2=(4,0)$，点 $(2,0)$ 所属簇号？\n\n距离平方 $d_1^2=4$，$d_2^2=4$，相等时取 1。→ **答案 1**\n\n---\n\n**例（中心更新）**\n\n簇 1 含点 $(1,2)$、$(3,4)$，则新中心 $\\bar{x}=(1+3)/2=2$，$\\bar{y}=(2+4)/2=3$。→ **(2, 3)**","2":"$1c"},"visual":""},"mlCrossValidation":{"chapter":"Chapter 09","title":"交叉验证：模拟考与正式考试","description":"为防止模型变成只背练过题的「井底之蛙」，必须做交叉验证。就像考生用**模拟考**检查真实水平、用**正式考试**一锤定音一样，机器学习模型也不能只靠**训练数据**打分，而要用**验证**和**测试**这些「陌生题目」来评估。本章学习将数据划分后验证模型真实水平的**交叉验证**（留出法、K折等）以及如何提高结果可信度。","sectionTitle":"交叉验证：模拟考与正式考试","whatIs":{"0":"**交叉验证是什么？「不用做过的题来打分」** — 如果数学考试出的全是练习册里做过的题，我们无法知道学生是懂了原理还是**过拟合**地背答案。机器学习也一样：用训练过的数据再测，总是高分。所以要把数据分成**训练**、**验证**、**测试**三块，在「从未见过的数据」上严格、公平地评估模型的真实水平，这就是交叉验证。","1":"**数据划分的三种角色** — 划分数据时的理想比例与各自角色如下。\n\n| 数据类型 | 比喻 | 角色与用途 | 常见比例 |\n| :--- | :--- | :--- | :--- |\n| **训练集** | 教材/习题集 | 模型学习模式、更新权重所用的主数据。 | 约70～80% |\n| **验证集** | 模拟考 | 学习过程中检查实力、调整超参或比较模型时使用。 | 约10～15% |\n| **测试集** | 正式考试 | 全部学习结束后、投入实战前**仅使用一次**报告最终性能。 | 约10～15% |","2":"**怎么划分？留出法与K折** — 划分方式主要有两种。**留出法**像把披萨一刀切开：数据只分一次成训练和测试，简单快速，但若「运气不好」容易的那部分进了测试集，估计会偏乐观。**K折交叉验证**则把数据切成K块，轮流用一块当模拟考（验证）、其余训练，这样每份数据都会当一次「考题」，估计更稳定、客观。","3":"**用公式看K折的最终成绩** — K折验证结束后共有K次「考试」成绩。模型的最终真实水平由这K次成绩的平均值决定。\n\n* **平均成绩公式：** $\\bar{S} = \\frac{1}{K}\\sum_{k=1}^K S_k$\n\n* **符号说明：** $K$ 为折数（验证次数），$S_k$ 为第 $k$ 折用作验证时得到的分数（如准确率、MSE等）。$\\sum_{k=1}^K S_k$ 即 $S_1 + S_2 + \\cdots + S_K$，除以 $K$ 得到 $\\bar{S}$，即**K个验证分数的平均**，用作最终性能估计。\n\n* **数值例：** 5折时若五次分数为 80、85、90、80、85，则 $\\bar{S} = (80+85+90+80+85)/5 = 84$ 分。"},"whyImportant":{"0":"**跳出「井底之蛙」（发现过拟合）** — 若模型在训练数据上得99分、在未见验证数据上只得50分，多半是**过拟合**（死记硬背而非理解）。交叉验证能在上线前筛掉这类模型。","1":"**证明真实实力（泛化性能）** — 企业用AI是为了预测未来，不是复现过去。用K折和留出测试集验证过的模型，在真正的新数据上更可能表现稳定。","2":"**找到最佳设置（超参与模型选择）** — 定树深度、K近邻的K、学习率等时，用验证集试多种配置并选最优。测试集严格分离，才能公平比较。"},"howUsed":{"0":"**数据科学家的日常（实战流程）** — 拿到数据后，先把约10%留作**测试集**锁起来。其余用于训练和K折验证，打磨出最佳模型后，再拿出测试集用一次报告：「本模型最终准确率为92%」。","1":"**公平比较算法** — 例如「客户流失预测用逻辑回归还是随机森林？」时，对两者用同一K折划分，平均验证分数（$\\bar{S}$）更高的算法入选上线。"},"problemSolving":{"0":"**小结** — 交叉验证的前提是：不能只用训练数据评估性能。正如正式考前用模拟考检查实力，机器学习中若只用**训练数据**打分，就无法判断是「理解原理」还是「只背答案」。因此将数据分为**训练**、**验证**、**测试**三部分。**训练**数据用于模型学习模式，**验证**用于学习过程中检查实力或选择超参，**测试**在所有学习结束后、投入实战前**仅使用一次**报告最终性能。划分方式有**留出法**和**K折**。留出法是将数据一次性分为训练/测试（或验证）；K折是将数据分成K份，轮流用一份作验证、其余作训练。使用K折时每份数据都会参与一次验证，因此比单次划分的估计更稳定。","1":"**术语与计算**\n\n| 项目 | 说明 |\n| :--- | :--- |\n| **定义(对/错)** | 叙述正确输入1，错误输入0。根据训练/验证/测试的角色、留出法与K折的定义、过拟合含义判断。 |\n| **训练个数 (留出法)** | 训练个数 $= n \\times (\\text{比例}/100)$。比例仅50%或80%。例：100的80%→80。 |\n| **测试个数 (留出法)** | 测试个数 $= n - \\text{训练个数}$。用总数减去训练个数。 |\n| **单折大小 (K折)** | 单折大小 $= \\lfloor n / K \\rfloor$（商）。将 $n$ 分为 $K$ 份时每份的大小。 |\n| **K折平均** | $\\bar{S} = (S_1 + \\cdots + S_K) / K$。分数为%(整数)，答案 = 和÷K（整数）。 |\n| **分层** | 分类时使各折保持相同类别比例的分法。叙述正确为1，错误为0。 |\n\n---\n\n**例（定义对/错）**\n\n「测试集可以多次使用」是否正确？\n\n测试集仅用于最终报告一次，故该叙述错误。→ **答案 0**\n\n---\n\n**例（留出法训练个数）**\n\n100个样本、训练比例80%时，训练个数为？\n\n100的80% $= 80$。→ **答案 80**\n\n---\n\n**例（留出法测试个数）**\n\n100个样本、训练比例80%时，测试个数为？\n\n训练80个，故测试 $= 100 - 80 = 20$。→ **答案 20**\n\n---\n\n**例（K折单折大小）**\n\n100个样本、5折时，单折（验证段）大小为？\n\n$100 \\div 5 = 20$。→ **答案 20**\n\n---\n\n**例（K折验证分数平均）**\n\n5折验证分数(%)为 80, 80, 90, 80, 90 时，平均(整数)为？\n\n和 $= 420$，$420 \\div 5 = 84$。→ **答案 84**\n\n---\n\n**例（分层）**\n\n「各折中保持正负类比例一致」是否为分层的正确描述？\n\n是。分层K折在分类中保持各类别比例。→ **答案 1**"},"visual":""},"mlEvaluation":{"chapter":"Chapter 10","title":"分类评估指标：模型的详细成绩单","description":"学习分类人工智能模型在「考试」之后拿到的**「详细成绩单」**。不只看「一共对了几题」（准确率），还要搞清楚**「哪些题、怎样错」**，这就是**混淆矩阵(Confusion Matrix)**要讲的内容。在垃圾邮件过滤、癌症诊断AI等「错法」会带来致命后果的业务场景里，**精确率、召回率、F1**等指标如何证明模型的真实实力，我们会用直观比喻一起说明。","sectionTitle":"分类评估指标：混淆矩阵与模型成绩单","whatIs":{"0":"**什么是混淆矩阵？模型的详细成绩单** — 考试光看「对了几题」看不出学生是数学好还是英语好。分类模型也一样。把模型的**预测（列）**和**实际答案（行）**并排做成 2×2 表，就是**混淆矩阵**。看这四个格子，就能一眼看出模型哪里对、哪里「混淆」、哪里踩空。","1":"**四格的秘密：TP、TN、FP、FN** — 用经典的「狼来了」来理解：这里「阳性」= 喊狼来了，「阴性」= 平安无事。\n* **TP（真正例·True Positive）：** 狼真的来了(1)，少年也喊狼来了(1)。救了全村，最好结局。\n* **TN（真负例·True Negative）：** 狼没来(0)，少年也没喊(0)。太平。\n* **FP（假正例·False Positive）：** 狼没来(0)，少年却喊狼来了(1)。村民白跑一趟（误报）。\n* **FN（漏检·False Negative）：** 狼真的来了(1)，少年在睡觉没喊(0)。羊被吃光，最糟结局（漏检）。\n* 总个数 $n = \\mathrm{TP} + \\mathrm{TN} + \\mathrm{FP} + \\mathrm{FN}$。","2":"**准确率(Accuracy)的坑** — 表示「全部题目里对了几成」，公式是 $\\text{准确率} = \\frac{\\mathrm{TP}+\\mathrm{TN}}{n}$。很直观，但有个可怕陷阱：假设 100 天里 99 天太平，狼只来 1 天。一个天天闭眼只会喊「没狼！」的笨机器人，准确率也有 99%。在「阳性极少」的不均衡数据下，绝不能只信准确率这一个数。","3":"**精确率(Precision)与召回率(Recall)：要追的两只兔子** —\n* **精确率（谨慎）：** 「我喊狼来了的时候，有几成真是狼？」即**预测为正例的里，真正是正例的比例**。$\\text{精确率} = \\frac{\\mathrm{TP}}{\\mathrm{TP}+\\mathrm{FP}}$。少误报(FP)、有把握才喊，精确率就高。\n* **召回率（敏感）：** 「狼真的来的那些次里，我几次发现并警告了？」即**实际正例里，模型命中的比例**。$\\text{召回率} = \\frac{\\mathrm{TP}}{\\mathrm{TP}+\\mathrm{FN}}$。一头狼都不漏(FN 少)，召回率就高。","4":"**F1 分数：精确率与召回率的黄金平衡** — 精确率和召回率像跷跷板，硬抬一边另一边就掉。把两者合成一个数就是**F1 分数**，用的是**调和平均**：$\\text{F1} = \\frac{2 \\cdot \\mathrm{TP}}{2\\cdot\\mathrm{TP}+\\mathrm{FP}+\\mathrm{FN}}$。只要精确率或召回率有一边很差，F1 就会很低。想找「不偏科」的均衡模型时常用 F1。","5":"**AUC（Area Under the ROC Curve）：模型的排名裁判** — 当模型不只输出「正/负」，而是输出「90% 概率是狼」这类概率时，用 **AUC** 评价：在 0～1 之间，看**真实正例是否普遍比真实负例得到更高概率**（区分能力）。1 表示排序完美，0.5 相当于闭眼瞎猜。在调阈值之前，比较模型本身的「基础体力」时非常有用。"},"whyImportant":{"0":"**别被 99% 准确率骗了** — 假设做信用卡欺诈检测：10 万笔交易里只有 1 笔欺诈。模型啥也不干、一律判「全部正常」，准确率也有 99.999%，但召回率是 0%，一个骗子都抓不到。只有画出**混淆矩阵**，拆开看**精确率**和**召回率**，才能知道模型是在干活还是在糊弄。","1":"**实际业务是「哪种错更能忍」的残酷取舍** — 业务目标不同，押注的指标就不同。\n* **召回率（别漏）是命：** 癌症筛查。健康人多查几次(FP)可以忍，真患者漏诊(FN)耽误治疗绝不能忍。\n* **精确率（少误报）是命：** 垃圾邮件过滤。漏进一两封垃圾(FN)删掉就行，老板的重要邮件被误判成垃圾(FP)可能职场危机。"},"howUsed":{"0":"**AI 服务的最终过审（二分类评估）** — 新冠阳性/阴性判定、YouTube 有害视频拦截/放行、银行贷款通过/拒绝等，大量二选一的实际项目在上线前都会画混淆矩阵，综合看精确率、召回率、F1。","1":"**调节告警灵敏度（阈值调参）** — AI 通常输出 0～1 的概率。「概率到多少%就拉响警报？」通过调节这条线（阈值）来适应业务：安全要求极高的机构会把阈值压低，稍有异常就报警（召回率最大化）；反之，告警太多用户烦的 App 会把阈值调高，只有非常确定才报警（精确率最大化）。"},"problemSolving":{"0":"看分类模型性能时，不要只看对了几题，用**混淆矩阵**把实际（行）与预测（列）分成 2×2，填好 TP、TN、FP、FN。**准确率**=(TP+TN)/n，**精确率**=TP/(TP+FP)，**召回率**=TP/(TP+FN)。类别不平衡时单看准确率容易误解，要按目标侧重精确率（减误报）或召回率（减漏检），平衡看**F1**。","1":"**各指标的确切含义（叙述）** — **TP**：实际为正例且预测为正例的个数（真正例）。**TN**：实际为负例且预测为负例的个数（真负例）。**FP**：实际为负例却预测为正例（假正例）。**FN**：实际为正例却预测为负例（漏检）。**准确率**：全体中预测正确的比例。**精确率**：预测为正例中实际为正例的比例。**召回率**：实际为正例中被模型预测正确的比例。**F1**：精确率与召回率的调和平均。**AUC**：正例是否普遍比负例得分高，用 0～1 概括。","2":"**术语与计算小结**\n\n| 类型 | 解题·示例（关键词→答案） |\n| :--- | :--- |\n| **TP** | 实际正例、预测正例 → 个数取整数 |\n| **TN** | 实际负例、预测负例 → 个数取整数 |\n| **FP** | 假正例（实际负例、预测正例）→ 个数整数 |\n| **FN** | 漏检（实际正例、预测负例）→ 个数整数 |\n| **准确率(%)** | $100 \\times (\\mathrm{TP}+\\mathrm{TN}) / n$，$n=\\mathrm{TP}+\\mathrm{TN}+\\mathrm{FP}+\\mathrm{FN}$。取整(整数)。 |\n| **精确率(%)** | $100 \\times \\mathrm{TP} / (\\mathrm{TP}+\\mathrm{FP})$。取整(整数)。 |\n| **召回率(%)** | $100 \\times \\mathrm{TP} / (\\mathrm{TP}+\\mathrm{FN})$。取整(整数)。 |\n| **F1(%)** | $100 \\times 2\\mathrm{TP} / (2\\mathrm{TP}+\\mathrm{FP}+\\mathrm{FN})$。取整(整数)。 |\n| **定义(对/错)** | 叙述正确则 1，错误则 0。 |\n\n---\n\n**例（准确率）**\n\nTP=10，TN=70，FP=10，FN=10 时准确率(%)(整数)是？\n\n$n=100$，准确率 $= 100 \\times (10+70)/100 = 80$。→ **答案 80**\n\n---\n\n**例（精确率）**\n\nTP=10，FP=10 时精确率(%)(整数)是？\n\n$100 \\times 10/(10+10) = 50$。→ **答案 50**\n\n---\n\n**例（召回率）**\n\nTP=10，FN=10 时召回率(%)(整数)是？\n\n$100 \\times 10/(10+10) = 50$。→ **答案 50**\n\n---\n\n**例（F1）**\n\nTP=10，FP=10，FN=10 时 F1(%)(整数)是？\n\n$100 \\times 20/(20+10+10) = 100 \\times 20/40 = 50$。→ **答案 50**"},"visual":""},"mlRegularization":{"chapter":"Chapter 11","title":"正则化：超越死记硬背"},"mlRecommendation":{"chapter":"Chapter 12","title":"协同过滤：推荐系统基础"}},"mathChapters":{"mathCumulativeVisualTitle":"基础数学概念脉络","mathCumulativeVisualLabel":"基础数学各章节概念图示","sectionLabels":{"whatIs":"是什么概念","whyImportant":"为何重要","howUsed":"如何被使用","problemSolving":"解题说明"},"mathIntro":{"chapter":"Chapter 00","title":"基础数学与人工智能：学习AI的语言","description":"为理解深度学习与机器学习，为什么需要数学、会用到哪些数学工具，我们将一起画出这张地图。","sectionTitle":"理解深度学习与机器学习，为什么需要数学","visualIntro":"","visualInputLabel":"输入","visualInputTypes":"图像、文字、声音","visualMathLabel":"基础数学","visualMathTopics":"函数 · 向量 · 矩阵","whatIs":{"0":"**理解AI需要数学这副眼镜** — 深度学习与机器学习会把我们提供的图像、文字、声音都变成**数字**。这些数字经过**函数**这条通道，通过反复**乘法和加法**寻找答案。整个过程都用数学书写，所以掌握数学就能清晰读出AI的**内部运作**。","1":"**会用到哪些数学工具？** — 我们会学习规定输入与输出规则的**函数**、把大量数据打包一次处理的**向量与矩阵**、让模型自己学习并逼近答案的**微分**，以及衡量结果可能性的**概率与分布**。这些工具组合在一起，构成智能的AI。","2":"**小结** — AI运行在数字与函数构成的坚实基础上。要解释AI为何给出某个结果、并设计更好的模型，必须具备**函数**、**极限**、**微分**、**概率**等基础能力。本课程就是一步步打好这一基础的旅程。"},"whyImportant":{"0":"**为了理解AI的决策依据** — AI做出的每一个决策，归根结底都是**数字与函数**计算的结果。我们学习函数与微分，就是为了跟上计算过程，在逻辑上理解**为什么得到那个答案**。","1":"**数学在AI模型中的位置** — 模型的每一**层**都是做「乘权重、相加」的**函数**的集合。AI通过学习减小误差的过程，使用的就是**梯度**这一微分概念。概率则成为衡量AI对自身预测有多大把握的指标。","2":"**我们将一起走的路线图（Ch01～Ch12）** — 本课程按以下顺序进行：处理数据流的**函数（Ch01～03）**、处理变化基础的**极限与连续（Ch04～05）**、学习核心的**微分（Ch06～08）**、作为累积与概率基础的**积分（Ch09）**，以及处理不确定性的**概率与分布（Ch10～12）**。"},"howUsed":{"0":"**现实与数学的桥梁** — AI模型具有**输入→转为数字→反复经过函数→输出**的结构。**函数**是这座建筑的砖块，**微分**是让砖块更聪明的凿子，**概率**是检验建成后建筑稳定性的工具。掌握这些基础数学后，深度学习中复杂的公式才会开始像有意义的句子一样被读懂。"},"problemSolving":{"0":"| 区分 | 在AI中的角色 | 核心数学概念 |\n| --- | --- | --- |\n| **输入与输出** | 放入数据并得到答案的基本框架 | 函数、指数、对数 |\n| **学习(训练)** | 减少误差、逼近正确答案的过程 | 极限、微分、链式法则 |\n| **预测与判断** | 在不确定结果中选择最优 | 概率、统计、正态分布 |"}},"mathFunctions":{"chapter":"Chapter 01","title":"函数：连接输入与输出的AI基本单元","description":"函数是「一个输入对应一个输出」的规则。人工智能把输入变成输出的方式，也直接对应这一函数概念。","sectionTitle":"什么是函数","visualIntro":"输入 $x$ 进去就确定一个输出 $y$ 的规则。下图表示 $x$ → $f$ → $y$ 的流程。","visualCaption":"例：$x=3$ 时，$f(x)=2x+1$ 得 7","whatIs":{"0":"**函数**是两个集合之间的严格**对应（映射）**。作为输入的**定义域**的每个元素，必须与作为输出的**值域**中的元素**一一对应**。就像自动售货机按一个键却不出饮料或出两瓶就是坏了，函数也要求一个输入恰好对应一个输出。","1":"数学上写成 $y = f(x)$。$x$ 是**自变量（原因）**，$y$ 是**因变量（结果）**。从 AI 角度看，$x$ 是我们提供的**数据**（图像像素、句子、传感器值），$y$ 是 AI 算出的**预测**（是否猫、下一个词、股价预测）。函数 $f$ 就是把数据变成答案的**转换器**。","2":"**AI 模型**本身就是巨大的**复合函数**。输入数据经过第一个函数（层）被变换，结果再进入下一个函数（层），如此重复几十次。就像数学里 $y = f(g(h(x)))$ 这样把函数叠在一起，深度学习把大量函数一层层叠起来，从复杂数据中读出模式。"},"whyImportant":{"0":"因为能**建模现实**。「多读书成绩就好」这种模糊关系用**一次函数** $y = ax + b$ 表示后，就能根据学习时间（$x$）算预期成绩（$y$）。AI 则用函数去近似更复杂的非线性关系（如图像与物体名），从而解决问题。","1":"因为它是**优化**的对象。AI 训练的目标是让正确答案与预测之间的误差最小。这个误差本身由**损失函数**这个函数计算，要找它的最小值就要用微分。若不用函数定义，训练 AI 就没有数学依据。","2":"因为它是描述**变化**的语言。要知道输入略变时输出变多少（斜率），才能让 AI 一步步朝正确答案走。函数把输入和输出的**因果关系**用式子写清楚，我们才能分析 AI 为何那样判断。"},"howUsed":{"0":"**AI** 中每个神经元都是一个小**函数**：对输入信号（$x$）乘权重（$w$）加偏置（$wx+b$），再经**激活函数**送到下一层。ReLU、Sigmoid 等函数决定是否「点火」，这些小块函数组合起来像人脑一样做复杂判断。","1":"用于**数据变换**。对人来说是一张图，对计算机是一堆数字（$x$）。AI 把这些数送进函数，做降维或升维，只保留「耳朵形状」「眼睛形状」等关键特征（$y$），即高维向量到低维空间的函数运算。","2":"用于**概率**计算。分类最后一层的 **Softmax** 把模型输出的原始分数变成「和为 1 的概率」，AI 才能说「这张图 90% 是狗」。函数把原始数据加工成我们能理解的信息。"},"problemSolving":{"0":"| 函数 | 例（输入 → 输出） |\n| --- | --- |\n| $f(x)=x+1$ | 3 → 4，10 → 11 |\n| $g(x)=2x$ | 3 → 6，10 → 20 |\n| $h(x)=x^2$ | 3 → 9，$-2$ → 4 |","1":"如下图所示 $f(x) = 2x + 1$ 在 x = 3 时为 7，x = 10 时为 21。请在题目中填空白。"}},"mathVideoExponential":{"chapter":"Chapter 02","title":"指数与指数函数：增长与激活的数学","description":"指数表示同一数连乘的次数，指数函数则是把这一规则写成变量的函数。深度学习中的激活与损失设计会用到。","sectionTitle":"什么是指数与指数函数","visualIntro":"固定底数 $a$，对每个指数 $x$ 有唯一的 $a^x$。下面是 $2^x$ 的例子。","visualCaption":"例：$2^0=1$，$2^1=2$，$2^2=4$，$2^3=8$","whatIs":{"0":"**指数**表示把某数（底）连乘若干次的运算。就像「纸折 42 次能从地球到月球」那样，用乘法（$\\times$）而不是加法（$+$）连接，所以具有**爆炸式增长（指数增长）**的性质。","1":"**指数函数**是把「连乘次数」写成变量 $x$ 的函数 $y = a^x$。多项式里变量在底（如 $x^2$），指数函数里变量在指数上，表示**「按当前大小成比例增长」**。$a>1$ 时随 $x$ 增大值会急剧上升（**指数增长**），$00$**。0 或负数的对数没有定义，所以 AI 代码里常加一个很小的数 $\\epsilon$ 避免 $\\log(0)$ 报错。以 $e$ 为底的**自然对数 $\\ln$** 则让求导形式简洁，是深度学习里的标准选择。"},"whyImportant":{"0":"因为必须**防止下溢**。把概率 $0.1$ 连乘 100 次得到 $0.1^{100}$，计算机会当成「小到无法表示的 0」。取对数后 $\\log(0.1^{100}) = 100 \\times \\log(0.1) = -100$，就仍是**有意义的数**。","1":"因为它是**信息量（熵）**的尺子。概率越低（越罕见），对数值的绝对值越大。「明天太阳从西边出来」这种罕见事件信息量大，「明天早上会天亮」这种必然事件信息量接近 0。AI 用基于对数的信息量衡量**「学到了多令人惊讶的信息」**。","2":"因为**对错误施以重罚**。$y=\\ln x$（$0