AI 通识课 · 原理层 · 第 III 阶

AI 通识 III · 大模型探秘 101

不靠数学,但真的"看懂"AI——理解张量、训练、Transformer、注意力、强化学习的核心直觉。学期末孩子能用自己的话给别人讲清楚 AI 是怎么工作的。

时长:16 周 · 每周 1 次 · 共 32 课时 年级:推荐 6-9 年级 班型:8-12 人 · 1 主讲 + 1 助教 前置:建议先上完 AI 通识 II 或对 AI 有强烈好奇
01 · 课程定位

这门课要解决什么

把 AI 这只"黑箱"半透明化——孩子知道里面是怎么转的,但不需要会推导公式。

上完这门课,孩子可以对一个完全不懂 AI 的成年人讲清楚:"训练是什么、Transformer 是什么、为什么 ChatGPT 这么聪明、它的局限在哪里"——不靠背诵,靠真理解。
关键设计:所有概念都先用"直觉游戏"建立体感,再补符号语言。比如"张量"先用乐高积木的层叠来理解,"注意力"先用"读句子时眼睛在哪儿停"来体会。等回到数学描述时,孩子已经知道在说什么了。
02 · 适合谁

这门课为这样的孩子设计

✓ 适合

6-9 年级的孩子

  • 有数学好奇心,不排斥"有点抽象"的概念
  • 上过 AI 通识 II 或同等水平(能造一个 Agent)
  • 想理解 AI 的工作原理,不只是会用
  • 未来可能想学 CS / AI 专业 / 参加科创竞赛
× 不推荐

这门课不适合

  • 完全没用过 AI 的孩子(先上 I 或 II)
  • 只想"动手做项目"、不愿读 / 听讲的(这门课讲解占比更高)
  • 排斥任何带有公式 / 图表的学习(虽然不数学,但有图)
03 · 16 周课表

每周做什么

6 个核心概念逐步建立:机器学习→张量→训练→Transformer→注意力→强化学习。中间穿插 2 个动手小项目。

节奏说明:每个概念用 1-2 周。每周「直觉建立 + 可视化演示 + 自己讲一遍」三步。两个小项目分别在 W7(训练一个分类模型)和 W13(玩 RL 环境)。
W1 AI 是新东西吗 概念
关键内容图灵的预言(1950)+ 早期 AI 梦想 + 几次寒冬。从「机器能思考吗」这个 75 年前的问题出发。
本周产出一张 AI 简史时间线 + 你的「AI 能思考吗」初判断(学期末再回看)。
W2 传统机器学习:教计算机认猫 概念
关键内容不靠神经网络,怎么让计算机区分猫和狗?决策树、KNN、SVM 的直觉解释——从"特征"开始想问题。
本周产出在 Teachable Machine 上训一个图像分类器(10 分钟)+ 复盘"它怎么"学"会的。
W3 神经网络:一团乱麻为什么聪明 概念
关键内容神经元的灵感 + 多层网络。用一个 3D 可视化工具(TensorFlow Playground)看不同问题需要多少层。
本周产出一张"我画的神经网络结构图"+ 一句"它跟大脑像不像"的判断。
W4 张量是什么 概念
关键内容不解释成"多维数组"——而是"数据的形状"。用乐高积木的层叠、Excel 表格、视频帧来理解 1D / 2D / 3D / 4D 张量。
本周产出画 4 张图——分别用张量表示一个数字、一首歌、一张图、一段视频。
W5 一次训练发生了什么 概念
关键内容前向传播 + Loss + 反向传播——用"投飞镖练习"打比方:"你扔(前向)→ 看哪里偏了(Loss)→ 调整手腕(反向)→ 再扔"。
本周产出一张「训练循环」图 + 你的话讲一遍。
W6 GPT-2 是怎么训出来的 概念
关键内容看一段 GPT-2 训练过程的视频 + 拆"它读了多少书 / 训了多久 / 花了多少电"。建立"训练是个大工程"的真实感。
本周产出一份「GPT-2 训练资源账」估算(基于公开资料)。
W7 小项目 1 · 训一个真的小模型 项目
关键内容用一个在线工具(Teachable Machine / Hugging Face Spaces)训一个分类小模型——自己拍照标注 + 训练 + 测试 + 失败分析。
本周产出一个可以工作的图像分类器 + 失败分析报告("它把 X 误认为 Y 的 3 个原因")。
W8 语言模型的演化 概念
关键内容从词袋模型 → RNN → LSTM → Transformer——每个阶段解决了什么问题?为什么 Transformer 突然爆发?
本周产出一张「语言模型演化树」+ 每个节点一句话注释。
W9 注意力机制:Transformer 为什么强 概念
关键内容用「读句子时眼睛停在哪些词」建立直觉。看 BertViz 可视化——每个词在"看"哪些词。
本周产出在一个真实句子上手动标"我会注意哪些词"+ 和模型注意力对比。
W10 GPT 怎么炼成的 概念
关键内容预训练(读大量文本)+ 后训练(SFT + RLHF)的完整流程。理解"为什么 ChatGPT 比 GPT-3 更听话"。
本周产出一份「GPT 炼成手册」流程图(3 阶段)。
W11 强化学习:AlphaGo 怎么自学 概念
关键内容状态 / 动作 / 奖励三件套。看 AlphaGo 的故事——为什么它能下出"神之一手"?
本周产出画一张「强化学习循环」图 + 想一个生活里可以用 RL 的场景。
W12 RLHF:用偏好教 AI 守规矩 概念
关键内容GPT-3 → ChatGPT 的关键一步——人给 AI 打分,AI 学会"什么是好回答"。讨论"这会带来什么问题"。
本周产出一份「RLHF 的好处 + 风险」对比清单。
W13 小项目 2 · 玩一个 RL 环境 项目
关键内容在一个在线 RL 平台(CartPole 平衡杆 / Atari)训一个简单 agent。观察它从乱走到能玩通关。
本周产出训练过程视频 + 一句"它什么时候开始变聪明的"观察。
W14 多模态:视觉 + 语言 + 行动 概念
关键内容GPT-4V / Sora / Gemini 怎么"同时看图说话"?什么是统一表示?为什么"具身 AI"是下一步?
本周产出一份「多模态 AI 能做的 6 件事」预测清单。
W15 AGI 的边界 + 伦理讨论 概念
关键内容什么是 AGI?AI 真的会觉醒吗?讨论 4 个真实伦理案例(自动驾驶 / 简历筛选 / Deepfake / 大模型撒谎)。
本周产出一篇 800-1500 字的"我对 AI 的立场"长文(学期末再回看 W1 的初判断)。
W16 学期答辩 · 我所理解的 AI 学期项目
关键内容每个孩子做一次 10 分钟正式分享:"我用我的话讲 AI 是怎么工作的"——给一个不懂 AI 的家长 / 老师。
本周产出一段 10 分钟讲解视频 + 配套图文 PPT。
04 · 学期产出

一学期后孩子手里有什么

不是知识背诵——是真理解的能力。

主作品

我所理解的 AI · 讲解视频

10 分钟视频——孩子用自己的话讲清楚 AI 怎么工作。这个视频可以发给亲戚朋友、放进升学材料。

动手作品 1

一个图像分类器

自己拍照、标注、训练、调优的小模型——一个看得到、摸得着的"我训出来的 AI"。

动手作品 2

RL 训练记录

一段可视化训练过程视频——看着 agent 从乱走到熟练,孩子对"AI 是怎么学的"建立体感。

立场作品

AI 立场长文

一篇 800-1500 字的"我对 AI 的判断"——结合伦理讨论、技术理解、个人观察的深度思考。这是孩子的第一份"AI 时代立场宣言"。

05 · 教学法

这门课怎么上

讲解占比更高,但讲法不同:这门课的讲解比 AI 通识 I/II 都多,但所有概念都先用"直觉游戏"建立体感再补符号语言。比如"张量"先用乐高积木理解,"注意力"先用"读句子时眼睛停在哪儿"建立感觉,再去看数学描述。

每周都要"自己讲一遍":每节课的最后 15 分钟,是孩子互相讲——"这周学的概念,用你的话给同桌讲一遍"。如果同桌没听懂,说明你也没真懂。学期末的 10 分钟答辩,就是这个练习的最终版本。

两次回看:W1 让孩子写下"AI 能思考吗"的初判断;W15 写"我的 AI 立场"长文时再回看 W1。15 周的成长,孩子自己看得见。

详细教学法见 教学法六步循环 · 训练范式见 Pretrain × Posttrain × Harness × Delivery