第一部分:荒野求生 (1958 - 2012)
这一部分讲述了神经网络(Neural Networks)如何从被学术界嘲笑的“伪科学”,在 Geoff Hinton 等少数坚持者的努力下,通过数十年漫长的“AI寒冬”,最终凭借大数据和 GPU 算力迎来爆发。
PROLOGUE & CH.1
🔨
4400万的拍卖与
感知机的诅咒
点击查看详情
关键事件
- 2012太浩湖拍卖: Hinton 及其学生(包括 Ilya Sutskever)拍卖无产品的空壳公司。百度出价凶猛,Google 最终以 4400 万美元胜出。DeepMind 因资金不足退出。
- 1958 感知机诞生: Frank Rosenblatt 发明感知机,被《纽约时报》大肆炒作。
- 1969 毁灭性打击: Minsky & Papert 出版《Perceptrons》,从数学上证明了单层网络的局限性,直接导致长达几十年的 AI 寒冬。
核心概念
连接主义 (Connectionism)
反向传播 (Backprop)
人物语录
"我不想让他们(百度)觉得我又老又朽,所以我把烫衣板架在床中间假装在做引体向上。" —— Geoff Hinton
CH.2 - CH.3
❄️
地下党与
卷积网络的孤独
点击查看详情
至暗时刻
- Yann LeCun 的坚持: 在贝尔实验室开发了 LeNet(卷积神经网络),成功用于识别手写支票,但整个领域仍被 SVM 等统计方法主导。
- Hinton 的流亡: 因不满美国军方资助和里根政府政策,Hinton 移居加拿大,多伦多大学成为深度学习的“诺亚方舟”。
- 更名策略: 为了论文能被录用,他们不得不将“神经网络”改称为“深度学习”。
关键技术
CNN (卷积神经网络)
AI Winter
CH.4 - CH.6
🚀
AlexNet 时刻与
GPU 的介入
点击查看详情
转折点
- 语音识别突破: Hinton 的学生 George Dahl 在微软实习期间,证明深度学习在语音识别上碾压传统方法。
- ImageNet 竞赛 (2012): Alex Krizhevsky 利用两个 Nvidia GPU 训练神经网络,错误率从 26% 降至 15%,震惊世界。
- Google Brain: Andrew Ng 和 Jeff Dean 发现了著名的“猫脸识别”,证明无监督学习的可行性。
第二部分:谁拥有智能? (2013 - 2016)
这一部分聚焦于企业间的军备竞赛。Google、Facebook、Microsoft 和百度开始疯狂争抢这群稀有的科学家。同时,DeepMind 作为一个致力于 AGI 的异类,被 Google 收入囊中。
CH.7 - CH.8
⚔️
扎克伯格入局与
开源战争
点击查看详情
商业博弈
- Facebook FAIR: 扎克伯格亲自招募 Yann LeCun。LeCun 坚持“不离开纽约”和“必须开源”。
- 开源策略: Facebook 通过开源其 AI 代码(PyTorch的前身等),打破了 Google 的封闭优势,迫使 Google 后来开源了 TensorFlow。
- 微软的失落: 尽管微软研究院很早就有相关研究,但因内部官僚主义(Ballmer时代)和对传统方法的迷恋,错失了先机。
CH.10
♟️
DeepMind 与
AlphaGo
点击查看详情
高光时刻
- 收购: Google 以 6.5 亿美元收购 DeepMind。创始人 Hassabis 坚持要有“伦理委员会”(虽然并未真正生效)。
- 李世石对决 (2016): AlphaGo 在首尔 4:1 击败人类冠军。
- 第37手: 机器下出了人类几千年未曾设想的一步棋。这标志着 AI 展现出某种形式的“创造力”。
CH.9 - CH.12
🌍
百度与
Google 的翻译革命
点击查看详情
技术落地
- 机器翻译: Ilya Sutskever 推动的 Seq2Seq 模型让 Google 翻译在一夜之间质量飞跃。
- 百度的角色: 百度是这一领域最早的觉醒者之一,聘请吴恩达(Andrew Ng),并在中国积极部署 AI 基础设施。
- TPU 的诞生: 为了支撑庞大的算力需求,Google 秘密研发了自己的 AI 芯片 (TPU),摆脱了对 Nvidia 的完全依赖。
第三部分:动荡与伦理 (2016 - 2019)
随着 AI 变得强大,副作用开始显现。偏见、假新闻、Deepfakes 以及军事化应用引发了科技公司内部员工的抗议和社会的恐慌。
CH.13
🎭
GANs 与
造假的艺术
点击查看详情
发明
Ian Goodfellow 在酒吧争论后灵光一闪,发明了生成对抗网络 (GANs)。两个神经网络互相博弈:一个造假,一个鉴别。
后果
- Deepfakes: 技术迅速被用于制造假色情视频和政治虚假视频。
- 信任危机: 这一技术终结了“眼见为实”的时代,引发了对 AI 破坏民主制度的担忧。
概念
GANs
虚假信息
丑闻
Google Photos 将非裔美国人标记为“大猩猩”。这暴露了数据集主要由白人男性构成的问题。
反击
Joy Buolamwini (MIT) 揭露了商业人脸识别软件在深色皮肤女性上的高错误率。Timnit Gebru 成立 "Black in AI",推动社区关注算法偏见。
核心议题
算法偏见
数据集多样性
CH.16
🛡️
Project Maven与
员工起义
点击查看详情
冲突
Google 秘密参与五角大楼的 Project Maven,利用 AI 分析无人机视频。
结果
数千名 Google 员工联名抗议,Fei-Fei Li 等高管陷入邮件丑闻。Google 最终被迫承诺不再续约,并发布了 AI 伦理准则(但也并未完全放弃国防合同)。
核心议题
武器化 AI
硅谷价值观
第四部分:人类被低估了 (2018 - 2020)
AGI(通用人工智能)是宗教还是科学?OpenAI 的崛起改变了格局。与此同时,怀疑论者指出 AI 依然缺乏常识。故事的最后,图灵奖颁给了“深度学习三巨头”。
CH.19 - CH.20
🤖
OpenAI 与
AGI 的宗教
点击查看详情
OpenAI 的演变
- 成立初衷: Musk 和 Altman 成立 OpenAI 旨在作为 Google 的制衡力量,承诺非营利和开源。
- 转变: 为了追求 AGI 需要巨大算力,转为“封顶利润”公司,接受微软 10 亿美元投资。Musk 愤而退出。
- GPT与Dota: 展示了 AI 在游戏和语言模型(GPT)上的惊人能力。
概念
AGI (通用人工智能)
Scaling Laws
CH.18
🤔
怀疑论者:
Gary Marcus
点击查看详情
不同的声音
Gary Marcus 是深度学习的主要批评者。他认为深度学习只是在大规模数据匹配,缺乏真正的推理、因果关系和常识。
LeCun vs Marcus
两者在 NYU 进行了著名辩论。LeCun 认为数据规模可以涌现智能,而 Marcus 坚持 AI 需要预设的“先天机制”。
加冕
2019年,Hinton, LeCun, Bengio 共同获得图灵奖。这是对他们数十年坚持边缘研究的最终认可。
新的开始
永远不满足的 Hinton 开始质疑自己发明的反向传播,并提出 Capsules (胶囊网络),试图解决计算机视觉中识别三维空间关系的缺陷。
语录
"历史将会重演,我想。" —— Hinton