2012 - 2015 年:深度学习大爆炸
| 时间 | 概念 | 核心内容 | 代表事件 | 链接 |
|---|---|---|---|---|
| 2012.09 | CNN 崛起 (AlexNet) | 深度卷积神经网络首次在 ImageNet 夺冠,准确率远超传统算法 | AlexNet 开启深度学习革命 | AlexNet Paper (NIPS 2012) |
| 2014.06 | GANs (生成对抗网络) | 通过“生成器”与“判别器”博弈,开创生成式 AI 先河 | Ian Goodfellow 提出 GANs 概念 | GANs Paper (2014) |
| 2015.12 | ResNet (残差网络) | 解决深层网络退化问题,使训练百层甚至千层网络成为可能 | 微软发布 ResNet,斩获 ILSVRC 五项第一 | ResNet Paper (2015) |
2016 - 2018 年:感知到理解的飞跃
| 时间 | 概念 | 核心内容 | 代表事件 | 链接 |
|---|---|---|---|---|
| 2016.03 | 强化学习突破 | 深度学习与强化学习结合,处理极端复杂的博弈空间 | AlphaGo 以 4:1 击败人类顶尖棋手李世石 | DeepMind: AlphaGo |
| 2017.06 | Transformer 诞生 | 抛弃 RNN,采用“注意力机制”并行处理数据,LLM 的核心架构 | Google 发布《Attention Is All You Need》 | Transformer Paper (2017) |
| 2018.10 | BERT (预训练双向编码) | 引入“遮罩语言模型”,极大提升 NLP 任务的理解能力 | Google 发布 BERT,刷新 11 项 NLP 纪录 | BERT Paper (2018) |
2019 - 2021 年:参数爆炸与生成预热
| 时间 | 概念 | 核心内容 | 代表事件 | 链接 |
|---|---|---|---|---|
| 2020.05 | GPT-3 (千亿级参数) | 1750 亿参数,首次展现“上下文学习(In-context Learning)”能力 | OpenAI 发布 GPT-3,AI 开始展现惊人的创作潜力 | OpenAI: GPT-3 Paper. Language Models are Few-Shot Learners |
| 2020.10 | ViT (Vision Transformer) | 抛弃卷积网络(CNN),将图像切块后像文本一样处理 | Google 发布《An Image is Worth 16x16 Words》,视觉架构转向 Transformer,挑战 CNN 霸主地位 | ViT Paper |
| 2021.01 | CLIP & DALL-E | 借助 ViT 架构将图文关联,实现多模态理解与生成 | OpenAI 发布 DALL-E,开启多模态生成元年 | OpenAI Blog: DALL-E |
| 2021.06 | GitHub Copilot | 基于 OpenAI Codex 的代码补全,AI 辅助编程商业化 | GitHub 推出 Copilot 预览版 | GitHub Blog: Introducing Copilot |
2022 年:大模型觉醒之年
| 时间 | 概念 | 核心内容 | 代表事件 | 链接 |
|---|---|---|---|---|
| 2022.01 | CoT (思维链) | 通过 “Let’s think step by step” 诱导模型输出中间推理步骤 | Google 发布思维链研究,大幅提升模型逻辑推理能力 | CoT Paper (Google Brain) |
| 2022.03 | Chinchilla Scaling Laws | 提出参数量与数据量的最佳平衡比例(约 1:20) | DeepMind 发布 Chinchilla,70B 模型击败了 175B 的 GPT-3 | Chinchilla Paper |
| 2022.10 | ReAct 框架 | 将“推理(Reason)”与“行动(Act)”结合,允许模型在思考过程中调用搜索等外部工具 | Google & Princeton 发布 ReAct,奠定了 LLM Agent 的底层逻辑 | ReAct Paper |
| 2022.11 | ChatGPT 爆发 | 基于 GPT-3.5 的对话 AI,首次让公众体验“类人对话” | OpenAI 发布 ChatGPT,5 天破百万用户 | OpenAI Blog: Introducing ChatGPT |
| 2022.Q4 | Prompt Engineering(提示工程) | 通过精心设计输入指令引导 LLM 输出 | 成为早期 AI 使用者的核心技能 | Google Developers: Prompt Design Guide |
2023 年:多模态 + 开源崛起
| 时间 | 概念 | 核心内容 | 代表事件 | 链接 |
|---|---|---|---|---|
| 2023.03 | GPT-4 发布 | 多模态(图像+文本)、更强推理、上下文达 32K | OpenAI 宣称“AGI 重要一步” | OpenAI GPT-4 Technical Report |
| 2023.04 | LLM Agent 初现 | LLM 能调用工具、规划任务、自我反思 | AutoGPT、BabyAGI 开源引爆 GitHub | AutoGPT GitHub BabyAGI GitHub |
| 2023.07 | 开源大模型浪潮 | Meta 开源 Llama,打破闭源垄断 | Llama、Falcon、Mistral 推动本地部署 | Meta Llama 2 Announcement Falcon LM (TII) Mistral AI Launch |
| 2023.09 | RAG(检索增强生成) | 让 LLM 结合私有知识库回答问题 | 成为企业落地 LLM 的首选架构 | Lewis et al., “Retrieval-Augmented Generation”, 2020 (奠基) LangChain RAG Docs |
| 2023.12 | AI Coding 工具普及 | Copilot 全面商用,代码生成进入日常开发 | GitHub Copilot 覆盖超 3 万企业 | GitHub Copilot Enterprise Launch |
2024 年:Agentic 智能体元年
| 时间 | 概念 | 核心内容 | 代表事件 | 链接 |
|---|---|---|---|---|
| 2024.02 | Multimodal Agents | 能看图、听音、操作 GUI 的智能体 | Google 推出 Astra,OpenAI 展示 GPT-4V 操控手机 | Google Astra Demo (I/O 2024) OpenAI GPT-4o Vision Demo |
| 2024.05 | Memory & Reflection | Agent 具备长期记忆与事后复盘能力 | Stanford 发布 “Reflexion” 框架 | Shinn & Cassano et al., “Reflexion: Language Agents with Verbal Reinforcement Learning”, NeurIPS 2023 |
| 2024.08 | Function Calling 2.0 | 更可靠的工具调用协议(如 MCP 前身) | Anthropic、OpenAI 升级 Tool Use API | Anthropic Tools Documentation OpenAI Function Calling Guide |
| 2024.10 | AI OS / AI Native App | 应用围绕 AI 重构,而非“加个聊天框” | Notion AI、Cursor、Windsurf 等新锐产品崛起 | Notion AI Cursor.sh Windsurf.ai |
2025 年:规范驱动 + 技术融合爆发年
| 时间 | 概念 | 核心内容 | 代表事件 | 链接 |
|---|---|---|---|---|
| 2025.01 | DeepSeek | 中国开源模型进入全球第一梯队 | DeepSeek App和DeepSeek-R1开源模型发布 | DeepSeek-R1 发布,性能对标 OpenAI o1 正式版 |
| 2025.01 | Spec-Driven Development (SDD) | 先写规范(Spec),AI 自动生成并维护代码 | AWS 推出 Kiro,GitHub 推出 Spec-kit | AWS Kiro Announcement (re:Invent 2024) GitHub Spec-kit Docs |
| 2025.05 | MCP (Model Communication Protocol) | 统一 LLM 与外部工具通信的标准协议 | 类似“AI 的 USB-C”,被 Cursor、Continue、Claude 采纳 | MCP Specification (GitHub) |
| 2025.07 | Agentic IDE | IDE 内置自主编程智能体(非仅补全) | Cursor Pro、Trae、Qoder 支持“自然语言建项目” | Cursor Agentic Mode Trae.ai Alibaba Qoder |
| 2025.09 | AI Factories / AI DevOps | 用 AI 自动构建、测试、部署其他 AI 应用 | Microsoft 提出“AI 生产 AI”范式 | Microsoft Build 2025 Keynote |
| 2025.10 | Skills (技能) | 模块化、可共享的 Agent 能力包 | Anthropic 在 Claude Code 中正式支持 Skills | Introducing Agent Skills |

