AI大事件

2012 - 2015 年:深度学习大爆炸

时间概念核心内容代表事件链接
2012.09CNN 崛起 (AlexNet)深度卷积神经网络首次在 ImageNet 夺冠,准确率远超传统算法AlexNet 开启深度学习革命AlexNet Paper (NIPS 2012)
2014.06GANs (生成对抗网络)通过“生成器”与“判别器”博弈,开创生成式 AI 先河Ian Goodfellow 提出 GANs 概念GANs Paper (2014)
2015.12ResNet (残差网络)解决深层网络退化问题,使训练百层甚至千层网络成为可能微软发布 ResNet,斩获 ILSVRC 五项第一ResNet Paper (2015)

2016 - 2018 年:感知到理解的飞跃

时间概念核心内容代表事件链接
2016.03强化学习突破深度学习与强化学习结合,处理极端复杂的博弈空间AlphaGo 以 4:1 击败人类顶尖棋手李世石DeepMind: AlphaGo
2017.06Transformer 诞生抛弃 RNN,采用“注意力机制”并行处理数据,LLM 的核心架构Google 发布《Attention Is All You Need》Transformer Paper (2017)
2018.10BERT (预训练双向编码)引入“遮罩语言模型”,极大提升 NLP 任务的理解能力Google 发布 BERT,刷新 11 项 NLP 纪录BERT Paper (2018)

2019 - 2021 年:参数爆炸与生成预热

时间概念核心内容代表事件链接
2020.05GPT-3 (千亿级参数)1750 亿参数,首次展现“上下文学习(In-context Learning)”能力OpenAI 发布 GPT-3,AI 开始展现惊人的创作潜力OpenAI: GPT-3 Paper. Language Models are Few-Shot Learners
2020.10ViT (Vision Transformer)抛弃卷积网络(CNN),将图像切块后像文本一样处理Google 发布《An Image is Worth 16x16 Words》,视觉架构转向 Transformer,挑战 CNN 霸主地位ViT Paper
2021.01CLIP & DALL-E借助 ViT 架构将图文关联,实现多模态理解与生成OpenAI 发布 DALL-E,开启多模态生成元年OpenAI Blog: DALL-E
2021.06GitHub Copilot基于 OpenAI Codex 的代码补全,AI 辅助编程商业化GitHub 推出 Copilot 预览版GitHub Blog: Introducing Copilot

2022 年:大模型觉醒之年

时间概念核心内容代表事件链接
2022.01CoT (思维链)通过 “Let’s think step by step” 诱导模型输出中间推理步骤Google 发布思维链研究,大幅提升模型逻辑推理能力CoT Paper (Google Brain)
2022.03Chinchilla Scaling Laws提出参数量与数据量的最佳平衡比例(约 1:20)DeepMind 发布 Chinchilla,70B 模型击败了 175B 的 GPT-3Chinchilla Paper
2022.10ReAct 框架将“推理(Reason)”与“行动(Act)”结合,允许模型在思考过程中调用搜索等外部工具Google & Princeton 发布 ReAct,奠定了 LLM Agent 的底层逻辑ReAct Paper
2022.11ChatGPT 爆发基于 GPT-3.5 的对话 AI,首次让公众体验“类人对话”OpenAI 发布 ChatGPT,5 天破百万用户OpenAI Blog: Introducing ChatGPT
2022.Q4Prompt Engineering(提示工程)通过精心设计输入指令引导 LLM 输出成为早期 AI 使用者的核心技能Google Developers: Prompt Design Guide

2023 年:多模态 + 开源崛起

时间概念核心内容代表事件链接
2023.03GPT-4 发布多模态(图像+文本)、更强推理、上下文达 32KOpenAI 宣称“AGI 重要一步”OpenAI GPT-4 Technical Report
2023.04LLM Agent 初现LLM 能调用工具、规划任务、自我反思AutoGPT、BabyAGI 开源引爆 GitHubAutoGPT GitHub
BabyAGI GitHub
2023.07开源大模型浪潮Meta 开源 Llama,打破闭源垄断Llama、Falcon、Mistral 推动本地部署Meta Llama 2 Announcement
Falcon LM (TII)
Mistral AI Launch
2023.09RAG(检索增强生成)让 LLM 结合私有知识库回答问题成为企业落地 LLM 的首选架构Lewis et al., “Retrieval-Augmented Generation”, 2020 (奠基)
LangChain RAG Docs
2023.12AI Coding 工具普及Copilot 全面商用,代码生成进入日常开发GitHub Copilot 覆盖超 3 万企业GitHub Copilot Enterprise Launch

2024 年:Agentic 智能体元年

时间概念核心内容代表事件链接
2024.02Multimodal Agents能看图、听音、操作 GUI 的智能体Google 推出 Astra,OpenAI 展示 GPT-4V 操控手机Google Astra Demo (I/O 2024)
OpenAI GPT-4o Vision Demo
2024.05Memory & ReflectionAgent 具备长期记忆与事后复盘能力Stanford 发布 “Reflexion” 框架Shinn & Cassano et al., “Reflexion: Language Agents with Verbal Reinforcement Learning”, NeurIPS 2023
2024.08Function Calling 2.0更可靠的工具调用协议(如 MCP 前身)Anthropic、OpenAI 升级 Tool Use APIAnthropic Tools Documentation
OpenAI Function Calling Guide
2024.10AI OS / AI Native App应用围绕 AI 重构,而非“加个聊天框”Notion AI、Cursor、Windsurf 等新锐产品崛起Notion AI
Cursor.sh
Windsurf.ai

2025 年:规范驱动 + 技术融合爆发年

时间概念核心内容代表事件链接
2025.01DeepSeek中国开源模型进入全球第一梯队DeepSeek App和DeepSeek-R1开源模型发布DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
2025.01Spec-Driven Development (SDD)先写规范(Spec),AI 自动生成并维护代码AWS 推出 Kiro,GitHub 推出 Spec-kitAWS Kiro Announcement (re:Invent 2024)
GitHub Spec-kit Docs
2025.05MCP (Model Communication Protocol)统一 LLM 与外部工具通信的标准协议类似“AI 的 USB-C”,被 Cursor、Continue、Claude 采纳MCP Specification (GitHub)
2025.07Agentic IDEIDE 内置自主编程智能体(非仅补全)Cursor Pro、Trae、Qoder 支持“自然语言建项目”Cursor Agentic Mode
Trae.ai
Alibaba Qoder
2025.09AI Factories / AI DevOps用 AI 自动构建、测试、部署其他 AI 应用Microsoft 提出“AI 生产 AI”范式Microsoft Build 2025 Keynote
2025.10Skills (技能)模块化、可共享的 Agent 能力包Anthropic 在 Claude Code 中正式支持 SkillsIntroducing Agent Skills

本作品采用 知识共享署名 4.0 国际许可协议 进行许可。

转载时请注明原文链接:https://blog.hufeifei.cn/2026/01/ai/ai-events/

鼓励一下
支付宝微信