AI for Science 2026 H1:从 AlphaFold 3 到 IsoDDE,「药物发现 Hit-to-Lead」从年降到月

2024 年底 AlphaFold 3 (DeepMind + Isomorphic Labs) 把蛋白 / DNA / RNA / 小分子统一成一个 diffusion network 来预测所有原子级交互;2026-02 Isomorphic Labs 又推出 IsoDDE(Drug Design Engine)把 AF3 在 protein-ligand 上准确率翻倍,被业界称作 'AlphaFold 4'。本文是 H1 AI for Science 当下事实切片:药物发现、材料发现、Agent for Science 三条主线。

7 min read Part of AI Research · Ch. 9

AI for Science 2026 H1:从 AlphaFold 3 到 IsoDDE

flowchart LR
  A["AI for Science"]
  A --> B["分类:前沿探索"]
  A --> C["关键词:AlphaFold"]
  A --> D["关键词:Drug Discovery"]
  A --> E["关键词:材料发现"]
  A --> F["关键词:Agent for Science"]

一年前讨论”AI for Science”,主要素材是 AlphaFold 2 在蛋白结构上做的事情,加上一些”模型可以辅助文献检索”的故事。2026 H1 这件事的内容已经完全变了:AlphaFold 3 (2024-05 论文 / 2024 末权重开源) + IsoDDE (Isomorphic Labs, 2026-02) 把”药物 hit-to-lead”从年压到了月,材料发现、AI for Math、AI for Climate 也各自有了实质突破。本文不是综述,是 H1 事实切片。


延伸阅读


先说结论

  • 药物发现:AF3 已被 190+ 国家、3M+ 研究者使用;IsoDDE 把 protein-ligand 预测准确率比 AF3 再提升 50%–100%,被业界称为 “AlphaFold 4”
  • Hit-to-Lead 周期 从传统 1–2 年压到几个月——这是 AI for Science 第一个清晰的”经济价值可量化” 突破
  • 材料发现:DeepMind GNoME / Microsoft MatterGen 已让”候选材料” 数量从年级几千上升到月级几百万
  • AI for Math:Lean / Coq + Agent 自动证明在 IMO / 中等竞赛级别已经常规
  • Agent for Science:Sakana AI、Anthropic Research Agent、Google Co-Scientist 把”读文献 + 设计实验 + 跑数值 + 写论文” 全链路开始走通
  • 未到的事:通用”端到端发现”(不依赖人类设定问题)、临床有效性(AI 设计的药物批量进入 Phase 3 还没发生)

1. AlphaFold 3:把”蛋白结构” 升级成”所有原子结构”

1.1 它做了什么

AlphaFold 2 (2021) 的能力是”给定氨基酸序列,预测蛋白三维结构”。AF3 的边界明显推宽:

  • 输入可以是蛋白、DNA、RNA、小分子、离子、修饰基团等任意组合
  • 输出是这些分子之间的全原子级三维交互预测
  • Diffusion Network(和 Stable Diffusion 同类的架构思想)替代 AF2 的 evoformer 主干

1.2 为什么对药物发现是关键

传统药物发现的瓶颈不在”找候选小分子”,在”预测它和靶点蛋白怎么结合”。这一步以前要靠:

  • 物理模拟(AMBER、Gromacs)—— 慢、需要人类调参
  • X-射线晶体学 / cryo-EM 实验 —— 准、但每个候选要花数月

AF3 在 protein-ligand 和 protein-DNA 的预测上比专门工具好 50%–100%,意味着可以在计算机里筛掉 99% 的候选,只把最有希望的几十个送去做湿实验。

1.3 Cryptic Pocket:开了一扇新门

AF3 能识别”隐藏口袋”——蛋白表面在 holo-form(结合配体)时才暴露的结合位点。这件事的意义:之前被认为”无法成药”的靶点(很多癌症 / 神经退行),因为 AF3 能算出 cryptic pocket,开始有了候选化合物。

1.4 开源 + 全球普及

AF3 在 2024 末把权重开源给学术使用。当前 AlphaFold Server 已经被 190+ 国家、3M+ 研究者使用。这是 科研 AI 工具历史上最快的全球普及之一。


2. IsoDDE:被业界叫”AlphaFold 4”

2.1 是什么

Isomorphic Labs(DeepMind 旗下药物发现独立公司)在 2026-02 推出 Drug Design Engine (IsoDDE)。它不是 AF3 的简单升级,而是:

  • 在 AF3 之上加了 小分子结合亲和力(binding affinity) 预测
  • 在 protein-ligand 结构准确率上比 AF3 再翻倍以上
  • 在某些任务上超过物理仿真方法

2.2 为什么叫”AlphaFold 4”

Scientific American 等期刊里有研究者明确这么叫——主要是因为:

  • 在结构预测上的提升达到了 AF2 → AF3 量级
  • 但 IsoDDE 是 闭源 / 专有,仅限 Isomorphic Labs 自己 + 商业合作伙伴使用
  • 这意味着 H1 末”前沿 AI 药物发现”已经从”开源 + 学界共享” 转向”商业化 + 私有”

2.3 它能不能做端到端药物设计

不能,至少目前不能。IsoDDE 解决的是 hit identification 和 hit-to-lead 阶段——找到结合得上、亲和力足够强的候选。后续的 ADMET 性质(吸收 / 代谢 / 毒性)、临床试验仍然需要传统流程。

但即便只解决前两步,行业影响也是巨大的:Isomorphic 自己的合作管线(Eli Lilly / Novartis 等)已经开始把 hit-to-lead 周期从 1–2 年压到 3–6 个月


3. 材料发现:GNoME / MatterGen

3.1 GNoME (DeepMind, 2023-11,2024–2026 持续迭代)

GNoME 用 GNN 预测晶体材料的稳定性,给出了 220 万 个候选稳定材料(其中 38 万经过实验或计算验证)。这比人类历史所有发现晶体材料总和高一个数量级。

3.2 MatterGen (Microsoft, 2024-末–2026 内化)

MatterGen 是 diffusion model 直接生成材料晶体结构。和 GNoME 的”筛”不同,MatterGen 是”生”。两者结合代表了”生成 + 筛选”的两条线。

3.3 真实落地难在哪

模型生成的候选 ≠ 实际能合成的材料。从”理论上稳定”到”在实验室里跑出来”中间还有合成路径设计、工艺成本、规模化等大量人类工程问题。所以材料 AI 当前更像 hit-finding 而不是端到端发明。


4. Agent for Science:让 LLM 变成”实验科学家”

4.1 三个范式

产品 / 项目关键能力阶段
Sakana AI Scientist自动跑文献综述 → 提假设 → 写代码 → 跑实验 → 写论文已发表 ICLR 论文
Anthropic Research AgentClaude Cowork 风格的”长任务 Agent”,重点在”读 + 综合”企业可用
Google Co-Scientist假设生成 + Critique loop + 实验设计已在 Google Health 内部使用

4.2 现在做得好的事

  • 文献综合 / RAG over papers061 RAG 风格但跨 1000+ paper
  • 数值实验 / 代码生成:把 AlphaFold / IsoDDE 接进来跑批量预测
  • 报告 / draft 写作:把上面两步的结果产出成第一稿

4.3 仍然不行的事

  • 真正的”假设生成”:Agent 提出来的假设质量普遍不如有经验的研究者
  • 物理直觉 / 实验设计:不知道哪个实验有信息量、哪个是浪费
  • 科学严谨性:模型容易把”看似有道理” 当成”有道理”

H1 末,“AI 写论文” 仍然是 80% 是辅助、20% 是自动——离 Sakana AI 期待的 “完全自主科学家” 还差得很远。


5. AI for Math / Theorem Proving

  • Lean 4 + GPT-5.4 / Claude Opus 4.7 在 IMO / Putnam 中等题已能稳定通过
  • DeepMind AlphaProof (2024) 在 IMO 2024 拿到银牌成绩
  • Goedel-Prover / DeepSeek-Prover-V2 等开源模型在 miniF2F 等基准上接近 frontier

但仍然没解决的是:真实数学研究里 90% 的工作是定义新概念 / 选取问题 / 找类比,证明只是最后一步。这不是 LLM 当前 fortes。


6. 当下能用 / 不能用

能用

  • 蛋白 / RNA / DNA 结构预测 → AF3 (公开 server)
  • 药物 hit-finding → AF3 + 小分子库筛选
  • 材料候选筛选 → GNoME 数据集
  • 文献综合 → Sakana / Anthropic Research Agent
  • 数学证明辅助 → Lean + GPT-5.4

不能用

  • 端到端药物上市(IsoDDE 帮 hit-to-lead,临床试验仍要 5–10 年)
  • 自主科学家(H1 末仍是辅助形态)
  • 自主材料合成(缺合成路径设计 + 工程实现)

7. 实践启示

你是应该做什么
生物 / 药物研究者把 AF3 / AlphaFold Server 纳入日常;关注 IsoDDE 商业接入;不要等”全自动”,从”AF3 + 人 review” 做混合工作流
材料研究者GNoME 数据集已开源,可以下载筛你方向;MatterGen 仍未公开,关注但不要等
数学 / CS 研究者Lean + GPT-5.4 / Opus 4.7 已经能帮证明;用 Agent 跑文献综合 + draft 已 ROI 正
企业 / 投资人关注 Isomorphic 的合作管线,看到 hit-to-lead 周期对比是 H1 最有信号的数字
政策 / 伦理开始关注:AI 药物专利归属、AF3 数据访问公平性、Agent 自主性的边界

8. 关键词卡片

概念一句话
AlphaFold 3 (AF3)DeepMind + Isomorphic 2024-05 推出,把蛋白 / DNA / RNA / 小分子全原子交互统一在一个 diffusion network 里
Diffusion Network (in AF3)用 noise → denoise 范式生成 3D 坐标,不是 AF2 的 evoformer / structure module
Cryptic Pocket蛋白表面只有在结合配体时才暴露的结合位点;AF3 能预测这些
Hit-to-Lead药物发现的中间阶段,从初步活性化合物(hit)到优化后的候选药(lead);传统 1–2 年,AI 后压到月
IsoDDEIsomorphic Labs Drug Design Engine, 2026-02;AF3 之上的商业药物设计引擎
GNoMEDeepMind 2023 推出的材料发现 GNN,给出 220 万候选材料
MatterGenMicrosoft 的材料生成 diffusion model
Co-ScientistGoogle 2025 末推出的”假设生成 + critique” Agent
AlphaProofDeepMind 数学证明 Agent,IMO 2024 银牌

小结

如果你一年前问”AI for Science 是不是炒作”,合理回答是”过半”。今天问,合理回答是**“AlphaFold 这条线已经 ROI 正、其它线还在路上”**。

具体几个判断:

  1. AlphaFold 3 + IsoDDE 是 2024–2026 内 AI 改造科学最实质的一条线——不是因为 paper 多,是因为药物发现周期数字真的变了
  2. 材料 / 数学 / 通用 Agent for Science 仍处在 demo 转 production 的过程——值得跟,但不是”明天就用上”
  3. 闭源化趋势:IsoDDE 不开源,反映 H1 末”前沿 AI 科学” 商业化压力大于学术开放
  4. 下一阶段值得关注:DeepSeek / Z.ai 等中国玩家在 AI 药物发现领域是否会推出公开权重;新一代蛋白设计工具(RFDiffusion 后继)

参考链接