AI Control:把自主 Agent 当作内部威胁来设计
结合 2026 年 6 月 Google DeepMind AI Control Roadmap 的公开报道、International AI Safety Report、AI Agent Index 与 agent containment 研究,整理为什么高自治 Agent 不能只靠 alignment,还要按内部威胁模型设计监控、隔离、审计和降级。
Learning AI with AI
从零开始的 AI 系统化学习路径,记录每一个技术节点的演进。
结合 2026 年 6 月 Google DeepMind AI Control Roadmap 的公开报道、International AI Safety Report、AI Agent Index 与 agent containment 研究,整理为什么高自治 Agent 不能只靠 alignment,还要按内部威胁模型设计监控、隔离、审计和降级。
结合 2026 年 6 月 OpenAI 网络安全项目报道、Five Eyes 对 frontier AI cyber 风险的警告,以及 AgentCyberRange 等新评测,梳理 AI 进入漏洞发现、补丁生成、开源维护和安全运营后,企业安全流程该怎样改。
基于 AI Engineer Knowledge Map 2026 这张能力地图,重新整理现代 AI Engineer 的知识结构:基础设施、数据、LLM、推理、RAG、Agent、安全、评测、FinOps 与业务理解。
从 Responses API、Agents SDK、MCP、Computer Use、WebSocket agent loop 和 Claude Agent SDK 出发,梳理 Agent Runtime 为什么会成为 AI 产品的核心底座,以及团队该怎样设计状态、工具、权限、沙箱、评测和可观测性。