AI Daily 2026-06-25 | OpenAI 首颗推理芯片 Jalapeño 发布，Gemini 3.5 Flash 内置计算机使用，Notion 引入外部 Agent

title: “OpenAI 发布首颗推理芯片，Notion 引入外部 Agent，Qwen 开源语言世界模型” lead: “OpenAI联合 Broadcom 发布首颗自研推理芯片 Jalapeño，9 个月流片，能效声称超越 SOTA；Google DeepMind 发布 Gemini 3.5 Flash 计算机使用能力，可操作浏览器和手机；Notion 推出 External Agents 功能，将 Claude 和 Cursor 引入协作平台。” highlights:

“OpenAI 首颗自研推理芯片 Jalapeño 发布，9 个月流片”
“Google Gemini 3.5 Flash 获内置计算机使用能力”
“Notion 推出 External Agents 引入 Claude 和 Cursor”

1️⃣ OpenAI 发布首颗自研推理芯片 Jalapeño：9 个月流片，能效超越 SOTA#

核心发布：OpenAI 联合 Broadcom 发布其首颗自研 AI 芯片 Jalapeño，专为 LLM 推理优化。芯片从设计到流片仅用 9 个月，首批样片已到手。Broadcom CEO 称该芯片性能功耗比“显著优于当前最先进水平”，成本可省一半。
技术路线：由 OpenAI 完成芯片架构设计、内核优化和 serving 系统，Broadcom 负责硅实现和网络技术（Tomahawk 交换芯片），Celestica 负责系统集成。芯片仅针对推理，训练大概率仍需依赖 NVIDIA。
部署计划：预计 2026 年底开始以吉瓦级规模部署，微软已参与芯片产能承购。Jalapeño 是未来多代计算平台的第一代，第二代代号 Serrano 已有规划。
行业意义：这标志着 OpenAI 从模型公司向全栈 AI 基础设施公司的关键转折。自研推理芯片能直接降低运营成本并优化用户体验，同时也表明当规模达到一定程度后，垂直整合成为必然选择。 🔗 OpenAI 官方公告 | Broadcom CEO 声明 | Berryxia 详细分析

2️⃣ Google DeepMind 发布 Gemini 3.5 Flash 内置计算机使用能力：可操作浏览器、手机和桌面环境#

核心发布：Google DeepMind 宣布 Gemini 3.5 Flash 模型内置 计算机使用 功能。该能力原生集成在模型中，支持浏览器、手机和桌面三种环境，并附带内置安全机制（用户确认、自动停止提示注入）。
技术细节：该功能基于屏幕截图和操作指令，可执行复杂的多步交互任务，如“审核此页面、运行代码示例、寻找问题并生成报告”。模型额外针对提示注入进行了专项训练。
开源与体验：Google 已开源对应的 GitHub 仓库，开发者可通过 Google AI Studio、Gemini API 或 Browserbase 直接试用。
行业意义：计算机使用能力从实验性功能升级为模型原生能力，标志着 AI Agent 交互范式的再次跃迁。Gemini 3.5 Flash 将替代过去依赖多模型串联的繁琐架构。 🔗 Google DeepMind 博客 | Philipp Schmid 推文 | GitHub 仓库

3️⃣ Notion 推出 External Agents：Claude 和 Cursor 嵌入任务板，AI 成为团队同事#

核心发布：Notion 正式推出 External Agents 功能，将 Claude 和 Cursor 引入共享任务板。用户可创建专用 AI Agent（数据分析、编码、生成电子表格等），通过 @ 提及即委派任务。Agent 运行记录对全员可见。
能力演示：Claude 可根据粗略 PRD 读取代码库并完善技术细节，Cursor 可从 Notion 接收任务指令后自动打开 PR。多个 Agent 可串联形成长工作流。
Cursor SDK 赋能：Notion 与 Cursor 的集成基于新发布的 Cursor SDK，确保云端 Agent 共享相同的模型和运行环境。
行业意义：这是任务协作平台首次原生引入外部 AI Agent，标志着 Agent 正从“个人工具”向“团队协作者”演进。Notion 的行动有望重新定义知识工作者的协作形态。 🔗 Notion 官方推文 | Cursor SDK 说明 | 更多功能演示

4️⃣ Qwen 开源 Qwen-AgentWorld：语言世界模型模拟 7 种 Agent 环境，超越 Claude Opus 4.8 和 GPT-5.4#

核心发布：阿里 Qwen 团队开源 Qwen-AgentWorld，一个原生语言世界模型，能在一个统一框架内模拟 MCP、搜索、终端、SWE、网页、操作系统和安卓等 7 种 Agent 环境。
技术突破：该模型将“环境建模”作为训练核心目标，而非后置适应。在 AgentWorldBench 上，35B MoE 模型（3B 活跃参数）超越 Claude Opus 4.8 和 GPT-5.4。更重要的是，单纯通过环境预测训练出的模型，即使不做任何 Agent 微调，也能直接迁移到真实 Agent 任务上。
双路线：两条研究路线并行：将世界模型用作可控的环境模拟器（Sim RL），以及通过学习预测环境来增强 Agent 能力。后者在多个 benchmark 上提升显著。
行业意义：这项研究从根本上重新定义了 Agent 训练范式——“先让 AI 真正理解环境，再教它如何行动”。世界建模作为可迁移的推理能力，可能成为下一波 Agent 能力跃升的关键。 🔗 Qwen 官方推文 | Berryxia 解读 | 论文

5️⃣ a16z 领投 Mirendil 2 亿美元种子轮：构建自我加速 AI 研发系统#

核心发布：a16z 宣布领投 Mirendil 的 2 亿美元种子轮，NVIDIA 等跟投。创始团队来自 Anthropic、Google DeepMind 和 xAI 共 20 人。
目标定位：Mirendil 构建的是“能自行做 AI 研究的 AI 系统”——训练前沿模型进行 AI 研发，并围绕其构建产品闭环。该系统可自主循环解决科研和工程问题，无需人工干预。相当于一个控制着自身 GPU 的 AI 研究编码 Agent。
创始人观点：CEO Behnam Neyshabur 称，当系统能自动朝着特定方向快速改进时，就构成了自我加速的 AI 技术。这与过去依赖大实验室集中开发生成对比。
行业意义：这是当前针对“AI 自动化 AI 研发”的最高倍投注之一。若成功，将重新定义前沿 AI 研究的效率曲线和权力分布——从少数实验室集中转向更广泛的参与者。 🔗 a16z 推文 | Mirendil CEO 推文

6️⃣ Databricks 联合创始人深度访谈：Omnigent 成为 Agent 基础设施层，LTAP 重新定义数据库#

核心发布：Latent Space 发布对 Databricks 联合创始人 Matei Zaharia 和 Reynold Xin 的深度专访，讨论 Databricks 如何从数据平台演变为 Agent 操作系统。
关键内容：Omnigent 是一个开源的元框架，提供统一的 API 来管理多种编码 Agent（Claude Code、Codex、Cursor 等），解决安全策略、上下文共享和成本控制等基础设施问题。LTAP 则是通过统一存储层（将数据以列式格式写入数据湖）来消除经典 HTAP 的工程妥协。
Reality 空间：Zaharia 和 Xin 强调，未来软件的形态可能简化为“将数据放在正确位置，然后在上面运行 Agent”。数据库公司天然具备成为 Agent 基础设施提供者的条件。
行业意义：这份访谈清晰勾勒出数据平台公司如何响应 Agent 时代的战略路径：不做模型，而是提供模型运行所需的全部上下文、权限和计算基础设施。 🔗 Latent Space 播客 | 相关推文

7️⃣ Kog 开源 LaneFormer 2B：3000+ token/s 推理速度，专为低延迟场景设计#

核心发布：Kog 在 Hugging Face 开源 2B 参数的 LaneFormer 2B 模型，专为极致低延迟推理设计，在演示中以 3000+ token/s 的速度运行。
技术背景：该模型是“延迟优先”设计理念的产物，据称通过优化架构和训练策略，在保持较小模型体量的同时实现了远超同等规模模型的推理性能。
行业意义：端侧和实时场景对推理速度的要求正在催生一个新的模型设计品类。3000+ token/s 的吞吐量刷新了对“小模型能有多快”的认知，对于需要实时交互的 Agent 和语音应用有直接价值。 🔗 Clement Delangue 推文 | Hugging Face 博文

8️⃣ [持续跟踪] FIGMA Motion、Code Layers、Shader 效果在 Config 2026 发布#

前情提要：昨日 Figma 在 Config 2026 前夕全量开放设计 Agent Beta。
最新发布：Figma 在 Config 2026 主题演讲中发布多项新功能：Figma Motion（设计+动画同一文件）、Code Layers（将代码直接引入画布）、Shader 效果和填充、生成式插件（用户描述需求后由 Figma Agent 自动创建）、3D Transforms 预览。Weave 工具的 20+ 功能也全部集成到画布中。
行业意义：Figma 正从“设计工具”进化为“设计+代码+动画+AI 生成”的完整创作平台。生成式插件的引入尤其值得关注，它允许非开发者通过自然语言创建自定义工作流工具，大大降低了 Figma 的扩展门槛。 🔗 Figma Motion 发布 | Code Layers | 生成式插件 | 3D 预览

9️⃣ GPT-5.5 Instant 更新：意图理解增强，付费用户即日可用#

核心发布：OpenAI 发布新版本 GPT-5.5 Instant，重点提升对用户意图的理解能力，能更准确地适应对话上下文。新版在购物建议、本地推荐和约束处理方面也有明显改善。
部署：即日向付费用户（Pro 和 Plus）推送，向免费用户次日开放。Greg Brockman 强调新版“对话体验更有趣”。
行业意义：GPT-5.5 Instant 作为 OpenAI 最常用的模型，此次迭代聚焦于对话质感和与用户的连接，证明在模型能力持续泛化的过程中，对话式 AI 的微妙体验改进同样重要。 🔗 OpenAI 官方推文 | Greg Brockman 推文

🔟 Perplexity 推出 Computer for Counsel：面向律师的 AI 研究工具#

核心发布：Perplexity 发布 Computer for Counsel，一款专为法律工作者设计的 AI 研究工具。该产品连接了 Midpage AI、LegalZoom、DocuSign、NetDocuments 等法律行业常用平台，可直接从这些系统中提取可引用来源。
可用性：该功能面向所有 Pro 和 Max 订阅用户开放。
行业意义：这是 Perplexity 从通用搜索转向垂直行业解决方案的首次尝试。法律领域对精确引用和来源验证要求极高，原本是 LLM 被诟病最多的场景。Perplexity 的针对性优化若能解决“引文验证”这一核心痛点，将打开一个付费意愿极强的专业市场。 🔗 Perplexity 官方推文 | 详情页

⭐ GitHub 趋势#

📊 类别速览

项目	类别	Stars
stablyai/orca	AI Agent IDE	6.8k
google-labs-code/design.md	AI Agent 规范	17.3k
kunchenguid/no-mistakes	AI 开发工具	2.1k

1. stablyai/orca ⭐ 今日 +331#

语言/许可： TypeScript / MIT
总 Stars： 6,752
仓库： GitHub

项目定位：
面向 AI Agent 开发者的并行 Agent 工作台，支持在同一界面内同时运行多个 CLI 编码代理（Claude Code、Codex、OpenCode 等），每个代理运行在独立的 git worktree 中，实现并行对比与合并。

核心功能：

并行 Worktrees：将同一个 prompt 分发给多个 agent，每个 agent 在隔离的 worktree 中执行，完成后可对比结果并合并胜出分支。
移动端 Companion App：iOS/Android 应用，可远程监控 agent 进度、接收通知并发送后续指令。
终端分屏与 SSH Worktrees：内置 WebGL 终端，支持无限分屏；可连接远程服务器运行 agent，自动重连与端口转发。
Design Mode：在嵌入式 Chromium 浏览器中选中 UI 元素，自动提取 HTML/CSS/截图并注入 agent prompt。

技术亮点：
基于 Electron 实现跨平台桌面应用，通过 git worktree 实现隔离，支持任意 CLI agent 的无侵入集成。

2. google-labs-code/design.md ⭐ 今日 +619#

语言/许可： TypeScript / Apache-2.0
总 Stars： 17,297
仓库： GitHub

项目定位：
为 AI 编码代理提供持久化、结构化的设计系统描述规范。通过 YAML 前置元数据 + Markdown 样式说明，让代理理解视觉身份的设计 Token 与应用规则。

核心功能：

双结构文件格式：YAML 定义精确的 tokens（颜色、字体、间距、圆角等）；Markdown 描述设计 rationale，解释“为什么这样设计”。
CLI 工具链：提供 lint（验证结构正确性）、diff（对比两个版本的变化）、export（导出为 Tailwind / W3C DTCG 格式）等命令。
组件规范扩展：支持定义按钮、卡片等组件的 token 引用，以及 hover/active 状态变体。

技术亮点：
即时代理可理解的 token 引用系统 ({colors.primary})，支持 WCAG 对比度检查，输出结构化 JSON 供 CI 集成。

3. kunchenguid/no-mistakes ⭐ 今日 +110#

语言/许可： Go / MIT
总 Stars： 2,061
仓库： GitHub

项目定位：
AI 驱动的 Git 提交质检门禁。在本地创建代理 remote，推送至 no-mistakes 后自动在隔离 worktree 中运行 review → test → docs → lint → push → PR → CI 全流程，全部通过后才将分支转发到真实远端。

核心功能：

非阻塞流水线：在临时 worktree 中执行，不影响当前工作分支。
Agent 原生集成：支持 /no-mistakes 指令让 Claude Code、Codex 等代理直接触发质检流程，自动修复机械问题，人工决策关键变更。
TUI 交互：运行 no-mistakes 打开终端 UI，逐个展示检查发现，支持 approve / auto-fix / skip。

技术亮点：
用 Go 实现本地 git remote 代理，通过 worktree 与管道实现无侵入式 CI 前过滤，兼容所有主流 CLI agent。

今日洞察#

今日最值得关注的变化不是单个产品发布，而是两个平行趋势同时加速：模型公司开始垂直整合推理硬件，同时 Agent 的“环境理解”正在从工具调用范式转向原生建模。两者指向同一个方向——AI 系统的成本结构和能力边界正被重新定义。

OpenAI 自研芯片 Jalapeño 从设计到流片仅用 9 个月，能效声称超越 SOTA，成本可省一半，2026 年底吉瓦级部署。这不仅是减少对 NVIDIA 依赖，更关键的是：当模型公司拥有自己的推理芯片时，API 定价、模型架构（如 MoE 层数、KV cache 大小）和 serving 策略（如动态批处理）都可以联合优化。这解释了为何 OpenAI 同时也在加强训练芯片路线（Serrano 已有规划）——垂直整合带来的成本优势会转化为对开发者的锁定效应。未来两年，推理成本结构将从“依赖 GPU 现货市场”转向“自研芯片的工程优化”，这将改变中小模型提供商的生存空间。

与此同时，Agent 正从“调用工具”转向“理解环境”。Gemini 3.5 Flash 原生集成计算机使用能力，不再需要外部 Agent 框架串联截图和操作指令；Qwen 开源的 Qwen-AgentWorld 语言世界模型更彻底：让模型先学会预测环境状态，再据此行动，即使不进行 Agent 微调也能直接迁移到真实任务。这两条路线的共同信号是：过去一年围绕 agent 框架（ReAct、Plan-and-Solve）的工程探索正在收敛成一个更本质的认知——Agent 能力的瓶颈不在工具调用，而在对环境的因果建模。

第二个趋势是 Agent 从个人工具变成团队基础设施。Notion 的 External Agents 将 Claude 和 Cursor 嵌入任务板、运行记录全员可见；GitHub 上 orca（并行 Agent 工作台）和 no-mistakes（AI 质检门禁）等项目说明开发者已经在为多 Agent 协作搭建规范。当 Agent 不再是屏幕后的单次对话，而是持续运行的团队成员时，权限管理、审计日志、成本追踪会成为新的刚需——Databricks 联合创始人在访谈中提到的 Omnigent 元框架正是这个方向的雏形。数据库平台天生适合做 Agent 的上下文和权限层，这可能是下一轮基础设施投资的主战场。

OpenAI 发布首颗推理芯片，Gemini 3.5 Flash 内置计算机使用

1️⃣ OpenAI 发布首颗自研推理芯片 Jalapeño：9 个月流片，能效超越 SOTA#

2️⃣ Google DeepMind 发布 Gemini 3.5 Flash 内置计算机使用能力：可操作浏览器、手机和桌面环境#

3️⃣ Notion 推出 External Agents：Claude 和 Cursor 嵌入任务板，AI 成为团队同事#

4️⃣ Qwen 开源 Qwen-AgentWorld：语言世界模型模拟 7 种 Agent 环境，超越 Claude Opus 4.8 和 GPT-5.4#

5️⃣ a16z 领投 Mirendil 2 亿美元种子轮：构建自我加速 AI 研发系统#

6️⃣ Databricks 联合创始人深度访谈：Omnigent 成为 Agent 基础设施层，LTAP 重新定义数据库#

7️⃣ Kog 开源 LaneFormer 2B：3000+ token/s 推理速度，专为低延迟场景设计#

8️⃣ [持续跟踪] FIGMA Motion、Code Layers、Shader 效果在 Config 2026 发布#

9️⃣ GPT-5.5 Instant 更新：意图理解增强，付费用户即日可用#

🔟 Perplexity 推出 Computer for Counsel：面向律师的 AI 研究工具#

⭐ GitHub 趋势#

1. stablyai/orca ⭐ 今日 +331#

2. google-labs-code/design.md ⭐ 今日 +619#

3. kunchenguid/no-mistakes ⭐ 今日 +110#

今日洞察#