Yeekal Logo Yeekal
4,280 字
早报 | MORNING 2026-06-25

OpenAI 发布首颗推理芯片,Gemini 3.5 Flash 内置计算机使用

今日要点
  • OpenAI 首颗自研推理芯片 Jalapeño 发布,9 个月流片
  • Gemini 3.5 Flash 原生集成计算机使用能力
  • Notion 引入 External Agents,Claude 和 Cursor 成为团队协作者
上一期 · 2026-06-24 已是最新一期
OpenAI 联合 Broadcom 发布首颗自研推理芯片 Jalapeño,从设计到流片仅用 9 个月,能效声称超越当前 SOTA,预计 2026 年底吉瓦级部署;Google DeepMind 发布 Gemini 3.5 Flash,模型原生集成计算机使用能力,支持浏览器、手机和桌面环境;Notion 推出 External Agents 功能,允许用户将 Claude 和 Cursor 嵌入共享任务板,通过 @ 提及委派任务。

title: “OpenAI 发布首颗推理芯片,Notion 引入外部 Agent,Qwen 开源语言世界模型” lead: “OpenAI联合 Broadcom 发布首颗自研推理芯片 Jalapeño,9 个月流片,能效声称超越 SOTA;Google DeepMind 发布 Gemini 3.5 Flash 计算机使用能力,可操作浏览器和手机;Notion 推出 External Agents 功能,将 Claude 和 Cursor 引入协作平台。” highlights:

  • “OpenAI 首颗自研推理芯片 Jalapeño 发布,9 个月流片”
  • “Google Gemini 3.5 Flash 获内置计算机使用能力”
  • “Notion 推出 External Agents 引入 Claude 和 Cursor”

1️⃣ OpenAI 发布首颗自研推理芯片 Jalapeño:9 个月流片,能效超越 SOTA#

  • 核心发布:OpenAI 联合 Broadcom 发布其首颗自研 AI 芯片 Jalapeño,专为 LLM 推理优化。芯片从设计到流片仅用 9 个月,首批样片已到手。Broadcom CEO 称该芯片性能功耗比“显著优于当前最先进水平”,成本可省一半。
  • 技术路线:由 OpenAI 完成芯片架构设计、内核优化和 serving 系统,Broadcom 负责硅实现和网络技术(Tomahawk 交换芯片),Celestica 负责系统集成。芯片仅针对推理,训练大概率仍需依赖 NVIDIA。
  • 部署计划:预计 2026 年底开始以吉瓦级规模部署,微软已参与芯片产能承购。Jalapeño 是未来多代计算平台的第一代,第二代代号 Serrano 已有规划。
  • 行业意义:这标志着 OpenAI 从模型公司向全栈 AI 基础设施公司的关键转折。自研推理芯片能直接降低运营成本并优化用户体验,同时也表明当规模达到一定程度后,垂直整合成为必然选择。 🔗 OpenAI 官方公告 | Broadcom CEO 声明 | Berryxia 详细分析

2️⃣ Google DeepMind 发布 Gemini 3.5 Flash 内置计算机使用能力:可操作浏览器、手机和桌面环境#

  • 核心发布:Google DeepMind 宣布 Gemini 3.5 Flash 模型内置 计算机使用 功能。该能力原生集成在模型中,支持浏览器、手机和桌面三种环境,并附带内置安全机制(用户确认、自动停止提示注入)。
  • 技术细节:该功能基于屏幕截图和操作指令,可执行复杂的多步交互任务,如“审核此页面、运行代码示例、寻找问题并生成报告”。模型额外针对提示注入进行了专项训练。
  • 开源与体验:Google 已开源对应的 GitHub 仓库,开发者可通过 Google AI Studio、Gemini API 或 Browserbase 直接试用。
  • 行业意义:计算机使用能力从实验性功能升级为模型原生能力,标志着 AI Agent 交互范式的再次跃迁。Gemini 3.5 Flash 将替代过去依赖多模型串联的繁琐架构。 🔗 Google DeepMind 博客 | Philipp Schmid 推文 | GitHub 仓库

3️⃣ Notion 推出 External Agents:Claude 和 Cursor 嵌入任务板,AI 成为团队同事#

  • 核心发布:Notion 正式推出 External Agents 功能,将 Claude 和 Cursor 引入共享任务板。用户可创建专用 AI Agent(数据分析、编码、生成电子表格等),通过 @ 提及即委派任务。Agent 运行记录对全员可见。
  • 能力演示:Claude 可根据粗略 PRD 读取代码库并完善技术细节,Cursor 可从 Notion 接收任务指令后自动打开 PR。多个 Agent 可串联形成长工作流。
  • Cursor SDK 赋能:Notion 与 Cursor 的集成基于新发布的 Cursor SDK,确保云端 Agent 共享相同的模型和运行环境。
  • 行业意义:这是任务协作平台首次原生引入外部 AI Agent,标志着 Agent 正从“个人工具”向“团队协作者”演进。Notion 的行动有望重新定义知识工作者的协作形态。 🔗 Notion 官方推文 | Cursor SDK 说明 | 更多功能演示

4️⃣ Qwen 开源 Qwen-AgentWorld:语言世界模型模拟 7 种 Agent 环境,超越 Claude Opus 4.8 和 GPT-5.4#

  • 核心发布:阿里 Qwen 团队开源 Qwen-AgentWorld,一个原生语言世界模型,能在一个统一框架内模拟 MCP、搜索、终端、SWE、网页、操作系统和安卓等 7 种 Agent 环境。
  • 技术突破:该模型将“环境建模”作为训练核心目标,而非后置适应。在 AgentWorldBench 上,35B MoE 模型(3B 活跃参数)超越 Claude Opus 4.8 和 GPT-5.4。更重要的是,单纯通过环境预测训练出的模型,即使不做任何 Agent 微调,也能直接迁移到真实 Agent 任务上。
  • 双路线:两条研究路线并行:将世界模型用作可控的环境模拟器(Sim RL),以及通过学习预测环境来增强 Agent 能力。后者在多个 benchmark 上提升显著。
  • 行业意义:这项研究从根本上重新定义了 Agent 训练范式——“先让 AI 真正理解环境,再教它如何行动”。世界建模作为可迁移的推理能力,可能成为下一波 Agent 能力跃升的关键。 🔗 Qwen 官方推文 | Berryxia 解读 | 论文

5️⃣ a16z 领投 Mirendil 2 亿美元种子轮:构建自我加速 AI 研发系统#

  • 核心发布:a16z 宣布领投 Mirendil 的 2 亿美元种子轮,NVIDIA 等跟投。创始团队来自 Anthropic、Google DeepMind 和 xAI 共 20 人。
  • 目标定位:Mirendil 构建的是“能自行做 AI 研究的 AI 系统”——训练前沿模型进行 AI 研发,并围绕其构建产品闭环。该系统可自主循环解决科研和工程问题,无需人工干预。相当于一个控制着自身 GPU 的 AI 研究编码 Agent。
  • 创始人观点:CEO Behnam Neyshabur 称,当系统能自动朝着特定方向快速改进时,就构成了自我加速的 AI 技术。这与过去依赖大实验室集中开发生成对比。
  • 行业意义:这是当前针对“AI 自动化 AI 研发”的最高倍投注之一。若成功,将重新定义前沿 AI 研究的效率曲线和权力分布——从少数实验室集中转向更广泛的参与者。 🔗 a16z 推文 | Mirendil CEO 推文

6️⃣ Databricks 联合创始人深度访谈:Omnigent 成为 Agent 基础设施层,LTAP 重新定义数据库#

  • 核心发布:Latent Space 发布对 Databricks 联合创始人 Matei Zaharia 和 Reynold Xin 的深度专访,讨论 Databricks 如何从数据平台演变为 Agent 操作系统。
  • 关键内容:Omnigent 是一个开源的元框架,提供统一的 API 来管理多种编码 Agent(Claude Code、Codex、Cursor 等),解决安全策略、上下文共享和成本控制等基础设施问题。LTAP 则是通过统一存储层(将数据以列式格式写入数据湖)来消除经典 HTAP 的工程妥协。
  • Reality 空间:Zaharia 和 Xin 强调,未来软件的形态可能简化为“将数据放在正确位置,然后在上面运行 Agent”。数据库公司天然具备成为 Agent 基础设施提供者的条件。
  • 行业意义:这份访谈清晰勾勒出数据平台公司如何响应 Agent 时代的战略路径:不做模型,而是提供模型运行所需的全部上下文、权限和计算基础设施。 🔗 Latent Space 播客 | 相关推文

7️⃣ Kog 开源 LaneFormer 2B:3000+ token/s 推理速度,专为低延迟场景设计#

  • 核心发布:Kog 在 Hugging Face 开源 2B 参数的 LaneFormer 2B 模型,专为极致低延迟推理设计,在演示中以 3000+ token/s 的速度运行。
  • 技术背景:该模型是“延迟优先”设计理念的产物,据称通过优化架构和训练策略,在保持较小模型体量的同时实现了远超同等规模模型的推理性能。
  • 行业意义:端侧和实时场景对推理速度的要求正在催生一个新的模型设计品类。3000+ token/s 的吞吐量刷新了对“小模型能有多快”的认知,对于需要实时交互的 Agent 和语音应用有直接价值。 🔗 Clement Delangue 推文 | Hugging Face 博文

8️⃣ [持续跟踪] FIGMA Motion、Code Layers、Shader 效果在 Config 2026 发布#

  • 前情提要:昨日 Figma 在 Config 2026 前夕全量开放设计 Agent Beta。
  • 最新发布:Figma 在 Config 2026 主题演讲中发布多项新功能:Figma Motion(设计+动画同一文件)、Code Layers(将代码直接引入画布)、Shader 效果和填充生成式插件(用户描述需求后由 Figma Agent 自动创建)、3D Transforms 预览。Weave 工具的 20+ 功能也全部集成到画布中。
  • 行业意义:Figma 正从“设计工具”进化为“设计+代码+动画+AI 生成”的完整创作平台。生成式插件的引入尤其值得关注,它允许非开发者通过自然语言创建自定义工作流工具,大大降低了 Figma 的扩展门槛。 🔗 Figma Motion 发布 | Code Layers | 生成式插件 | 3D 预览

9️⃣ GPT-5.5 Instant 更新:意图理解增强,付费用户即日可用#

  • 核心发布:OpenAI 发布新版本 GPT-5.5 Instant,重点提升对用户意图的理解能力,能更准确地适应对话上下文。新版在购物建议、本地推荐和约束处理方面也有明显改善。
  • 部署:即日向付费用户(Pro 和 Plus)推送,向免费用户次日开放。Greg Brockman 强调新版“对话体验更有趣”。
  • 行业意义:GPT-5.5 Instant 作为 OpenAI 最常用的模型,此次迭代聚焦于对话质感和与用户的连接,证明在模型能力持续泛化的过程中,对话式 AI 的微妙体验改进同样重要。 🔗 OpenAI 官方推文 | Greg Brockman 推文

🔟 Perplexity 推出 Computer for Counsel:面向律师的 AI 研究工具#

  • 核心发布:Perplexity 发布 Computer for Counsel,一款专为法律工作者设计的 AI 研究工具。该产品连接了 Midpage AI、LegalZoom、DocuSign、NetDocuments 等法律行业常用平台,可直接从这些系统中提取可引用来源。
  • 可用性:该功能面向所有 Pro 和 Max 订阅用户开放。
  • 行业意义:这是 Perplexity 从通用搜索转向垂直行业解决方案的首次尝试。法律领域对精确引用和来源验证要求极高,原本是 LLM 被诟病最多的场景。Perplexity 的针对性优化若能解决“引文验证”这一核心痛点,将打开一个付费意愿极强的专业市场。 🔗 Perplexity 官方推文 | 详情页

⭐ GitHub 趋势#

📊 类别速览

项目类别Stars
stablyai/orcaAI Agent IDE6.8k
google-labs-code/design.mdAI Agent 规范17.3k
kunchenguid/no-mistakesAI 开发工具2.1k

1. stablyai/orca ⭐ 今日 +331#

语言/许可: TypeScript / MIT
总 Stars: 6,752
仓库: GitHub

项目定位:
面向 AI Agent 开发者的并行 Agent 工作台,支持在同一界面内同时运行多个 CLI 编码代理(Claude Code、Codex、OpenCode 等),每个代理运行在独立的 git worktree 中,实现并行对比与合并。

核心功能:

  • 并行 Worktrees:将同一个 prompt 分发给多个 agent,每个 agent 在隔离的 worktree 中执行,完成后可对比结果并合并胜出分支。
  • 移动端 Companion App:iOS/Android 应用,可远程监控 agent 进度、接收通知并发送后续指令。
  • 终端分屏与 SSH Worktrees:内置 WebGL 终端,支持无限分屏;可连接远程服务器运行 agent,自动重连与端口转发。
  • Design Mode:在嵌入式 Chromium 浏览器中选中 UI 元素,自动提取 HTML/CSS/截图并注入 agent prompt。

技术亮点:
基于 Electron 实现跨平台桌面应用,通过 git worktree 实现隔离,支持任意 CLI agent 的无侵入集成。


2. google-labs-code/design.md ⭐ 今日 +619#

语言/许可: TypeScript / Apache-2.0
总 Stars: 17,297
仓库: GitHub

项目定位:
为 AI 编码代理提供持久化、结构化的设计系统描述规范。通过 YAML 前置元数据 + Markdown 样式说明,让代理理解视觉身份的设计 Token 与应用规则。

核心功能:

  • 双结构文件格式:YAML 定义精确的 tokens(颜色、字体、间距、圆角等);Markdown 描述设计 rationale,解释“为什么这样设计”。
  • CLI 工具链:提供 lint(验证结构正确性)、diff(对比两个版本的变化)、export(导出为 Tailwind / W3C DTCG 格式)等命令。
  • 组件规范扩展:支持定义按钮、卡片等组件的 token 引用,以及 hover/active 状态变体。

技术亮点:
即时代理可理解的 token 引用系统 ({colors.primary}),支持 WCAG 对比度检查,输出结构化 JSON 供 CI 集成。


3. kunchenguid/no-mistakes ⭐ 今日 +110#

语言/许可: Go / MIT
总 Stars: 2,061
仓库: GitHub

项目定位:
AI 驱动的 Git 提交质检门禁。在本地创建代理 remote,推送至 no-mistakes 后自动在隔离 worktree 中运行 review → test → docs → lint → push → PR → CI 全流程,全部通过后才将分支转发到真实远端。

核心功能:

  • 非阻塞流水线:在临时 worktree 中执行,不影响当前工作分支。
  • Agent 原生集成:支持 /no-mistakes 指令让 Claude Code、Codex 等代理直接触发质检流程,自动修复机械问题,人工决策关键变更。
  • TUI 交互:运行 no-mistakes 打开终端 UI,逐个展示检查发现,支持 approve / auto-fix / skip。

技术亮点:
用 Go 实现本地 git remote 代理,通过 worktree 与管道实现无侵入式 CI 前过滤,兼容所有主流 CLI agent。

今日洞察#

今日最值得关注的变化不是单个产品发布,而是两个平行趋势同时加速:模型公司开始垂直整合推理硬件,同时 Agent 的“环境理解”正在从工具调用范式转向原生建模。两者指向同一个方向——AI 系统的成本结构和能力边界正被重新定义。

OpenAI 自研芯片 Jalapeño 从设计到流片仅用 9 个月,能效声称超越 SOTA,成本可省一半,2026 年底吉瓦级部署。这不仅是减少对 NVIDIA 依赖,更关键的是:当模型公司拥有自己的推理芯片时,API 定价、模型架构(如 MoE 层数、KV cache 大小)和 serving 策略(如动态批处理)都可以联合优化。这解释了为何 OpenAI 同时也在加强训练芯片路线(Serrano 已有规划)——垂直整合带来的成本优势会转化为对开发者的锁定效应。未来两年,推理成本结构将从“依赖 GPU 现货市场”转向“自研芯片的工程优化”,这将改变中小模型提供商的生存空间。

与此同时,Agent 正从“调用工具”转向“理解环境”。Gemini 3.5 Flash 原生集成计算机使用能力,不再需要外部 Agent 框架串联截图和操作指令;Qwen 开源的 Qwen-AgentWorld 语言世界模型更彻底:让模型先学会预测环境状态,再据此行动,即使不进行 Agent 微调也能直接迁移到真实任务。这两条路线的共同信号是:过去一年围绕 agent 框架(ReAct、Plan-and-Solve)的工程探索正在收敛成一个更本质的认知——Agent 能力的瓶颈不在工具调用,而在对环境的因果建模。

第二个趋势是 Agent 从个人工具变成团队基础设施。Notion 的 External Agents 将 Claude 和 Cursor 嵌入任务板、运行记录全员可见;GitHub 上 orca(并行 Agent 工作台)和 no-mistakes(AI 质检门禁)等项目说明开发者已经在为多 Agent 协作搭建规范。当 Agent 不再是屏幕后的单次对话,而是持续运行的团队成员时,权限管理、审计日志、成本追踪会成为新的刚需——Databricks 联合创始人在访谈中提到的 Omnigent 元框架正是这个方向的雏形。数据库平台天生适合做 Agent 的上下文和权限层,这可能是下一轮基础设施投资的主战场。