Yeekal Logo Yeekal
3,744 字
早报 | MORNING 2026-06-24

Claude Tag 发布,火山引擎 Seedance 2.5 登场,企业微信 AI Agent 内测

今日要点
  • Anthropic 发布 Claude Tag,Claude 可直接加入 Slack 频道工作
  • 火山引擎 Seedance 2.5 支持原生 4K、30 秒视频
  • 企业微信 AI Agent 内测,可基于工作数据自动回复
上一期 · 2026-06-23 已是最新一期
Anthropic 发布 Claude Tag,Claude 可加入 Slack 频道作为团队成员,拥有指定权限和工具;火山引擎发布 Seedance 2.5 视频模型,支持原生 4K、最长 30 秒视频及 50 个多模态参考;企业微信 AI Agent 进入内测,用户左滑即可唤起,自动识别工作场景并基于群聊、文档等数据回复。

title: “Claude Tag 正式发布,OpenAI 半年 API 更新 30+ 模型,火山引擎 Seedance 2.5 登场” lead: “Anthropic 发布 Claude Tag,Claude 可直接加入 Slack 频道作为团队成员;OpenAI 总结半年 API 更新 30+ 模型、启动 DevDay 2026 申请和 Patch the Planet 开源安全计划;火山引擎发布 Seedance 2.5 和豆包 2.1 Pro,Seedance 支持原生 4K、30 秒视频;xAI 为 Grok Build 引入 Firecrawl 官方插件;GitHub Copilot app 支持自带模型密钥;Google Gemini Interactions API 正式 GA 并推出 Managed Agents;Cursor 上线团队插件排行榜和预置画布;HeyGen 发布 HTML 转视频引擎 Hyperframes;微信生态 AI 加速,企业微信“大圆”进入内测,微信“小微”曝更多功能。” highlights:

  • “Anthropic 发布 Claude Tag,Kaethy 称第三次 LLM UI/UX 范式转变”
  • “火山引擎 Seedance 2.5 支持原生 4K、30 秒视频及 50 个多模态参考”
  • “Firecrawl 成为 Grok Build 官方插件,GitHub Copilot app 支持 BYOK”

1️⃣ Claude Tag 正式发布:从对话窗口到团队内建成员#

  • 核心发布:Anthropic 发布 Claude Tag,Claude 可以像团队成员一样加入 Slack 频道,拥有指定权限和工具。用户在频道中 @Claude 即可委派任务,Claude 能自主完成复杂流程、下拉代码、修复故障、回答问题等,完成后通知结果。
  • Andrej Karpathy 评论:这是第三次 LLM UI/UX 范式转变:第一次是 LLM 成为“你需要访问的网站”(ChatGPT 网页端),第二次是“你下载到电脑的 App”(桌面应用),第三次是“一个自包含、持久、异步的实体,拥有全局工具和上下文,与人类团队并肩工作”。一旦底层工程(跨工具、集成、计算环境、记忆、安全等)就绪,Claude 就以无缝方式加入团队。
  • 行业意义:Agent 从“工具”进化为“数字同事”,标志着人机协作进入新阶段。Claude Tag 不仅降低了 Agent 的使用门槛,还改变了团队协作的根本模式——开发者不再需要离开工作环境去另一个 App 中与 AI 对话。 🔗 Anthropic 推文 | Karpathy 推文 | Karpathy 推文(补充)

2️⃣ OpenA 半年 API 大更新:30+ 模型、DevDay 2026 开放、Patch the Planet 开源安全计划#

  • 核心发布:OpenAI 官方用一张图总结过去六个月 API 更新:包括 GPT‑5.5、GPT‑5.4 mini/nano、GPT‑Realtime‑2、GPT‑Realtime‑Whisper/Translate、GPT‑Image‑2 等新模型;Agent 构建模块(Agents SDK 沙箱、Skills in Responses API、WebSocket 模式、托管 shell 等);以及管理 API 增强、OpenAI CLI、Amazon Bedrock 上模型等。
  • DevDay 2026:开发者日将于 9 月 29 日在旧金山举行,7 月 10 日截止申请,主题演讲同步直播,还将扩展至班加罗尔、东京、首尔等全球 8 个城市。
  • Patch the Planet 项目:与 Daybreak、Trail of Bits 合作,利用 AI 辅助安全研究帮助开源项目验证漏洞、开发补丁和测试、协调披露。
  • Codex 开源支持:自 3 月启动以来已为 3500+ 维护者提供 6 个月 ChatGPT Pro。
  • 行业意义:OpenAI 在模型、Agent 框架、开发者生态和安全合规四线并进,展示其从“模型公司”向“平台公司”转型的决心。 🔗 OpenAI Devs 推文 | DevDay 公告 | Patch the Planet 推文 | Codex 推文

3️⃣ xAI 为 Grok Build 引入 Firecrawl 官方插件:AI Agent 获得搜索网页与抓取能力#

  • 核心发布:Firecrawl 正式成为 Grok Build 插件市场的官方插件。Grok 用户可以在 CLI 中通过 /plugin 命令安装 Firecrawl,使 Grok Agent 具备搜索、抓取和与任意网页交互的能力。前 1000 个月度积分免费。
  • xAI 官方确认:Grok Build 插件市场已上架该插件,鼓励用户试用。
  • 行业意义:Firecrawl 的能力从通用 Agent 工具扩展到 xAI 生态,标志着 Grok Build 正在构建类似 OpenAI Codex 的 Agent 平台,并通过插件生态差异化竞争。 🔗 Firecrawl 推文 | xAI 推文

4️⃣ GitHub Copilot app 支持 BYOK:自带模型密钥、本地模型或订阅模型自由切换#

  • 核心发布:GitHub 宣布 GitHub Copilot app 的模型选择器正式支持 BYOK(Bring Your Own Key)。开发者可自带自有提供商密钥、使用本地模型或订阅模型,在同一个 Agent session 中自由切换。
  • 使用场景:你决定每个 Agent session 最适合哪种模型,不再被绑定在单一模型上。
  • 行业意义:这是 AI 编程工具的一个重要开放时刻。GitHub 将模型选择权完全交给用户,满足不同任务对成本、隐私和性能的多样化需求,可能推动更多编码 Agent 走向模型中立。 🔗 GitHub 推文 | Changelog

5️⃣ Google Gemini Interactions API 全面上市,Managed Agents 上线可零基础设施自动运行#

  • 核心发布:Google AI Developers 宣布 Gemini Interactions API 已正式可用,提供统一接口处理文本、多模态、工具使用和 Managed Agents。开发者现可通过单个端点构建自主 Agent。
  • Managed Agents 演示:只需一条 prompt,Agent 可自动在临时安全 Linux 沙箱中研究主题、自我修正、创建电台节目(包括编写脚本、生成音乐、制作专辑封面),全程无需任何基础设施设置。
  • 开发者指南:Google AI Studio 发布了详细的入门教程,覆盖流式、工具调用、Managed Agents 以及使用 previous_interaction_id 链式对话。
  • 行业意义:Google 正快速缩小与 OpenAI 和 Anthropic 在 Agent 体验上的差距。Managed Agents 的“零基础设施”免部署模式,可能吸引大量不喜欢运维的开发者。 🔗 Google AI Devs 推文 | Google AI Devs 推文 2 | 开发者指南推文

6️⃣ Cursor 发布多项协作新功能:团队插件排行榜、预置画布、市场扩展#

  • 核心发布:Cursor 在 Customize 页面上线多项更新:团队插件、技能和 MCP 的排行榜(一键添加到配置)、预置画布(如 Atlassian 画布显示实时 Issues/Projects/Documents)、团队市场支持 GitLab/Bitbucket/Azure DevOps(除本地仓库外)。
  • 使用场景:开发者可看到团队中最流行的插件/技能/MCP,一键启用;利用 Atlassian 画布直接在 Cursor 中查看和管理 Jira 工单。
  • 行业意义:Cursor 正在从单兵编码工具演变为团队协作平台。通过排行榜和画布,降低了团队间共享 Agent 配置的门槛,也扩展了 AI IDE 在企业协作中的角色。 🔗 Cursor 推文 1 | Cursor 推文 2 | Cursor 推文 3

7️⃣ HeyGen 推出 Hyperframes:专为 Agent 设计的 HTML 转视频渲染引擎#

  • 核心发布:HeyGen 正式推出 Hyperframes,一个通过 HTML 自动渲染视频的引擎。Agent 只需“写 HTML,渲染视频”,即可生成带音频和对白的视频。同时发布了“节奏技能”(skill),Agent 可以安装后根据音乐节拍自动构建视频节奏。
  • 技术亮点:视频节奏围绕音乐而非字幕,Agent 可读取节拍并围绕其构建镜头和转场。Hyperframes 已被设计为 Agent Skill,通过 npx skills add heygen-com/hyperframes 一键安装。
  • 行业意义:视频生成正从“提示词 + 模型”转向“Agent 可编程渲染管道”。Hyperframes 让 Agent 能够程序化控制视频结构,对营销、教育、社交媒体内容自动化具有潜在颠覆性。 🔗 HeyGen 推文 1 | HeyGen 推文 2 | GitHub

8️⃣ 火山引擎 Seedance 2.5 发布:原生 4K、30 秒时长、50 个多模态参考#

  • 核心发布:在 2026 火山引擎 FORCE 原动力大会上,豆包大模型 2.1 Pro 正式发布,在 Terminal Bench 等代码基准中与 Claude Opus 4.7 持平,价格仅为 Claude 系列同行的约 20%。视频模型 Seedance 2.5 同期发布(预计 7 月初正式上线),三大升级:单条视频最长 30 秒(全球第一)、支持 50 个全模态素材联合输入(全球最多)、灵活视频编辑(局部修改背景/商品/模特)。
  • 配套工具:Seedream 5.0 Pro 支持交互式精准编辑、多图层分离、10+ 种语言排版适应;Seed-Audio 1.0 支持情绪/口音/音效一次性输出。
  • 业务数据:火山引擎在公有云大模型市场份额已达 49.5%;豆包日均 token 调用量 180 万亿。
  • 行业意义:字节跳动展示出完整的“模型 + 视频 + 音频 + 设计”全栈能力。Seedance 2.5 突破 15 秒时长的行业天花板,为 AI 视频从 UGC 走向专业创作铺平道路。 🔗 爱范儿报道 | 量子位报道

9️⃣ [持续跟踪] 腾讯连续推出 AI Agent:微信“小微”功能曝光,企业微信“大圆”内测#

  • 前情提要:微信原生 AI 助手“小微”已灰度上线,支持朋友圈、小程序、音乐等操作。
  • 最新进展:据爱范儿和智东西报道,微信“小微”功能进一步曝光:支持发红包、通过聊天记录总结群聊、创建自定义小工具(内置小程序生成能力)、记忆用户偏好等。同时,企业微信即将推出名为“大圆”的 AI Agent,目前已进入内测阶段。用户在企微页面左滑即可唤起,自动识别所处场景,可基于群聊、文档、会议等工作数据给出回复。
  • 行业意义:微信和企业微信同时接入 AI Agent,标志着腾讯正在将生态优势转化为 AI 时代“超级应用 + 企业协作”的双重入口。企业微信连接 1400 万组织、7.5 亿微信用户,数据场景巨大。 🔗 爱范儿报道 | 智东西报道

⭐ GitHub 趋势#

📊 类别速览

项目类别Stars
NousResearch/hermes-agentAI Agent200.9k
affaan-m/ECCAI Infra / Agent 工具链220.5k

1. NousResearch/hermes-agent ⭐ 今日 +936#

语言/许可: Python / MIT
总 Stars: 200.9k
仓库: GitHub

项目定位:
面向个人开发者和研究者的自改进 AI Agent 系统,具备跨会话记忆、自主技能生成和多平台部署能力。

核心功能:

  • 闭环学习:自动从复杂任务中创建技能,技能在后续使用中自优化,支持 FTS5 全文检索与 LLM 摘要的跨会话记忆
  • 多终端统一:同一进程同时服务 Telegram、Discord、Slack、WhatsApp、Signal、CLI,语音消息转录且对话跨平台连续
  • 调度与自动化:内置 cron 调度器,支持自然语言配置周期性任务(日报、备份等),无人值守运行
  • 可分离架构:支持本地、Docker、SSH、Modal、Daytona 等6种终端后端,Modal/Daytona 实现无会话时自动休眠、几乎零成本

技术亮点:
基于 Honcho 的辩证用户建模 + agentcurated memory 与定期“nudge”机制;兼容 agentskills.io 开放技能标准;支持 200+ 模型提供商切换,无供应商锁定。


2. affaan-m/ECC ⭐ 今日 +593#

语言/许可: JavaScript / MIT
总 Stars: 220.5k
仓库: GitHub

项目定位:
跨 AI 编码助手的统一性能优化与安全层,为 Claude Code、Codex、Cursor、OpenCode 等提供可复用的技能、记忆优化、安全扫描和编排能力。

核心功能:

  • 技能与指令标准化:261 个跨 harness 通用的技能,66 个 agent 定义,84 个 legacy command shim,实现工作流在不同助手中的可迁移
  • 记忆持续化:通过 hooks 自动保存/加载上下文,支持跨会话连续学习与模式提取
  • 安全层(AgentShield):提供输入消毒、CVE 扫描、沙箱化执行,针对 agent 常见攻击向量(prompt injection、工具滥用)
  • 编排系列(orch-*):包含工作树生命周期管理、MCP 清单、session adapter 等控制面组件,支持并行化评估与 failover

技术亮点:
面向多 harness 的抽象架构——通过 session adapter 统一不同助手的上下文接口;基于 Git worktrees 的并行化方法用于大规模评估;支持 GitHub App 与 npm 双通道分发。

今日洞察#

今日最值得关注的信号不是某个单一大模型发布,而是 Agent 的产品形态正在从“对话窗口”向“内建同事”和“后台调度器”两个方向同时分化。

Claude Tag 的发布是一个标志性事件。Karpathy 将其定义为 LLM UI/UX 的第三次范式转换:从需要用户主动访问的网站(ChatGPT),到下载到本地的桌面应用,再到一个持久存在、异步工作的数字实体。这个判断的核心在于“持久”和“异步”——用户不再需要主动发起对话,Claude 像团队成员一样存在于 Slack 频道中,可随时被委派任务并自主完成后通知。这彻底改变了人机协作的交互模型,将 Agent 从用户驱动的工具变为系统驱动的角色。

与之形成对照的是 GitHub Copilot app 的 BYOK 支持。GitHub 将模型选择权完全交给用户,允许在同一 session 内自由切换自带密钥、本地模型或订阅模型。这个动作的本质是 Agent 工具链的“去平台化”——当开发者可以在 Copilot Agent 中混用不同模型时,单一模型供应商的锁定效应被显著削弱,开发者的选择基准将从“哪个模型最好”转向“哪个模型最适合当前子任务”。

Cursor 的更新则指向另一个方向:协作标准化。团队插件排行榜和预置画布降低了团队共享 Agent 配置的门槛,本质上是在解决 Agent 工具链的“协作沉没成本”问题——如果每个开发者都自己配置 Agent,团队难以形成工作流统一。Cursor 在用排行榜和画布建立团队级别的 Agent 配置规范。

这三个信号共同指向一个趋势:Agent 的产品设计正从“模型能力竞赛”进入“工程形态竞赛”——谁能让 Agent 更好地嵌入现有工作流(Claude Tag)、谁能让工具链更灵活(BYOK)、谁能降低团队协作成本(Cursor),谁就能在下一阶段取得优势。