AI Daily 2026-06-24 | Anthropic 发布 Claude Tag 可加入 Slack，火山引擎 Seedance 2.5 支持 30 秒视频，企业微信 AI Agent 内测

title: “Claude Tag 正式发布，OpenAI 半年 API 更新 30+ 模型，火山引擎 Seedance 2.5 登场” lead: “Anthropic 发布 Claude Tag，Claude 可直接加入 Slack 频道作为团队成员；OpenAI 总结半年 API 更新 30+ 模型、启动 DevDay 2026 申请和 Patch the Planet 开源安全计划；火山引擎发布 Seedance 2.5 和豆包 2.1 Pro，Seedance 支持原生 4K、30 秒视频；xAI 为 Grok Build 引入 Firecrawl 官方插件；GitHub Copilot app 支持自带模型密钥；Google Gemini Interactions API 正式 GA 并推出 Managed Agents；Cursor 上线团队插件排行榜和预置画布；HeyGen 发布 HTML 转视频引擎 Hyperframes；微信生态 AI 加速，企业微信“大圆”进入内测，微信“小微”曝更多功能。” highlights:

“Anthropic 发布 Claude Tag，Kaethy 称第三次 LLM UI/UX 范式转变”
“火山引擎 Seedance 2.5 支持原生 4K、30 秒视频及 50 个多模态参考”
“Firecrawl 成为 Grok Build 官方插件，GitHub Copilot app 支持 BYOK”

1️⃣ Claude Tag 正式发布：从对话窗口到团队内建成员#

核心发布：Anthropic 发布 Claude Tag，Claude 可以像团队成员一样加入 Slack 频道，拥有指定权限和工具。用户在频道中 @Claude 即可委派任务，Claude 能自主完成复杂流程、下拉代码、修复故障、回答问题等，完成后通知结果。
Andrej Karpathy 评论：这是第三次 LLM UI/UX 范式转变：第一次是 LLM 成为“你需要访问的网站”（ChatGPT 网页端），第二次是“你下载到电脑的 App”（桌面应用），第三次是“一个自包含、持久、异步的实体，拥有全局工具和上下文，与人类团队并肩工作”。一旦底层工程（跨工具、集成、计算环境、记忆、安全等）就绪，Claude 就以无缝方式加入团队。
行业意义：Agent 从“工具”进化为“数字同事”，标志着人机协作进入新阶段。Claude Tag 不仅降低了 Agent 的使用门槛，还改变了团队协作的根本模式——开发者不再需要离开工作环境去另一个 App 中与 AI 对话。 🔗 Anthropic 推文 | Karpathy 推文 | Karpathy 推文（补充）

2️⃣ OpenA 半年 API 大更新：30+ 模型、DevDay 2026 开放、Patch the Planet 开源安全计划#

核心发布：OpenAI 官方用一张图总结过去六个月 API 更新：包括 GPT‑5.5、GPT‑5.4 mini/nano、GPT‑Realtime‑2、GPT‑Realtime‑Whisper/Translate、GPT‑Image‑2 等新模型；Agent 构建模块（Agents SDK 沙箱、Skills in Responses API、WebSocket 模式、托管 shell 等）；以及管理 API 增强、OpenAI CLI、Amazon Bedrock 上模型等。
DevDay 2026：开发者日将于 9 月 29 日在旧金山举行，7 月 10 日截止申请，主题演讲同步直播，还将扩展至班加罗尔、东京、首尔等全球 8 个城市。
Patch the Planet 项目：与 Daybreak、Trail of Bits 合作，利用 AI 辅助安全研究帮助开源项目验证漏洞、开发补丁和测试、协调披露。
Codex 开源支持：自 3 月启动以来已为 3500+ 维护者提供 6 个月 ChatGPT Pro。
行业意义：OpenAI 在模型、Agent 框架、开发者生态和安全合规四线并进，展示其从“模型公司”向“平台公司”转型的决心。 🔗 OpenAI Devs 推文 | DevDay 公告 | Patch the Planet 推文 | Codex 推文

3️⃣ xAI 为 Grok Build 引入 Firecrawl 官方插件：AI Agent 获得搜索网页与抓取能力#

核心发布：Firecrawl 正式成为 Grok Build 插件市场的官方插件。Grok 用户可以在 CLI 中通过 /plugin 命令安装 Firecrawl，使 Grok Agent 具备搜索、抓取和与任意网页交互的能力。前 1000 个月度积分免费。
xAI 官方确认：Grok Build 插件市场已上架该插件，鼓励用户试用。
行业意义：Firecrawl 的能力从通用 Agent 工具扩展到 xAI 生态，标志着 Grok Build 正在构建类似 OpenAI Codex 的 Agent 平台，并通过插件生态差异化竞争。 🔗 Firecrawl 推文 | xAI 推文

4️⃣ GitHub Copilot app 支持 BYOK：自带模型密钥、本地模型或订阅模型自由切换#

核心发布：GitHub 宣布 GitHub Copilot app 的模型选择器正式支持 BYOK（Bring Your Own Key）。开发者可自带自有提供商密钥、使用本地模型或订阅模型，在同一个 Agent session 中自由切换。
使用场景：你决定每个 Agent session 最适合哪种模型，不再被绑定在单一模型上。
行业意义：这是 AI 编程工具的一个重要开放时刻。GitHub 将模型选择权完全交给用户，满足不同任务对成本、隐私和性能的多样化需求，可能推动更多编码 Agent 走向模型中立。 🔗 GitHub 推文 | Changelog

5️⃣ Google Gemini Interactions API 全面上市，Managed Agents 上线可零基础设施自动运行#

核心发布：Google AI Developers 宣布 Gemini Interactions API 已正式可用，提供统一接口处理文本、多模态、工具使用和 Managed Agents。开发者现可通过单个端点构建自主 Agent。
Managed Agents 演示：只需一条 prompt，Agent 可自动在临时安全 Linux 沙箱中研究主题、自我修正、创建电台节目（包括编写脚本、生成音乐、制作专辑封面），全程无需任何基础设施设置。
开发者指南：Google AI Studio 发布了详细的入门教程，覆盖流式、工具调用、Managed Agents 以及使用 previous_interaction_id 链式对话。
行业意义：Google 正快速缩小与 OpenAI 和 Anthropic 在 Agent 体验上的差距。Managed Agents 的“零基础设施”免部署模式，可能吸引大量不喜欢运维的开发者。 🔗 Google AI Devs 推文 | Google AI Devs 推文 2 | 开发者指南推文

6️⃣ Cursor 发布多项协作新功能：团队插件排行榜、预置画布、市场扩展#

核心发布：Cursor 在 Customize 页面上线多项更新：团队插件、技能和 MCP 的排行榜（一键添加到配置）、预置画布（如 Atlassian 画布显示实时 Issues/Projects/Documents）、团队市场支持 GitLab/Bitbucket/Azure DevOps（除本地仓库外）。
使用场景：开发者可看到团队中最流行的插件/技能/MCP，一键启用；利用 Atlassian 画布直接在 Cursor 中查看和管理 Jira 工单。
行业意义：Cursor 正在从单兵编码工具演变为团队协作平台。通过排行榜和画布，降低了团队间共享 Agent 配置的门槛，也扩展了 AI IDE 在企业协作中的角色。 🔗 Cursor 推文 1 | Cursor 推文 2 | Cursor 推文 3

7️⃣ HeyGen 推出 Hyperframes：专为 Agent 设计的 HTML 转视频渲染引擎#

核心发布：HeyGen 正式推出 Hyperframes，一个通过 HTML 自动渲染视频的引擎。Agent 只需“写 HTML，渲染视频”，即可生成带音频和对白的视频。同时发布了“节奏技能”（skill），Agent 可以安装后根据音乐节拍自动构建视频节奏。
技术亮点：视频节奏围绕音乐而非字幕，Agent 可读取节拍并围绕其构建镜头和转场。Hyperframes 已被设计为 Agent Skill，通过 npx skills add heygen-com/hyperframes 一键安装。
行业意义：视频生成正从“提示词 + 模型”转向“Agent 可编程渲染管道”。Hyperframes 让 Agent 能够程序化控制视频结构，对营销、教育、社交媒体内容自动化具有潜在颠覆性。 🔗 HeyGen 推文 1 | HeyGen 推文 2 | GitHub

8️⃣ 火山引擎 Seedance 2.5 发布：原生 4K、30 秒时长、50 个多模态参考#

核心发布：在 2026 火山引擎 FORCE 原动力大会上，豆包大模型 2.1 Pro 正式发布，在 Terminal Bench 等代码基准中与 Claude Opus 4.7 持平，价格仅为 Claude 系列同行的约 20%。视频模型 Seedance 2.5 同期发布（预计 7 月初正式上线），三大升级：单条视频最长 30 秒（全球第一）、支持 50 个全模态素材联合输入（全球最多）、灵活视频编辑（局部修改背景/商品/模特）。
配套工具：Seedream 5.0 Pro 支持交互式精准编辑、多图层分离、10+ 种语言排版适应；Seed-Audio 1.0 支持情绪/口音/音效一次性输出。
业务数据：火山引擎在公有云大模型市场份额已达 49.5%；豆包日均 token 调用量 180 万亿。
行业意义：字节跳动展示出完整的“模型 + 视频 + 音频 + 设计”全栈能力。Seedance 2.5 突破 15 秒时长的行业天花板，为 AI 视频从 UGC 走向专业创作铺平道路。 🔗 爱范儿报道 | 量子位报道

9️⃣ [持续跟踪] 腾讯连续推出 AI Agent：微信“小微”功能曝光，企业微信“大圆”内测#

前情提要：微信原生 AI 助手“小微”已灰度上线，支持朋友圈、小程序、音乐等操作。
最新进展：据爱范儿和智东西报道，微信“小微”功能进一步曝光：支持发红包、通过聊天记录总结群聊、创建自定义小工具（内置小程序生成能力）、记忆用户偏好等。同时，企业微信即将推出名为“大圆”的 AI Agent，目前已进入内测阶段。用户在企微页面左滑即可唤起，自动识别所处场景，可基于群聊、文档、会议等工作数据给出回复。
行业意义：微信和企业微信同时接入 AI Agent，标志着腾讯正在将生态优势转化为 AI 时代“超级应用 + 企业协作”的双重入口。企业微信连接 1400 万组织、7.5 亿微信用户，数据场景巨大。 🔗 爱范儿报道 | 智东西报道

⭐ GitHub 趋势#

📊 类别速览

项目	类别	Stars
NousResearch/hermes-agent	AI Agent	200.9k
affaan-m/ECC	AI Infra / Agent 工具链	220.5k

1. NousResearch/hermes-agent ⭐ 今日 +936#

语言/许可： Python / MIT
总 Stars： 200.9k
仓库： GitHub

项目定位：
面向个人开发者和研究者的自改进 AI Agent 系统，具备跨会话记忆、自主技能生成和多平台部署能力。

核心功能：

闭环学习：自动从复杂任务中创建技能，技能在后续使用中自优化，支持 FTS5 全文检索与 LLM 摘要的跨会话记忆
多终端统一：同一进程同时服务 Telegram、Discord、Slack、WhatsApp、Signal、CLI，语音消息转录且对话跨平台连续
调度与自动化：内置 cron 调度器，支持自然语言配置周期性任务（日报、备份等），无人值守运行
可分离架构：支持本地、Docker、SSH、Modal、Daytona 等6种终端后端，Modal/Daytona 实现无会话时自动休眠、几乎零成本

技术亮点：
基于 Honcho 的辩证用户建模 + agentcurated memory 与定期“nudge”机制；兼容 agentskills.io 开放技能标准；支持 200+ 模型提供商切换，无供应商锁定。

2. affaan-m/ECC ⭐ 今日 +593#

语言/许可： JavaScript / MIT
总 Stars： 220.5k
仓库： GitHub

项目定位：
跨 AI 编码助手的统一性能优化与安全层，为 Claude Code、Codex、Cursor、OpenCode 等提供可复用的技能、记忆优化、安全扫描和编排能力。

核心功能：

技能与指令标准化：261 个跨 harness 通用的技能，66 个 agent 定义，84 个 legacy command shim，实现工作流在不同助手中的可迁移
记忆持续化：通过 hooks 自动保存/加载上下文，支持跨会话连续学习与模式提取
安全层（AgentShield）：提供输入消毒、CVE 扫描、沙箱化执行，针对 agent 常见攻击向量（prompt injection、工具滥用）
编排系列（orch-*）：包含工作树生命周期管理、MCP 清单、session adapter 等控制面组件，支持并行化评估与 failover

技术亮点：
面向多 harness 的抽象架构——通过 session adapter 统一不同助手的上下文接口；基于 Git worktrees 的并行化方法用于大规模评估；支持 GitHub App 与 npm 双通道分发。

今日洞察#

今日最值得关注的信号不是某个单一大模型发布，而是 Agent 的产品形态正在从“对话窗口”向“内建同事”和“后台调度器”两个方向同时分化。

Claude Tag 的发布是一个标志性事件。Karpathy 将其定义为 LLM UI/UX 的第三次范式转换：从需要用户主动访问的网站（ChatGPT），到下载到本地的桌面应用，再到一个持久存在、异步工作的数字实体。这个判断的核心在于“持久”和“异步”——用户不再需要主动发起对话，Claude 像团队成员一样存在于 Slack 频道中，可随时被委派任务并自主完成后通知。这彻底改变了人机协作的交互模型，将 Agent 从用户驱动的工具变为系统驱动的角色。

与之形成对照的是 GitHub Copilot app 的 BYOK 支持。GitHub 将模型选择权完全交给用户，允许在同一 session 内自由切换自带密钥、本地模型或订阅模型。这个动作的本质是 Agent 工具链的“去平台化”——当开发者可以在 Copilot Agent 中混用不同模型时，单一模型供应商的锁定效应被显著削弱，开发者的选择基准将从“哪个模型最好”转向“哪个模型最适合当前子任务”。

Cursor 的更新则指向另一个方向：协作标准化。团队插件排行榜和预置画布降低了团队共享 Agent 配置的门槛，本质上是在解决 Agent 工具链的“协作沉没成本”问题——如果每个开发者都自己配置 Agent，团队难以形成工作流统一。Cursor 在用排行榜和画布建立团队级别的 Agent 配置规范。

这三个信号共同指向一个趋势：Agent 的产品设计正从“模型能力竞赛”进入“工程形态竞赛”——谁能让 Agent 更好地嵌入现有工作流（Claude Tag）、谁能让工具链更灵活（BYOK）、谁能降低团队协作成本（Cursor），谁就能在下一阶段取得优势。

Claude Tag 发布，火山引擎 Seedance 2.5 登场，企业微信 AI Agent 内测