AI Daily 2026-06-28 | 📰 AI Daily 每日精选

1️⃣ DeepSeek 与北大合作发布 DSpark：投机解码框架落地 V4，推理速度大幅提升#

核心亮点：DeepSeek 给 V4 发布了基于投机解码（Speculative Decoding）的推理加速框架 DSpark，并开源配套训练框架 DeepSpec，目前已部署在 V4 Flash 和 Pro 的线上流量中，替换上一代 MTP-1 方案。
技术突破：DSpark 采用“半自回归”创新，用并行骨干网络保证高吞吐（起草耗时与长度几乎无关），再附以轻量串行 Markov head 补足尾部连贯性。相比自回归 Eagle3 平均接受长度提升 26.7%–30.9%，相比并行 DFlash 提升 16.3%–18.4%。
硬件感知动态调度：DSpark 的另一核心创新是置信度头（Confidence Head）+ 校准（STS） + 硬件感知前缀调度器。在高并发环境下，根据负载动态决定每个请求验证多长，避免在大概率被拒的尾部 token 上浪费算力。
生产环境实测：在吞吐量持平前提下，V4-Flash 上每个用户生成速度提升 60%–85%，V4-Pro 提升 57%–78%。当对单用户速度要求严苛（120 tok/s）时，MTP-1 已近极限，DSpark 仍能维持，相对吞吐差距可达 +661%。 🔗DSpark Paper | Datawhale 解读

2️⃣ [持续跟踪] Codex/Claude Code 使用体验演进：从切换上下文到管理长期 Agent#

前情提要：过去几周，开发者社区围绕 Codex 与 Claude Code 的成本与上下文管理展开了密集讨论。
最新突破：
- 上下文压缩成熟：宝玉指出，Codex/Claude Code 上下文压缩配合 Prompt Caching，使长期 session 的成本压力大减。配套的 fork 功能（从某位置开分支）和 /btw 或 /side 指令（临时提问不干扰主上下文）大幅提升了 Agent 使用体验。
- 长期领域式 Agent：多位开发者分享从“基于任务的用完即弃”转向“按领域拆分的长期 session”，Agent 越用越好用，但指出“毁灭式上下文压缩”破坏了 trajectory 仍是限制。
- 从 Prompt 到 Goal Engineering：Jerry Liu 指出，/goal 让世界从 prompt engineering 走向 goal and eval engineering。用户指定目标，模型智能自主推断步骤；重复任务可采集数据集 hillclimb 优化效率。
- 生产级 Agent 记忆系统：Anthropic 应用 AI 负责人 Lamis 在 AI DevCon 2026 上详述其四层记忆架构：CLAUDE.md 文件（极有效但会膨胀）→ 自主记忆工具（Agent 判断记忆）→ Skills 渐进式披露（扫前言定加载）→ 文件系统建模。核心洞察：带内记忆有根本局限——Agent 既要执行任务又要管理记忆是竞争目标。“做梦”（异步带外分析 session 模式识别）解决了这一问题，已被 Anthropic 投入生产。
行业意义：Agent 的使用姿势正从“一次性对话”向“有记忆、可进化的数字伙伴”迁移。/goal 和 /btw 等指令的出现，标志着 Agent 交互从“开发者逐条指示”进化到“人机协作目标驱动”。 🔗宝玉推文 | Jerry Liu 推文 | Berryxia 视频解读

3️⃣ LlamaIndex 开源 LiteParse：3ms 文档解析，50+ 格式，登顶多项评测#

核心亮点：LlamaIndex 开源 LiteParse，是目前最快的文档解析工具，平均每页解析仅 3ms。支持 Markdown 输出后，在 opendataloader-bench、OlmOCR-bench 和 ParseBench 上准确率登顶。
功能与生态：支持 50+ 文档格式，提供基础边界框供编码 Agent 拼接。LlamaIndex 创始人 Jerry Liu 强调，即使需要更深度的 VLM 解析（如 LlamaParse），也应先用 LiteParse 作为首轮过滤。
社区反响：该项目在 GitHub 上已斩获 10k ⭐，开发者社区反响热烈。 🔗GitHub 仓库 | Jerry Liu 推文

4️⃣ [持续跟踪] Fable 下架与 GPT-5.6 延迟发布：非正式 AI 监管框架成型#

前情提要：Anthropic 于 4 月发布的 Fable 模型因“过于强大”仅开放给小部分合作伙伴，随后应美国政府要求限制非美国公民访问，最终被撤下。OpenAI 的 GPT-5.6 因此推迟发布。
最新突破：Anthropic 创始人 Dario Amodei 被指通过“基于恐惧的营销”游说政府监管。Fable 下架后，OpenAI 的 GPT-5.6 也未能正常发布。据 The Information，美国政府要求 OpenAI 错开发布时间，先给一小群“值得信赖的合作伙伴”。Sam Altman 的内部信证实正在遵循“有限预览”模式。同时，苹果 Vision Pro 负责人 Paul Meade 跳槽 OpenAI 硬件部门，苹果市值因涨价消息蒸发超 2300 亿美金，凸显 AI 硬件战的升温。
行业意义：AI 监管已非法律或国会讨论，而是三个实体（Anthropic、OpenAI 及美国政府）之间的非正式电话与协议。这本质上是事实上的 AI 许可制：最前沿的模型不再由公司决定何时发布、给谁用，而是由政府根据安全评估逐一审批。这种模式将加速闭源地缘管控，同时刺激开源生态与非美国模型崛起。 🔗Berryxia 分析 | Bloomberg 苹果高管离职报道 | GPT-4.5 下线公告

5️⃣ Anthropic 披露 Agent 记忆系统方法论：从 CLAUDE.md 到“做梦”异步优化#

核心亮点：Anthropic 应用 AI 负责人 Lamis 在 2026 AI DevCon 上发表演讲，系统阐述了 Anthropic 构建 Agent 记忆系统的四层架构，被社区称为“最实用的 Agent 记忆管理分享”。
架构演进：起点是 CLAUDE.md 文件（Anthropic 评价为“unreasonably effective”），但文件膨胀引发上下文瓶颈。随后引入记忆工具（Agent 自主读写），再到 Skills（渐进式披露），最终将整个记忆系统建模为文件系统（bash + grep，无需向量数据库）。
关键创新——做梦：带内记忆的根本局限是 Agent 在执行任务与管理记忆之间存在竞争目标。“做梦”是一个带外的异步处理过程，由专门的 Agent 分析一段时间内的会话记录，自主识别模式、提出内存更改建议。Anthropic 已在生产环境运行该机制，第二次执行相同任务时成本降低、延迟下降，额外 token 消耗被效率提升抵消。
行业意义：Lamis 最后总结：“模型智能本身不会产生复利。它需要上下文来执行你交给它的具体任务。”上下文工程效果是倍增智能的。这对 Agent 产品经理和开发者具有直接的工程设计指导价值。 🔗Berryxia 视频与文字 | Berryxia 文字摘要

⭐ GitHub 趋势#

📊 类别速览

项目	类别	Stars
anomalyco/opencode	AI Agent	179.7k
Fission-AI/OpenSpec	AI Agent (工具链)	57.1k
hugohe3/ppt-master	AI 集成开发者工具	33.1k

1. anomalyco/opencode ⭐ 今日 +428#

语言/许可： TypeScript / MIT
总 Stars： 179.7k
仓库： GitHub

项目定位：
面向开发者的开源 AI 编码代理（Coding Agent），在终端或桌面应用中提供计划-构建双模式，支持多模型、多工具编排。

核心功能：

双 Agent 模式：build 模式具有完整文件读写与 bash 执行权限；plan 模式为只读分析，用于探索代码库和规划变更，降低误操作风险。
终端与桌面双入口：npm 全局包 + 跨平台桌面应用（macOS/Windows/Linux），安装即用，自带 UI。
多 Agent 内部协作：内置 general 子代理，负责复杂搜索和多步骤任务，用户可通过 @general 调用。
快速安装脚本：curl -fsSL https://opencode.ai/install | bash，覆盖主流包管理器（brew/choco/scoop/pacman/mise/nix）。

技术亮点：
基于 TypeScript 全栈，终端与桌面共享同一核心引擎；Tab 键切换 Agent 模式，会话内零等待切换上下文。

2. Fission-AI/OpenSpec ⭐ 今日 +167#

语言/许可： TypeScript / MIT
总 Stars： 57.1k
仓库： GitHub

项目定位：
为 AI 编码助手设计的 Spec-Driven Development（SDD）框架，通过轻量级规范文件夹结构，在人类与 AI 之间对齐需求后再执行代码，减少因需求模糊导致的错误迭代。

核心功能：

/opsx 命令集：通过 /opsx:explore（探索）、/opsx:propose（提案）、/opsx:apply（实现）、/opsx:archive（归档）四个命令覆盖从头脑风暴到交付的完整工作流。
自动目录结构：每个变更生成独立文件夹，内含 proposal.md、specs/、design.md、tasks.md，保持可追踪性。
支持 25+ AI 工具：通过 slash commands 与 Claude Code、Codex、Cursor 等主流 IDE 和 CLI 集成，无需切换工具。
存量项目友好：提供 openspec init 和 brownfield 适配指南，无需从零开始采用。

技术亮点：
与 GitHub Spec Kit 和 AWS Kiro 相比，OpenSpec 更轻量，无阶段门（phase gate），支持任何 AI 编码代理；采用 npm 全局包 + 单条命令初始化，降低上手门槛。

3. hugohe3/ppt-master ⭐ 今日 +589#

语言/许可： Python / MIT
总 Stars： 33.1k
仓库： GitHub

项目定位：
从文档（Markdown/文本/URL 等）直接生成原生可编辑的 PPTX 文件，支持自定义模板、动画、语音旁白，输出不是图片而是真实幻灯片对象。

核心功能：

原生 PPTX 输出：生成的幻灯片包含独立形状、文本框、图表，用户在 PowerPoint 中可直接编辑文字、移动元素，而非一张静态图片。
多模板支持：内置 6+ 专业模板（Editorial 杂志、数据新闻、瑞士网格、玻璃态 SaaS 等），也支持用户提供自己的 .pptx 模板文件。
语音旁白：自动为每页生成 AI 语音解说并嵌入 PPTX，播放时幻灯片自动朗读。
示例演示：提供了“Attention Is All You Need”论文等多种真实生成案例，可直接下载 .pptx 查看效果上限。

技术亮点：
基于 python-pptx 库操作原生 XML 结构，而非截图或 HTML 转 PDF，保证生成内容可继续编辑；支持复杂布局（多列、图标、数据可视化）和自定义动画时序。

title: “Anthropic 披露四层 Agent 记忆系统，DeepSeek 开源 DSpark 推理加速” excerpt: “Agent 记忆系统正从一次性会话转向可进化的数字伙伴” seotitle: “Anthropic 披露四层 Agent 记忆系统与”做梦”机制，DeepSeek 发布开源投机解码框架 DSpark，LlamaIndex 开源 LiteParse” seodescription: “Anthropic 应用 AI 负责人 Lamis 在 AI DevCon 2026 上详细披露 Agent 四层记忆架构，包括带外”做梦”机制；DeepSeek 与北大合作发布 DSpark，通过投机解码将 V4 推理速度提升 60-85%；LlamaIndex 开源 LiteParse，3ms 单页解析登顶多项评测。” lead: “Anthropic 应用 AI 负责人 Lamis 在 AI DevCon 2026 上系统披露了 Agent 记忆系统的四层架构，核心创新是其带外异步’做梦’机制；DeepSeek 与北大合作发布并开源 DSpark 推理加速框架，在 V4 上实现 60%-85% 的用户生成速度提升；Jerry Liu 指出/goal 指令推动世界从 prompt engineering 走向 goal and eval engineering。” highlights:

“Anthropic 披露 Agent 记忆四层架构，含带外’做梦’机制”
“DeepSeek 开源 DSpark 投机解码，V4 推理速度提升 60%-85%”
“LlamaIndex 开源 LiteParse，3ms 单页解析登顶多项评测”

今日洞察#

今日素材里最值得关注的信号，不是一个单独事件，而是一个正在开始收拢的趋势：Agent 开发者的关注焦点，正从“模型能力”转向“记忆管理与工作流控制”。

Anthropic 在 AI DevCon 上披露的四层记忆架构，提供了最具体的技术路线图。从最基础的 CLAUDE.md 文件，到自主记忆工具，再到渐进式披露的 Skills，最终到文件系统建模，整个过程揭示了一个根本约束：带内记忆有限，Agent 既要执行任务又要管理记忆是竞争目标。这也是“做梦”机制出现的直接原因——把记忆管理变成带外的异步过程，用专门的 Agent 分析会话记录、自主提出内存更改。Anthropic 的实测表明，第二次执行相同任务时成本降低、延迟下降，额外 token 消耗被效率提升抵消。这意味着，记忆系统已经开始成为 Agent 产品差异化的核心，而非附属功能。

与记忆转向同步发生的，是 Agent 交互范式的迁移。Jerry Liu 指出的从 prompt engineering 到 goal and eval engineering 的转变，本质上是将“人逐条指示”替换为“人定目标、机器自主推理步骤”。Codex/Claude Code 生态中出现的 /btw、/side 和 fork 等指令，都是这个范式的工程化落地：Agent 不再需要每次从头理解上下文，而是能够维护多个长期 session。这意味着开发者的决策顺序发生了变化——过去是“选哪个模型”，现在是“如何设计上下文结构和任务分解策略”。

Token 生成速度的提升（DeepSeek DSpark 的 60%-85% 增益）和文档解析成本的下降（LiteParse 的 3ms/页）正在降低底层基础设施的摩擦，但真正决定 Agent 产出质量的，已不是推理速度，而是上下文管理的系统设计。这一趋势对尚未开始构建记忆层或明确交互范式的 Agent 产品团队来说，是值得关注的窗口信号。

📰 AI Daily 每日精选 | 2026-06-28

1️⃣ DeepSeek 与北大合作发布 DSpark：投机解码框架落地 V4，推理速度大幅提升#

2️⃣ [持续跟踪] Codex/Claude Code 使用体验演进：从切换上下文到管理长期 Agent#

3️⃣ LlamaIndex 开源 LiteParse：3ms 文档解析，50+ 格式，登顶多项评测#

4️⃣ [持续跟踪] Fable 下架与 GPT-5.6 延迟发布：非正式 AI 监管框架成型#

5️⃣ Anthropic 披露 Agent 记忆系统方法论：从 CLAUDE.md 到“做梦”异步优化#

⭐ GitHub 趋势#

1. anomalyco/opencode ⭐ 今日 +428#

2. Fission-AI/OpenSpec ⭐ 今日 +167#

3. hugohe3/ppt-master ⭐ 今日 +589#

今日洞察#