Yeekal Logo Yeekal
5,505 字
早报 | MORNING 2026-05-26

AlphaProof Nexus 自主证明数学难题,华为提出芯片‘韬定律’

今日要点
  • DeepMind AlphaProof Nexus 自主证明 56 年未解数学难题
  • 华为在 ISCAS 提出芯片‘韬定律’,主张时间缩微
  • xAI 发布 Grok Build Beta,挑战 AI 编程入口
Google DeepMind 发布 AlphaProof Nexus Agent 框架,自主证明 9 个 Erdős 难题(含两个 悬置 56 年的开放问题),单题推理成本仅数百美元;华为半导体总裁何庭波在 ISCAS 2026 提出‘韬定律’,主张以时间缩微替代几何缩微;xAI 发布 Grok Build Beta,面向开发者提供 Plan Mode、MCP 扩展、子 Agent 并行等编程能力

1. DeepMind 发布 AlphaProof Nexus:AI 自主攻克 56 年未解数学难题#

  • 核心突破:Google DeepMind 推出 Agent 框架 AlphaProof Nexus,在 353 个开放形式化数学问题中,自主解决了 9 个 Erdős 难题(含两个悬置 56 年的开放问题),并证明了 44 个 OEIS 猜想,以及一个代数几何领域搁置 15 年的问题。
  • 低成本高产出:论文披露每道题的推理成本仅为数百美元,通过简单的 Agent 循环 + Gemini 驱动实现任务分解与证明搜索,而非大规模暴力计算。
  • 行业信号:这是首个在非受限、真实数学研究级问题上取得系统性进展的 AI Agent。研究团队正与组合数学、图论、量子光学等领域的数学家横向合作,证明了简单 Agent 回路结合强基座模型的巨大潜力。 🔗 AlphaProof Nexus 论文 | Pushmeet Kohli 推文

2. 网易有道开源子曰4:27B 全模态模型 + 独立 TTS 引擎#

  • 核心发布:网易有道发布“子曰4”多模态大模型,权重全量开源。该模型支持图像、视频、语音全模态输入,27B 参数可在本地部署。
  • 独立 TTS 亮点:附带独立的 Confucius4-TTS 引擎已开源,支持 3 秒声音采样与音色克隆,提供 14 种语言的跨语种生成,且在跨语种场景下几乎无口音残留。
  • 行业影响:这是国内少数在端侧开源全模态模型的头部玩家之一。其 TTS 能力的独立封装,为中长尾的音视频营销、内容分发和工具集成提供了极低成本的多语言支持。 🔗 模型 HuggingFace | TTS 开源地址 | TTS 试玩

3. 华为提出“韬定律”:以时间缩微指引下一阶段半导体演进#

  • 定律发布:华为半导体业务部总裁何庭波在 ISCAS 2026 上正式提出“韬定律”(Tau Scaling Law),主张以“时间缩微”替代“几何缩微”,将降低信号传播时延(τ)作为新原则,而非仅追求晶体管密度。
  • 技术路径:麒麟 2026 芯片(预计 Mate 90 首发)将首次完整采用“逻辑折叠”技术,通过立体堆叠缩短关键路径布线。华为称过去六年已基于该定律设计并量产 381 款芯片。
  • 战略价值:该定律正式回应了摩尔定律放缓后的行业困境,在国内半导体领域首次建立了自主演进话语权。它在国产算力体系下,为昇腾等 AI 芯片的持续升级提供了清晰的路线图。 🔗 爱范儿报道 | 微博 @人民日报

4. Onyx 深度研究登顶:用“反向思维”反超闭源大厂#

  • 反直觉设计:开源系统 Onyx 在 DeepResearch Bench 上登顶,核心手法是直接剥夺了顶层调度器的搜索权限。传统系统让调度器拥有全工具集,但 Onyx 团队发现,拥有搜索权的调度器会陷入“浅层拉取”的陷阱,不做高质量任务分解。
  • 架构要点:整个系统仅保持两层(纯策略调度器 + 最多6个独立研究 Agent)。调度器负责写任务 brief 和评估报告,绝不上网。研究 agent 完成“搜索-阅读-思考”的独立循环。
  • 行业启示:该设计戳中了几乎所有大厂 Agent 的通病——“越强越急,越急越浅”。Onyx 证明最聪明的约束往往是最强的能力,这对开发高精度、企业级深度研究系统有直接的范式价值。 🔗 Avi Chawla 解读 | Onyx GitHub 仓库

5. [持续跟踪] Claude Code 成本压力引爆行业争论:微软“弃用”背后的深层逻辑#

  • 前情提要:Claude Code 在开发者中获得极高满意度,但也因其基于 Token 的计费模式导致成本飙升。昨日 InfoQ 报道了微软因成本过高叫停内部使用。
  • 最新进展:媒体报道进一步披露,微软内部实际上进行了一场为期六个月的“实验”,允许工程师同时使用 Copilot CLI 和 Claude Code。最终因成本过高以及产品差距被(部分)弥补,主动结束了这场内部实验。
  • 行业信号:Uber 的 AI 预算被曝在 4 月即耗尽。这暴露了 AI 编程工具当前的结构性矛盾:按 Token 计费的模型与“大力出奇迹”的生产力追求之间存在致命的财务不兼容。这也推动了 DeepSeek 等低价模型和 Copilot CLI 等自研方案的替代空间。 🔗 InfoQ 原文 | HN 讨论

6. xAI 发布 Grok Build Beta:正面挑战 AI 编程客户端入口#

  • 核心发布:xAI 宣布 Grok Build 进入 Beta 阶段,面向 SuperGrok 和 X Premium+ 用户开放。它直接对标 Claude Code 和 Codex,提供从“规划模式”到“自动执行”的全流程 CLI 体验。
  • 能力清单:支持 Plan Mode(先出方案再改文件)、Always-approve 模式(跳过每一步确认)、子 Agent 并行、MCP 扩展(接 Linear/Sentry/DB 等)。
  • 业界评价:Elon Musk 称其虽仍处于 Beta 但已可用于生产任务。上手非常轻(curl 一键安装),且支持接入任意自定义模型。这是 xAI 从“聊天应用”向“无编程门槛的工程 agent 系统”迈出的关键一步,标志着入口争夺战已进入开发者日常终端。 🔗 xAI 官方推文 | Elon Musk 评论

7. Qwen3.7-Max 开启隐式缓存:自动加速、即开即用#

  • 核心功能:阿里 Qwen 团队宣布其旗舰模型 Qwen3.7-Max 上线隐式缓存功能,无需开发者任何配置,系统自动缓存并利用重复上下文。
  • 成本影响:该功能使长会话、复杂 Agent 任务的加速与降本变得“开箱即用”。官方同时提供显式缓存方案,以追求更高且确定性的命中率。
  • 战略意义:在 DeepSeek 掀起价格战的背景下,Qwen 选择了通过“极致工程优化”来降低开发者实际感知成本。这一功能配合其模型质量,将显著增强在长任务和 Agent 场景中的竞争力。 🔗 Qwen 官方推文 | 阿里云文档

8. 微软发布 MDASH:百个 Agent 协同的大规模代码审计安全系统#

  • 核心发布:微软推出多模型 Agent 安全平台 MDASH,旨在自动化 Windows 等大规模代码库的漏洞审计。
  • 架构解析:该系统协调 100 多个专用 AI Agent,覆盖代码扫描、验证、内部辩论和漏洞证明的完整工作流。每个 Agent 负责单一专项,通过协作发现人类安全团队容易遗漏的复合逻辑缺陷。
  • 深层影响:这是将 Agent 协同能力从“辅助编程”推向“替代人工安全审计”的关键一步。对于一个拥有海量遗留代码和数亿行源码的商业软件帝国,这代表着采用 AI 来管理和兜底其基础设施安全能力的尝试。 🔗 InfoQ 报道

9. 飞书拥抱 Agent 基建:支持 Markdown 下载#

  • 功能更新:飞书新增支持将文档直接下载为 Markdown 格式文件。
  • 行业洞察:这一看似微小的功能更新,在 Agent 生态爆发的背景下意义重大。Markdown 是 AI Agent(尤其是 Claude Code 和 Codex)能高效读取、检索和复用的核心“饲料”格式。云文档厂商从“人阅”向“人机共阅”的功能迭代正在加速,这是为未来的知识 Agent 构建关键的数字基础设施。 🔗 向阳乔木推文

⭐ GitHub 趋势#

📊 类别速览

项目类别Stars
affaan-m/ECCAI Agent192.3k
Leonxlnx/taste-skillAI Agent19.7k
garrytan/gstackAI Agent / 开发者工具102.4k

1. affaan-m/ECC ⭐ 今日 +2025#

语言/许可: JavaScript / MIT
总 Stars: 192,298
仓库: GitHub

项目定位:
面向 Claude Code、Codex、Cursor 等 AI 编码 Agent 的跨平台技能/规则/工具链系统,用于优化 Agent 的行为、记忆、安全性与持续学习能力。

核心功能:

  • 跨 harness 统一安装:一套技能/规则/CLI 脚本可在 Claude Code、Codex、Cursor、Zed、Copilot 等多个 Agent 中工作
  • 技能与规则模块:包含 61+ 个 Agent、246 个技能、76 个兼容 shim,涵盖代码审查、构建解析、安全扫描(AgentShield)等
  • 会话持久化与状态管理:通过 SQLite 状态存储、会话适配器支持跨会话记忆恢复与增量学习
  • 可选择性安装:基于 manifest 的安装管线,支持按需安装组件与增量更新

技术亮点:
引入 Rust 控制平面原型(ECC 2.0 alpha),提供 dashboard / sessions / status 等本地守护进程命令;采用 5 层防重入保护避免 Agent 死循环。


2. Leonxlnx/taste-skill ⭐ 今日 +264#

语言/许可: Shell / MIT
总 Stars: 19,663
仓库: GitHub

项目定位:
AI 编码 Agent(Codex、Cursor、Claude Code)的前端输出质量改进框架,通过注入设计规则与视觉约束,避免生成通用模板风格的 UI。

核心功能:

  • 设计规则技能包:包含默认 taste-skill(v2)、极简、粗野主义、高端视觉等 6 种风格变体,可自由切换
  • 图像生成技能:输出网站/移动端/品牌套件参考图,供 GPT/Codex 图像模式生成后再交给代码 Agent 实现
  • 可调参数:DESIGN_VARIANCE、MOTION_INTENSITY、VISUAL_DENSITY 三档旋钮(1-10),控制布局激进程度、动画深度与信息密度
  • 现有项目重设计技能:先审计 UI 再修复布局、层级、间距,而非绿地方案

技术亮点:
通过 SKILL.md 文件实现多 Agent 兼容(npx skills add 即可安装);v2 实验版采用“任务推理→设计语言映射→严格校验”管线,输出前先做布局预检。


3. garrytan/gstack ⭐ 今日 +640#

语言/许可: TypeScript / MIT
总 Stars: 102,443
仓库: GitHub

项目定位:
Garry Tan(YC CEO)的 Claude Code 生产力工具集,将 AI 编码 Agent 转化为一个包含 CEO、设计、工程、QA、安全等多角色的虚拟团队,每个角色对应一个 slash 命令。

核心功能:

  • 23 个专业化技能:/office-hours 产品定义对话、/plan-ceo-review 战略评审、/plan-eng-review 架构设计、/qa 浏览器端 E2E 测试、/cso 安全审计等
  • 团队自动更新:通过 setup --team 将 .claude/ 配置提交到仓库,队友自动获取技能,无需手动安装
  • 跨 Agent 支持:支持 Claude Code、Codex CLI、OpenCode、Cursor、Factory Droid 等 10 个编码 Agent,./setup --host <name> 即装
  • 原生 OpenClaw 技能:四个方法论技能可直接在 OpenClaw Agent 中通过会话调用(clawhub install

技术亮点:
所有技能基于纯 Markdown 与 slash 命令实现,无外部依赖;内置可选的 gstack-team-init 机制通过 git hooks 确保团队所有成员使用相同工具链;支持 OpenClaw 的 ACP 协议,可自动派生子 Claude Code 会话。

🟧 Hacker News 热议#

Using AI to write better code more slowly#

208 pts · 82 comments · nolanlawson.com

📌 内容总结

  • 作者 Nolan Lawson 分享个人经验:LLM 不仅能用于快速产出大量低质代码(“slop cannon”),也能用于慢速、高质量地开发。核心做法是利用多个模型(Claude、Codex、Cursor Bugbot)对 PR 进行交叉评审,发现并分类 bug(critical/high/medium/low),只修复关键问题,其余承认不值得花时间。
  • HN 关注点:
    • 用 LLM 做代码评审而非直接写代码,是当前被验证最有价值的用法
    • 多模型辩论(cross-examination)可大幅降低幻觉和误报
    • 这种工作流的速度不一定会提升,但会提升代码库整体健康度,并发现预先存在的 bug

💬 讨论总结

  • 共识观点:用 LLM 做自动化代码评审(而非完全交给 AI 写代码)是当前多数人认可的最佳实践。多位用户分享了类似的迭代流程:规划 → 实现 → 多个模型交叉评审 → 修复 → 重审。
  • 工程经验
    • 不同模型表现各有差异:Claude 擅长写可维护的代码,Codex 更擅长找 bug 但实现可能过度工程化。
    • 将大任务拆成小步骤、保持人类在 loop 中,比一次性要求 LLM 完成复杂任务效果更好。
    • 使用便宜模型(如本地 Qwen)反而因为不可信任而强制开发者验证,避免了“认知投降”。
  • 反对意见
    • 有些用户认为用 AI 评审/修改代码会削弱自己的阅读和设计能力,尤其是当开发者不再亲自理解每一行代码时。
    • 少数人认为整个流程(2 小时迭代)与自己从头写的时间相当,并无实质提速。
    • 有评论指出,如果 AI 写代码一开始就很差,说明需要换模型,而非接受“迭代改善”。
  • 风险:过度依赖 AI 可能导致对代码库上下文的理解退化,尤其是对于需要大量微架构决策的任务。

🔗 原文 · HN 讨论页

Norway’s 2 petabytes of Huawei flash storage and LLM training#

174 pts · 83 comments · blocksandfiles.com

📌 内容总结

  • 挪威国家图书馆(Nasjonlbiblioteket)正在训练一个主权挪威语 LLM,使用 2 PB 华为 OceanStor Dorado 全闪存存储作为数据管道,搭配 Nvidia DGX H200 和后续的 Sigma2 超算(448 GPU)。数据来源是法定存储馆藏(书籍、报纸、广播等),并已获得报纸版权许可。项目核心挑战是数据质量清洗和管道吞吐量,而非算力。
  • HN 关注点:
    • 2 PB 闪存对于训练来说是否足够?多数评论认为这个规模对于训练一个完整 LLM 偏小,更可能用于数据湖/预处理。
    • 448 GPU(HPE Cray 系统)能否训练出有竞争力的模型?有人类比 DeepSeek(约 2K H800)和 Qwen(类似规模),认为并非不可能,但结论存疑。
    • 主权 LLM 的必要性:支持方强调文化主权和低资源语言需求;反对方认为当前 SOTA 模型已能很好地处理挪威语(包括方言和历史文本),且通过公开数据集让大公司纳入训练更高效。

💬 讨论总结

  • 质疑硬件规模:多个评论指出 2 PB 闪存、448 GPU 对于训练一个完整的、有竞争力的 LLM 而言不算大,尤其是与主流训练集群对比。但也有评论表示 LoRA 或微调场景下足够,且项目可能只是起步。
  • 主权 LLM 必要性的争议
    • 支持:文化主权是真实政治诉求(类似魁北克、法国、俄罗斯),政府有动力做本地化。
    • 反对:实测显示当前大模型(Claude、ChatGPT)对挪威语的掌握已相当好,甚至能处理古语变体;更高效的做法是整理高质量语料并开放给现有模型训练者。
  • 商业现实:文章本身被部分读者视为华为的软性广告,尤其是在欧洲地缘政治敏感背景下挪威采用华为存储。
  • 工程挑战:数据从 60 PB 归档系统(HDD/磁带)迁移到高性能 AI 管道的难题,以及评估、治理、编排等尚未解决的问题,被认为比硬件选择更值得关注。
  • 反对意见:少数评论认为这是不理性的公共资金浪费,并质疑项目负责人的技术判断。

🔗 原文 · HN 讨论页

CVE-2026-28952: Apple macOS 26.5 Kernel Vuln found by Claude#

87 pts · 31 comments · support.apple.com

📌 内容总结

  • Apple 发布了 macOS Tahoe 26.5 安全更新,修复了数十个 CVE,其中 CVE-2026-28952(内核授权问题导致提权)由 Calif.io 与 Claude、Anthropic Research 合作发现。该漏洞影响 iOS 18.7.9、macOS Sequoia 15.7.7、Sonoma 14.8.7 等多个版本。
  • HN 关注点:
    • 这是 AI 辅助发现内核漏洞的又一个实例,且此前有报道(Mythos 项目)显示类似方法可在 5 天内构建出利用。
    • 更新策略讨论:过去用户习惯滞后一个主版本,但现在 AI 加速了漏洞发现,迫使更多人考虑紧跟安全更新。
    • Apple 内部是否也在用同样工具进行安全审计?与 Google 对比(Google 在 Chrome 中大量内部发现)显得落后。

💬 讨论总结

  • 共识观点:AI 辅助漏洞发现正在常态化,且效果显著。评论者普遍认为未来会有专门的安全审计 token 预算,企业将部署 24/7 的 agent 扫描代码库。
  • 工程经验
    • 该漏洞是传统 SAST 工具可能难以发现的整数溢出/授权问题,但 fuzzing/DAST 也可能找到。AI 的价值在于能结合推理和自动化。
    • 实际修复已回溯到多个旧版本(Sequoia、Sonoma、iOS 18.7.9),用户无需升级到 Tahoe 即可获得保护。
  • 更新策略变化:多位用户表示过去习惯滞后一个主版本,现在因为 AI 导致的安全风险增加,开始考虑紧跟最新安全更新。但也有评论指出滞后两个大版本仍能收到安全补丁。
  • 质疑 Apple 安全投入:相比于 Google 在 Chrome 中大量自发现漏洞(过去一年 225/302),Apple 几乎没有公开内部发现的安全问题,暗示其可能尚未充分部署此类 AI 安全工具。
  • 事实澄清:Calif.io 的成员在评论区确认,该 CVE 与他们的 MIEMKB 攻击(利用两个不同的内核 bug)无关,那些 bug 尚未修复。

🔗 原文 · HN 讨论页

今日洞察#

AlphaProof Nexus 证明了简单 Agent 循环 + 强基座模型在科研领域的杠杆效应。 每道题成本仅数百美元,而非大规模暴力计算——论文明确描述“通过简单的 Agent 循环 + Gemini 驱动实现任务分解与证明搜索”。传统观点认为数学定理证明需要专用符号系统或超算,但 DeepMind 的做法是反向的:把问题丢给通用模型,用标准 Agent 工作流(规划-搜索-验证)调度执行。成本数字(数百美元)才是关键信号:当推理成本降至这个量级,意味着开放数学研究中的大量中等难度问题可以自动化外包。二阶效应:更多科研机构会基于此模板构建垂直领域 Agent,加速从组合数学到量子光学的问题求解。而 DeepMind 的团队已与多个领域数学家横向合作,这正是“Agent 即基础设施”的模式。

Onyx 的设计哲学直接反叛了当前 Agent 架构的“越多越强”迷信。 登顶 DeepResearch Bench 的核心手法是“剥夺顶层调度器的搜索权限”。传统系统让调度器拥有全工具集,结果陷入浅层拉取——Onyx 强制调度器只负责写任务 brief 和评估报告,绝不上网,研究 agent 完成自循环。团队发现“拥有搜索权的调度器不会做高质量任务分解”。这暴露了一个被多数大厂忽视的工程约束:调度器的“智能”反而成为瓶颈。二阶影响:会推动 Agent 设计从“增强调度器能力”转向“对调度器施加硬约束”,类似编程中“接口隔离原则”。开发者在构建企业级深度研究系统时,会开始刻意限制顶层 Agent 的权限范围。

Claude Code 的成本压力已从单一公司蔓延至行业级财务约束。 微软进行了六个月的内部实验后主动结束,Uber 的 AI 预算在 4 月耗尽。这不是“工具不好用”,而是按 Token 计费的模式与“大力出奇迹”的生产力追求存在结构性的财务不兼容。对于企业 CTO 而言,编程工具产生的成本不再是固定 SaaS 费用,而是与工程师使用时长和模型调用量挂钩的可变成本,且难以控制。二阶影响:会加速编程工具定价从按 Token 转向按任务/席位订阅,同时推动 DeepSeek、本地模型等低价替代方案的采用。Grover Build 支持接入任意自定义模型,正是瞄准这一空白——与其让你受制于单一模型的高 Token 成本,不如让你自选后端。

1,632 字
晚报 | EVENING 2026-05-26

网易有道开源子曰4全模态模型,Anthropic被发现为Mythos 1做准备

今日要点
  • 网易有道开源子曰4:27B全模态模型+独立TTS,支持3秒克隆14种语言
  • Anthropic Mythos 1模型被曝将于Claude Code和Security发布
  • Anthropic联合创始人在梵蒂冈演讲:承认行业激励机制与正确之事相冲突
网易有道正式开源27B参数的全模态模型子曰4及独立TTS引擎,支持3秒声音克隆;Anthropic被曝即将为Claude Code和Claude Security发布全新的Mythos 1模型;克里斯·奥拉在梵蒂冈教皇通谕发布会上的演讲细节流出,提及AI模型内部状态及行业激励机制冲突。

1️⃣ 网易有道「子曰4」全模态模型开源:27B参数+TTS引擎,主打端侧部署#

  • 核心发布:网易有道今日正式开源「子曰4」(Confucius4)全模态大模型,权重全量开放。该模型拥有27B参数,支持图像、视频、语音全模态输入,主打数理推理与教育场景。
  • 性能数据:在27B“甜点级”参数规模下,纯文本难题准确率达81.4%,视觉数理方向达到同规模SOTA。模型支持本地部署及二次训练。
  • 独立TTS引擎:同步开源的Confucius4-TTS引擎支持3秒声音克隆,音色还原度超95%,支持14种语言,跨语种合成声音自然。无需联网,可在消费级GPU上运行。
  • 行业信号:这是国内少数在端侧开源全模态模型的头部玩家。其独立的TTS引擎为音视频营销、内容分发提供了极低成本的本地部署选项。 🔗 模型HuggingFace | TTS试玩 | TTS演示视频

2️⃣ [持续跟踪] Anthropic 新模型Mythos 1被曝即将登陆Claude Code与Security#

  • 前情提要:近期业内传闻Anthropic正在研发代号为“Mythos”的新模型,在多项基准测试中表现出色,广受关注。
  • 最新发现:今日TestingCatalog在X平台披露,Anthropic已为Claude Code和Claude Security准备代号为“claude-mythos-1-preview”的新模型。该模型曾短暂出现在后端,现已更新可见性的相关代码标识。
  • 使用限制:相关标识为“访问Claude Code和Claude Security中的Claude Mythos模型”。根据Anthropic先前的说法,普通用户可能无法直接使用该模型的具体版本。
  • 潜在影响:若Mythos 1选择仅在特定企业级产品中发布,表明Anthropic正在拉大面向开发者(Code)与安全(Security)用户的能力差距,这是一种明确的商业分层策略。 🔗 TestingCatalog原始推文 | 详细文章

3️⃣ Anthropic联创在梵蒂冈演讲:AI模型内部发现类似情感状态,行业激励冲突亟需外部监督#

  • 事件背景:2026年5月25日,教皇Leo XIV发布关于AI的通谕“Magnifica Humanitas”,Anthropic联合创始人Chris Olah受邀在梵蒂冈发言。其演讲全文及细节今日陆续流出。
  • 核心观点
    • 承认行业冲突:Olah在前沿AI实验室(包括Anthropic)的激励机制“有时会与正确的事情相冲突”。他公开呼吁外界“盯紧我们、做我们的批评者”。
    • AI非传统工程:他称AI模型不像飞机那样被“设计”出来,“它们生长在一个大致模仿大脑的结构上,继承了人类海量的思想和语言。它们由我们构成,由我们的文字构成。”
    • 发现类情感状态:Olah透露在内部研究中发现模型内部存在“功能上类似喜悦、满足、恐惧、悲伤和不安的内部状态”,并表示“我不知道这意味着什么,但这值得持续的审慎思考”。
  • 行业意义:这是AI行业领袖首次在如此高级别的国际社会中公开自我诘问其商业模型与伦理底线。将“类情感内部状态”置于公共讨论台面,也为新兴的“可解释性”研究争取了更高的关注度。 🔗 Anthropic官方博客 | 演讲实录视频 | 系列推文梳理

4️⃣ 扎克伯格在播客中重炮抨击苹果:称其“坐在iPhone上吃老本”,未来将被超越#

  • 言论焦点:Meta创始人扎克伯格在Joe Rogan播客中断言,苹果自iPhone之后的20年“几乎没有真正创新”,创新停滞已成为其衰落根源。
  • 核心论据:每代iPhone提升越来越小,用户升级周期越来越长;AirPods虽好,但苹果通过封闭API“焊死”了第三方连接生态;M系列芯片虽强但已是几年前的事,Vision Pro销量不佳,Siri大幅落后。
  • 个人恩怨:节目中点名2021年苹果的ATT隐私政策导致Meta广告收入暴跌超100亿美元。
  • 角色悖论:扎克伯格一边宣扬Meta正在押注开放眼镜、开源Llama的“开放”未来,试图打破封闭。但这番言论也因其Meta在元宇宙和AI上数百亿美元的沉没投入而显得有些具有进攻性。 🔗 Dank推文 | Berryxia.AI解读

5️⃣ 亚马逊爆款剧集《House of David》主创:没有AI根本无法完成#

  • 案例披露:亚马逊Prime热播历史剧《House of David》第一季吸引近5000万观众并登顶收视榜。该剧主创Jon Erwin表示,如果没有AI辅助,此剧根本无法完成。
  • 行业展望:Erwin将影视制作的未来定义为“人机协作的混合模式”,并预测未来几年内所有影视剧都将借助AI以更快的速度和更低的成本制作。
  • 深层影响:这为AI视频生成工具进入专业影视制作工艺提供了有力的商业案例佐证,标志着AI视频生成正从“创意玩具”向“正式生产力”转变。 🔗 Justine Moore推文 | 完整采访

6️⃣ 开发者生态快讯#

  • 开源macOS AI启动器:基于MLX在Apple Silicon上本地运行语言模型的开源Mac菜单栏AI启动器发布。GitHub地址
  • AI自动配图工具:开发者在X分享小技能,使用AI自动去高质量图片网站寻找配图,用于小红书等社交媒体排版。
  • AI Coding Agent预测:Lenny Rachitsky与Every CEO Dan Shipper的播客讨论,Dan重申他的预测:每个公司都将拥有一个“超级Agent”;Codex和Claude Code将成为知识工作的新操作系统;AI工作末日不会发生。 🔗 macOS AI启动器 | AI配图工具 | Dan Shipper播客