🤖AI 日报 | 2026-04-03
type
Post
status
Published
date
Apr 3, 2026
slug
ai-daily-2026-04-03
summary
2026-04-03 AI 日报:Google Gemma 4 今日发布(Apache 2.0,31B 全球开源第 3 名)、Claw Code 开源 coding agent 框架 24h 内突破 10 万 stars 创 GitHub 历史记录、Claude Mythos 5 泄露详情(10T 参数)、GPT-5.5 Spud 预训练完成、Runway 推出 $1000 万 AI 视频创业基金 + Builders 程序。
tags
新闻
开发
思考
category
技术分享
icon
password
Comment

一、今日最重要的 5 条

① Google 正式发布 Gemma 4 开源模型家族 —— 2026 年最重要开源模型发布(2026-04-03)
Gemma 4 今日上线,Apache 2.0 授权,四种规格:E2B(速度最快)、E4B、26B MoE、31B Dense。31B 在 Arena AI 排行榜上排全球开源模型第 3,26B MoE 排第 6,且能力超过 20 倍大小的闭源模型。原生支持 function calling、结构化 JSON output、system instructions,专为 agent workflow 设计。移动端 E2B 比上代快 4 倍,省电 60%。同日 Google 宣布 Android AICore Developer Preview,可在设备端本地运行 Gemma 4。对攀岩 App:本地推理方案的最强候选,尤其 E2B 可在手机端运行配合 MediaPipe pose 实现全端侧 pipeline。

② Claw Code 开源 Coding Agent 框架 —— 24 小时 10 万 stars,GitHub 历史最快纪录(2026-04-02)
Claw Code 是 Claude Code 架构的 clean-room Python + Rust 重写,April 2 正式上线。48 小时内突破 10 万 stars,创 GitHub 有史以来最快增长记录(打破此前 OpenClaw 的纪录)。项目核心是完全开放、可检查的 agent harness 架构,解决了「LLM 能力越来越强,但连接工具/文件系统/任务规划的控制层长期是黑箱」的问题。包含 src/ Python workspace、tests/、command-line utilities,Rust 移植版本进行中。不隶属于 Anthropic,是完全独立的社区项目。对我的意义:这是学习 agent harness 内部架构的最佳开源范本。

③ Claude Mythos 5 内部文档泄露 —— Anthropic 10 万亿参数下一代模型曝光(2026-03-26)
Anthropion 数据存储配置错误导致内部草稿博客和产品发布文档在 3 月 26 日曝光,确认 Claude Mythos 5 参数量约 10 万亿(10T),重点能力方向:cybersecurity、coding、academic reasoning。同时还有一个中端配套模型 Capabara 即将上线。当前市场上的 Claude Opus 4.6 在 4 月 1 日日报中已显示 ARC-AGI-2 达 68.8%,Mythos 5 大概率将在推理和编码上大幅提升。GPT-5.5 "Spud" 抢在 Mythos 5 发布前加速进入 Q2 发布时间窗口,三大 lab 竞争最激烈时期。

④ OpenAI GPT-5.5 "Spud" 完成预训练 —— Q2 正式发布倒计时
GPT-5.5(代号 Spud)预训练已完成,Q2 2026 发布。OpenAI 的战略是在 Claude Mythos 5 正式上市前完成发布,前沿竞争进入「多周内相互追赶」的激烈阶段。当前在用的 GPT-5.4(3 月 5 日发布)已具备 1M token context window(实验性,需显式配置)、原生 computer-use 能力,OSWorld-V benchmark 75%,比 GPT-5.2 减少 33% 单条错误率。随着 GPT-5.5 临近,现在基于 GPT-5.4 API 构建的 agent 应保持架构灵活性。

⑤ Runway 推出 $1000 万 AI 视频 Builders 基金 —— 视频 AI 平台化战略加速(2026-03-31)
Runway 推出 $10M VC 基金 + Builders 程序,面向 pre-seed 至 Series C,最高 $50 万/笔投资。Builders 程序为创业公司提供 50 万 API credits 以及 Characters API(实时视频 agent API)访问权,首批包含 Cartesia、MSCHF 等创业团队。这是 Runway 从「AI 视频生成工具」向「视频 AI 平台 + 世界模型生态」转型的关键信号。策略上复制了 OpenAI 的 converge program 模式。对攀岩 App:如果 app 涉及视频生成或分析,申请 Builders 程序可以获得零成本 API credits。

二、按我的目标分类

A. 前沿模型 / 一手发布

Google Gemma 4(2026-04-02/03 发布)
  • 事件:Google 发布 Gemma 4 开源模型家族,同日发布 Android AICore Developer Preview
  • 核心内容:四规格(E2B/E4B/26B MoE/31B Dense)。31B 全球开源第 3(Arena)。MoE 架构高效能耗比,31B 模型能力超越多数 600B 级模型。原生 function calling + JSON output + system instructions,专为 agent 优化。E2B 移动端 3x 更快,E2B vs E4B;整体移动端 4x 加速,60% 省电。Apache 2.0 无商用限制。
  • 为什么重要:开源模型能力首次在多个维度真正追平(甚至超越)闭源 API。对于不想付费 API 的 side project 和需要本地推理的 app,Gemma 4 是目前最优方案。MoE 架构在保持高性能的同时大幅降低推理成本。
  • 我需不需要点开:必须点开。这直接影响攀岩 App 的技术选型:是否采用本地/设备端推理方案,E2B 能否在 Android 实时运行。
Claude Mythos 5 泄露(~2026-03-26)
  • 事件:Anthropic 内部文档意外曝光,确认 Mythos 5 参数量和方向
  • 核心内容:参数量约 10T(10 万亿),重点在 cybersecurity、coding、academic reasoning。配套中端模型 Capabara 同期发布。无具体发布时间,但 GPT-5.5 抢在前面,Anthropic 有压力加速。
  • 为什么重要:提供了 Anthropic 前沿模型路线图的罕见窗口。10T 参数规模意味着对 scaling 路线的继续坚持,与 OpenAI/Google 的方向一致。
  • 我需不需要点开:了解即可,无需深究,等正式发布。
OpenAI GPT-5.4 → GPT-5.5 进展
  • 事件:GPT-5.4(3月5日已上线),GPT-5.5 Spud 预训练完成待发布
  • 核心内容:GPT-5.4 已具备 1M token context(需显式开启)、native computer-use、1分钟级 agent 任务执行能力。GPT-5.5 代号 Spud,pretraining done,Q2 发布。
  • 为什么重要:1M context 让 long-horizon agent 任务(如分析一整个 codebase 或一场完整攀岩训练)不再受上下文截断。
  • 我需不需要点开:GPT-5.4 API 现在可用,可以试验 1M context 的长视频分析 pipeline。

B. AI 工程 / Agent / Coding Workflow

Claw Code —— 开源 Coding Agent Harness 框架
  • 内容:Claude Code 架构的 clean-room 重写(Python + Rust),提供完全开放、可检查的 agent harness。核心解决的问题:LLM 连接工具/文件系统/多步任务规划的「控制层」长期黑箱。24h 内 10 万 stars,GitHub 历史最快记录。包含 src/ workspace、tests/、CLI utilities,Rust 移植进行中。
  • 可落地价值:(1) 完整研究 coding agent 的内部架构而不依赖 Anthropic 私有实现;(2) 基于此构建自定义 agent workflow,不受服务端速率/成本限制;(3) Rust 移植版本将来可用于生产级高性能部署。
  • 对我当前开发/学习的意义:。这是学习「agent harness 如何组织 tool loop、文件操作、任务规划」的最佳开源案例。攀岩 App 的 analysis agent 需要类似的控制层设计。Clone 下来读 src/ 核心逻辑,写一篇解析博客是绝佳 portfolio 材料。
Gemma 4 + Google ADK —— 本地 Agent 的最优组合
  • 内容:Gemma 4 原生支持 function calling 和 system instructions,配合 Google Agent Development Kit (ADK) 可以完整构建本地 agent pipeline。Android AICore Developer Preview 让 E2B/E4B 可以在 Android 设备本地运行。
  • 可落地价值:零 API 成本的本地 agent,隐私友好,无延迟。用于 side project 特别合适 —— 不需要 API key,不受速率限制,可以 offline 运行。
  • 对我当前开发/学习的意义:中高。如果要做攀岩 App 的 Android 端,Gemma 4 E2B + MediaPipe 的 on-device pipeline 是最值得尝试的方案。
Agent SDK 生态格局(2026 Q1 总结)
  • 内容:当前各大 lab 都有自己的 agent framework:OpenAI Agents SDK、Google ADK、Anthropic Agent SDK、Microsoft Semantic Kernel/AutoGen、HuggingFace Smolagents。市场正在向「专业化平台」而非「通用工具」演进。
  • 可落地价值:选型时要考虑 lock-in 风险。MCP 作为互操作标准(9700 万+ installs)让跨框架连接成为可能。
  • 对我当前开发/学习的意义:建议项目从第一天就用 MCP 接口封装核心功能(如视频分析),避免框架锁定。

C. 视觉 / 视频 / 运动人体分析

"The Way Up" —— 攀岩 Hold 使用检测数据集(arXiv 2505.12854)
  • 内容:专门针对运动攀岩的 hold usage detection 数据集和 baseline 方法,首个系统化处理攀岩 hold 使用分析的公开数据集。arXiv 最新论文。
  • 与「攀岩动作分析 app」的相关性:极高。Hold 使用检测是攀岩动作分析的核心子任务 —— 分析攀岩者在哪个 hold 上施力、如何过渡,才能判断动作是否合理高效。这个数据集是从零开始构建 hold detection 模块的最直接起点。
  • 可迁移到项目的点:(1) 直接参考数据集结构和标注方式;(2) Baseline 模型作为 hold detection 模块的起点;(3) 论文中的错误分类 taxonomy 可以直接用于 app 的「动作问题标签」设计。
  • 优先级:
攀岩骨架视频流分析系统 —— MDPI Sensors 2023
  • 内容:使用 iPad Pro LiDAR + 2D skeleton → 3D joints 方法,自动识别初学者 6 种常见动作错误。系统将 2D skeleton 通过 LiDAR 深度信息提升为 3D,然后做错误分类。
  • 与「攀岩动作分析 app」的相关性:。这是最接近你 app 目标场景的已有学术工作,提供了从视频到动作错误识别的完整 pipeline。注意:上一个日报中 ClimbingCap(arXiv 2503.21268)已从学术多模态角度覆盖,这篇侧重实用设备(iPad)和错误分类。
  • 可迁移到项目的点:(1) 6 种错误类型的分类框架可以直接参考;(2) iPhone/iPad LiDAR 的可行性已验证;(3) 2D→3D 提升的实现方案可借鉴。
  • 优先级:
Gemma 4 E2B/E4B 移动端部署 —— Android AICore
  • 内容:Google 同日宣布 Android AICore Developer Preview,Gemma 4 E2B/E4B 可在 Android 设备本地运行,E2B 速度 3x 于 E4B,整体比上代 4x 提速,60% 省电。
  • 与「攀岩动作分析 app」的相关性:。如果 app 需要在手机端做文本 reasoning(如解读 pose 数据、生成建议文字),Gemma 4 E2B 是目前最优的 on-device LLM 方案。可与 MediaPipe Pose 组合构建完整端侧 pipeline:MediaPipe 抽 pose keypoints → Gemma 4 E2B 分析 → 输出攀岩建议。
  • 可迁移到项目的点:设计攀岩 App 时考虑混合架构:pose estimation(端侧)+ LLM reasoning(端侧 Gemma 4 E2B 或云端 Gemini API),根据设备性能自动降级。
  • 优先级:
2026 年运动 HAR 综述 —— Wiley Applied Bionics(2026)
  • 内容:新发布的系统综述,覆盖 2001-2024 年 AI 在运动人体活动识别(HAR)领域的应用,重点梳理深度学习方法演进(CNN → LSTM → Transformer → ViT)和应用场景分布。
  • 与「攀岩动作分析 app」的相关性:。综述类文献,不直接提供可用方案,但有助于快速了解当前 SOTA 技术路线和你的项目在学术脉络中的位置。
  • 可迁移到项目的点:了解「lightweight model + edge deployment」这一主流研究方向,指导攀岩 App 在数据量有限时的模型选型策略。
  • 优先级:(收藏,不必立刻精读)

D. 产品化 / 商业化 / 行业动态

Runway $10M Builders 基金 —— 视频 AI 平台生态战略
  • 动态:2026-03-31 发布,$10M 基金 + Builders 程序。最高 $50 万投资(pre-seed/seed),Builders 程序提供 50 万 API credits + Characters 实时视频 agent API 访问。首批 cohort 含 Cartesia、MSCHF 等。
  • 背后的趋势判断:Runway 从「AI 视频生成工具」转向「视频 AI 平台 + 世界模型生态」,这是 Sora 关停(见 4 月 1 日日报)后视频 AI 市场格局重构的加速。控制上层应用生态是当前 AI 平台竞争的核心策略(参考 OpenAI 的 converge program)。视频理解 + 世界模型是接下来 2-3 年的重点方向。
  • 对 side project / 求职 / 项目方向的启发:(1) 申请 Builders 程序可获 50 万 API credits(免费测试视频 AI 能力);(2) 视频「分析 + 理解」类 app 比「生成」类更容易盈利(Sora 前车之鉴);(3) 攀岩 App 的「视频上传 → 动作分析」方向与 Runway 的视频理解生态高度匹配,可以考虑申请。
Gemma 4 Apache 2.0 —— 开源模型商业化门槛归零
  • 动态:Gemma 4 全系列 Apache 2.0,无使用限制,可商用。31B 性能排全球开源第 3,且能力超过 20 倍大的部分闭源模型。
  • 背后的趋势判断:「模型层」正在快速商品化(commoditize)。依赖 API 差价的 AI 中间层应用将越来越难生存;真正的护城河在垂直场景数据 + 用户体验,而不是模型本身。
  • 对 side project / 求职 / 项目方向的启发:现在构建 AI 应用完全可以做到零 API 成本(本地 Gemma 4)。攀岩这样的垂直场景,专业数据集 + 特定用户群体 + 定制化 feedback 是你能建立的差异化,不是模型选型。
三大 Lab 激烈竞争 —— 开发者红利期窗口
  • 动态:Google(Gemma 4, Gemini 3.1)、Anthropic(Mythos 5 泄露即将发布)、OpenAI(GPT-5.5 Q2 发布),数周内相互追赶,前沿模型能力快速提升,API 定价持续下降。
  • 背后的趋势判断:竞争激烈 = 能力上升 + 价格下降 = 开发者最有利的时期。现在是「同等预算能做的事比 6 个月前多 2 倍」的阶段。
  • 对 side project / 求职 / 项目方向的启发:不要等「最好的模型出来了再做」——每个月都有「最好的模型」。应聚焦应用层和场景积累,模型本身用当期最优的即可。

E. 学习价值 / 求职价值

Claw Code 源码 —— Agent Harness 架构精读
  • 内容:Claude Code 架构的开源重写,可以完整研究 coding agent 的 tool use loop、文件系统操作、任务规划、多步工作流的实现方式。
  • 适合我怎么用:精读 + 复现 —— Clone 下来,跑通 demo,读 src/ 核心逻辑,理解 agent harness 如何组织 tool loop。在此基础上实现一个 mini 攀岩分析 agent,写成 blog 或项目文档。
  • 推荐动作:git clone https://github.com/instructkr/claw-code → 读 README + src/ 核心文件 → 理解 tool use 循环实现 → 写一篇「Coding Agent Harness 架构解析」博客 → 面试时展示对 agent 架构的深度理解。
Gemma 4 技术报告 —— 2026 年最值得精读的开源模型报告
  • 内容:官方博客 + 技术细节,涵盖 MoE 架构设计、mobile 优化方案(E2B vs E4B 权衡)、benchmark 对比策略(为什么 26B MoE 能超过 600B 闭源模型)。
  • 适合我怎么用:精读 —— 重点关注 MoE 架构决策和 mobile 优化部分,这两个话题在 ML 工程面试中是高频考点。
  • 推荐动作:读完官方博客 → 关注 Gemma 4 Hugging Face 页面,找 technical report → 整理「MoE 如何提升效能比」和「mobile LLM 优化核心策略」两个知识点 → 面试时可以说「我测试了 Gemma 4 E2B 在移动端的推理速度,了解了 MoE 在 edge deployment 上的优势」。
"The Way Up" 攀岩 Hold 检测论文 —— 直接落地型学术材料
  • 内容:最新 arXiv 攀岩 CV 数据集和论文,首个专注 hold usage detection 的公开数据集。
  • 适合我怎么用:精读 + 复现 —— 下载数据集,跑通 baseline,将 hold detection 功能集成到攀岩 App,写 project portfolio。
  • 推荐动作:读完论文 → 下载数据集 → 复现 baseline → 写 blog「基于 The Way Up 数据集的攀岩 Hold 检测」→ 面试时说「我参考了 arXiv 最新数据集,在攀岩 App 中实现了 hold usage detection 模块」。

三、今日高分 GitHub Repo(固定栏目)

1. instructkr/claw-code
  • 方向标签:agent / coding / infra
  • 这项目是干什么的:Claude Code 架构的 clean-room Python + Rust 重写,提供完全开放的 AI coding agent harness 架构
  • 为什么今天值得关注:24 小时 10 万 stars,GitHub 历史最快增长。架构清晰,有文档,可运行。是理解 coding agent 内部工作原理的最佳开源教材。
  • 与我的相关性: —— 任何想构建 agentic app 的开发者都应该研究其 tool loop 实现
  • 上手成本:中
  • 是否建议我收藏:是
  • 是否建议我复现:是(先跑 demo,再读 src/ 核心,写解析博客)
  • 一句话判断:今天最值得 clone 的 AI 工程项目,agent harness 架构的开源教科书
2. openclaw/openclaw
  • 方向标签:agent / app / deployment
  • 这项目是干什么的:本地运行的个人 AI 助手,连接 50+ 集成(WhatsApp/Telegram/Slack 等),完全隐私,支持 Any OS
  • 为什么今天值得关注:210,000+ stars,持续高热度,代表 local-first AI 的产品趋势,是目前最活跃的开源 AI 个人助手项目
  • 与我的相关性:低(不直接相关)
  • 上手成本:低
  • 是否建议我收藏:是(了解 local-first AI 产品设计)
  • 是否建议我复现:否
  • 一句话判断:热度高,local-first 产品趋势的代表,了解用户需求角度有价值,但不是工程学习重点
3. caramaschiHG/awesome-ai-agents-2026
  • 方向标签:agent / resource
  • 这项目是干什么的:2026 年最全 AI agents 资源列表,300+ 资源,20+ 分类,月更
  • 为什么今天值得关注:Claw Code 上线后 agent 工具生态快速扩张,这里是快速索引当前工具全貌的最佳入口
  • 与我的相关性:中
  • 上手成本:低
  • 是否建议我收藏:是
  • 是否建议我复现:否
  • 一句话判断:agent 工具地图,每月刷一次,不确定选什么框架时先翻这里
4. google/gemma(Hugging Face Gemma 4)
  • 方向标签:multimodal / deployment / mobile / agent
  • 这项目是干什么的:Google Gemma 4 官方模型,Apache 2.0,今日发布,原生 function calling + agent 支持,E2B 可在 Android 本地运行
  • 为什么今天值得关注:今天刚发布,是当前最强开源模型,Apache 2.0 可商用,E2B 性能实测需要尽快跑一遍
  • 与我的相关性: —— 攀岩 App 本地推理方案首选
  • 上手成本:中
  • 是否建议我收藏:是
  • 是否建议我复现:是(今天就本地跑 E2B)
  • 一句话判断:今天最重要的开源模型发布,先用 Ollama 或 HuggingFace 本地跑一遍 E2B
5. arXiv: The Way Up —— 攀岩 Hold 检测数据集
  • 方向标签:video / sports / climbing / dataset
  • 这项目是干什么的:首个专注运动攀岩 hold 使用检测的公开数据集和 baseline 方法
  • 为什么今天值得关注:攀岩 CV 领域极少有专项数据集,这是目前最值得复现的攀岩 App 核心功能基础
  • 与我的相关性:极高
  • 上手成本:中
  • 是否建议我收藏:是
  • 是否建议我复现:是(下载数据集,跑 baseline,纳入项目 portfolio)
  • 一句话判断:攀岩 App 开发者必读,直接提供 hold detection 模块的学术基础
6. wangruohui/EfficientVideoAgent(EVA)
  • 方向标签:video / agent / eval
  • 这项目是干什么的:强化学习驱动的端到端视频理解 Agent,「先规划再感知」架构,自动决定看哪段视频、关注哪些帧(4 月 1 日日报已收录,今日提醒跟进)
  • 为什么今天值得关注:长视频攀岩训练分析的关键工具,今日 Gemma 4 + 攀岩数据集的组合让这个 repo 的完整 pipeline 价值更清晰
  • 与我的相关性:高
  • 上手成本:中
  • 是否建议我收藏:是(已在 4 月 1 日日报收录)
  • 是否建议我复现:是
  • 一句话判断:长视频攀岩分析的智能选帧方案,配合今日 Gemma 4 本地部署测试效果

四、今日最值得我看的 3 篇 / 3 个链接

第 1 位:Gemma 4 官方博客
今天最重要的开源模型发布,直接影响攀岩 App 的技术选型。20 分钟读完,重点关注 MoE 架构、mobile 优化数据、agent 能力部分。同时注册 Android AICore Developer Preview 感受 E2B 实际表现。
第 2 位:Claw Code GitHub(instructkr/claw-code)
GitHub 历史最快增长 repo,Claude Code 架构的开源重写。Clone 下来,跑 demo,读 src/ 核心逻辑。理解 agent harness 的内部实现是今年工程竞争力的关键差异点。
第 3 位:"The Way Up" 攀岩 Hold 检测论文
迄今最专业的攀岩 CV 数据集。读完后立刻下载数据集,跑 baseline,这是将攀岩 App 从「视频描述」升级到「动作量化分析」的关键一步,也是最有说服力的 portfolio 材料。

五、今日行动清单

1. 今天值得收藏但不必立刻看的
2. 今天值得精读的
3. 今天值得复现/试用的
  • Gemma 4 E2B 本地运行:用 Ollama 或 HuggingFace 跑 E2B,测试攀岩 feedback 生成速度和质量
  • Claw Code demogit clone → 跑通 demo → 读 src/ tool loop 实现
  • The Way Up 数据集:下载数据集,跑 baseline hold detection 模型
4. 今天值得记到项目 roadmap 的
  • 攀岩 App 新增 hold detection 模块(参考 The Way Up 数据集和 MDPI 骨架分析论文)
  • 本地推理方案:Gemma 4 E2B(Android)+ MediaPipe Pose 的端侧 pipeline 原型
  • Agent harness 设计:参考 Claw Code 架构,用 MCP 接口封装视频分析功能(延续 4 月 1 日 roadmap)
  • 考虑申请 Runway Builders 程序(50 万 API credits 用于视频分析测试)
5. 今天面试里可以拿来讲的 1~2 个点
开源模型前沿认知:"Google 今天发布了 Gemma 4,31B 模型在 Arena 排全球开源第 3,我测试了 E2B 在本地的推理表现。它的 MoE 架构让 26B 参数的模型能超越大多数 600B 以上的闭源模型——核心原因是 sparse activation,每次推理只激活部分专家网络,大幅降低实际计算量。这种架构设计对边缘部署非常友好,这也是我在攀岩 App 技术选型中优先考虑 Gemma 4 E2B 做端侧 reasoning 的原因。"
攀岩 CV 落地实践:"我在攀岩动作分析 App 中实现了 hold usage detection 功能,参考了 arXiv 上最新的 The Way Up 数据集(专门针对运动攀岩的 hold 检测数据集)。这让 App 不只是描述动作,而是能量化分析'攀岩者如何使用每个 hold'——这是和普通动作识别 App 最大的差异化,也是教练最关心的分析维度。"

🤖 AI 日报由 Claude 自动生成 | 数据截至 2026-04-03 | 如有遗漏或错误欢迎反馈
AI 日报 | 2026-03-29AI 日报 | 2026-04-01
Loading...