商汤把免费额度做成了正式入口
SenseNova 的 Token Plan 进入公测,免费开放自家模型和 DeepSeek-V4-flash 的调用额度。重点不是“又送了多少”,而是平台开始把模型调用包装成持续留存产品,而不只是一次性活动。
查看服务页5 月 4 日的 AI 新闻,不再只是模型又快了一点、又大了一点。更值得读的,是 AI 同时走进了真实工作流、订阅体系、法院判决、急诊室和短剧平台,这些场景开始逼问责任、成本与边界。
这三条更适合放在早报边栏里看:一条是平台开放额度,一条是工具链继续提速,一条是 Agent 真正开始接入邮箱这种老系统。
SenseNova 的 Token Plan 进入公测,免费开放自家模型和 DeepSeek-V4-flash 的调用额度。重点不是“又送了多少”,而是平台开始把模型调用包装成持续留存产品,而不只是一次性活动。
查看服务页2026.5.2 版本重写插件架构,强调 `npm` 优先安装、Gateway 与 Agent 热路径优化,同时补上 Grok 4.3 和更多搜索集成。说明 agent 工具的竞争点已经落到了工程体验。
查看版本说明ClawEmail 的想法很朴素:给 Agent 一个真实邮箱地址。每个账号最多 5 个邮箱位、每月 3000 封额度,意味着很多“人发邮件、Agent 回邮件”的老工作流要开始被重新包装。
查看内测页这三条构成了今天的主线:Agent 的真实能力、模型专属工具链、AI 产品开始收费。它们共同说明行业已经从“秀能力”进入“讲交付、讲成本、讲留存”的阶段。
Claw-Eval-Live 把 Agent 从“会修终端”拉回到更真实的企业流程:找记录、改状态、留下审计证据。
PaperAgent 的解读里,最刺眼的数字不是哪家模型排第一,而是最强模型通过率也只有 66.7%,没有任何模型超过 70%。这说明前沿模型已经能做不少事,但离“稳稳交付”还有一段距离。
更反直觉的是,真正卡住它们的不是 terminal,而是 HR、管理和 workflow 任务。文章指出,单看对话记录会系统性高估 Agent,必须把执行轨迹、审计日志和运行后的环境快照一起纳入评分。
DeepSeek-TUI 爆到 GitHub 2.3k 星,说明 coding agent 已经开始按模型特性做深适配,而不只是换一个 API 壳子。
量子位的文章把它描述成一款用 Rust 写的终端编程 agent,读写文件、shell、Git、网页搜索、MCP、skills 和子 agent 基本配齐。它像一个“DeepSeek 版 Claude Code”,但真正的差异不是名字,而是设计重心。
更关键的是它围绕 DeepSeek-V4 的 100 万 token 上下文、prefix cache、自动 compact 和低成本多子任务模式做优化。模型专属工具链开始比“通用壳子 + 替换模型”更有吸引力。
`68 / 200 / 500` 元三档月费,把“国内 AI 助手到底能不能靠订阅活下去”这个问题摆上了桌面。
极客公园的报道把重点说得很直接:免费版保留,付费版瞄准 PPT 生成、数据分析、影视制作等更重的生产力场景。表面上看是在卖更强能力,实质上是在试探用户是否愿意为“复杂任务的确定性”付钱。
难点也被点透了:真正难的不是首月转化,而是续费、成本和不可替代性。与之呼应,AI 工程化的另一篇文章把 Token 比作“水和电”,认为开发者最后还是得为结果收费,而不是为转手算力收费。
这部分参考了阮一峰周刊的节奏感处理:不把它们写成长文,而是让图片、标题和一条判断先落下去,再决定要不要深挖原文。
杭州一名做大模型问答质检的 35 岁主管,被公司以“AI 冲击”为由调岗降薪并辞退,最终胜诉。报道里最有力的不是情绪,而是判决逻辑:如果企业说 AI 改变了岗位,就要举证清楚是哪些工作被替代、剩余职能如何安置。
哈佛相关研究在 76 名真实急诊患者场景中,让 OpenAI o1 的诊断准确率达到 67%,高于两位内科主治的 55% 和 50%。管理方案得分更夸张,文章引用的数据是 89% 对 34%。
Tri Dao 团队的 SonicMoE 直接盯上细粒度 MoE 的显存和带宽瓶颈。按机器之心整理的结果,它在 Blackwell GPU 上相对 DeepGEMM 前向平均快 54%,反向平均快 35%,同时把激活内存压力压得更平。
脑极体的报道把流程写得很具体:录 10 到 15 秒视频、完成人脸采集、生成数字人,然后这张脸就可能被反复塞进不同角色。更麻烦的是授权链路,文章指出不少平台默认协议会要求全球、免费、可再许可的使用权。
主阅读流只留了 7 条。剩下这些更适合当成你自己的“收藏夹入口”,需要时再展开,不必一次读完。
免费额度不只是在送 token,更是在把模型接入变成长期入口。
安全扫描、威胁建模、漏洞发现、验证与攻击路径分析,被包装成一条自动化流水线。
插件架构重写、启动更快、默认接上 Grok 4.3,适合继续跟踪 agent 工具工程化速度。
给每个 Agent 一真实邮箱地址,意味着邮件这种旧入口也开始被重新 agent 化。
这条不炫,但对真正接入的人更重要:API 能不能稳定地跑起来,本身就是产品体验。
如果你更关心下一轮多模态发布会,这条适合先挂着等 5 月中旬验证。