时长
4:14
分辨率
1920×1080 · 30fps
制作成本
约 ¥38(i2v + TTS + Remotion)
技术栈
Remotion · MiniMax TTS · 即梦 Dreamina i2v · ffmpeg sidechain

本期速览

五条主线,一周内全部落地:

  1. GPT-5.5 Instant 默认上线 ChatGPT — 法律 / 医学等高风险场景幻觉率较 GPT-5 砍约一半,免费用户立即可用
  2. 开源侧双线齐发 — Google Gemma 4 多 token 预测(推理加速 3 倍)+ 智谱 GLM-5V-Turbo(多模态 Agent 基础模型)
  3. 马斯克诉 OpenAI 庭审升温 — Brockman 个人日记当庭朗读、检方亮出马斯克威胁短信
  4. Anthropic × SpaceX 22 万张 GPU — 租用 Colossus-1 数据中心,缓解 AWS/GCP 依赖,算力向太空延伸;同期 Anthropic 发布 10 款金融 AI Agent
  5. 代理走向后台 — Vercel 开源 Open Agents 框架,AI 代理像 CI/CD 一样异步跑编码任务;DeepClaude / DeepSeek-TUI / Browserbase Skills 同期登场

工程师本周该做的三件事

  1. 把 GPT-5.5 Instant 接进高风险输出场景做一次幻觉回归 — 法律引用 / 医学建议 / 财报摘要对比上一版错误率
  2. 盯一下 Gemma 4 的多 token 预测 — 如果你在做实时对话或本地推理,这一改造可能直接把延迟压一半
  3. 给团队的编码流水线找一个能跑后台的代理框架 — Vercel Open Agents / ruflo / Open Agents,让 AI 不再只在对话框里干活

本期关键词

精度 · 算力 · 后台代理。OpenAI 把模型推向更可靠,Anthropic 把算力推向更深远,开源把多智能体编排推向了后台。工程师这一周该做的,是把这些能力真正接进自己的流水线,而不是停在 demo 截图里。


制作笔记

这条视频是脚本生成的,不是手工剪辑——v3 流水线首期:

  • 配音:MiniMax speech-2.6-hd × male-qn-jingying 精英男声,10 段共 1715 字
  • B-roll:10 段即梦 Dreamina seedance2.0fast_vip 图生视频(i2v)—— 先 img-dreamina 5.0 模型生 1920×1080 keyframe,再以 keyframe 作首帧生成 6s 视频;画质相比 W18 t2v 明显高一档
  • 动效:Remotion 写的 React 组件,本期新增章节 Stinger 卡(NEW MODELS / OPENAI GOVERNANCE / BUILDER STACK / ENGINEER ACTION 四章)+ 底部新闻 ticker + 右上日期戳 + 左下来源徽章 + 左上 LIVE 频道角标
  • 字幕条:按中文标点切段、按字符比例对齐音频
  • 音频后处理:ffmpeg sidechaincompress 替换 Remotion 内置 fixed volume——人声进自动压 BGM -12dB,停 0.4s 后回升
  • SFX:whoosh / tick / ding / shimmer 占位(章节卡 + 数字 reveal 触发)
  • 总成本:约 ¥38,即梦 vip 档不排队 + MiniMax TTS 按量

源码与流水线:ai-weekly-2026-05-11(流水线脚本未公开,复用 Remotion + MiniMax + Dreamina + ffmpeg)。

Sources