返回首页
一周热榜
Kling刚刚宣布了VIDEO 3.0——这是对其2.6和O1型号的重大升级。
主要改进:
*延长时长:*
- 连续视频时长可达15秒(相比之前的5-10秒)
- 时长灵活,可在3-15秒之间选择
- 更适合复杂的动作序列和场景发展
*统一的多模态方法:*
- 集成文本转视频、图像转视频、参考转视频
- 在一个模型中实现视频的修改和转换
- 原生音频生成(与视频同步)
*两个版本:*
- VIDEO 3.0(从2.6升级而来)
- VIDEO 3.0 Omni(从O1升级而来)
*增强的功能:*
- 通过基于参考的生成提高主题一致性
- 更好的提示遵循和输出稳定性
- 在故事板和镜头控制方面提供更多灵活性
这使得Kling在竞争中具备优势,主要竞争对手包括:
- Runway Gen-4.5(每月95美元)
- Sora 2(有限访问)
- Veo 3.1(谷歌)
- Grok Imagine(刚刚登顶排名)
15秒的时长尤其引人注目——相比典型的5秒短片,它能够实现更丰富的叙事故事。结合原生音频,这可能会改变内容创作者的工作流程。
公告中没有提到定价。之前的Kling型号价格在每月10-40美元之间,明显低于Runway。
有人已经可以测试这个吗?我很好奇在这个新时长下,它的质量与Runway和Sora相比如何。
我开始时提出了一个问题:现有的基础设施是为人类构建的,但现在需要为人工智能代理工作的是哪些?表单似乎是一个显而易见的答案。
问题在于,人工智能代理可以填写大部分表单,但某些字段仍然需要人类来完成,比如签名、文件上传以及任何主观内容。而现有的表单工具要么是完全自动化的,要么是完全手动的,没有什么能够很好地处理这种交接。
因此,FormBridge 基本上是为代理与人类之间的交接提供的表单基础设施。代理通过 API 创建提交,填写它所知道的内容,然后返回一个 URL。人类打开链接,查看已经填写的内容(并带有小徽章显示是谁填写的),完成剩余部分后提交。然后,它会经过验证、可选的审批、Webhook 等等。
我对几个决策感到满意:
- 字段级归属:每个字段都知道是哪个参与者(代理、人类、系统)在何时进行了操作。
- 旋转简历令牌:每次状态变化时,URL 令牌都会旋转,因此过期的链接会停止工作。
- 内置 MCP 服务器:它会根据你的表单定义自动生成 MCP 工具,因此代理可以在无需额外设置的情况下发现和使用表单。
- 模式灵活性:你可以将 Zod、JSON Schema 或 OpenAPI 规范应用于它,它会在内部进行规范化。
技术栈包括 TypeScript、Hono 用于 HTTP、React 用于表单 UI,存储可替换(开发时使用内存,生产时使用 SQLite,文件存储使用 S3)。共有 1,339 个测试,覆盖率为 85.9%。
我在大约一周内独立完成了这个项目。如果有人感兴趣,我很乐意讨论架构或交接模型。
我注意到,大多数物理科学计算器和图形计算器在性能、功能和易用性方面,远不如像Desmos这样的在线计算器以及iOS、Android和Windows等操作系统自带的计算器。这让我不禁想知道,是否还有人使用德州仪器、卡西欧等公司的物理计算器。如果你在使用,我很想知道原因,以及它们与我提到的那些计算器相比,对你来说有什么不同或更好的地方,反之亦然。谢谢!
DietPi 发布了新版本 v10.0
DietPi 是一个基于 Debian 的轻量级 Linux 发行版,适用于单板计算机(SBC)和服务器系统,同时也可以选择安装桌面环境。它以最小化镜像的形式发布,但允许用户通过一系列基于控制台的对话框和脚本安装完整且可立即使用的软件堆栈。
源代码托管在 GitHub 上: https://github.com/MichaIng/DietPi
官方网站: https://dietpi.com/
维基百科: https://de.wikipedia.org/wiki/DietPi
该项目于 2026 年 1 月 25 日发布了 DietPi v10.0 版本。
此版本的亮点包括:
- 支持的最低 Debian 版本:从 Bullseye(Debian 11)提升至 Bookworm(Debian 12)
- ownCloud Infinite Scale:新的软件包,替代 ownCloud
- Uptime-Kuma:新的软件包,系统监控工具
- Sparky SBC、NanoPi M2/T2/Fire2 和 NanoPi M3/T3/Fire3 系列:由于供应商镜像过旧,已移除支持
- RPi Cam Web Interface、Pydio:已移除,不支持 Bookworm 及更高版本
- Quartz64:支持新的 NPU 驱动程序
- 修复 Radxa ZERO 3、Orange Pi 3/3 LTS/3B、NanoPi R2S、NanoPi NEO3、ROCK64 的问题
- 修复 Home Assistant、BirdNET-Go、Mopidy 的问题
- Raspberry Pi Imager:支持 DietPi 作为可选的“其他通用操作系统”
完整的发布说明可以在以下链接找到: https://dietpi.com/docs/releases/v10_0/
我开发了 claw-daw:一个可以通过终端驱动的小型 MIDI 数字音频工作站(TUI + 无头脚本)。<p>动机:我希望实现“像编码一样的音乐创作”——可复现、可比较和便于自动化。相同的脚本 + 相同的种子 → 相同的节拍。<p>功能:<p>• 离线使用(FluidSynth + SoundFont) + ffmpeg 导出
• 确定性渲染,便于迭代/代理管道
• WAV/MP3/MIDI 导出
• 项目以 JSON 格式存储(适合 Git)
非常希望能得到关于工作流程的反馈,以及哪些功能会让这个工具对你更有用。