返回首页
一周热榜
我正在研究基础设施,以解决重试风暴和故障问题。在深入之前,我想了解一下人们今天实际在做什么。比较不同的解决方案,也许能帮助某些人发现潜在的解决办法。
问题:
- 重试风暴 - API 失败,整个系统的实例独立重试,造成“雷鸣般的群体效应”,使情况更糟。
- 部分故障 - API 虽然“在线”,但性能下降(响应慢,间歇性500错误)。健康检查通过,但请求却受到影响。
我想了解的是:
- 你们目前的解决方案是什么?(熔断器、队列、自定义协调、服务网格,还是其他?)
- 效果如何?存在哪些不足之处?
- 你们的规模有多大?(公司规模、实例数量、请求数/秒)
我很想听听哪些方法有效,哪些无效,以及你们希望存在的解决方案。
人们通常相信这些理论,因为他们只挑选出少数符合的周期,而忽视了大量不符合的周期。Gartner的炒作周期并不描述每一个炒作周期,而是描述了极少数的那些,实际上确实取得了一些成果的周期。但像往常一样,给一个概念起个花哨的名字,人们就会开始相信它,仿佛这是一种自然法则。实际上,它描述的是自然法则的一个例外。能够真正跨越“失望低谷”的技术屈指可数。
大家好,
我构建了一个运行时环境,用于通过 WebAssembly 沙箱隔离不可信代码。基本上,它保护您的主机系统免受不可信代码可能引发的问题。最近我们对 Python 中的沙箱化进行了深入讨论,更详细地阐述了这个问题[1]。在 TypeScript 中,由于两个生态系统之间的紧密联系,WebAssembly 的集成显得更加自然。
核心部分是用 Rust 编写的。在此基础上,我通过 wasmtime 和组件模型使用了 WASI 0.2,并结合自定义 SDK,使其尽可能符合语言习惯。
例如,在 Python 中,我们有一个简单的装饰器:
```python
from capsule import task
@task(
name="analyze_data",
compute="MEDIUM",
ram="512mb",
allowed_files=["./authorized-folder/"],
timeout="30s",
max_retries=1
)
def analyze_data(dataset: list) -> dict:
"""在一个隔离的、资源受控的环境中处理数据。"""
# 您的代码在 Wasm 沙箱中安全运行
return {"processed": len(dataset), "status": "complete"}
```
在 TypeScript 中,我们有一个包装器:
```typescript
import { task } from "@capsule-run/sdk"
export const analyze = task({
name: "analyzeData",
compute: "MEDIUM",
ram: "512mb",
allowedFiles: ["./authorized-folder/"],
timeout: 30000,
maxRetries: 1
}, (dataset: number[]) => {
return {processed: dataset.length, status: "complete"}
});
```
您可以设置 CPU(通过 compute)、内存、文件系统访问权限和重试次数,以精确控制您的任务。
虽然现在还处于早期阶段,但我非常希望能听到反馈。我会在这里回答问题。
GitHub: [https://github.com/mavdol/capsule](https://github.com/mavdol/capsule)
[1] [https://news.ycombinator.com/item?id=46500510](https://news.ycombinator.com/item?id=46500510)
Kling刚刚宣布了VIDEO 3.0——这是对其2.6和O1型号的重大升级。
主要改进:
*延长时长:*
- 连续视频时长可达15秒(相比之前的5-10秒)
- 时长灵活,可在3-15秒之间选择
- 更适合复杂的动作序列和场景发展
*统一的多模态方法:*
- 集成文本转视频、图像转视频、参考转视频
- 在一个模型中实现视频的修改和转换
- 原生音频生成(与视频同步)
*两个版本:*
- VIDEO 3.0(从2.6升级而来)
- VIDEO 3.0 Omni(从O1升级而来)
*增强的功能:*
- 通过基于参考的生成提高主题一致性
- 更好的提示遵循和输出稳定性
- 在故事板和镜头控制方面提供更多灵活性
这使得Kling在竞争中具备优势,主要竞争对手包括:
- Runway Gen-4.5(每月95美元)
- Sora 2(有限访问)
- Veo 3.1(谷歌)
- Grok Imagine(刚刚登顶排名)
15秒的时长尤其引人注目——相比典型的5秒短片,它能够实现更丰富的叙事故事。结合原生音频,这可能会改变内容创作者的工作流程。
公告中没有提到定价。之前的Kling型号价格在每月10-40美元之间,明显低于Runway。
有人已经可以测试这个吗?我很好奇在这个新时长下,它的质量与Runway和Sora相比如何。
我开始时提出了一个问题:现有的基础设施是为人类构建的,但现在需要为人工智能代理工作的是哪些?表单似乎是一个显而易见的答案。
问题在于,人工智能代理可以填写大部分表单,但某些字段仍然需要人类来完成,比如签名、文件上传以及任何主观内容。而现有的表单工具要么是完全自动化的,要么是完全手动的,没有什么能够很好地处理这种交接。
因此,FormBridge 基本上是为代理与人类之间的交接提供的表单基础设施。代理通过 API 创建提交,填写它所知道的内容,然后返回一个 URL。人类打开链接,查看已经填写的内容(并带有小徽章显示是谁填写的),完成剩余部分后提交。然后,它会经过验证、可选的审批、Webhook 等等。
我对几个决策感到满意:
- 字段级归属:每个字段都知道是哪个参与者(代理、人类、系统)在何时进行了操作。
- 旋转简历令牌:每次状态变化时,URL 令牌都会旋转,因此过期的链接会停止工作。
- 内置 MCP 服务器:它会根据你的表单定义自动生成 MCP 工具,因此代理可以在无需额外设置的情况下发现和使用表单。
- 模式灵活性:你可以将 Zod、JSON Schema 或 OpenAPI 规范应用于它,它会在内部进行规范化。
技术栈包括 TypeScript、Hono 用于 HTTP、React 用于表单 UI,存储可替换(开发时使用内存,生产时使用 SQLite,文件存储使用 S3)。共有 1,339 个测试,覆盖率为 85.9%。
我在大约一周内独立完成了这个项目。如果有人感兴趣,我很乐意讨论架构或交接模型。
我注意到,大多数物理科学计算器和图形计算器在性能、功能和易用性方面,远不如像Desmos这样的在线计算器以及iOS、Android和Windows等操作系统自带的计算器。这让我不禁想知道,是否还有人使用德州仪器、卡西欧等公司的物理计算器。如果你在使用,我很想知道原因,以及它们与我提到的那些计算器相比,对你来说有什么不同或更好的地方,反之亦然。谢谢!