返回首页

一周热榜

2作者: rjpruitt164 天前原帖
我正在研究基础设施,以解决重试风暴和故障问题。在深入之前,我想了解一下人们今天实际在做什么。比较不同的解决方案,也许能帮助某些人发现潜在的解决办法。 问题: - 重试风暴 - API 失败,整个系统的实例独立重试,造成“雷鸣般的群体效应”,使情况更糟。 - 部分故障 - API 虽然“在线”,但性能下降(响应慢,间歇性500错误)。健康检查通过,但请求却受到影响。 我想了解的是: - 你们目前的解决方案是什么?(熔断器、队列、自定义协调、服务网格,还是其他?) - 效果如何?存在哪些不足之处? - 你们的规模有多大?(公司规模、实例数量、请求数/秒) 我很想听听哪些方法有效,哪些无效,以及你们希望存在的解决方案。
2作者: cadabrabra4 天前原帖
人们通常相信这些理论,因为他们只挑选出少数符合的周期,而忽视了大量不符合的周期。Gartner的炒作周期并不描述每一个炒作周期,而是描述了极少数的那些,实际上确实取得了一些成果的周期。但像往常一样,给一个概念起个花哨的名字,人们就会开始相信它,仿佛这是一种自然法则。实际上,它描述的是自然法则的一个例外。能够真正跨越“失望低谷”的技术屈指可数。
2作者: mavdol044 天前原帖
大家好, 我构建了一个运行时环境,用于通过 WebAssembly 沙箱隔离不可信代码。基本上,它保护您的主机系统免受不可信代码可能引发的问题。最近我们对 Python 中的沙箱化进行了深入讨论,更详细地阐述了这个问题[1]。在 TypeScript 中,由于两个生态系统之间的紧密联系,WebAssembly 的集成显得更加自然。 核心部分是用 Rust 编写的。在此基础上,我通过 wasmtime 和组件模型使用了 WASI 0.2,并结合自定义 SDK,使其尽可能符合语言习惯。 例如,在 Python 中,我们有一个简单的装饰器: ```python from capsule import task @task( name="analyze_data", compute="MEDIUM", ram="512mb", allowed_files=["./authorized-folder/"], timeout="30s", max_retries=1 ) def analyze_data(dataset: list) -> dict: """在一个隔离的、资源受控的环境中处理数据。""" # 您的代码在 Wasm 沙箱中安全运行 return {"processed": len(dataset), "status": "complete"} ``` 在 TypeScript 中,我们有一个包装器: ```typescript import { task } from "@capsule-run/sdk" export const analyze = task({ name: "analyzeData", compute: "MEDIUM", ram: "512mb", allowedFiles: ["./authorized-folder/"], timeout: 30000, maxRetries: 1 }, (dataset: number[]) => { return {processed: dataset.length, status: "complete"} }); ``` 您可以设置 CPU(通过 compute)、内存、文件系统访问权限和重试次数,以精确控制您的任务。 虽然现在还处于早期阶段,但我非常希望能听到反馈。我会在这里回答问题。 GitHub: [https://github.com/mavdol/capsule](https://github.com/mavdol/capsule) [1] [https://news.ycombinator.com/item?id=46500510](https://news.ycombinator.com/item?id=46500510)
2作者: dallen977 天前原帖
Kling刚刚宣布了VIDEO 3.0——这是对其2.6和O1型号的重大升级。 主要改进: *延长时长:* - 连续视频时长可达15秒(相比之前的5-10秒) - 时长灵活,可在3-15秒之间选择 - 更适合复杂的动作序列和场景发展 *统一的多模态方法:* - 集成文本转视频、图像转视频、参考转视频 - 在一个模型中实现视频的修改和转换 - 原生音频生成(与视频同步) *两个版本:* - VIDEO 3.0(从2.6升级而来) - VIDEO 3.0 Omni(从O1升级而来) *增强的功能:* - 通过基于参考的生成提高主题一致性 - 更好的提示遵循和输出稳定性 - 在故事板和镜头控制方面提供更多灵活性 这使得Kling在竞争中具备优势,主要竞争对手包括: - Runway Gen-4.5(每月95美元) - Sora 2(有限访问) - Veo 3.1(谷歌) - Grok Imagine(刚刚登顶排名) 15秒的时长尤其引人注目——相比典型的5秒短片,它能够实现更丰富的叙事故事。结合原生音频,这可能会改变内容创作者的工作流程。 公告中没有提到定价。之前的Kling型号价格在每月10-40美元之间,明显低于Runway。 有人已经可以测试这个吗?我很好奇在这个新时长下,它的质量与Runway和Sora相比如何。
2作者: amit_paz5 天前原帖
我开始时提出了一个问题:现有的基础设施是为人类构建的,但现在需要为人工智能代理工作的是哪些?表单似乎是一个显而易见的答案。 问题在于,人工智能代理可以填写大部分表单,但某些字段仍然需要人类来完成,比如签名、文件上传以及任何主观内容。而现有的表单工具要么是完全自动化的,要么是完全手动的,没有什么能够很好地处理这种交接。 因此,FormBridge 基本上是为代理与人类之间的交接提供的表单基础设施。代理通过 API 创建提交,填写它所知道的内容,然后返回一个 URL。人类打开链接,查看已经填写的内容(并带有小徽章显示是谁填写的),完成剩余部分后提交。然后,它会经过验证、可选的审批、Webhook 等等。 我对几个决策感到满意: - 字段级归属:每个字段都知道是哪个参与者(代理、人类、系统)在何时进行了操作。 - 旋转简历令牌:每次状态变化时,URL 令牌都会旋转,因此过期的链接会停止工作。 - 内置 MCP 服务器:它会根据你的表单定义自动生成 MCP 工具,因此代理可以在无需额外设置的情况下发现和使用表单。 - 模式灵活性:你可以将 Zod、JSON Schema 或 OpenAPI 规范应用于它,它会在内部进行规范化。 技术栈包括 TypeScript、Hono 用于 HTTP、React 用于表单 UI,存储可替换(开发时使用内存,生产时使用 SQLite,文件存储使用 S3)。共有 1,339 个测试,覆盖率为 85.9%。 我在大约一周内独立完成了这个项目。如果有人感兴趣,我很乐意讨论架构或交接模型。
2作者: speedylight7 天前原帖
我注意到,大多数物理科学计算器和图形计算器在性能、功能和易用性方面,远不如像Desmos这样的在线计算器以及iOS、Android和Windows等操作系统自带的计算器。这让我不禁想知道,是否还有人使用德州仪器、卡西欧等公司的物理计算器。如果你在使用,我很想知道原因,以及它们与我提到的那些计算器相比,对你来说有什么不同或更好的地方,反之亦然。谢谢!