2作者: ghostinit8 天前原帖
2023年初,一家小型金融科技初创公司。截止日期:4个月内上线。工程团队只有3个人。我担任架构师,还有两名开发人员。我们已经准备好了。架构设计完成,基础设施在云端运行,后端框架也搭建好了。 开发人员正在构建功能。我们进展顺利。然后到了第二个月,管理层开始招聘。很多经理出现了。接着,他们引入了一位Scrum Master。这个家伙在第一周就想要实施完整的敏捷仪式。 每日站会、冲刺规划、回顾会议、待办事项梳理,所有的流程都来了。他的理由是:“你需要流程来扩展。”而我们只剩下8周的时间。 我们并不是在尝试扩展。我们只是想完成项目。我已经看到这种模式多次上演。小团队在交付,管理层对缺乏可见性感到不安,于是他们招聘流程专家。流程专家需要证明自己的存在,仪式被实施,一切都变得缓慢。 让我感到痛心的是时机。我们正在工作。为什么在距离截止日期只有8周的时候要修复那些并没有坏掉的东西?我真心好奇,为什么管理层不能就让工作团队独立运作?这是真正对可持续性的担忧,还是仅仅对缺乏控制机制的不安? 你对此有什么经验?
6作者: lcastricato8 天前原帖
在过去几周,世界模型首次开始显得真实。你可以看到连贯的环境、长时间的展开,以及越来越令人信服的视觉效果。同时,这些系统大多数难以运行,难以集成,并且在规模与交互性之间进行了权衡。 我们创立Overworld是因为我们更关注构建可以实际栖息的世界,而不是制作令人印象深刻的视频。这意味着低延迟、持续控制,以及每次你采取行动时系统都会做出响应,而不是每次只在提示时响应。 上周,我们发布了Waypoint 1,这是一个实时扩散世界模型的研究预览,能够在本地运行。下周,我们将发布Waypoint 1.1 Small,旨在能够在现代消费级GPU上运行,并且易于构建和修改。 Waypoint是从零开始构建的,而不是从大型视频模型微调而来。我们在控制频率、稀疏注意力和快速推理方面进行了大量优化,以便系统能够维持持久的世界状态,并以游戏级帧率响应输入。我们的目标是创造一些开发者今天就能集成的东西,而不仅仅是作为演示观看。 我们认为,一旦世界模型遵循类似于大型语言模型(LLMs)的路径:本地执行、开放工具和快速的社区驱动迭代,这个领域将会快速发展。Genie和类似系统展示了在大规模下的可能性。我们的重点是让这个未来变得本地化和可接触。 我们在最近的博客文章中详细讨论了“沉浸差距”,为什么交互性比单纯的视觉效果更重要,以及我们如何优化模型。 代码、演示和发布详情请访问:https://over.world/blog/the-immersion-gap
1作者: sensecall8 天前原帖
我一直在使用人工智能来寻找“我可以用这个做什么”,但我希望能有更快速和更有结构的解决方案,于是我创建了Spud(spud.recipes)。它可以将你的食材转换为可烹饪食谱的简短列表。欢迎反馈。
1作者: Ohans_favour8 天前原帖
嗨,HN, 我们开发了 Bluebag,一个运行时环境,允许你从 skills.sh 导入代理技能,并在你的生产 AI 代理中使用它们。 演示: [https://www.bluebag.ai/playground](https://www.bluebag.ai/playground) 博客: [https://www.bluebag.ai/blog/import-skills-sh-into-bluebag](https://www.bluebag.ai/blog/import-skills-sh-into-bluebag) 文档: [https://bluebag.ai/docs](https://bluebag.ai/docs) 问题:skills.sh 拥有 100 多个开源代理技能(PDF 处理、代码审查、数据提取等)。这些技能在 Claude 和 Cursor 中表现良好。但如果你想在自己的代理中使用它们,配合 Vercel AI SDK 或 LangChain,你需要构建沙箱、依赖管理、文件存储等。 我们构建的解决方案:导入一个技能,获取工具。我们处理基础设施。 ```javascript import { Bluebag } from "@bluebag/ai-sdk"; const bluebag = new Bluebag({ apiKey: process.env.BLUEBAG_API_KEY }); const config = await bluebag.enhance({ model, messages }); const result = streamText(config); ``` 要导入一个技能,只需更换 URL: ```plaintext skills.sh/owner/skill → bluebag.ai/owner/skill ``` 就这样。该技能在一个隔离的沙箱中运行,依赖项已预先安装。 技术栈:每个租户都有隔离的虚拟机,技能加载在 /skills/{name},用于 bash/代码执行/文件访问的工具会自动注入。 兼容:Vercel AI SDK、LangChain、任何模型(Claude、GPT-4、Gemini、Llama)。 我们非常希望听到反馈,特别是你希望在生产环境中运行哪些技能。
5作者: cadabrabra8 天前原帖
我无法列举出任何一个由人工智能提出的软件应用或软件功能。一个都没有。以Excel为例,人工智能不仅没有完全取代Excel,还未能替代其任何功能。人工智能仅仅作为一种附加功能以智能聊天机器人的形式被添加进来。这种趋势在整个行业中普遍存在,这也是为什么人工智能未能从根本上改变我们现有软件应用的原因。 现在你可能会问:那人工智能原生应用呢?事实证明,它们大多数本质上是现有软件的克隆,只是在上面加了一个聊天机器人。由于人工智能本身容易出错,任何利用它的应用程序都必须提供所有必要的控制选项,以便覆盖其所有决策。因此,你最终得到的是一个传统软件应用加上人工智能。 人工智能曾承诺要转变甚至取代软件应用,但它所做的只是用一个不可靠的聊天机器人来增强这些应用。所有旧的字段和按钮仍然存在,但现在多了一个可以输入文本的字段,希望能有所作为。
3作者: eriam8 天前原帖
人工智能不仅仅是提高生产力:它创造了*过度效率*。<p>个人和小团队现在能够比现有组织的设计更快地生成决策、选项和倡议,而这些组织本身并未准备好去合法化、协调或吸收这些内容。瓶颈已经从执行转移到了治理。<p>当过剩的生产能力积累而没有吸收层时,组织并不会逐渐适应。历史上,它们往往会冻结:更加严格的规则、集中化、禁令和脱钩。<p>我们在新冠疫情期间看到了类似的反应:当系统无法在地方吸收冲击时,它们便会在全球范围内关闭。<p>似乎被讨论得不够充分的是<i>吸收</i>:不是“我们能多快生产”,而是<i>一个组织能够在不进行防御性关闭的情况下,代谢多少决策、选项和变更</i>。<p>有两个机制似乎相关但理论化不足:(1) 小规模的本地过程变更,重新分配协调和决策的负担;(2) 持续的技能和角色转变,随着人们围绕仍需决策、维护和合法化的事项重新定位。<p>我一直在尝试将其视为一种“导电”问题,即人类的决策和合法性如何与世代、人工智能和人类并行流动。<p>如果你见过组织在这方面表现良好(或失败得很惨),我很想知道:究竟是什么让系统能够吸收人工智能驱动的过度效率,而不回归到控制、排名、裁员或关闭的状态?
2作者: MarcelOlsz8 天前原帖
我使用苹果键盘的打字速度是每分钟160个单词。这绝对是我最喜欢的键盘,但我希望能有一个带有巧克力键和内置鼠标的人体工学键盘。我曾考虑过cybord imprint和kinesis advantage 360,但尽管kinesis的评价非常好,但它没有鼠标,而且对我来说价格太贵,虽然它是无线的,imprint也是如此。我的目标是将它用扎带固定在我的Herman Miller Aeron椅子的扶手上,这样我就不必移动手臂,可以轻松转身查看其他显示器,而不需要扭动脖子。有没有现成的解决方案可以订购,不需要焊接和组装?似乎选择不多。