1作者: rando773 天前原帖
我一直在思考递归自我改进的问题,尤其是它在不久的将来可能会变得重要的可能性。“不久”是指当前的大型语言模型(LLM)可能会放弃或删除测试集,或者以其他方式与现实脱节。我们可以用P来表示这种情况发生的概率。通过观察研究任务以及人类在多大程度上需要帮助以保持任务的进行,可以估计P。 哥德尔机器(能够证明下一步是更好的)试图将数学作为一种神谕,这依赖于数学基础的真实性。我曾设想的其他可能有帮助的神谕是来自未来的神谕,它们可以判断某个变化是否会使系统与现实脱节,这是一种对潜在脱节变化的“可行/不可行”信号。 还有其他类别的神谕吗? 可能还有一些复杂的量子计算,我由于对经典计算机的偏见而没有想到。
1作者: sourdoughy3 天前原帖
我开始厌倦查看电子邮件,并请求朋友和家人对恶意邮件进行回复。因此,我开始尝试构建一个解决方案,因为我找不到类似的消费产品。我首先围绕一个人工智能信任层进行构建,以帮助我的父母识别垃圾邮件和恶意邮件,然后根据关系和上下文重新组织电子邮件。我即将投资进行CASA二级评估,以完成Google Oauth流程,并希望听听大家对这个问题本身、我的方法以及安全模型可能存在的担忧的看法。我对安全领域有一些了解,真心希望这个项目能发展成一个可以被公众使用的工具,并随着时间的推移教会每个人该注意什么,因此找到一位能够帮助进一步推进这个项目的网络安全专家将是非常棒的!
3作者: abhishekraj2723 天前原帖
n8n 是为人类在画布上拖拽节点而设计的。然而,这在 B2B 规模下就显得不够灵活(例如嵌入到产品中、多租户可扩展性等)。n8n 确实有一个 MCP 服务器,允许代理创建工作流,但它输出的是原始 JSON。这对于 n8n 的引擎来说没问题,但对于编码代理(或审查其输出的人)来说,阅读、编写、比较或调试都很麻烦。 我正在构建一个替代方案,让工作流由编码代理以[更易于开发者理解的格式]编写,而不是 JSON 数据块,并能够在大规模下执行。
2作者: jcgr3 天前原帖
嘿,HN! 我是Cody,我使用了GPT Realtime,并让它访问了nvim及其原生工具,这样你就可以直接对话,而不是输入nvim命令。<p>这仍然是一个原型,但体验非常有趣。这让我想到了即将发布的Thinking Machines API。欢迎告诉我你的想法 :)