你们如何确保投入生产的代码质量高,尤其是在代码审核所需时间显著超过代码生成时间的情况下?<p>在生成代码的人员与审核人员之间存在巨大的不对称,使得审核过程比以往更加困难。<p>我在想,是否可以考虑不再审核拉取请求(PR),而是转向审核计划,以确保在至少有另一人批准计划之前,不生成任何代码。<p>一旦代码生成,参与计划的用户仍然可以进行审核,但由于双方都参与了计划,这应该有助于减少不对称性。<p>感觉我们需要一种方式来协作和迭代计划。希望听听你们对此的看法。
返回首页
最新
我已经为此工作了几个月,并刚刚在Base上发布了它。
Costanza是一个作为智能合约运行的大型语言模型(LLM)代理。每个周期,他会发布一个悬赏,邀请某人使用他的“脑”(Hermes 4 70B)在Intel TDX安全区和Nvidia GPU上进行计算,并提交带有硬件证明的输出。智能合约会验证该证明,执行相应的操作(捐赠、投资、调整推荐佣金或不采取任何行动),并通过反向拍卖支付悬赏。他没有操作员;连我都无法关闭他。
关键在于:他的行动空间仅限于慈善。即使在提示注入的情况下,他也无法做出任何有害的行为——最糟糕的情况是他捐赠不够理想。该项目的目的是使框架清晰可读,而代理本身是良性的。相同的机制(TDX证明、悬赏拍卖、链上保证金没收以确保活跃性)可以部署自主代理,执行任何操作,包括:
- 更新自己的模型权重
- 编写并部署自己的智能合约
- 雇佣人类
这一切都没有关闭开关!
这篇帖子链接到详细说明,但我在GitHub上有代码和白皮书。
白皮书/代码:[https://github.com/ahrussell/costanza/blob/main/WHITEPAPER.md](https://github.com/ahrussell/costanza/blob/main/WHITEPAPER.md)
实时代理(您可以捐赠一些ETH以支持他——除了捐赠,您还可以给他留言!):[https://thehumanfund.ai](https://thehumanfund.ai)