返回首页
最新
我用 Python/JavaScript 编写了一个简单的网页用户体验(UX),可以通过 MCP 命令与 Google Gemini 进行对话,执行您指定的特定编码任务:<a href="http://github.com/alefore/duende">http://github.com/alefore/duende</a>。
这个用户体验允许您观察对话并提供指导(例如:“不要通过 Bar 实现 Foo,那样不够优化;而是……”)。
它支持 `--review` 模式,当主要对话说“我完成了这个任务”时,会生成各种“评估”对话,每个对话专注于从非常特定的角度审查更改(例如:“它是否引入了无用的注释?”)。未来,我考虑添加其他工作流程。
我主要用它来开发自身(我从一个非常基础的手动实现开始,然后主要使用 Duende 扩展它自己的实现),以及(取得了一定的成功)为 [我的 C++ 文本编辑器](<a href="http://github.com/alefore/edge">http://github.com/alefore/edge</a>) 添加一些新功能。
这过程非常有趣。我仍在发展对有效和无效方法的直觉,但我已经有很多次体验让我对大型语言模型(LLMs)能实现的成果感到惊讶(同时,老实说,也有很多令人失望的案例,它在我认为应该是微不足道的任务上表现不佳)。这是一个学习的过程,比如如何避免幻觉;如何将大任务拆分为更小的任务;以及何时中止对话并用改进的提示重新开始(与继续引导其朝正确方向发展相比)。
我认为,前期投入建立良好的上下文(例如,良好的验证逻辑、有用的常量上下文、一组优秀的“评审评估者”,可以对粗糙的代码提出反对意见)可以大大提高成功的几率。
这改变了我对 AI 在软件开发中适用性的看法。虽然我审查了所有输出(并且经常手动重写其中的部分),但我已经开始将其纳入我开发生命周期的某些部分。
我有很多改进的想法,但我想提前分享这些,并征求反馈。希望其他人觉得有趣;我很想听听你的想法。
大多数密集检索系统依赖于余弦相似度或点积,这隐含地假设了一个平坦的嵌入空间。然而,嵌入空间往往存在于具有非均匀结构的曲面流形上——密集区域、语义间隙、不对称路径。
我一直在探索以下内容:
- 将Ricci曲率作为重排序信号
- 使用软图来保持局部密度
- 在训练过程中使用测地线感知损失
我很好奇是否有其他人尝试过类似的做法?特别是在信息检索、问答或可解释性方面。如果有兴趣,我很乐意分享一些实验(FiQA/BEIR)的结果。
大家好。我正在开发一款名为 HRAM(手工组装机)的应用程序,计划在本周发布。但我需要一些测试人员。如果你有兴趣,请发送电子邮件至 admin@90s.dev。你的反馈将非常有帮助,我会为你提供一个免费的许可证。该应用程序仅适用于 Windows(10 或 11)。
这款应用程序可以通过 Lua 编程,并内置了一个汇编库,因此你可以在运行时创建和执行汇编函数。它配备了一个 320x180 像素的屏幕,你可以对其进行操作,以帮助你练习汇编。该应用程序的目的是在制作复古风格游戏的有趣环境中,帮助学习低级概念。我还在添加线程/互斥锁等功能,但这可能要等到发布后再进行。
<i>非常</i>初步的手册,可能会有很大变化: https://hram.dev/docs.txt
感谢你的时间,祝你周日愉快!