嘿,HN,
我写了这篇短文,因为我对目前的对齐方法(RLHF)感到厌倦。优化“人类偏好”只会导致模型产生看似合理的幻觉,以取悦用户(随机鹦鹉),而不是扎根于现实。
我提出了一个不同的框架,称为LOGOS-ZERO。这个想法是放弃道德护栏(这些是主观的/流动的),将损失函数锚定在物理/逻辑不变性上。
基本上:
热力学损失:将高熵/幻觉视为“废物”。如果某个行为增加了系统的无序性,就会受到惩罚。
行动门控:与当前模型必须生成标记不同,这种架构首先在潜在空间中进行模拟。如果输出是高熵或逻辑不一致,它将返回一个零向量(沉默/否)。
它试图通过让人工智能遵循最小行动/熵的路径来解决基础问题,而不仅仅是模仿人类的语言模式。
链接到zenodo上的pdf文档:[https://zenodo.org/records/17976755](https://zenodo.org/records/17976755)
期待听到你们对物理映射的看法,如果想的话可以批评一下。
返回首页
最新
Raycaster(raycaster.ai)(YC F24)为生命科学领域的高风险、受监管工作(CMC / 质量 / 合规)构建了一款文档集成开发环境(IDE)。该产品将杂乱的版本化文档(PDF、Word 修订、表格)转变为一个结构化的工作空间,代理可以在其中搜索、引用、调和更改并协助撰写。
我们正在招聘一名研究工程师,要求能够同时(1)交付生产系统和(2)帮助定义公司的研究方向。从第一天起,就有机会发表技术深度分析、基准测试和论文。
你将要做的工作:
- 构建并交付核心代理工作流程:编排、检索、工具使用、保护措施、评估
- 处理文档管道 + 版本控制 + 可靠性/可观察性
- 将研究想法转化为生产特性(有时反向也是如此)
- 帮助设计高风险文档任务的基准/数据集;有可能发表
我们寻找的候选人:
- 扎实的工程基础(分布式系统 / 性能 / 可靠性)
- 能够舒适地实施和迭代评估(不仅仅是演示)
- 产品品味:关注用户体验细节,并能够构建端到端的解决方案
- 能够快速学习一个领域并提出尖锐的问题
加分项:
- 之前的出版物、开源项目或技术写作经验
后勤信息:
- 工作地点:纽约市(哈德逊园区),每周五天到办公室
- 薪酬:基础薪资 + 创始人级别的股权(具体细节正在处理)
申请方式,请发送邮件至:founders [at] raycaster.ai
请包含:你已交付工作的链接(GitHub/项目)和你构建的1-2个研究/评估示例(可以是非正式的)。
官方文档中他们首席科学家的引用相当可疑:<p><pre><code> 隐藏的思维链使我们能够“读懂”模型的思维,并理解其思考过程。例如,在未来,我们可能希望监控思维链,以寻找操控用户的迹象。
</code></pre>
如果他们不在此基础上进行训练,他们肯定是在读取推理标记。<p>https://developers.openai.com/blog/responses-api
嗨,HN,
我开发了SoundlyFM,这是一款为喜欢在工作、驾驶或学习时听直播电台作为背景音的人们设计的简约电台应用。
我想要的就是非常简单的东西。没有播放列表,没有推荐,没有无尽的选择。只有实时播放的声音。
在此之前,我尝试过实体收音机、大型流媒体平台和各种电台应用。没有一个让我满意。有的嘈杂或功能有限,有的则让人感到不知所措,还有很多充满广告。
SoundlyFM是围绕几个特定的使用场景设计的。
- 在macOS上,它位于菜单栏中,点击一下即可开始播放。
- 在iPhone上,它支持后台播放和睡眠定时器。
- 在车里,它通过蓝牙良好工作,快速切换电台,并可访问本地交通电台。
该应用故意不依赖算法。电台是手动策划的,更接近传统电台,而非现代内容流。界面非常简约,只有播放、暂停、切换电台和收藏功能。没有广告。
它支持iOS和macOS,并包含数千个全球电台,我会根据反馈不断维护和扩展。
着陆页: [https://soundlyfm.com](https://soundlyfm.com)
App Store: [https://apps.apple.com/app/id6754501543](https://apps.apple.com/app/id6754501543)
我主要是为自己开发这个应用,并且每天使用,尤其是在macOS上。欢迎反馈或提问。
介绍一下这个项目。到目前为止你的经历如何?你的方法或思路是什么?这是一个人独立完成的项目,还是有多个(人类)参与者?