返回首页

一周热榜

1作者: jacklanda5 天前原帖
你好!<p>我们提出了一种并行推理器,旨在减轻幻觉现象并增强推理的公平性。<p>欢迎在 Hugging Face 上投票支持!<p>[推特链接] https://x.com/ZilongZheng/status/1998252267783516444<p>[项目页面与演示] https://bigai-nlco.github.io/Native-Parallel-Reasoner<p>[GitHub 仓库] https://github.com/bigai-nlco/Native-Parallel-Reasoner<p>[HF 论文] https://huggingface.co/papers/2512.07461<p>[arXiv 预印本] https://arxiv.org/abs/2512.07461<p>亮点:该模型是一个原生的并行推理系统原型,与其他流行的多智能体方法不同,它具有多条推理路径。它不是由多个智能体组成,而是由一个智能体在同一时间片内进行多路径推理。训练从一个单一的串行模型开始,零外部监督,利用自蒸馏生成合成轨迹,然后通过模仿学习和适用于并行思维加速的强化学习 + SGLang 基础设施进行多阶段优化。它使用简单的并行性进行思考和解决问题。通过最小的自蒸馏并行推理轨迹样本,它在多个数学和复杂推理基准测试中与现有的并行和自回归推理基准相匹配并略有超越。在推理方面,它实现了高达 4.6 倍的实际时间加速。在物理层面,它实现了约 100% 的并行触发。在逻辑层面,它展现了新兴的问题分解和分而治之的能力,内化了并行思维,而不是回归到串行策略。
1作者: hyun_kim5 天前原帖
我创建了 Updated.dev,它可以将你的 Git 提交记录转化为干净、随时可以发布的版本说明,整个过程只需几秒钟。连接你的代码库,选择重要内容,让人工智能来处理草稿。发布的更新会立即在应用内小部件和公共页面上显示。
1作者: pysupremacy5 天前原帖
我花了过去六年时间构建SIMO.io,这是一个以安全为首的、有线的开源智能家居系统,专为专业安装而设计(全栈硬件 + 软件)。 该中心是一个小型的Ubuntu服务器盒子,运行Django/Python栈(PostgreSQL、Redis、Supervisor等)。它按照设计部署在本地,配备不间断电源(UPS)和路由器及PoE交换机。每晚进行LVM/Borg备份,备份数据存储在可移动介质上;恢复过程为裸机恢复,而非依赖云服务。 系统的骨干是以太网/PoE。面板采用DIN导轨“游戏改变者”板,配备16个通用I/O接口以及用于DALI或I²C等总线的数字接口插槽。您可以插入继电器/调光器/输入模块,用于灯光、阀门、传感器、百叶窗、门等。关键回路(例如,墙壁开关 ↔ 灯光)直接在面板上运行,因此即使中心出现故障,基本功能仍然可以继续使用。房间由Sentinel单元处理:这些是带有存在感应、环境传感器、AI语音助手和100分贝警报器的PoE天花板设备,所有设备通过局域网与本地中心通信。 一些可能引起HN兴趣的具体细节: - 以线缆为主、以安全为先的架构:PoE骨干,骨干中没有无线电,UPS感知的电源管理,以及核心功能的离线优先行为。 - 专业级权限和角色:中心管理员、实例超级用户,以及每个组件的访问控制列表(ACL),使电工、客户、居民和访客能够看到和控制他们应有的内容。 - 面向开发者的设计:Django管理界面和仅限密钥的远程SSH访问中心,Python虚拟环境用于集成,结构化日志存储在/var/log/simo下,以及为第三方系统提供的文档化扩展模型。 - 自动化模型:组件(灯光、阀门、传感器、场景、警报组、全局状态等)以及运行普通Python的脚本组件。该应用可以根据自然语言描述生成初始Python脚本;然后您可以在管理界面中进行编辑。 - 移动优先的调试:安装人员可以创建实例、配对面板、映射I/O、构建场景/存在感应照明/警报组,并通过手机生成二维码交接访问权限,只有在需要更深入的工作时才进入管理界面/SSH。 我们的目标不是一堆Wi-Fi设备,而是电工或集成商可以作为基础设施部署的系统:可重复的面板、可审计的中心、在故障情况下可预测的行为,以及开发者可以真正理解的开源栈。 我非常希望能收到关于架构、安全模型和开发者使用体验的直接反馈,特别是来自今天运行或部署全屋系统的人的意见。 网站: [https://simo.io](https://simo.io) 文档: [https://simo.io/wiki/](https://simo.io/wiki/) GitHub: [https://github.com/SIMO-io](https://github.com/SIMO-io)
1作者: mdahardy大约 20 小时前原帖
嘿,HN - 我开发了ModelGuessr,这是一个游戏,你可以与一个随机的AI模型聊天,并尝试猜测它是哪一个。 在AI领域,一个重要的未解之问是,AI公司是否有足够的品牌差异化来获得真正的利润。模型会像云计算一样被商品化,还是像智能手机一样具有差异化? 我创建ModelGuessr就是为了测试这个问题。我认为人们在猜测时会比他们预期的更困难。而且,模型之间的混淆越多,这些模型可能就越像商品。 如果有足够多的人参与游戏,我会发布一些关于混淆模式的后续分析(哪些模型容易被混淆,是什么让它们被识别出来等等)。非常欢迎任何反馈!
1作者: slmslm5 天前原帖
和许多开发者一样,我厌倦了在不同的代码库之间来回跳转,只为回答一些简单的问题,比如: <p>这周到底发生了什么变化?<p>哪些拉取请求被卡住了?<p>我们发布了什么?<p>谁在等待审核?<p>它位于你的 GitHub/GitLab/Bitbucket 代码库之上,将杂音转化为可读的信息。<p>最困难的部分是什么?Webhooks。 每个提供商发送的负载完全不同: <p>不同的键<p>不同的结构<p>缺失的字段<p>不一致的命名<p>你最终花费更多时间在规范化上,而不是在构建功能上。<p>我们通过创建一个内部统一的事件模式和每个提供商的映射器来解决这个问题。 所有规范化的事件都存储在 MongoDB 中,这非常有帮助,因为灵活的文档模型使得处理略有不同的数据结构变得毫不费力,而不会破坏任何东西。<p>一旦我们有了这个,功能自然就来了: 实时提交和拉取请求监控<p>基于你代码库活动训练的 AI 代理<p>自动化的每周/月总结(通过电子邮件或 Slack)<p>贡献评分的排行榜<p>公开的变更日志页面<p>多平台支持(GitHub/GitLab/Bitbucket)<p>基本上是一个为快速发展的团队提供的统一活动层。<p>为什么要构建它? Git 平台提供原始数据。 团队需要上下文。 开发者想要快速的答案。 管理者想要总结,而不是仪表盘。
1作者: npunzi5 天前原帖
我是一名开发者,厌倦了浪费整个晚上来规划旅行。在第十次凌晨两点发现自己打开了50个标签页,阅读相互矛盾的博客文章后,我决定创建Voyaige。 <p>它的功能: 输入一个城市和你的旅行风格(预算背包客、奢华、吃货等)→ 大约15分钟后获得个性化的PDF指南。不是那些泛泛而谈的“十大”列表,而是真正的行程安排,包括开放时间、交通提示和符合你偏好的推荐。 <p>为什么选择Perplexity而不是GPT/Claude: Perplexity的深度研究API是改变游戏规则的关键。它实际引用真实来源并获取最新数据。而GPT-4则不断给我提供2021年的过时餐厅推荐。Perplexity进行搜索、综合和引用——这对旅行来说,准确性至关重要。 <p><pre><code>技术栈: - Laravel后端,使用队列工作者处理长时间生成 - Perplexity深度研究API用于研究和综合 - 自定义PDF生成(尝试过DOMPDF,最终选择了Browsershot + 无头Chrome) - Polar用于支付(Stripe因“旅行内容”拒绝我3次) 最大的技术挑战: 1. API响应质量:通过提示工程确保不同城市/角色间的一致结构 2. PDF布局:制作25页的指南,确保既美观又适合移动设备阅读 3. 队列管理:优雅地处理生成失败和重试逻辑 4. 支付处理器:寻找一个接受“AI生成内容”业务的支付处理器 HN提问: 1. 你愿意支付13美元来省去3-5小时的研究时间吗? 2. 什么情况会使更高的定价合理? 3. 你对AI生成的旅行建议与人类旅行博主的看法如何? 链接:https://voyaige.io 欢迎讨论或回答任何问题!</code></pre>