最新

我在OptiLLM中构建了一个开源插件，实施了谷歌的“深度思考”推理方法，适用于DeepSeek R1和Qwen3等本地模型。谷歌最近的Gemini 2.5报告介绍了深度思考——一种模型并行生成多个假设并进行批判性分析后得出最终答案的技术。该方法在数学奥林匹克和竞争性编码基准测试中取得了最先进的结果。该插件通过修改推理流程，同时探索多个解决方案路径，然后综合出最佳方案。与单次生成不同，模型在回应之前实际上进行了一场内部辩论。技术细节： - 适用于任何支持结构化推理模式的模型 - 在响应生成过程中实现并行思考 - 对于复杂推理任务、数学和编码问题特别有效 - 增加推理时间，但显著提高答案质量链接: [https://github.com/codelion/optillm/tree/main/optillm/plugins/deepthink](https://github.com/codelion/optillm/tree/main/optillm/plugins/deepthink) 演示: [https://www.youtube.com/watch?v=b06kD1oWBA4](https://www.youtube.com/watch?v=b06kD1oWBA4) 该实现赢得了Cerebras与OpenRouter的Qwen 3黑客马拉松，但更重要的是，它现在对任何运行本地模型的人都可用。关于HN的问题： - 有没有人尝试过类似的并行推理方法与本地模型？ - 你认为还有哪些专有技术对开源有价值？ - 有什么建议可以优化性能权衡？我们的目标是使以前被API锁定的高级推理能力民主化。希望能收到对该方法的反馈和改进建议。

德州仪器将在美国投资超过600亿美元用于基础半导体的制造。

2 分•作者: TMWNN•8 个月前•原帖

Roast：轻松构建结构化的人工智能工作流程

1 分•作者: doppp•8 个月前•原帖

Foreman – 自动化您的混合基础设施，让运营变得愉悦

1 分•作者: indigodaddy•8 个月前•原帖

下载更多是为了商务，还是为了娱乐？

1 分•作者: thunderbong•8 个月前•原帖

一个同步的国家网络

2 分•作者: teleforce•8 个月前•原帖

XAI因在未获得许可的情况下运营超过400兆瓦的燃气涡轮机而面临诉讼。

3 分•作者: pseudolus•8 个月前•原帖

脑冻（或称“冰淇淋头痛”）

2 分•作者: atlasunshrugged•8 个月前•原帖

上一页 1...3415 3416 3417 3418 3419...4735 下一页