4作者: eamag3 个月前原帖
我标记了所有来自“你在做什么?”(例如 <a href="https://news.ycombinator.com/item?id=45561428">https://news.ycombinator.com/item?id=45561428</a>)的评论,并建立了一个简单的 SvelteKit 网站,希望这能帮助找到有类似项目的人。我还在考虑添加一些项目类型随时间变化的分析,以观察技术的变化。
17作者: onasta3 个月前原帖
我很高兴地宣布发布 TabPFN-2.5,这是我们的表格基础模型,现在可以扩展到最多 50,000 个样本和 2,000 个特征——相比于今年早些时候在《自然》杂志上发布的 TabPFN v2,增加了 5 倍。TabPFN-2.5 在分类和回归任务中能够在一次前向传递中提供最先进的预测,且无需超参数调优。 <i>2.5 版本的新特性</i>: TabPFN-2.5 保持了 v2 的核心方法——一个在超过一亿个合成数据集上预训练的变换器,能够进行上下文学习并为测试数据输出预测分布。它原生支持缺失值、分类特征、文本和数值特征,并且对异常值和无信息特征具有鲁棒性。 主要改进包括: - 5 倍规模提升:现在可以处理 50,000 个样本 × 2,000 个特征(相比 v2 的 10,000 × 500)。 - 最先进的性能:TabPFN-2.5 超越了经过调优的树基方法,并且与复杂集成方法(AutoGluon 1.4)的性能相匹配,后者本身包括经过 4 小时调优的 TabPFN v2。对模型进行调优可以提升性能,在回归任务中超越 AutoGluon 1.4。 - 重建的 API:新的 REST 接口以及带有专用拟合和预测端点的 Python SDK,使得部署和集成对开发者更加友好。 - 一个蒸馏引擎,可以将 TabPFN-2.5 转换为紧凑的 MLP 或树集成,同时保持准确性并提供低延迟推理。 目前仍然存在一些限制。该模型设计用于最多 50,000 个样本的数据集。虽然可以处理更大的数据集,但这并不是我们在 TabPFN-2.5 中的重点。蒸馏引擎尚未通过 API 提供,仅通过许可证提供(尽管我们在模型报告中展示了性能)。 我们正在积极努力消除这些限制,并计划发布更专注于上下文推理、因果推断、图网络、更大数据和时间序列的新模型。 TabPFN-2.5 通过 API 和 Hugging Face 上的包提供。希望您能尝试并给我们反馈! 模型报告:<a href="https://priorlabs.ai/technical-reports/tabpfn-2-5-model-report" rel="nofollow">https://priorlabs.ai/technical-reports/tabpfn-2-5-model-report</a> 包:<a href="https://github.com/PriorLabs/TabPFN" rel="nofollow">https://github.com/PriorLabs/TabPFN</a> 客户端:<a href="https://github.com/PriorLabs/tabpfn-client" rel="nofollow">https://github.com/PriorLabs/tabpfn-client</a> 文档:<a href="https://docs.priorlabs.ai/quickstart" rel="nofollow">https://docs.priorlabs.ai/quickstart</a>
1作者: sandeepkd3 个月前原帖
背景:我有一个同事,他习惯于高信心地执行Chat-GPT提供的脚本。最近,有一个使用Github API的脚本出现了问题,他请我帮忙调试。结果发现,Github已经更改了输出中的属性名称,这些名称与Chat-GPT提供的脚本不再匹配。困难在于,这位同事是一位非常优秀的工程师,但他/她对如何调试Chat-GPT提供的脚本缺乏信心。
1作者: roundstars3 个月前原帖
我买了很多书,但大多数时候我没有动力去阅读它们。相反,我更喜欢在YouTube上观看一小时的纪录片或TED演讲。请问有什么建议吗?