返回首页
最新
我很高兴地宣布发布 TabPFN-2.5,这是我们的表格基础模型,现在可以扩展到最多 50,000 个样本和 2,000 个特征——相比于今年早些时候在《自然》杂志上发布的 TabPFN v2,增加了 5 倍。TabPFN-2.5 在分类和回归任务中能够在一次前向传递中提供最先进的预测,且无需超参数调优。
<i>2.5 版本的新特性</i>:
TabPFN-2.5 保持了 v2 的核心方法——一个在超过一亿个合成数据集上预训练的变换器,能够进行上下文学习并为测试数据输出预测分布。它原生支持缺失值、分类特征、文本和数值特征,并且对异常值和无信息特征具有鲁棒性。
主要改进包括:
- 5 倍规模提升:现在可以处理 50,000 个样本 × 2,000 个特征(相比 v2 的 10,000 × 500)。
- 最先进的性能:TabPFN-2.5 超越了经过调优的树基方法,并且与复杂集成方法(AutoGluon 1.4)的性能相匹配,后者本身包括经过 4 小时调优的 TabPFN v2。对模型进行调优可以提升性能,在回归任务中超越 AutoGluon 1.4。
- 重建的 API:新的 REST 接口以及带有专用拟合和预测端点的 Python SDK,使得部署和集成对开发者更加友好。
- 一个蒸馏引擎,可以将 TabPFN-2.5 转换为紧凑的 MLP 或树集成,同时保持准确性并提供低延迟推理。
目前仍然存在一些限制。该模型设计用于最多 50,000 个样本的数据集。虽然可以处理更大的数据集,但这并不是我们在 TabPFN-2.5 中的重点。蒸馏引擎尚未通过 API 提供,仅通过许可证提供(尽管我们在模型报告中展示了性能)。
我们正在积极努力消除这些限制,并计划发布更专注于上下文推理、因果推断、图网络、更大数据和时间序列的新模型。
TabPFN-2.5 通过 API 和 Hugging Face 上的包提供。希望您能尝试并给我们反馈!
模型报告:<a href="https://priorlabs.ai/technical-reports/tabpfn-2-5-model-report" rel="nofollow">https://priorlabs.ai/technical-reports/tabpfn-2-5-model-report</a>
包:<a href="https://github.com/PriorLabs/TabPFN" rel="nofollow">https://github.com/PriorLabs/TabPFN</a>
客户端:<a href="https://github.com/PriorLabs/tabpfn-client" rel="nofollow">https://github.com/PriorLabs/tabpfn-client</a>
文档:<a href="https://docs.priorlabs.ai/quickstart" rel="nofollow">https://docs.priorlabs.ai/quickstart</a>
背景:我有一个同事,他习惯于高信心地执行Chat-GPT提供的脚本。最近,有一个使用Github API的脚本出现了问题,他请我帮忙调试。结果发现,Github已经更改了输出中的属性名称,这些名称与Chat-GPT提供的脚本不再匹配。困难在于,这位同事是一位非常优秀的工程师,但他/她对如何调试Chat-GPT提供的脚本缺乏信心。
我买了很多书,但大多数时候我没有动力去阅读它们。相反,我更喜欢在YouTube上观看一小时的纪录片或TED演讲。请问有什么建议吗?
我创建了一台可以公开访问的Windows计算机,多个用户可以同时控制(每个人都能看到相同的屏幕,并控制相同的鼠标和键盘)。它在浏览器中运行,使用Apache Guacamole构建 :)<p>这旨在对基础设施进行短期压力测试。
几年前(可能至少五年,甚至超过十年),我看到一篇文章,作者描述了一个概念操作系统。它包含一个文件系统的数据库,层级不仅由特定的文件路径决定,还可以通过与文件关联的可选关键词来确定。访问网络也可能通过这个数据库进行了抽象。应用程序被描述为该数据库的用户界面视图,所有数据(包括视图的状态)在用户的设备之间是原生自动同步的。作者当时还在开发一个原型,可能是用JavaScript实现的。
我很想找到这篇文章再读一遍,看看在实现方面可能有什么进展,但搜索起来很有挑战性。我很可能是通过HN发现了那篇文章。也有可能我对这个概念的某些部分产生了“幻觉”。不过如果这篇文章还存在,那么这里很有可能有人见过它,或许还记得来源。或者是类似的东西。有人遇到过这个,或者对如何进一步搜索有什么想法吗?
大家好。最近有很多令人兴奋和酷炫的事情,真是一个活着的奇妙时刻!<p>不过,我不禁感到一种无尽未开发潜力和决策疲劳的恐惧,尤其是在这个领域中进行导航时。<p>你们是怎么应对的?对你们有效的是什么?有什么推荐吗?<p>我觉得我现在想要的是一种能够替代我在决策疲劳时做出决策的代理工具,我不断在不同的代理和模型之间跳来跳去,老实说,它们都能发挥作用并产生类似的结果,我是不是做错了什么?<p>如果我试着分析我的挫败感,我会说这是一种用户体验问题。例如,我相信Cursor在重新设计自动完成功能时成功跨越了鸿沟,Claude Code的命令行界面也是如此。不过,我觉得它们似乎并没有“老去”得很好,可能只是我个人的感觉。<p>让我感到沮丧的是,我们似乎处于一种次优的中间状态,试图进入一种低到中等监督的自主计算,但用户体验在我看来仍然没有完全与这个方向对齐。——我在表达上有些挣扎,希望比我聪明的人能在HN上理解我的意思,嘿。<p>我喜欢我们现在进入了一个云沙盒和异步环境逐渐兴起的时代,但出于某种原因,这种感觉仍然很尴尬。半成品,功能工厂,很多尝试各种东西看看哪个有效。——也许这只是知识的空白、信息密度/过载,或者我只是需要更好地集中注意力。<p>还有其他人觉得现在是一场竞赛,市场推出的速度优先于质量和创新吗?我们是否会再慢下来?<p>哦,好吧……是时候回去在Sora上继续无尽滑动了 ¯\_(ツ)_/¯
我在这里和那里找到了一些线索,但没有什么真正能抓住重点,特别是像招聘、融资等关键方面。我想如果有哪个社区知道我遗漏的好资源,那一定是这个社区!
这只是我用Raylib制作的一个小游戏。