嗨,HN,似乎大家对之前GPT 5.2 Pro解决的Erdos问题表现出了广泛的兴趣:<a href="https://news.ycombinator.com/item?id=46664631">https://news.ycombinator.com/item?id=46664631</a>
我招募了一支聪明的本科生团队,构建了一个数据集,记录了ChatGPT对每个开放Erdos问题的回答,并验证了输出结果。
他们发现:
- 3个问题有新的证明(虽然在2个案例中,发现了历史上的部分结果,可以扩展以解决同样的问题)
- 4个问题中,5.2 Pro或Deep Research在之前的文献中找到了未被记录的确切解决方案
- 3个问题中,5.2 Pro或Deep Research能够加强文献中的先前结果
- 3个问题中发现了问题陈述中的错别字
最常见的失败案例是,5.2 Pro解决了问题的表述,但专业数学家理解到该问题存在隐含约束。例如,问题可能说是整数,但实际上他们只指正整数。
欢迎随时询问有关数据集的任何问题!
返回首页
最新
我不断看到几年前以大约一半价格出售的房屋,现在却没有任何背景信息地重新上市。买家无法分享观察结果、指出快速转手的情况或添加历史背景。这些平台(如Zillow)为什么避免评论,是否有真正的原因,还是主要是因为管理风险?
你好!<p>我刚在家设置了TinyTinyRSS(https://tt-rss.org/),正在寻找有趣的阅读内容以及发布有趣内容的人或网站。<p>这样做的目的是为了减少每天的(无聊)刷屏,避免社交媒体的推荐算法。<p>所以,你通过RSS订阅了谁或什么,为什么?
我发布了 LocalPass——一款以本地为优先、离线使用的密码管理器,完全不依赖云服务、没有数据监测,也没有供应商锁定。100% 本地存储,100% 开源。
我并不指望这篇文章能登上 HN 的首页,但我非常兴奋,所以想和大家分享一下。
PrecisionRush 是我独自开发的一款小型免费 iOS 计时游戏。奇怪的是,这个想法源于我玩 iPhone 默认计时器时的思考:如果这是一款真正的游戏会怎么样?
我自己并不是个游戏爱好者(我只玩过几款游戏),但这个小机制让我念念不忘,因此我决定制作一个我个人想玩的版本。
游戏的 premise 很简单:你会得到一个目标时间,启动计时器,目标是尽可能接近这个目标时间停止计时。如果你能在大约 20 毫秒内停下,简直让人觉得不真实。这个概念虽然简单,却意外地让人上瘾。
我上周发布了这款游戏,目前正处于“首批真实用户”阶段。到目前为止,我只收到了少量评分,但看到有人尝试这款游戏让我感到非常开心。有一点意外的是,竟然有几个用户点击了“支持开发者”,这我真的没想到。
我是在业余时间做这个的,绝对不是顶尖的游戏设计师或用户体验专家——我只是喜欢制作一些我喜欢的小东西,并不断迭代。我还没有进行任何营销,也不打算在这里出售任何东西。我只是希望能从喜欢简约游戏或快速技能测试的人那里获得诚实的反馈:
- 玩几分钟后仍然有趣吗,还是变得重复?
- 用户界面/反馈循环是否令人满意且清晰?
- 有什么明显的地方你会改进或添加?
App Store 链接:https://apps.apple.com/ro/app/precisionrush/id6755596108
感谢阅读。