返回首页

一周热榜

1作者: Keeper1236 天前原帖
我们已预注册了一种可测试的协议,用于检测大型语言模型(LLMs)中的几何一致性推理。该协议预测在元认知状态下,Betti数、Kolmogorov-Smirnov(KS)熵和脆弱性在消融实验中会增加。欢迎进行复制研究。 <p>OSF协议: https://osf.io/2r6v8 预印本和案例研究: https://doi.org/10.5281/zenodo/18346699<p>这不是哲学——这是一个可证伪的数学假设。如果你有GPU访问权限和拓扑数据分析(TDA)/深度学习(DL)专业知识,你可以在一个周末内验证它。
1作者: Mikulas_Tomanka6 天前原帖
嗨,HN, 我创建Firenum是因为我发现大多数FIRE计算器要么过于简单,要么需要将我的整个财务状况上传到第三方服务器。 我希望有一个全面的工具,能够模拟的不仅仅是4%的规则。这个工具可以处理Coast、Lean、Fat和Barista FIRE,更重要的是,它允许你模拟“假设”场景,比如市场崩盘或重大生活事件,以查看这些情况如何影响你的时间线。 主要功能: - 隐私优先:无需注册。所有计算和数据存储都在本地进行,任何信息都不会发送到后端。 - 场景模拟:你可以模拟市场下跌,以查看你的计划的韧性。 - 多货币支持:支持8种主要货币。 - 进度跟踪:一个仪表板,用于可视化旅程中的“无聊中段”。 我们的目标是制作一个功能强大的工具,像复杂的电子表格一样,但用户体验要好得多。我很想听听你们对预测逻辑的看法,以及你们认为是否缺少任何特定变量(例如税收拖累或通货膨胀调整)。 网址: [https://firenum.com](https://firenum.com) 我很乐意回答有关数学或本地优先实现的任何问题!
1作者: __patchbit__6 天前原帖
我看到有提到一所医院使用机器人从人类身上抽血,成功率为94%(向下取整)。对于政策制定者和医院管理者来说,关于在对人类和生物体操作机器人时可接受的失败率,有什么指导建议?