1作者: ToJans4 个月前原帖
我想更好地理解这篇论文,因此我请Claude训练并生成一个小型数独解题器,并附上额外的解释。<p>原始论文: <a href="https:&#x2F;&#x2F;arxiv.org&#x2F;abs&#x2F;2510.04871" rel="nofollow">https:&#x2F;&#x2F;arxiv.org&#x2F;abs&#x2F;2510.04871</a>
2作者: kodomonocch14 个月前原帖
你好!我开发了SEE(语义熵编码),因为“数据税”(存储/出口)和“CPU税”(解压/解析)不断上升。 权衡:它的压缩率不一定总是比Zstd小,但在压缩时仍然可以搜索,并且最小化了I/O。 关键数据(演示):综合压缩率约为原始数据的19.5%,跳过率约为99%,查找p50约为0.18毫秒(布隆过滤器约为0.30毫秒)。 10分钟重现步骤(无营销): 1) 下载演示ZIP(发布版)。 2) 按照README_FIRST.md中的说明操作。 3) 运行`python samples/quick_demo.py` → 输出比率/跳过/布隆 + p50/p95/p99。 投资回报率快速计算:节省/TB ≈ (1 − 0.195) × 每GB价格 × 1000(例如,$0.05/GB → 约$40/TB)。 NDA/VDR(私密,公共信息中无机密内容):[<a href="https://docs.google.com/forms/d/e/1FAIpQLScV2Ti592K3Za2r_WLUd0E6xSvCEVnlEOxYd6OGgbpJm0ADlg/viewform?usp=header" rel="nofollow">https://docs.google.com/forms/d/e/1FAIpQLScV2Ti592K3Za2r_WLU...</a>] 很高兴回答技术问题(架构感知布局、增量策略、布隆密度、跳过启发式、故障模式)。