2作者: patrickdavey21 天前原帖
我为我的女儿(6岁)制作了这个基本的网站,以便她学习如何移动棋子。我想要一个简单的游戏,不需要所有的规则,只需要知道如何将棋子从A点移动到B点。老实说,我一制作好这个网站,就有朋友指出了一个非常不错的资源:<a href="https://lichess.org/learn" rel="nofollow">https://lichess.org/learn</a>。<p>这个网站有很多设置可以调整,以便设置难度等。总之,这也许会是一个有趣的(短暂的)消遣。
1作者: jqssun21 天前原帖
我正在开发一款基于Chromium的实验性浏览器,为您的手机/平板带来了两个主要功能: 1. 桌面风格的扩展:可以直接从Chrome网上应用店安装任何扩展(如uBO),只需先在菜单中切换“桌面网站”即可。 2. 隐私/安全增强:应用了Vanadium的完整补丁集(目前Helium的补丁正在开发中)。 这意味着您可以同时享受到两个浏览器出色的隐私功能,例如Vanadium的WebRTC IP策略选项,默认情况下可以保护您的真实IP,以及安全性改进,例如默认禁用JIT,同时它还是一款相对高效的开源应用,可以安装在任何(现代)安卓设备上。 目前仍处于测试阶段,正如我在README中提到的,它并不能替代运行GrapheneOS与Vanadium组合所提供的完整操作系统级安全模型。然而,目标是将Vanadium的隐私性与桌面扩展和Helium功能的强大结合起来,使其能够被更广泛的用户群体所使用。(Bitwarden Mobile的密码密钥在合并到FIDO2特权浏览器列表后也应该可以立即使用) 如果您想自己编译,可以在代码库中找到构建脚本。您也可以在那找到预编译的版本。 非常欢迎任何反馈和支持!
2作者: ubutler21 天前原帖
嘿,HN, 我很高兴地分享《大规模法律嵌入基准》(Massive Legal Embedding Benchmark,简称MLEB)——这是第一个全面的法律嵌入模型基准。 与以往的法律检索数据集不同,MLEB是由具有实际领域专业知识的人创建的(我拥有法律学位,并曾在澳大利亚总检察长办公室领导人工智能团队)。 我在尝试训练自己的最先进法律嵌入模型时想到了MLEB。我发现没有合适的法律信息检索基准来评估我的模型。 这促使我和我的兄弟花了几个月的时间来识别或在许多情况下构建我们自己的高质量法律评估集。 最终产品是10个数据集,涵盖多个法域(美国、英国、澳大利亚、新加坡和爱尔兰)、文档类型(案例、法律、法规、合同和教科书)以及问题类型(检索、零样本分类和问答),所有数据集都经过质量、多样性和实用性的审核。 为了在MLEB上表现良好,模型需要具备广泛的法律领域知识和强大的法律推理能力。这是有意为之——考虑到高质量嵌入对法律RAG(特别是在减少幻觉方面)的重要性,我们希望我们的基准尽可能与现实世界的实用性相关联。 我们最自豪的数据集名为《澳大利亚税务指导检索》。它将澳大利亚纳税人提出的真实税务问题与相关的澳大利亚政府指导和政策文件配对。 我们通过从澳大利亚税务局的社区论坛中获取问题来构建该数据集,论坛中,澳大利亚纳税人向会计师和ATO官员询问他们的税务问题。 我们发现,在大多数情况下,这些问题可以通过参考政府网页来回答,而用户出于某种原因未能找到这些网页。因此,我们手动筛选了112个具有挑战性的论坛问题,并提取了税务专家确认的相关政府指导材料的相关部分。 该数据集之所以如此有价值,是因为与目前可用的大多数法律信息检索评估集不同,它由真正具有挑战性的真实用户创建的问题组成,而不是有时与嵌入模型实际使用的任务类型相差甚远的人工构造查询。 《澳大利亚税务指导检索》只是我们辛苦构建的几个评估集之一,因为当时没有其他选择。 我们将所有内容,包括用于在MLEB上评估模型的代码,贡献回开源社区。 我们的希望是,MLEB及其内部的数据集能够在未来长期保持价值,以便其他训练法律信息检索模型的人不必绕道去构建自己的“法律MTEB”。 如果您想直接查看排行榜,而不是阅读我们的完整公告,可以在这里找到: [https://isaacus.com/mleb](https://isaacus.com/mleb) 如果您有兴趣尝试我们的模型,截止到2025年10月16日,它在MLEB上排名第一,请查看我们的文档: [https://docs.isaacus.com/quickstart](https://docs.isaacus.com/quickstart)