返回首页
一周热榜
如果你成功做到这一点,你学到了什么?<p>我个人已经放弃了将 PinePhone Pro 作为便携设备的想法,尽管我仍然好奇是否能让 uconsole + 4G 调制解调器作为一个笨重的便携设备工作。<p>在这几年的实验过程中(自大约2014年以来),我一直在不同的翻盖手机之间跳跃,最初是因为更新型号开始更好地支持 MMS 消息,最近则是在 3G 开始逐步淘汰的时候。<p>对我来说,最好的选择似乎就是完全避免智能手机的生活方式。这是唯一的办法吗,还是说在 Linux 手机中仍然存在一些可能性?
嘿,HN!我是Emotive Engine的创始人。我已经为此工作了超过两年,今天终于开源了它。
核心理念:大多数动画库的工作单位是毫秒,而音乐的单位是节拍。这造成了不匹配——如果为500毫秒硬编码一个弹跳动画(在120 BPM下完美),切换到90 BPM时,一切都会漂移,因为500毫秒现在相当于0.75节拍。
Emotive Engine使用音乐时间作为基本单位。你可以用节拍来指定动画,它们会自动转换为:
- 120 BPM时为500毫秒
- 90 BPM时为667毫秒
- 170 BPM时为353毫秒
改变节奏,所有内容都会自动调整,无需重新计算。
这个引擎是为AI界面(聊天机器人、语音助手)而构建的,但也适用于任何实时角色动画。支持纯Canvas 2D,在移动设备上可达到60 FPS,已有2532个测试通过。
现场演示请访问<a href="https://emotiveengine.com/demo" rel="nofollow">https://emotiveengine.com/demo</a> - GitHub上的英雄横幅是用这个引擎生成的。
欢迎提出任何技术问题!采用MIT许可证。
嘿,HN,
我很高兴地分享《大规模法律嵌入基准》(Massive Legal Embedding Benchmark,简称MLEB)——这是第一个全面的法律嵌入模型基准。
与以往的法律检索数据集不同,MLEB是由具有实际领域专业知识的人创建的(我拥有法律学位,并曾在澳大利亚总检察长办公室领导人工智能团队)。
我在尝试训练自己的最先进法律嵌入模型时想到了MLEB。我发现没有合适的法律信息检索基准来评估我的模型。
这促使我和我的兄弟花了几个月的时间来识别或在许多情况下构建我们自己的高质量法律评估集。
最终产品是10个数据集,涵盖多个法域(美国、英国、澳大利亚、新加坡和爱尔兰)、文档类型(案例、法律、法规、合同和教科书)以及问题类型(检索、零样本分类和问答),所有数据集都经过质量、多样性和实用性的审核。
为了在MLEB上表现良好,模型需要具备广泛的法律领域知识和强大的法律推理能力。这是有意为之——考虑到高质量嵌入对法律RAG(特别是在减少幻觉方面)的重要性,我们希望我们的基准尽可能与现实世界的实用性相关联。
我们最自豪的数据集名为《澳大利亚税务指导检索》。它将澳大利亚纳税人提出的真实税务问题与相关的澳大利亚政府指导和政策文件配对。
我们通过从澳大利亚税务局的社区论坛中获取问题来构建该数据集,论坛中,澳大利亚纳税人向会计师和ATO官员询问他们的税务问题。
我们发现,在大多数情况下,这些问题可以通过参考政府网页来回答,而用户出于某种原因未能找到这些网页。因此,我们手动筛选了112个具有挑战性的论坛问题,并提取了税务专家确认的相关政府指导材料的相关部分。
该数据集之所以如此有价值,是因为与目前可用的大多数法律信息检索评估集不同,它由真正具有挑战性的真实用户创建的问题组成,而不是有时与嵌入模型实际使用的任务类型相差甚远的人工构造查询。
《澳大利亚税务指导检索》只是我们辛苦构建的几个评估集之一,因为当时没有其他选择。
我们将所有内容,包括用于在MLEB上评估模型的代码,贡献回开源社区。
我们的希望是,MLEB及其内部的数据集能够在未来长期保持价值,以便其他训练法律信息检索模型的人不必绕道去构建自己的“法律MTEB”。
如果您想直接查看排行榜,而不是阅读我们的完整公告,可以在这里找到: [https://isaacus.com/mleb](https://isaacus.com/mleb)
如果您有兴趣尝试我们的模型,截止到2025年10月16日,它在MLEB上排名第一,请查看我们的文档: [https://docs.isaacus.com/quickstart](https://docs.isaacus.com/quickstart)
似乎我们过于依赖少数几家公司的工作和生产力。全球有80亿人,但只有少数几个国家拥有良好的法治、优秀的大学和支持当地生产力的企业;一些国家因移民涌向少数生产力中心而保持低失业率。
与其将80亿人口挤入少数几个国家,不如在当地法治、基础设施、研发、教育、大学和企业上进行更多投资。成功的国家拥有强烈的社区意识和文化,因此不太可能腐败。
对于某些地方,这是否意味着需要更多的开源投资和本地采购?我认为是的。原则应该是尽可能多地购买本地产品。
我为什么现在要说这些?因为最近大规模裁员的原因并不是人工智能,而是由于美国关税导致的经营成本增加。但没有人会说出这个原因,因为担心报复。
美国的失业影响将逐渐显现,随着美国消费者需求的减少,其他国家也会出现大规模裁员。因此,我只能得出结论,一些经济体与大型企业之间形成的寄生关系是问题所在。你的主要进口不应该是劳动力。要在本地建设,购买本地产品,保持本地发展。但这只有在法治和可控腐败水平的情况下,才能在平均水平上改善生活质量。
也许这意味着要让事情变得更低技术化。大型企业是否在破坏世界的同时,所提供的价值却不如预期?我对此尚未决定。也许只有大型制药公司在全球范围内改善生活质量方面发挥了作用。
当我开始为我的代数引擎 RomiMath 用 TypeScript 实现布赫伯格算法时,我发现了一个令人惊讶的事实:这个被认为是计算代数中最复杂的算法之一,实际上只是纯粹的机械操作。
让我们一步一步地将其简化为易于理解的内容,不做不必要的抽象。
1. 单项式(简单明了)
单项式就是一个项。加法(+)和减法(-)将单项式分开。
示例:25<i>4 + 15</i>x - 2 有 3 个单项式。
在代码中:
```typescript
class Monomial {
coefficient: number; // 例如,5,-2
variables: string[]; // 例如,['x', 'y']
exponents: number[]; // 例如,[2, 1] 表示 x²y
}
```
2. 次数(超级简单)
次数就是指数的总和:
```
3x²y → 次数 = 2 + 1 = 3
5x → 次数 = 1
7 → 次数 = 0
```
3. 词典顺序(比看起来简单)
这就像在字典中排列单词:
```
x > y > z > w
x³ > x²y¹⁰⁰⁰ (因为 3 > 2)
x²y > x²z (因为 y > z)
xy > x (因为它有更多的变量)
```
4. 布赫伯格算法(逐步解析)
步骤 1:取两个多项式
P1: x² + y - 1
P2: x + y² - 2
步骤 2:查看它们的“主项”
```
LT(P1) = x² (因为 x² > y > -1)
LT(P2) = x (因为 x > y² > -2)
```
步骤 3:计算这些项的“最小公倍数”
```
LCM(x², x) = x² (指数的最大值:max(2,1) = 2)
```
步骤 4:进行“智能减法”(S-多项式)
```
S(P1,P2) = (x²/x²)P1 - (x²/x)P2
= (1)(x² + y - 1) - (x)(x + y² - 2)
= (x² + y - 1) - (x² + xy² - 2x)
= -xy² + 2x + y - 1
```
步骤 5:与已有的结果进行简化
```
尝试使用 P1 和 P2 来简化结果
如果不能简化为零 → 新多项式!
```
步骤 6:重复直到没有新项出现
真正的精髓
布赫伯格算法实际上就是:
```
while (还有对) {
1. 取两个多项式
2. 进行它们的“智能减法”
3. 简化结果
4. 如果还有新项,添加到基底
}
```
这并不比跟随食谱复杂。
为什么这很重要
我在 TypeScript 中实现了这个算法,现在它可以在浏览器中在几秒钟内解决 7 个变量的系统。复杂性并不在于理解算法,而在于克服对数学符号的恐惧。
当你将“高级”概念分解为机械操作时,一切都变得可接近。
有没有其他人也有过这样的经历:发现一个“复杂”的概念实际上在分解后变得简单?