返回首页
最新
我对《超越善恶》的五个英文翻译进行了句子嵌入分析,以观察自然语言处理(NLP)是否能检测到我作为读者所感受到的每个翻译都像是一本不同的书。
研究发现:
- 霍林代尔的翻译位于语义中心,最接近德文原著(0.806)以及其他所有翻译者。
- 翻译者有独特的“指纹”:UMAP在没有告知翻译者身份的情况下,能够在视觉上将他们分开。
- 短小的格言差异最大,缺乏上下文意味着更多的解释自由。
- 尼采在1901年前的拼写(“Werth”与“Wert”)使模型感到困惑;因此构建了95条规则的标准化器。
该研究使用了MiniLM嵌入、UMAP和Next.js。对这种方法是否适用于其他翻译的哲学文本感到好奇,并欢迎对方法论的反馈。
为什么HN没有暗黑模式?
我建立了一个开放标签标准,用于跟踪蘑菇标本在其生命周期中的各个阶段(从孢子/培养到收获)。<p>版本1.1增加了克隆世代的跟踪(与子代/菌株世代不同),并符合JSON-LD标准,以便与农业/科学数据系统实现互操作性。<p>规范(CC 4.0):<a href="https://wemush.com/open-standard/specification" rel="nofollow">https://wemush.com/open-standard/specification</a>
客户端库(Apache 2.0):
Python + CLI:使用命令 pip install wols(也可在GHCR上找到)
TypeScript/JS:使用命令 npm install @wemush/wols<p>背景:真菌学的数据实践存在碎片化问题(物种误识别、栽培日志不一致、缺乏用于跨世代跟踪遗传信息的共享词汇)。这是对此问题的尝试。<p>希望能收到任何从事生物标本跟踪、农业数据系统或真菌学相关工作的人的反馈。