返回首页
最新
我对《超越善恶》的五个英文翻译进行了句子嵌入分析,以观察自然语言处理(NLP)是否能检测到我作为读者所感受到的每个翻译都像是一本不同的书。
研究发现:
- 霍林代尔的翻译位于语义中心,最接近德文原著(0.806)以及其他所有翻译者。
- 翻译者有独特的“指纹”:UMAP在没有告知翻译者身份的情况下,能够在视觉上将他们分开。
- 短小的格言差异最大,缺乏上下文意味着更多的解释自由。
- 尼采在1901年前的拼写(“Werth”与“Wert”)使模型感到困惑;因此构建了95条规则的标准化器。
该研究使用了MiniLM嵌入、UMAP和Next.js。对这种方法是否适用于其他翻译的哲学文本感到好奇,并欢迎对方法论的反馈。