1作者: mettamage5 个月前原帖
个人而言,我测试过ChatGPT、Claude、Deepseek和Gemini。除了Gemini,其他的语言模型在某种程度上都显得过于迎合,以至于除了基本问题和编程(Claude)之外几乎无法使用。 Gemini在某种程度上也有迎合的感觉,但根据我的测试,可以说它在保持客观的同时也表现得比较外交。至少在我进行的小规模测试中(Gemini Pro 2.5),它的表现要比其他三个好得多。 你有什么经验?我对这种行为有点厌倦。我没有足够的时间和金钱去测试Grok和其他模型。 至少,当我坚持说2 + 2 = 5时,没有哪个语言模型会妥协。但如果给它们一些真正模棱两可的内容,它们就会屈服于那些最愚蠢/明显/透明的挑战。
2作者: doodyman5 个月前原帖
我创建了Lekh,这是一个极简的写作网站,秉持只写的理念。你可以创建lekh.space/你的名字,设置密码,然后开始写作——无需认证,无需信息流,无需干扰。自动保存;内容以加密形式存储;阅读不是重点(你可以在/你的名字/all查看自己的历史记录)。<p>网站地址:lekh.space<p>代码地址:github.com/swappysh/lekh<p>我希望能收到关于以下方面的反馈: (1) “无法编辑”的限制 (2) 你会尝试的使用场景 (3) 首先需要修复的粗糙之处。我在这里回答问题!