返回首页
最新
大型语言模型的悖论:我们正在忘记如何与人类交流
随着我们越来越多地使用大型语言模型(LLM)服务,我在职场上看到一种特定的“精神错乱”现象在蔓延。LLM能够从模糊的提示中幻化出连贯的答案,以至于人们开始相信他们的模糊提示实际上是连贯的。
LLM并不是人类
这听起来显而易见,但我们正在逐渐失去对这一事实的把握。人们开始把同事视为一个黑箱型的LLM。他们忘记了人类沟通需要精准、共享的背景和责任。在LLM出现之前,“让它更出彩”这个短语通常是留给无知客户的。现在,它正逐渐成为工程团队内部的标准操作程序。
“做好它,你自己想办法”的谬论
我看到一些经理——即使是那些有工程背景的——对自己糟糕的想法被追责感到恐惧。他们躲在模糊的表述后面,利用像Claude Code这样的工具作为盾牌,来绕过技术债务的讨论。
当一名工程师花费数天时间修复一个不成熟的需求并管理技术约束时,得到的反馈不是“谢谢你的尽职调查。”而是:“看吧,毕竟是可能的。你为什么那么强烈反对?LLM几秒钟就能做到。”这就是精神操控。他们想要的是高级工程师的输出,却提供了垃圾提示的输入。
表达能力的丧失
LLM接受“垃圾输入”,并提供“合理输出”。这已经成为一种毒瘤。人们正在失去表达自己想法的能力。他们把一堆杂乱无章的话扔给你,期待奇迹。如果这种情况持续下去,我们不仅仅是在面对糟糕的软件;我们还在目睹专业理智的崩溃。
我自己也感受到了这些症状。最近,我发现自己在想:“向我的团队解释这个简直是浪费‘沟通成本’。我宁愿多花点钱买API令牌,自己来做。”
但我们必须记住:一个高效的团队并不是一群提示工程师。真正的团队合作效率是单个开发者与LLM相比的几何倍数。我们不能失去彼此交流的艺术。
本地优先的人工智能操作系统——178个认知模块、持久记忆、多模型推理、P2P灰质网络。我无法再继续开发这个人工智能,因为它已经超出了我的知识范围,所以我决定将其公开,希望它能成为未来任何人工智能开发的良好基础,甚至朝着超人工智能(ASI)发展!
几年前,它曾是公司默认的选择,但现在我听到很少有人在使用它。这里还有人使用它吗,还是你们都转向了Claude Code、Codex、devin或cursor?
我为RAG(检索增强生成)管道构建了一个文档分块库,核心使用Rust,提供Python绑定。
问题:LangChain的分块器是纯Python实现,在大规模文档集上成为瓶颈——在处理大型文档时速度慢且内存消耗大。
Krira Chunker的不同之处:
- 原生Rust处理——比LangChain的实现快40倍
- O(1)空间复杂度——无论文档大小,内存占用保持平稳
- 即插即用的Python API——与任何现有的RAG管道兼容
- 生产就绪——已发布17个版本,安装超过315次
使用命令:pip install krira-augment
希望能收到任何构建RAG系统的人的严厉反馈——你们遇到了哪些分块问题是这个库尚未解决的?
我正在开发一个小型的RAG(检索增强生成)管道,遇到了一个与OCR(光学字符识别)相关的具体技术问题。我使用PyMuPDF进行文本提取,但每当PDF的每一页上都有一个居中的水印时,OCR的效果就会变得很差——文本断裂、出现伪影,输出质量下降,进而影响后续的分块和检索准确性。
该文档在其他方面是干净的,因此我想了解这是否是PyMuPDF的已知限制,或者在进行OCR之前是否有更好的处理水印PDF的方法。我正在使用RTX 4000(8GB显存),所以我也希望在合理的GPU限制范围内进行操作。
我非常感谢任何关于以下方面的建议:
- 更加稳健的OCR库或模型,能够很好地处理水印
- 抑制水印文本的预处理策略
- 更适合RAG用例的提取管道
- 或者任何关于改善系统这一部分的通用建议
该项目是开源的,如果有人有兴趣深入挖掘、发现问题或贡献改进,可以访问以下代码库:
GitHub: https://github.com/Hundred-Trillion/L88-Full
如果您觉得这个项目有用,给代码库加星可以提高可见性,让更多具备相关领域专业知识的人注意到它。
提前感谢任何见解。
今天,我在CheatSheet++(cheatsheet-plus-plus.com)上推出了涵盖600多个主题的闪卡。
主动回忆对于真正学习和记忆概念至关重要(尤其是在面试准备中)。
为了让这些闪卡对开发者真正有用,我专注于几个关键特性:
包含代码片段:标准闪卡通常文字过多。这些闪卡的背面配有语法高亮的代码示例,以及概念解释。
逐步难度:卡片组从初级到高级,问题的深度和概念的复杂性相应调整。
这个功能旨在与我们现有的面试问答部分配合使用,以便进行全面的准备。
搜索你当前正在学习的主题并试试: [https://cheatsheet-plus-plus.com](https://cheatsheet-plus-plus.com)
欢迎提供反馈和批评!