2作者: maxtermed4 个月前原帖
我之前在各处使用大型语言模型(LLM)框架,但对它们内部的运作毫无头绪。一天,我需要优化某些东西,却发现自己无能为力。残酷的事实是:我并不理解基本原理,只知道调用哪个框架的函数。 于是,我剥离了一切。没有抽象层。只有 Python、HTTP 请求和 OpenAI/Anthropic 的 API。 我发现的结果在某种程度上是反高潮的:几乎没有什么东西。 ``` - “AI 代理”只是模型告诉你调用的函数 - “记忆”字面上只是一个你追加并发送回去的列表 - “RAG”是搜索、拼接到提示中,然后发送出去 - “多代理系统”只是按顺序进行的 API 调用 ``` 在那之后,一切都明白了。并不是因为这些模式难以理解。实际上,它们是微不足道的。只是被一层层抽象掩盖,让它们看起来很复杂。 我创建了 7 个模块,展示了基础知识:API 调用、对话状态、工具调用、RAG、流式处理、提示链。每个模块都有大量注释,内容简单明了。并且提供了 Claude 和 GPT 的并排示例,让你可以看到它们在本质上是相同的东西。 现在,当我使用框架时,我实际上知道我是否需要它们,或者只是增加了冗余。 仓库链接: [https://github.com/jmedia65/learn-ai-right](https://github.com/jmedia65/learn-ai-right)