返回首页
最新
我建立了一个社交聆听代理(没错,就像每个人和他们的祖母一样)。在这个过程中,我意识到最有用的部分之一就是找到合适的社区。因此,我开始保存这些社区,现在我大约有7万个。
接着,我添加了语义搜索功能,这样你就可以通过意义来查找社区。随着人们使用这个平台,数据集也在不断增长。
它的工作原理如下:
- 免费账户:对已经保存的7万个社区进行语义搜索
- 付费账户:首先进行实时搜索(从来源中进行关键词搜索),然后对更新后的社区数据集进行语义搜索
我还组建了一个代理,能够根据一个网站找到相关的社区。例如: [https://www.pluggo.ai/sites/bloodtrack_au](https://www.pluggo.ai/sites/bloodtrack_au)
目前它覆盖的内容包括:
- 子版块(subreddits)
- x 社区
- LinkedIn 群组
- Facebook 群组
- Discord 服务器
- Mastodon 服务器
接下来,我希望找到一种方法来添加 Slack 工作区,但除了使用爬虫去寻找 Slack 邀请链接外,我还没有找到好的方法。如果你知道可靠的来源,我非常乐意听取建议。
你有什么建议可以添加其他来源吗?
如果我们想要摆脱大型科技公司的控制,并希望信息和讨论能够被分发和复制,为什么我们又回到了使用Usenet?
我创建了llmswap来解决我在黑客马拉松中遇到的一个问题——在开发过程中反复测试相同的提示时,消耗大量的API积分。
这是一个简单的Python包,提供了一个统一的接口,支持OpenAI、Anthropic、Google Gemini和本地模型(Ollama),并内置响应缓存,可以将API成本降低50-90%。
主要特点:
- 智能缓存,具有TTL和内存限制
- 针对多用户应用的上下文感知缓存
- 当一个服务失败时,自动切换到其他服务
- 零配置——通过环境变量工作
```python
from llmswap import LLMClient
client = LLMClient(cache_enabled=True)
response = client.query("解释量子计算")
# 第二次相同的查询会立即从缓存中返回(免费)
```
出于安全原因,默认情况下缓存是禁用的。当启用时,它是线程安全的,并为多用户应用提供上下文隔离。
这个项目是从一个黑客马拉松项目的组件构建而成。目前在PyPI上已有2200次下载。希望它能帮助其他人在开发过程中节省API成本。
GitHub: [https://github.com/sreenathmmenon/llmswap](https://github.com/sreenathmmenon/llmswap)
PyPI: [https://pypi.org/project/llmswap/](https://pypi.org/project/llmswap/)