2作者: giulioco6 个月前原帖
我建立了一个社交聆听代理(没错,就像每个人和他们的祖母一样)。在这个过程中,我意识到最有用的部分之一就是找到合适的社区。因此,我开始保存这些社区,现在我大约有7万个。 接着,我添加了语义搜索功能,这样你就可以通过意义来查找社区。随着人们使用这个平台,数据集也在不断增长。 它的工作原理如下: - 免费账户:对已经保存的7万个社区进行语义搜索 - 付费账户:首先进行实时搜索(从来源中进行关键词搜索),然后对更新后的社区数据集进行语义搜索 我还组建了一个代理,能够根据一个网站找到相关的社区。例如: [https://www.pluggo.ai/sites/bloodtrack_au](https://www.pluggo.ai/sites/bloodtrack_au) 目前它覆盖的内容包括: - 子版块(subreddits) - x 社区 - LinkedIn 群组 - Facebook 群组 - Discord 服务器 - Mastodon 服务器 接下来,我希望找到一种方法来添加 Slack 工作区,但除了使用爬虫去寻找 Slack 邀请链接外,我还没有找到好的方法。如果你知道可靠的来源,我非常乐意听取建议。 你有什么建议可以添加其他来源吗?
5作者: Fabeltjeskrant6 个月前原帖
如果我们想要摆脱大型科技公司的控制,并希望信息和讨论能够被分发和复制,为什么我们又回到了使用Usenet?
2作者: sreenathmenon6 个月前原帖
我创建了llmswap来解决我在黑客马拉松中遇到的一个问题——在开发过程中反复测试相同的提示时,消耗大量的API积分。 这是一个简单的Python包,提供了一个统一的接口,支持OpenAI、Anthropic、Google Gemini和本地模型(Ollama),并内置响应缓存,可以将API成本降低50-90%。 主要特点: - 智能缓存,具有TTL和内存限制 - 针对多用户应用的上下文感知缓存 - 当一个服务失败时,自动切换到其他服务 - 零配置——通过环境变量工作 ```python from llmswap import LLMClient client = LLMClient(cache_enabled=True) response = client.query("解释量子计算") # 第二次相同的查询会立即从缓存中返回(免费) ``` 出于安全原因,默认情况下缓存是禁用的。当启用时,它是线程安全的,并为多用户应用提供上下文隔离。 这个项目是从一个黑客马拉松项目的组件构建而成。目前在PyPI上已有2200次下载。希望它能帮助其他人在开发过程中节省API成本。 GitHub: [https://github.com/sreenathmmenon/llmswap](https://github.com/sreenathmmenon/llmswap) PyPI: [https://pypi.org/project/llmswap/](https://pypi.org/project/llmswap/)