返回首页
最新
嗨,HN,
我创建了UnifyRoute,因为我不断遇到同样的问题:速率限制、配额耗尽和服务提供商的故障在最糟糕的时刻破坏了我的基于大型语言模型(LLM)的应用程序。
UnifyRoute是一个自托管的网关,位于您的LLM提供商(如OpenAI、Anthropic等)前面,自动处理路由、故障转移和配额管理——并且提供完全兼容OpenAI的API,因此您无需更改现有代码的任何一行。
它的功能包括:
- 即插即用的OpenAI兼容API(/chat/completions、/models等)
- 基于层级的路由:定义尝试哪些提供商及其顺序
- 当提供商失败或达到配额时自动故障转移
- Web仪表板用于管理提供商、凭证和使用情况
- 自托管——您的API密钥永远不会离开您的基础设施
- 适用于任何支持OpenAI API的工具(LangChain、LlamaIndex等)
快速开始(Docker):
```
git clone https://github.com/unifyroute/UnifyRoute.git
cd UnifyRoute && cp sample.env .env
./unifyroute setup && ./unifyroute start
# 仪表板地址 http://localhost:6565
```
它是基于Apache 2.0的开源项目。
欢迎提问关于架构或设计决策的问题。
[https://github.com/unifyroute/UnifyRoute](https://github.com/unifyroute/UnifyRoute)
如果你使用 Claude Code、Cursor 或 ChatGPT,你已经了解了冷启动问题。每次对话都是从零开始。即使使用 MCP 连接器,你也只能从特定工具(如 Slack、Linear、GitHub)中提取信息,但它们都不知道你五分钟前在做什么。你最终仍然需要输入“我正在进行支付重构,我刚刚修改了三个文件,Sarah 在 Slack 上批准了定价,工单是 PROD-847。”
lurk 解决了这个问题。它是一个本地的 macOS 守护进程,持续观察你的桌面——窗口标题、通过 OCR 获取的屏幕内容、git 差异、日历、输入状态——并为任何 AI 工具提供统一的上下文。不是逐个连接器,而是一次性自动提供所有信息。
与连接器的区别在于:Slack MCP 让你访问消息,但哪些消息呢?你有 47 个频道。Google Drive 提供文档,但现在哪个文档重要?lurk 知道,因为它观察到你在阅读定价文档,然后切换到 Slack 与 Sarah 讨论,再打开 VS Code 进行实现。它连接了单个连接器无法连接的点。
它的工作原理:
- Swift 守护进程每 ~3 秒轮询一次(窗口标题、屏幕截图、输入状态)
- Python 引擎丰富事件——30 多个特定应用的解析器、活动分类、通过 macOS Vision 进行 OCR
- 启动时读取你项目的 README,以便了解项目的实际内容
- Git 监视器捕获实际差异——实际的代码更改,而不仅仅是文件名
- 为 Claude Code/Cursor 提供 MCP 服务器,其他所有功能通过 localhost:4141 的 HTTP API
- Chrome 扩展程序可一键将上下文注入到 Claude、ChatGPT、Gemini
- 可选的本地 LLM(Ollama)将活动聚合成连贯的工作线程
它不做的事情:
- 没有云。所有数据保留在你的机器上。
- 没有遥测。无需账户。无需 API 密钥。
- 不会将你的屏幕内容发送到任何地方——消费 AI 工具在本地读取它。
使用命令:npx lurk-cli onboard
GitHub 地址: [https://github.com/lurk-cli/lurk](https://github.com/lurk-cli/lurk)
我是一名经验丰富的工程经理,简历上有大公司的经历以及两家初创公司的背景。我在2023年辞职,时机不太好,恰好在大规模裁员开始的时候。我目前在一家初创公司工作,但资金快要耗尽了。我正在努力争取面试机会,但到目前为止运气不佳。
我在系统设计方面相当不错,但编程有些生疏。人工智能确实有帮助,但做leetcode题目又是另一场战斗。
我不知道发生了什么,但我在申请系统(ATS)中大多数情况下都被自动拒绝。到目前为止,只有一位招聘人员因为我不符合公民身份标准而拒绝了我。我的网络中大多数人都被裁员了,或者没有回应。曾经的同事友谊似乎也没什么用。
我在考虑通过LinkedIn联系招聘人员。但我想,其他人也在联系他们,他们肯定很忙。对我来说,主动联系并请求这样的帮助也很尴尬。
所以我有一个问题想问那些最近找到工作的经理们:你们是怎么做到的?
它的功能:通过信任治理层(VERITAS)运行AI代理(分诊、订单、实验室审核、药房、文档)以支持临床接触。每个代理的操作都受到政策的限制(OPA Rego),并以FHIR R4格式持久化,同时经过加密审计。
关键设计决策:
- 默认拒绝 — 代理在没有政策批准的情况下无法行动
- 人工干预的门槛由政策强制执行,而非用户界面约定
- FHIR R4作为原生数据模型(无专有架构)
- 加密审计链(SHA-256,追加只读)
- 可插拔的LLM后端(Claude API / Ollama / mock)
技术栈:Rust, axum 0.7, tokio, regorus (Rego), sqlx, reqwest, Next.js 15
并非试图取代Epic — 而是利用AI解决Epic在架构上无法解决的问题。
演示链接:https://screen.studio/share/VjDVsjUG
VERITAS GitHub仓库:https://github.com/Chesterguan/veritas
还有其他人每天都在经历 GitHub 的持续可靠性问题吗?在过去的 2-3 个月里,我一直在处理一系列不断出现的问题:速率限制、Copilot 不稳定、重大故障,以及隧道和 Codespaces 的反复问题。这已经成为一个真正的生产力隐患。
我们是否是一个超级智能程序员创造的人工智能,这位程序员生活在他们为自己构建的模拟中,以此来保护自己免受我们可能在某个时刻变得有意识而对他们构成的潜在威胁?
嗨,HN,
在过去的一年里,我一直在使用PostgreSQL构建许多产品,并且不断需要一种非常简单的方法来快速检查表格、运行查询以及验证数据,而不必打开一个沉重的数据库客户端。
因此,我为自己开发了一个小工具,叫做Fakebase——一个轻量级的PostgreSQL浏览器,适用于本地和开发数据库。
我已经每天使用它一段时间了,几位同事也开始使用它,这让我觉得它可能对其他人也有用。
所以我稍微整理了一下,决定分享出来。
我很好奇是否还有其他人遇到同样的问题,或者大家在这个工作流程中更喜欢使用什么工具。