嘿,HN!<p>很久以前,我在 trains.fyi 上制作了一个火车地图,后来意识到没有人购买 planes.fyi - 所以这是我新的地图项目。<p>这个项目包含很多内容,但主要是一个关于特定机场周围飞机的 3D 地图,以及以 3D 和独特方式可视化的天气、ATIS 和其他数据源。<p>和我大多数的作品一样,这个项目并没有什么实际用途,但我觉得它很有趣。如果你喜欢飞机,可以查看 CYYZ/KJFK 的地图、天气和跑道标签 - 我在这些方面投入了最多的精力。<p>此外,任何功能请求、问题、评论等都非常欢迎!
返回首页
最新
我在过去几个月中为一个受监管的环境设计了一个RAG系统。虽然我不是专业开发人员,但我以严格的“系统工程”和审计思维来处理这个项目。
大多数教程仅停留在“LangChain + VectorDB”阶段,但我发现要使这个系统在法律上具有可辩护性并在操作上稳定,需要大约40个以上的额外组件。
我们从一个简单的数据摄取脚本转变为一个“多通道共识引擎”(受六西格玛启发),因为标准的OCR/提取对于我们的用例来说容易出现幻觉。我们必须构建广泛的审计、细化到文档级别的基于角色的访问控制(RBAC),以及混合图形+向量检索,以达到可接受的准确性。
当前的架构包括:
- 数据摄取:4条并行提取通道(视觉、布局、文本、法律),配备一个仅索引由多个来源确认的数据的共识引擎(“所罗门”)。
- 检索:混合Neo4j(图形)+ ChromaDB(向量),采用互惠排名融合。
- 性能:语义缓存(Redis),专门用于相似意义查询(速度提升40倍)。
- 安全性:全面的RBAC、每个提示/检索的审计日志记录,以及个人身份信息(PII)掩码。
我记录了完整的功能列表和差距分析。
我的问题是:
根据这个列表——“稳健的生产工程”和“过度工程”之间的界限在哪里?
对于在金融科技/医疗科技RAG领域工作的人:我在这个列表中还有哪些关键的故障模式是遗漏的?
我刚刚重新制作了我的个人作品集。
嗨,HN,
我在开发一个自托管的媒体服务器时,构建了GhostStream,希望能找到一种简单的方法将视频转码任务卸载到网络上可用的任何硬件上。
GhostStream是一个开源的视频转码服务器,具有以下特点:
- 零配置启动
- 自动检测GPU/编码器(NVENC、QuickSync、AMF、VideoToolbox)
- 实时HLS流媒体、ABR和批处理模式
- 如果硬件编码失败,自动回退到CPU
- 一个小型的HTTP + WebSocket API用于进度更新
它设计为本地运行(无云依赖),并且作为轻量级媒体服务器的侧车运行效果良好。
如果你想快速看到它的工作效果,代码库中包含一个演示,能够从公共视频URL开始转码并自动打开播放:
```python
python examples/demo.py
```
我主要希望获得关于API接口、硬件检测和实际转码边缘案例的反馈。