返回首页
最新
嗨,HN!
我一直在开发 AnuDB,这是一款轻量级的嵌入式键值数据库,使用 C++ 编写,专注于简单性、性能和小巧的体积。它现在支持原生 MQTT,允许您通过发布到 MQTT 主题直接写入数据库。
它的设计旨在在嵌入式设备、边缘节点以及任何需要本地持久化而不需要启动完整数据库服务器的地方良好运行。
亮点:
- 基于 MQTT 的数据摄取(通过发布实现零配置的数据库写入)
- 小巧且快速(单一二进制文件,无外部依赖)
- 仅追加的写前日志以确保持久性
- CLI 接口用于直接检查和调试
演示: [https://github.com/hash-anu/AnuDB/blob/main/demo.gif](https://github.com/hash-anu/AnuDB/blob/main/demo.gif)
我想到的用例:
- 离线优先的物联网数据收集
- 嵌入式机器学习工作流中的本地状态存储
- 在远程/低功耗环境中的数据同步
期待您的反馈、用例想法或对下一步优先事项的看法。谢谢!
嘿,HN,
我们是 Chonkie 的开发者,一个强大且易于使用的分块库。去年十一月,我们在 HN 上介绍了 Chonkie OSS(<a href="https://news.ycombinator.com/item?id=42100819">https://news.ycombinator.com/item?id=42100819</a>),并收到了非常棒的反馈。今天,我们很高兴地分享 Chonkie Cloud,这是一个完全托管的分块服务,并推出了新工具,使构建和调试 RAG 系统比以往任何时候都更容易。
---
为了提供一些背景信息:
我们在去年底将 Chonkie 作为一个开源项目推出。几周前,我们决定全职投入这个项目。不幸的是,这一转变并没有我们预期的那么顺利。由于一些法律问题,我们不得不在一个新的代码库中从头开始重建整个项目。
重新开始的过程很糟糕,但这给了我们机会来整理和构建更快、更干净、更好的东西。你可以在这里查看新的代码库:<a href="https://github.com/chonkie-inc/chonkie">https://github.com/chonkie-inc/chonkie</a>
---
我们今天推出的内容:
- **Chonkie Cloud** – 一个完全托管的分块服务。只需发送你的文本,就能获得分块结果。它支持我们所有的分块器,并配有一个可视化 RAG 的游乐场。试试看:<a href="https://chonkie.cloud" rel="nofollow">https://chonkie.cloud</a>(无需信用卡)
- **Chonkie Recipes** – 预定义的分块配置,帮助你快速入门。如果你不确定使用哪些设置,只需在我们的配方中找到最接近的匹配。这些配置适用于递归和延迟分块器。可在这里获取:<a href="https://huggingface.co/datasets/chonkie-ai/recipes" rel="nofollow">https://huggingface.co/datasets/chonkie-ai/recipes</a>
- **Chonkie Vizard** – 一个在开发过程中可视化分块输出的工具。如果你曾经用充满破折号和星号的打印语句进行调试,这个工具就是为你准备的。
安装方法:`pip install "chonkie[viz]"`
示例用法 (1):`viz.print(chunks)` # 在终端打印
示例用法 (2):`viz.save("out.html", chunks)` # 保存以备后用
---
接下来要做的事情:
- 一个代码分块器
- 用于清理和准备数据的文件“厨师”
- 与向量数据库和数据提取工具的集成
- 支持更多语言(TypeScript 是我们列表上的第一位)
---
我们非常希望能收到关于我们正在构建的内容的反馈。如果你有功能请求或想法,请在代码库上提出问题(<a href="https://github.com/chonkie-inc/chonkie">https://github.com/chonkie-inc/chonkie</a>)或在这里评论。
谢谢!