返回首页
一周热榜
问题:在我的代理构建器中,客户可以添加任何MCP源。有些MCP源可能会产生巨大的输出,超过输入上下文长度限制。<p>我正在寻找更聪明的方法来解决这个问题。
嘿,HN,
我们是Amin和Parsa,兴奋地向大家介绍DataKit,这是一个完全基于浏览器的数据分析平台,让您可以直接在浏览器标签页中处理大型数据集,无需服务器、无需设置,数据也不会离开您的设备。
- GitHub: [https://github.com/datakitpage/datakit](https://github.com/datakitpage/datakit)
- 在线演示: [https://datakit.page](https://datakit.page)
DataKit使用编译为WebAssembly的DuckDB,在客户端完全处理多达数十GB的数据集(CSV、Parquet、JSON、Excel)。您的数据保留在本地浏览器中,默认情况下不会上传到任何地方。
我们对必须在需要上传敏感数据的云工具和繁琐的本地设置之间做出选择感到沮丧,这些本地设置安装和维护起来都很麻烦。我们希望有一个只需在浏览器标签页中就能正常工作的解决方案,同时又具备真正的分析能力。
它的一些核心功能包括:
- 客户端处理大型文件(测试至约20GB),无需后端
- 完整的SQL接口,由DuckDB-WASM提供支持
- 通过Pyodide实现的数据科学工作流的Python笔记本
- 通过代理与远程数据源(Postgres、MotherDuck、S3)的可选连接
- 一个仅能看到模式和元数据的AI助手——从不接触原始数据
许可:DataKit采用AGPL许可,企业使用可提供商业许可证。
在过去几个月中,我们将DataKit作为一个副项目进行开发,非常希望得到您的反馈:
- 您遇到的性能瓶颈
- 您工作流中需要的功能
- 对全客户端架构与混合方法的看法
感谢您关注我们,我们很乐意回答任何问题。
— Amin & Parsa