返回首页
最新
嘿,HN,
我们是Amin和Parsa,兴奋地向大家介绍DataKit,这是一个完全基于浏览器的数据分析平台,让您可以直接在浏览器标签页中处理大型数据集,无需服务器、无需设置,数据也不会离开您的设备。
- GitHub: [https://github.com/datakitpage/datakit](https://github.com/datakitpage/datakit)
- 在线演示: [https://datakit.page](https://datakit.page)
DataKit使用编译为WebAssembly的DuckDB,在客户端完全处理多达数十GB的数据集(CSV、Parquet、JSON、Excel)。您的数据保留在本地浏览器中,默认情况下不会上传到任何地方。
我们对必须在需要上传敏感数据的云工具和繁琐的本地设置之间做出选择感到沮丧,这些本地设置安装和维护起来都很麻烦。我们希望有一个只需在浏览器标签页中就能正常工作的解决方案,同时又具备真正的分析能力。
它的一些核心功能包括:
- 客户端处理大型文件(测试至约20GB),无需后端
- 完整的SQL接口,由DuckDB-WASM提供支持
- 通过Pyodide实现的数据科学工作流的Python笔记本
- 通过代理与远程数据源(Postgres、MotherDuck、S3)的可选连接
- 一个仅能看到模式和元数据的AI助手——从不接触原始数据
许可:DataKit采用AGPL许可,企业使用可提供商业许可证。
在过去几个月中,我们将DataKit作为一个副项目进行开发,非常希望得到您的反馈:
- 您遇到的性能瓶颈
- 您工作流中需要的功能
- 对全客户端架构与混合方法的看法
感谢您关注我们,我们很乐意回答任何问题。
— Amin & Parsa
我们是Carolina Cloud——以约1/3的成本提供托管数据科学基础设施,远低于AWS的费用。
今年早些时候,我离开了我的工作,因为看到许多公司因不需要超大规模复杂性的工作负载而被云账单压垮。以下是我之前工作的一些例子:
- 基本的16 vCPU虚拟机每月$1000
- 高内存实例每月$50000
- 笔记本平台的启动-停止执行每月超过$1000
我们为需要强大计算能力但又不想承受高昂费用的数据科学家和小团队构建了Carolina Cloud。我们的优势在于:如果你正在运行虚拟机、笔记本或RStudio,并且没有深度依赖AWS/Azure/GCP服务生态系统,我们可以为你节省大量费用。
我们提供的服务包括:
- 标准的Ubuntu虚拟机
- 一键式Marimo笔记本
- 一键式RStudio服务器和Shiny托管
- 兼容S3的对象存储(即将推出)
- 最短2周的预付折扣
- 位于北卡罗来纳州夏洛特的SOC2认证、符合HIPAA标准的数据中心
简单的定价:$0.005/vCPU/小时,$0.005/GiB RAM/小时,以及$0.0001/GiB热存储/小时,基于AMD EPYC Turin处理器。一个32 vCPU、128GB RAM的实例每月约$240,而在AWS上则超过$800。
我们并不是想复制每一个AWS服务——如果你需要Lambda + Secrets Manager + S3和预签名URL,还是继续使用AWS吧。但如果你是一个进行回测的对冲基金、一个分析基因组数据的生物科技团队,或者一个只需要强大虚拟机而不想面对意外出站费用的研究人员,我们的价格仅为1/3。
欢迎访问console.carolinacloud.io,乐意回答关于我们基础设施、定价或我们为何认为基于自有硬件的区域云还有发展空间的问题。
我在寻找一款价格实惠的智能手表,最好是可以进行修改的。理想情况下,我只想设置一个自定义的背景图像,并锁定或禁用所有其他智能功能,特别是游戏之类的功能。而且希望价格足够便宜,这样当我的孩子不可避免地弄丢或弄坏它时,我就不会为浪费的钱而感到心痛。