返回首页
最新
嗨,HN,我们是Luke和Phillip,我们正在构建Spice.ai OSS——一个轻量级、可移植的数据和AI引擎,基于Apache DataFusion和Ballista,支持SQL查询、混合搜索和在企业如Barracuda Networks和Twilio使用的分散存储中的LLM推理。
我们在2021年首次在HN上介绍了Spice,并在2024年重新推出了从头开始用Rust重建的版本。
Spice包含数据加速器的概念,这是一种从不同来源(如其他数据库)在嵌入式数据库(如SQLite和DuckDB)中物化数据的方法。
今天,我们很高兴地宣布一个新的受Ducklake启发的数据加速器,基于Vortex构建,Vortex是一种高性能、可扩展的列式数据格式,声称随机访问速度比Apache Parquet快100倍,扫描速度快10-20倍,写入速度快5倍,同时具有相似的压缩比。
在我们的Spice测试中,Vortex的性能比DuckDB更快,内存使用量仅为其三分之一,并且具有更好的可扩展性(支持多文件)。在实际部署中,我们发现DuckDB数据加速器通常在1TB左右达到上限,而Spice Cayenne可以支持PB级别的规模。
您可以在<a href="https://spice.ai/blog" rel="nofollow">https://spice.ai/blog</a>和Spice OSS发布说明中阅读更多信息。
这只是第一个版本,我们非常希望听到您的反馈!
GitHub: <a href="https://github.com/spiceai/spiceai" rel="nofollow">https://github.com/spiceai/spiceai</a>
[1] <a href="https://news.ycombinator.com/item?id=28448887">https://news.ycombinator.com/item?id=28448887</a>
[2] <a href="https://news.ycombinator.com/item?id=39854584">https://news.ycombinator.com/item?id=39854584</a>
[3] <a href="https://github.com/vortex-data/vortex" rel="nofollow">https://github.com/vortex-data/vortex</a>
[4] <a href="https://spiceai.org/blog/releases/v1.9.0" rel="nofollow">https://spiceai.org/blog/releases/v1.9.0</a>
我需要在一个 Node.js 应用中生成发票。jsPDF 的体积为 229KB,而我只需要文本、矩形、线条和 JPEG 图像。
所以我写了 tinypdf:少于 400 行的 TypeScript,零依赖,压缩后仅 3.3KB。
它的功能:
- 文本(Helvetica 字体、颜色、对齐方式)
- 矩形和线条
- JPEG 图像
- 多页,自定义尺寸
它不支持的功能:
- 自定义字体、PNG/SVG、表单、加密、HTML 转 PDF
就这些。这涵盖了发票、收据、报告、票据和标签的 95% 使用场景。
GitHub: https://github.com/Lulzx/tinypdf
npm: npm install tinypdf
许多人参加会议是为了展示自己的工作、与志同道合的人建立联系,并可能寻找新的机会。<p>从一些会议组织者的随意评论中可以看出,他们的工作存在一定的风险,并且可能得不到应有的回报。他们可能面临以下不愉快的情况:
* 一位演讲者因其发布或言论而被取消。
* 不良人士违反行为准则。
* 会议组织者因拒绝某位演讲者的提案而遭受口头辱骂和死亡威胁。
* 与金钱相关的任何问题。<p>会议组织者还面临哪些其他困难呢?
大多数创业建议乍一看似乎都很合理。“找到一个问题。” “解决自己的痛点。” “构建人们想要的东西。”
我遵循了这些建议,但仍然看到聪明的创始人,包括我自己,花了几个月时间构建的东西悄无声息地失败了。
这种矛盾让我感到困扰,因此我开始深入研究。我阅读了失败的事后分析、无果的产品发布、被遗弃的GitHub仓库,以及长长的Hacker News讨论串,里面的人们解释了为什么放弃某个想法。
经过一段时间,我发现了一个模式。问题不在于人们缺乏想法,而在于我们用讲故事的逻辑来评估想法,而不是用生存的逻辑。
我们选择那些听起来有趣、感觉雄心勃勃或在推介中看起来不错的想法,但一旦遇到现实世界的行为就会崩溃。
大多数想法失败的原因不是竞争或执行,而是它们并没有替代任何紧迫的需求。
它们无法与现有的习惯、重复的成本或某人已经在使用的痛苦的变通方法相匹配。
当你问一些简单的问题,比如谁在付费、他们在采用这个想法时停止做什么,以及为什么是现在,大多数想法很快就会崩溃。
为了避免重复这个错误,我开始将想法写成假设,而不是灵感。
每个想法都必须经受几个不舒服的问题:这个想法替代了什么现有行为、在前30天内会导致它失败的因素是什么,以及什么是可以证明或反驳需求的最小实验。
大多数想法立即失败。少数想法的存活时间超过了预期。
随着时间的推移,这变成了一个私人数据库,我用它来避免在弱想法上浪费数月时间。这不是一个“伟大想法”的集合。
它是经过严格筛选后存活下来的想法的记录,还有许多没有存活的想法。最终,我将其整理成一个其他人可以浏览的东西,现在称为startupideasdb.com(可以搜索一下),主要是因为我一直希望早些时候就有这样的东西。
如果你在选择构建什么时感到困惑,或者厌倦了那些悄然死去的聪明想法,这可能会为你节省一些时间。
如果你不同意这个框架,我真心希望了解它的缺陷,Hacker News通常能比其他地方更快发现问题。
我感觉在阅读HN时,有一种假设是所有程序员默认都在从事网页相关的工作(前端/后端)。我很想了解除了这些之外还有哪些其他的工作/领域,以及从事非网页相关工作是什么样的。