DuckDB 表格可视化演示,展示了“浏览器中的 Iceberg”演示(<a href="https://duckdb.org/2025/12/16/iceberg-in-the-browser" rel="nofollow">https://duckdb.org/2025/12/16/iceberg-in-the-browser</a>)
返回首页
最新
嗨,HN,
我在2016年底为三星Tizen操作系统应用比赛构建了Drawize的第一个版本。我在不到4周的时间里完成了整个项目(包括实时多人游戏引擎)。
在比赛中它并没有获奖。
由于它是用网络技术构建的,我在2017年初将其发布在开放网络上,只是想看看会发生什么。它开始独立发展,今天——8年后——数据库处理了第1亿幅画作。
在最繁忙的日子里,活跃用户超过3万,目前存储的1亿幅画作大约占用3.16 TB的空间。
里程碑时刻:今天我在观看实时日志时,心里忐忑不安,担心第1亿幅画作会是成人内容。幸运的是,随机数生成的神灵眷顾了我,结果是一只红气球(你可以在这里查看第1亿幅画作:<a href="https://www.drawize.com/blog/100-million-drawings-milestone" rel="nofollow">https://www.drawize.com/blog/100-million-drawings-milestone</a>)。
技术栈(虽然无聊但快速):
后端:.NET + WebSockets(实时同步)
前端:手写HTML/JS + jQuery(没有React,没有打包工具)
数据:PostgreSQL和MongoDB
存储:Wasabi Cloud(为了节省S3费用而迁移到这里)
作为独立开发者的扩展:实时大厅 + 重新连接的边缘案例 + 内容审核/过滤。我使用2021年训练的内容分类模型来过滤不良内容,实时多人游戏部分主要是高度优化的.NET代码。
很高兴回答关于“失败”的Tizen起源、网络上的实时多人游戏、内容审核或.NET如何处理负载的问题。
嗨,HN!我是Artie的一名工程师,我们专注于实时数据复制。
我们正在将MotherDuck添加为目标,最初的版本直接使用了DuckDB的Go驱动。它在我的机器上运行得很好……直到我们将其接入我们的Transfer服务([https://github.com/artie-labs/transfer](https://github.com/artie-labs/transfer))。
由于该驱动需要CGO,我们的amd64和arm64的交叉编译开始失败,我们失去了轻松的静态二进制文件,并且我们的Docker镜像不得不引入C工具链和系统库,仅仅是为了支持一个依赖。我们尝试将CGO部分隔离到一个单独的模块,但这仍然导致CI失败,并迫使我们重写构建管道的部分内容。那时我们清楚地意识到,我们不希望CGO出现在我们的主要服务中。
因此,我构建了ducktape:一个小型独立的微服务,它通过HTTP/2流封装了DuckDB的Appender API。客户端通过HTTP/2流传输NDJSON,ducktape则直接将数据追加到另一端的DuckDB中。主代码库中没有CGO,我们保持了跨平台的纯Go构建方式。
在基准测试中,开销出乎意料地低:HTTP/2下约757 MiB/sec,而进程内约848 MiB/sec——大约是原生性能的90%,但通过网络传输。
ducktape是开源的,采用MIT许可证:[https://github.com/artie-labs/ducktape](https://github.com/artie-labs/ducktape)
我非常希望得到反馈,特别是如果你在CGO隔离方面有不同的处理方式或有想法可以进一步提升性能!
我正在构建一个包装器,查询 GPT-4、Claude 和 Gemini,然后在沙盒中执行它们的代码,以捕捉幻觉。<p>你觉得延迟(30秒)值得这种确定性吗?还是你更喜欢速度?<p>今天我正在为一些人进行手动测试,如果有人想试试的话。
嗨,HN,我是作者。
我创建了CommerceTXT,因为我厌倦了从HTML中提取定价和库存数据的脆弱性。目前,AI代理在解析一个产品页面时大约浪费了8000个token,却常常产生幻觉,错误地给出价格或忽略“缺货”的事实。
CommerceTXT是一种严格的只读文本协议(CC0公共领域),旨在为代理提供确定性的真实数据。可以将其视为`robots.txt` + `llms.txt`,但专门为交易结构化。
v1.0的关键技术决策:
1. *分形架构:* 根目录 -> 类别 -> 产品文件。代理只获取所需的数据(节省带宽/ token)。
2. *严格只读:* v1.0故意排除了交易/操作,以避免安全隐患。它纯粹是上下文。
3. *Token效率:* 一个典型的产品定义大约为380个token,而HTML等效物则为约8500个token。
4. *反幻觉:* 包含如@INVENTORY(带时间戳)和@REVIEWS(带验证来源)的指令。
规范已上线并开放。我非常希望能听到您对指令结构的反馈,尤其是我们正在探索的“信任与验证”概念。
规范链接: [https://github.com/commercetxt/commercetxt](https://github.com/commercetxt/commercetxt)
网站链接: [https://commercetxt.org](https://commercetxt.org)