3作者: aminkhorrami2 个月前原帖
大家好!今天我将开源 DataKit。 GitHub: [https://github.com/datakitpage/datakit](https://github.com/datakitpage/datakit) 在线演示: [https://datakit.page](https://datakit.page) DataKit 是一个基于浏览器的数据分析平台,能够完全在客户端处理多达数十GB的文件(CSV、Parquet、JSON、Excel),使用 DuckDB-WASM。您的数据始终保留在浏览器中。 它的功能包括: - 无需服务器处理大型文件(经过测试可支持到 20GB) - 完整的 SQL 接口,由编译为 WebAssembly 的 DuckDB 提供支持 - 通过 Pyodide 提供的数据科学工作流的 Python 笔记本 - 通过可选代理连接到远程数据源(PostgreSQL、MotherDuck、S3) - AI 助手仅查看列架构,而不接触实际数据 我厌倦了在云工具和繁重的本地安装之间做选择。我希望有一个可以在浏览器标签中直接使用,但又具备强大功能的工具。 该项目采用 AGPL 许可证,企业可获得商业许可证。 过去几个月我一直在独自开发这个项目,作为一个副业。我非常希望能听到您对以下方面的反馈: - 您遇到的性能瓶颈 - 您工作流中需要的功能 - 架构决策(完全客户端 vs 混合模式)
1作者: marsw422 个月前原帖
嗨,HN, 我创建了WhatHappened(whathappened.tech),因为我对这个网站有一种爱恨交织的关系。我喜欢这里的内容,但“文字墙”的界面让我感到焦虑。我花了太多时间去点击那些模糊的标题(“项目X”)或在争论中徘徊,只为找到一些技术见解。 我开发这个工具是为了充当过滤器。它为每日热门帖子生成卡片,并具备几个特定功能来减少噪音: 1. AI摘要:为每个帖子生成技术性的简要总结(3个要点)和通俗易懂的版本。 2. 热度计:我分析评论区,以可视化方式展示评论的分布:建设性评论、技术评论和争论。如果某个讨论的90%是争论,我就知道可以跳过(或者准备好爆米花)。 3. 反向检测:为了打破回音室,AI特别寻找评论中点赞最多的不同意见或批评,并将其固定在卡片上。 4. 移动优先的PWA:我主要在手机上阅读HN,因此我将其设计为PWA。它支持滑动手势,并可以在没有应用商店的情况下安装到主屏幕。 技术栈:Next.js、Gemini、Supabase。 目前支持英语和中文。任何反馈都将不胜感激!我的原始X帖子:[https://x.com/marsw42/status/1997087957556318663](https://x.com/marsw42/status/1997087957556318663),如果你喜欢或觉得有帮助,请分享!:D 谢谢!
2作者: sema4hacker2 个月前原帖
我花了太多时间在HN上发表评论。我从来无法预测哪些评论会被点赞,所以我将它们整理成表格,以查看是否有任何趋势: ``` 68分 1条评论 关于马斯克与OpenAI 39分 1条评论 关于私募股权 26分 1条评论 关于Teamshares 24分 1条评论 关于监控 23分 1条评论 关于项目提案 19分 1条评论 关于复杂网页 16分 1条评论 关于消防车效率 15分 2条评论 关于SQLite和电梯费用 13分 2条评论 关于AI编码错误和平衡立方体 12分 2条评论 关于家庭垃圾和我的薪资历史 11分 4条评论 关于研究对象的年龄、拉斯维加斯球体、我的技术历史(2次) 10分 4条评论 关于Waymo、害虫承包商、YouTube十进制、窃贼 9分 11条评论 关于生产力、一个糟糕的评论、监控滥用、TLDR风力涡轮机、机器人捡垃圾、人类记忆、中本聪、AI著作权、糟糕的商业、条形码安全、我的技术历史、Windows Cortana 8分 5条评论 关于SQL、POE交换机、写作质量、节食、我的技术教育 7分 5条评论 关于格式、拟人化AI、AI泡沫、技术就业与收入、Pascal 6分 7条评论 关于能力与可用时间、影响与操控、糟糕的客户服务、Lisa GUI、满意度、推荐书籍、我的薪资历史 5分 6条评论 关于网络提供商、接受信用卡、网页代码、旧文件、机器人捡垃圾、放弃Macintosh 4分 14条评论 关于:项目估算、面向对象编程、AI泡沫、糟糕的摩天大楼、调试、UCSD Pascal、拟人化AI、便宜的卡车、阿司匹林、Unix历史、原始文章年龄、足球中心、服务员、我的技术历史 点数为3或更少的评论太多,无法整理。 ``` 我没有发现主题、点赞数、写作质量等之间有明显的趋势或关联。