展示HN:一个用于CSV/TSV/Excel/Parquet的三工具ETL管道,使用Go语言编写

1作者: mimixbox8 天前原帖
我创建了一套小型的 Go 工具三部曲: - fileprep — 使用结构体标签进行预处理和验证(如修剪、替换、规范化等) - fileframe — 一个轻量级、不可变的数据框架,用于过滤、映射和分组 - filesql — 直接在 CSV/TSV/LTSV/Excel/Parquet 上运行 SQL(底层使用 SQLite) 代码库: - [fileprep](https://github.com/nao1215/fileprep) - [fileframe](https://github.com/nao1215/fileframe) - [filesql](https://github.com/nao1215/filesql)
查看原文
I built a small trilogy of Go tools:<p>- fileprep — preprocessing &amp; validation using struct tags (trim, replace, normalize, etc.)<p>- fileframe — a lightweight, immutable DataFrame for filtering, mapping, grouping<p>- filesql — run SQL directly on CSV&#x2F;TSV&#x2F;LTSV&#x2F;Excel&#x2F;Parquet (SQLite under the hood)<p>Repos:<p>- <a href="https:&#x2F;&#x2F;github.com&#x2F;nao1215&#x2F;fileprep" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;nao1215&#x2F;fileprep</a><p>- <a href="https:&#x2F;&#x2F;github.com&#x2F;nao1215&#x2F;fileframe" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;nao1215&#x2F;fileframe</a><p>- <a href="https:&#x2F;&#x2F;github.com&#x2F;nao1215&#x2F;filesql" rel="nofollow">https:&#x2F;&#x2F;github.com&#x2F;nao1215&#x2F;filesql</a>