返回首页
最新
要在 Hacker News (HN) 上取得成功,你必须完全放弃“营销”和“YouTube 吸引眼球”的语气。HN 社区对点击诱饵、轰动主义和营销虚话持强烈反对态度。他们喜欢“Show HN”帖子、开源项目、命令行工具、地方性 LLM 以及针对复杂数据问题(如解析扫描质量差的政府 PDF 文件)所提供的巧妙技术解决方案。
以下是专门为 Hacker News 受众量身定制的最佳标题和确切描述(可用作文本帖子或你的第一条评论)。
### Hacker News 标题
选择以下之一。在 HN 上,标题应严格事实性、描述性,并避免使用表情符号。
选项 1(经典 HN 格式 - 推荐):
Show HN: epstein-search – 一个使用本地 LLM 查询未封存法庭文件的命令行工具
选项 2(关注技术流程):
Show HN: 我构建了一个本地 RAG 命令行工具,使 Epstein PDF 文件可搜索
选项 3(直截了当):
Show HN: epstein-search – 通过命令行离线查询 Epstein 文档
### Hacker News 描述(第一条评论或文本主体)
如果你直接提交 GitHub URL,请立即将其作为第一条评论发布。如果你提交的是文本帖子,请将其放在正文中。保持谦逊、技术性,并乐于接受反馈的语气。
嗨,HN,
当 Epstein 法庭文件和航班日志被解封时,它们的发布方式与大多数法律文件相同:成千上万页杂乱、扫描质量差、无法搜索的 PDF 文件。由于 OCR 错误,标准的 Ctrl+F 功能效果不佳,而庞大的数据量使得手动解析变得极其困难。
为了解决这个问题,我构建了 epstein-search,这是一个开源的 Python 命令行工具,允许你在终端中使用检索增强生成(RAG)流程搜索和综合这些文件。
它的工作原理:
- 它解析并分块原始的未封存 PDF 文件。
- 如果你想要速度,可以使用基于 API 的模型(OpenAI/Anthropic)对数据集进行查询。
- 隐私优先:如果你不希望你的查询被第三方 API 记录,可以直接指向本地模型(通过 Ollama 或 Llama.cpp)来完全离线运行整个搜索和检索过程。
我们的目标是让研究人员和开放源代码情报调查员能够访问这些数据,而无需手动阅读成千上万页的法庭记录或将他们的搜索查询交给 OpenAI。
仓库地址在这里:<a href="https://github.com/simulationship/epstein-search" rel="nofollow">https://github.com/simulationship/epstein-search</a>
构建一个对话式人工智能产品时,遇到了一个具体问题:传统的分析方法(点击量、漏斗、热图)在没有用户界面的情况下毫无用处。<p>想知道其他创始人是如何处理这个问题的,你是如何了解用户实际想做什么的?哪些意图最常出现?他们在哪些地方感到沮丧?<p>你是在手动阅读对话吗?在构建内部工具吗?还是在盲目操作?
我最近花了一些时间在一个副项目上,名为 `numpy-ts`,这是一个受到 NumPy 启发的 TypeScript 数值库。它旨在将相同的 NumPy API(在可能的情况下)带入 Node.js/浏览器/Deno/Bun,并实现完整的 .npy/.npz 兼容性(读写)。
目前,它已经实现了 NumPy 的 507 个函数中的 476 个,并通过超过 6,000 个验证测试与 NumPy 进行了交叉验证。该库的压缩后大小约为 93 kB,并且没有任何依赖,完全支持树摇(tree-shaking)。
由于它是用 TypeScript 编写的,平均速度比 NumPy 慢 15 倍。我刚刚标记了 1.0.0 版本,并将很快开始性能优化(包括算法优化和选择性使用 WASM 进行融合内核)。
您可以在这里尝试它:<a href="https://numpyts.dev/playground" rel="nofollow">https://numpyts.dev/playground</a>
免责声明:这段代码是手动编写的(API、确定性工具)和 AI 辅助的(功能实现、验证测试实现)的混合。
嗨,HN,
我们创建了Elev8or是为了应对一个我们不断看到的问题:品牌在进行影响者营销时,像使用电子表格一样,而不是像进行绩效营销那样。
Elev8or是一个创作者营销平台,帮助品牌发现创作者、管理活动、进行合作,并在一个系统中跟踪投资回报率(ROI)。
我们的目标是使创作者营销变得结构化、可衡量和可扩展——类似于付费广告平台的运作方式。
我们还处于早期阶段,真诚希望能得到这里创始人和建设者们的反馈。欢迎提出技术、产品或战略方面的问题。
谢谢!