返回首页
最新
相关链接:<a href="https://xcancel.com/vmfunc/status/2003292986650853825" rel="nofollow">https://xcancel.com/vmfunc/status/2003292986650853825</a><p><a href="https://old.reddit.com/r/law/comments/1ptlms6/some_epstein_files_can_be_unredacted/" rel="nofollow">https://old.reddit.com/r/law/comments/1ptlms6/some_epstein_files_can_be_unredacted/</a><p><a href="https://krassencast.com/p/breaking-we-just-unredacted-the-epstein" rel="nofollow">https://krassencast.com/p/breaking-we-just-unredacted-the-epstein</a>
嗨,HN,
和很多人一样,我对发布的爱泼斯坦/麦克斯韦法庭文件感到沮丧,因为它们大多数是没有文本层的扫描图像(PDF),这使得无法进行Ctrl+F搜索或程序化分析。
我使用Python、Tesseract和OpenSearch构建了一个处理流程来解决这个问题。
网站: [https://epsteinfilez.com](https://epsteinfilez.com)
技术栈:
- 数据处理:使用ocrmypdf(Tesseract)的Python工作进程对原始文件进行并行OCR处理。
- 搜索:使用OpenSearch对提取的文本进行索引。
- 前端:使用Next.js(SSR)构建用户界面。
- 基础设施:自托管的Docker集群。
功能:
- 在大约15,000页上实现亚秒级全文搜索。
- 在PDF页面上直接高亮搜索词。
- 深度链接到特定页面/文档。
这是一款透明度工具,而非政治工具。我希望让原始的主要来源对研究人员和记者可访问。
欢迎对搜索相关性或索引流程提供反馈!
我曾经为一个每月收入为零的副项目支付200美元的分析费用。然后我花了两个小时尝试在GA4中配置一个简单的漏斗,最终决定自己动手开发一个。
Prysm是我希望存在的工具:
- 实时3D访客位置全球地图(使用Three.js和WebGL着色器)
- 3.8kb的跟踪脚本,远低于GA的45kb——纯JavaScript,无依赖
- 无需使用Cookies/指纹识别——无需同意横幅
- AI聊天功能,回答问题(“为什么流量激增?”)
- 自动时间线:首位客户、收入目标、流量事件
有趣的部分:
- 在处理单页应用(SPA)、离线模式和自定义事件的同时,保持跟踪脚本在200行以内
- 使用GPT-4o-mini处理简单查询,将成本控制在每位客户每月9美元
- 为全球地图构建连接池(最多5个并发连接,以避免压垮Supabase实时服务)
技术栈:Next.js、Supabase、Mapbox、OpenAI
定价:每月9.99–29.99美元,面向独立开发者
目前处于私人测试阶段。是什么让你最终决定从当前的分析工具切换到这个呢?
大家好,我们是Avi、Kiet和Satya。我们正在开发Superset,这是一个开源终端,旨在并行管理多个编码代理(如Claude Code、Codex等)。
- Superset使得创建git工作树和自动设置环境变得简单。
- 代理和终端标签被隔离到工作树中,避免了冲突。
- 内置钩子[0]可以在编码代理完成或需要关注时通知用户。
- 提供差异查看器,快速审查更改并创建PR。
我们三位工程师曾经构建和维护过大型代码库,一直希望能够尽可能并行地处理多个功能。Git工作树[1]是解决这个问题的有效方法,但创建和管理它们却很麻烦。我们开始开发Superset,作为一个利用我们在运行并行代理时发现的最佳实践的工具。
这里有一个演示视频:
<a href="https://www.youtube.com/watch?v=pHJhKFX2S-4" rel="nofollow">https://www.youtube.com/watch?v=pHJhKFX2S-4</a>
我们都在使用Superset来构建Superset,它使我们的生产力提升了两倍多(你可以从自动更新中看出来)。我们有很多朋友在他们选择的IDE上使用它,或者用Superset替代他们的终端,它似乎很受欢迎,因为他们可以继续使用任何CLI代理或工具,而Superset只是增强了他们现有的工具集。
Superset主要使用Typescript编写,基于Electron、xterm.js和node-pty。我们选择xterm+node-pty是因为它是一个在桌面应用中运行真实PTY的可靠方式(被VSCode和Hyper使用),而Electron让我们能够快速发布。
接下来,我们正在探索一些功能,比如在云虚拟机中运行工作树以减轻本地资源负担、代理之间的上下文共享,以及一个顶层编排代理,用于同时管理多个工作树或项目。
在构建这个产品的过程中,我们学到了很多:制作一个好的终端比你想象的要复杂,终端和git的默认设置并不是通用的(如svn与git、奇怪的shell设置、复杂的单体仓库等)。
为自己构建产品的速度更快,也非常有趣。虽然现在还处于早期阶段,但我们希望你能在所有CLI工具和环境中尝试Superset,欢迎你的反馈! :)
[0] <a href="https://code.claude.com/docs/en/hooks" rel="nofollow">https://code.claude.com/docs/en/hooks</a>
[1] <a href="https://git-scm.com/docs/git-worktree" rel="nofollow">https://git-scm.com/docs/git-worktree</a>
大家好,我是安德烈斯。我作为独立创始人一直在构建Kapso,现在已经拥有超过4000名开发者,全部是自然增长的。
WhatsApp拥有超过30亿用户,开放率高达98%。你可能会期待开发者在上面构建大量应用,尤其是在美国,WhatsApp的使用增长最快。
但事实并非如此……我敢打赌,这主要是因为开发体验(DX)非常痛苦。
每个团队都需要一次又一次地构建相同的功能。Meta为所有事情都提供了webhook。里面有宝贵的调试数据,但没有办法理解这些数据,除非你自己构建工具。
这就是我构建Kapso的原因。你将获得:
- 2分钟内即可使用的WhatsApp API和收件箱,而不是几天
- 完整的可观察性:每个webhook都被解析,每条消息都被追踪,实际的调试工具
- 多租户平台:生成设置链接,客户连接他们的Meta账户,完成
- 用于确定性自动化和AI代理的工作流构建器
- WhatsApp流程:使用AI和无服务器函数在WhatsApp内部构建迷你应用
- 适合人类和大型语言模型(LLM)的文档
我们的费用比Twilio便宜95%,并且提供慷慨的免费套餐(每月2000条消息)。
我们还开源了几个工具:一个TypeScript客户端用于WhatsApp云API,一个WhatsApp收件箱的参考实现,以及一个用于WhatsApp的语音AI代理。
GitHub链接:[https://github.com/gokapso](https://github.com/gokapso)
欢迎提问!
[https://kapso.ai](https://kapso.ai)