返回首页
最新
嗨,HN,
和很多人一样,我对发布的爱泼斯坦/麦克斯韦法庭文件感到沮丧,因为它们大多数是没有文本层的扫描图像(PDF),这使得无法进行Ctrl+F搜索或程序化分析。
我使用Python、Tesseract和OpenSearch构建了一个处理流程来解决这个问题。
网站: [https://epsteinfilez.com](https://epsteinfilez.com)
技术栈:
- 数据处理:使用ocrmypdf(Tesseract)的Python工作进程对原始文件进行并行OCR处理。
- 搜索:使用OpenSearch对提取的文本进行索引。
- 前端:使用Next.js(SSR)构建用户界面。
- 基础设施:自托管的Docker集群。
功能:
- 在大约15,000页上实现亚秒级全文搜索。
- 在PDF页面上直接高亮搜索词。
- 深度链接到特定页面/文档。
这是一款透明度工具,而非政治工具。我希望让原始的主要来源对研究人员和记者可访问。
欢迎对搜索相关性或索引流程提供反馈!
我曾经为一个每月收入为零的副项目支付200美元的分析费用。然后我花了两个小时尝试在GA4中配置一个简单的漏斗,最终决定自己动手开发一个。
Prysm是我希望存在的工具:
- 实时3D访客位置全球地图(使用Three.js和WebGL着色器)
- 3.8kb的跟踪脚本,远低于GA的45kb——纯JavaScript,无依赖
- 无需使用Cookies/指纹识别——无需同意横幅
- AI聊天功能,回答问题(“为什么流量激增?”)
- 自动时间线:首位客户、收入目标、流量事件
有趣的部分:
- 在处理单页应用(SPA)、离线模式和自定义事件的同时,保持跟踪脚本在200行以内
- 使用GPT-4o-mini处理简单查询,将成本控制在每位客户每月9美元
- 为全球地图构建连接池(最多5个并发连接,以避免压垮Supabase实时服务)
技术栈:Next.js、Supabase、Mapbox、OpenAI
定价:每月9.99–29.99美元,面向独立开发者
目前处于私人测试阶段。是什么让你最终决定从当前的分析工具切换到这个呢?
大家好,我们是Avi、Kiet和Satya。我们正在开发Superset,这是一个开源终端,旨在并行管理多个编码代理(如Claude Code、Codex等)。
- Superset使得创建git工作树和自动设置环境变得简单。
- 代理和终端标签被隔离到工作树中,避免了冲突。
- 内置钩子[0]可以在编码代理完成或需要关注时通知用户。
- 提供差异查看器,快速审查更改并创建PR。
我们三位工程师曾经构建和维护过大型代码库,一直希望能够尽可能并行地处理多个功能。Git工作树[1]是解决这个问题的有效方法,但创建和管理它们却很麻烦。我们开始开发Superset,作为一个利用我们在运行并行代理时发现的最佳实践的工具。
这里有一个演示视频:
<a href="https://www.youtube.com/watch?v=pHJhKFX2S-4" rel="nofollow">https://www.youtube.com/watch?v=pHJhKFX2S-4</a>
我们都在使用Superset来构建Superset,它使我们的生产力提升了两倍多(你可以从自动更新中看出来)。我们有很多朋友在他们选择的IDE上使用它,或者用Superset替代他们的终端,它似乎很受欢迎,因为他们可以继续使用任何CLI代理或工具,而Superset只是增强了他们现有的工具集。
Superset主要使用Typescript编写,基于Electron、xterm.js和node-pty。我们选择xterm+node-pty是因为它是一个在桌面应用中运行真实PTY的可靠方式(被VSCode和Hyper使用),而Electron让我们能够快速发布。
接下来,我们正在探索一些功能,比如在云虚拟机中运行工作树以减轻本地资源负担、代理之间的上下文共享,以及一个顶层编排代理,用于同时管理多个工作树或项目。
在构建这个产品的过程中,我们学到了很多:制作一个好的终端比你想象的要复杂,终端和git的默认设置并不是通用的(如svn与git、奇怪的shell设置、复杂的单体仓库等)。
为自己构建产品的速度更快,也非常有趣。虽然现在还处于早期阶段,但我们希望你能在所有CLI工具和环境中尝试Superset,欢迎你的反馈! :)
[0] <a href="https://code.claude.com/docs/en/hooks" rel="nofollow">https://code.claude.com/docs/en/hooks</a>
[1] <a href="https://git-scm.com/docs/git-worktree" rel="nofollow">https://git-scm.com/docs/git-worktree</a>
大家好,我是安德烈斯。我作为独立创始人一直在构建Kapso,现在已经拥有超过4000名开发者,全部是自然增长的。
WhatsApp拥有超过30亿用户,开放率高达98%。你可能会期待开发者在上面构建大量应用,尤其是在美国,WhatsApp的使用增长最快。
但事实并非如此……我敢打赌,这主要是因为开发体验(DX)非常痛苦。
每个团队都需要一次又一次地构建相同的功能。Meta为所有事情都提供了webhook。里面有宝贵的调试数据,但没有办法理解这些数据,除非你自己构建工具。
这就是我构建Kapso的原因。你将获得:
- 2分钟内即可使用的WhatsApp API和收件箱,而不是几天
- 完整的可观察性:每个webhook都被解析,每条消息都被追踪,实际的调试工具
- 多租户平台:生成设置链接,客户连接他们的Meta账户,完成
- 用于确定性自动化和AI代理的工作流构建器
- WhatsApp流程:使用AI和无服务器函数在WhatsApp内部构建迷你应用
- 适合人类和大型语言模型(LLM)的文档
我们的费用比Twilio便宜95%,并且提供慷慨的免费套餐(每月2000条消息)。
我们还开源了几个工具:一个TypeScript客户端用于WhatsApp云API,一个WhatsApp收件箱的参考实现,以及一个用于WhatsApp的语音AI代理。
GitHub链接:[https://github.com/gokapso](https://github.com/gokapso)
欢迎提问!
[https://kapso.ai](https://kapso.ai)
嗨,HN,
我正在开发Draped,这是一款虚拟试衣产品,旨在帮助人们选择他们已经拥有的服装。
这个想法源于一个简单的问题:人们有衣服,但每天仍然不知道该穿什么。
通过Draped,用户可以:
- 数字化他们的衣橱
- 根据环境(天气、日期、场合)获取搭配建议
- 通过轻量级的虚拟试衣功能预览服装(目前还在早期阶段)
我目前正在快速迭代,并验证用例,以便在扩展之前做好准备。
我非常希望能得到以下方面的反馈:
- 对这个问题本身的看法
- 对虚拟试衣方法的想法
- 任何我应该研究的类似产品
网站: [https://draped.me](https://draped.me)
很高兴回答问题,并分享我在开发过程中的学习。
谢谢!
我开发这个工具是因为在生产环境中运行 yt-dlp(尤其是在无服务器架构或 Vercel 上)是一场关于 IP 封锁、冷启动和二进制依赖的噩梦。
TranscriptAPI 是一个轻量级的封装工具,负责提取、格式化和代理轮换。它优先考虑手动生成的字幕,而非自动生成的,并返回带有时间戳的干净 JSON,便于用于 RAG 流水线。
MCP(模型上下文协议)集成:我最近添加了对 MCP 的原生支持。如果你使用 Claude Desktop 或其他符合 MCP 的代理,可以将此 API 作为工具直接在聊天上下文中“观看”视频,而无需手动复制转录文本。
技术栈:
后端:在 AWS Lambda 上使用 Python(FastAPI)(用于突发扩展)
缓存:Redis(以防止对同一视频进行重复请求)
挑战:处理长直播中的“漂移”时间戳,自动生成的字幕与视频帧失去同步。
它为爱好者提供了免费套餐。我很想知道你们在将完整的 3 小时转录文本输入 LLM 时是如何处理上下文窗口限制的。