1作者: soroucsh大约 1 个月前原帖
嗨,HN,我创建了VectorVid,因为我多次看到团队将Whisper和向量数据库结合在一起,以便在网络研讨会和演示中进行搜索。 问题是:你有超过100小时的视频。你想为RAG(检索增强生成)进行索引。但是流程很混乱——转录、帧采样、OCR、分块、嵌入,然后再接入你自己的向量数据库。 VectorVid只做一件事:将视频转换为RAG准备好的JSON格式。 输入:视频URL(网络研讨会、讲座、演示) 输出:{ chunks: [{ start_sec, end_sec, text, scene_description, ocr_text, embedding }] } 它是如何工作的: - 转录 + 说话者分离(Whisper/Deepgram) - 帧采样(每5秒1帧) + OCR(EasyOCR/Claude) - 提供视觉上下文的场景描述 - 包含嵌入(OpenAI) MVP是一个实时演示——你可以在2007年iPhone发布会上进行搜索,并查看确切的JSON API输出。 技术:Next.js前端、异步处理、Supabase pgvector,部署在Vercel上。 我看到的用例包括: - SaaS团队:“搜索我们的帮助视频” → 强化内部搜索/聊天 - 教育科技:“学生找到特定幻灯片” → 直接跳转到图表 - 销售:“定价幻灯片出现了吗?” → 自动化演示审核 希望得到早期反馈。试试这个演示,告诉我你会在此基础上构建什么。
3作者: zuhayeer大约 1 个月前原帖
很高兴与大家分享我的新年项目。 很长一段时间以来,我一直想将H-1B数据直接集成到Levels.fyi中。每次我去其他地方寻找这些数据时,使用体验都令人沮丧。大多数H-1B网站感觉过时、不够直观、广告杂乱,或者使用起来让人感到压倒。数据虽然存在,但并不可用,探索起来也绝对不愉快。 因此,出于这种挫败感,我决定构建我个人想要使用的H-1B数据体验,直接集成到Levels.fyi中。 一些我很兴奋的页面: 工资热图: [https://www.levels.fyi/h1b/map/wages/](https://www.levels.fyi/h1b/map/wages/) 公司H-1B足迹: [https://www.levels.fyi/h1b/map/company/](https://www.levels.fyi/h1b/map/company/) 最高薪资的H-1B职位: [https://www.levels.fyi/h1b/jobs/](https://www.levels.fyi/h1b/jobs/) H-1B热门城市: [https://www.levels.fyi/h1b/city/](https://www.levels.fyi/h1b/city/) 顶级公司赞助商: [https://www.levels.fyi/h1b/sponsors/](https://www.levels.fyi/h1b/sponsors/) 欢迎任何反馈,这绝对仍在不断完善中。
3作者: pea大约 1 个月前原帖
我经常有5到10分钟的空档。这段时间太容易被浪费了。<p>你喜欢在这些时间段做些什么?<p>例如,学习一项新技能,稍微提高某项能力,阅读高质量的内容。<p>编辑说明:我并不是指手机相关的活动!
8作者: jeffkumar大约 1 个月前原帖
我意识到我在LinkedIn上有一批不错的联系人,想在今年对他们进行分类并联系。当我尝试下载我的所有数据时,我发现95%的联系人没有电子邮件地址。因此,我决定逐个查看每个个人资料,查看联系信息,获取电子邮件并填写我的电子表格。在花了一个小时后,我获得了大约200个联系人,但我收到了警告,提示我正在使用自动化工具,并需要点击确认不再使用自动化工具。然而,我根本没有使用任何自动化工具,我只是手动提取我自己联系人列表中可用的电子邮件。有没有其他人遇到过这种情况?有什么解决方案吗?
1作者: practicalaifg大约 1 个月前原帖
嗨,HN, 我发现自己在浏览科技新闻和RSS源时浪费了太多时间,扫描数百个标题,只为找到3到4个对我的工作真正有意义的内容。 为了解决这个问题,我构建了一个自托管的自动化工作流程,使用n8n作为个人编辑器。 架构: 获取:每天早上提取RSS源(如TechCrunch、Hacker News等)。 过滤(代理):将标题传递给GPT-4o-mini,并使用系统提示“充当高级编辑”。它根据特定兴趣(例如,“对本地LLM高度关注”,“对加密八卦兴趣低”)对每篇文章进行0-10的评分。 逻辑:丢弃任何得分低于7的内容。 研究:使用Tavily API抓取并总结高评分文章的完整内容。 交付:通过SMTP发送一封简洁的邮件摘要。 最难的部分(SSE和超时):最大的技术难题是处理超时。由于AI研究步骤需要时间,HTTP请求经常会中断。我不得不配置服务器推送事件(SSE)并调整Node.js中的执行超时环境变量,以保持在深入研究阶段的连接活跃。 资源: 工作流程/源代码(JSON):[https://github.com/sojojp-hue/NewsSummarizer/tree/main](https://github.com/sojojp-hue/NewsSummarizer/tree/main) 视频演示与示范:[https://youtu.be/mOnbK6DuFhc](https://youtu.be/mOnbK6DuFhc) 我很想听听其他人是如何应对信息过载的,或者是否有更好的方法来处理AI代理的长轮询。
4作者: wafflesfreak大约 1 个月前原帖
Traceformer.io 是一个网络应用程序,可以导入 KiCad 项目或 Altium 网表以及相关的数据手册,从而实现基于大语言模型(LLM)的电路图审核。该系统旨在识别传统电气规则检查(ERC)工具无法检测到的基于数据手册的电路图问题。 自我们首次推出(前身为 Netlist.io)以来,我们进行了以下重大改进: - 通过开源插件实现完整的 KiCad 项目解析 - 采用通行 API 定价,并收取少量平台费用 - 自动获取数据手册 - ERC/DRC 风格的审核用户界面 - 改进的审核工作流程,支持选择前沿模型(如 GPT 5.2、Opus 4.5 等) - 可配置的审核参数(令牌限制、设计规则和并行审核) 此外,我们继续提供免费计划,让您在订阅之前评估设计。我们期待听到您的反馈!