返回首页
最新
嗨,HN,我创建了VectorVid,因为我多次看到团队将Whisper和向量数据库结合在一起,以便在网络研讨会和演示中进行搜索。
问题是:你有超过100小时的视频。你想为RAG(检索增强生成)进行索引。但是流程很混乱——转录、帧采样、OCR、分块、嵌入,然后再接入你自己的向量数据库。
VectorVid只做一件事:将视频转换为RAG准备好的JSON格式。
输入:视频URL(网络研讨会、讲座、演示)
输出:{ chunks: [{ start_sec, end_sec, text, scene_description, ocr_text, embedding }] }
它是如何工作的:
- 转录 + 说话者分离(Whisper/Deepgram)
- 帧采样(每5秒1帧) + OCR(EasyOCR/Claude)
- 提供视觉上下文的场景描述
- 包含嵌入(OpenAI)
MVP是一个实时演示——你可以在2007年iPhone发布会上进行搜索,并查看确切的JSON API输出。
技术:Next.js前端、异步处理、Supabase pgvector,部署在Vercel上。
我看到的用例包括:
- SaaS团队:“搜索我们的帮助视频” → 强化内部搜索/聊天
- 教育科技:“学生找到特定幻灯片” → 直接跳转到图表
- 销售:“定价幻灯片出现了吗?” → 自动化演示审核
希望得到早期反馈。试试这个演示,告诉我你会在此基础上构建什么。
很高兴与大家分享我的新年项目。
很长一段时间以来,我一直想将H-1B数据直接集成到Levels.fyi中。每次我去其他地方寻找这些数据时,使用体验都令人沮丧。大多数H-1B网站感觉过时、不够直观、广告杂乱,或者使用起来让人感到压倒。数据虽然存在,但并不可用,探索起来也绝对不愉快。
因此,出于这种挫败感,我决定构建我个人想要使用的H-1B数据体验,直接集成到Levels.fyi中。
一些我很兴奋的页面:
工资热图: [https://www.levels.fyi/h1b/map/wages/](https://www.levels.fyi/h1b/map/wages/)
公司H-1B足迹: [https://www.levels.fyi/h1b/map/company/](https://www.levels.fyi/h1b/map/company/)
最高薪资的H-1B职位: [https://www.levels.fyi/h1b/jobs/](https://www.levels.fyi/h1b/jobs/)
H-1B热门城市: [https://www.levels.fyi/h1b/city/](https://www.levels.fyi/h1b/city/)
顶级公司赞助商: [https://www.levels.fyi/h1b/sponsors/](https://www.levels.fyi/h1b/sponsors/)
欢迎任何反馈,这绝对仍在不断完善中。
我经常有5到10分钟的空档。这段时间太容易被浪费了。<p>你喜欢在这些时间段做些什么?<p>例如,学习一项新技能,稍微提高某项能力,阅读高质量的内容。<p>编辑说明:我并不是指手机相关的活动!
我意识到我在LinkedIn上有一批不错的联系人,想在今年对他们进行分类并联系。当我尝试下载我的所有数据时,我发现95%的联系人没有电子邮件地址。因此,我决定逐个查看每个个人资料,查看联系信息,获取电子邮件并填写我的电子表格。在花了一个小时后,我获得了大约200个联系人,但我收到了警告,提示我正在使用自动化工具,并需要点击确认不再使用自动化工具。然而,我根本没有使用任何自动化工具,我只是手动提取我自己联系人列表中可用的电子邮件。有没有其他人遇到过这种情况?有什么解决方案吗?
嗨,HN,
我发现自己在浏览科技新闻和RSS源时浪费了太多时间,扫描数百个标题,只为找到3到4个对我的工作真正有意义的内容。
为了解决这个问题,我构建了一个自托管的自动化工作流程,使用n8n作为个人编辑器。
架构:
获取:每天早上提取RSS源(如TechCrunch、Hacker News等)。
过滤(代理):将标题传递给GPT-4o-mini,并使用系统提示“充当高级编辑”。它根据特定兴趣(例如,“对本地LLM高度关注”,“对加密八卦兴趣低”)对每篇文章进行0-10的评分。
逻辑:丢弃任何得分低于7的内容。
研究:使用Tavily API抓取并总结高评分文章的完整内容。
交付:通过SMTP发送一封简洁的邮件摘要。
最难的部分(SSE和超时):最大的技术难题是处理超时。由于AI研究步骤需要时间,HTTP请求经常会中断。我不得不配置服务器推送事件(SSE)并调整Node.js中的执行超时环境变量,以保持在深入研究阶段的连接活跃。
资源:
工作流程/源代码(JSON):[https://github.com/sojojp-hue/NewsSummarizer/tree/main](https://github.com/sojojp-hue/NewsSummarizer/tree/main)
视频演示与示范:[https://youtu.be/mOnbK6DuFhc](https://youtu.be/mOnbK6DuFhc)
我很想听听其他人是如何应对信息过载的,或者是否有更好的方法来处理AI代理的长轮询。
Traceformer.io 是一个网络应用程序,可以导入 KiCad 项目或 Altium 网表以及相关的数据手册,从而实现基于大语言模型(LLM)的电路图审核。该系统旨在识别传统电气规则检查(ERC)工具无法检测到的基于数据手册的电路图问题。
自我们首次推出(前身为 Netlist.io)以来,我们进行了以下重大改进:
- 通过开源插件实现完整的 KiCad 项目解析
- 采用通行 API 定价,并收取少量平台费用
- 自动获取数据手册
- ERC/DRC 风格的审核用户界面
- 改进的审核工作流程,支持选择前沿模型(如 GPT 5.2、Opus 4.5 等)
- 可配置的审核参数(令牌限制、设计规则和并行审核)
此外,我们继续提供免费计划,让您在订阅之前评估设计。我们期待听到您的反馈!