3作者: navid_rezadoost大约 1 个月前原帖
我正在开发一个名为 SVGER 的开源命令行工具,它可以将 SVG 文件转换为可直接使用的组件,支持 React、Vue 3、Angular、Svelte、Solid 以及其他多个框架,且完全支持 TypeScript,并具备树摇优化导出功能。 它的独特之处在于: - 零运行时依赖 – 安装迅速,无捆绑膨胀,高安全性 - 内置优化器,通常能生成比 SVGO 更小的 SVG(自定义树状清理、路径简化、变换合并、形状转换) - 在 600 多个图标的实际基准测试中:总耗时约 30 秒,每个文件约 50 毫秒,吞吐量为 20 个文件/秒 – 比 SVGR 快 52%,比 SVGO 快 33%,同时进行优化和组件生成 - 插件系统(已包含渐变优化器、笔画标准化器等) - 在 CI 中自动化视觉回归测试,以确保输出的像素完美 - 支持并行处理,易于与 Vite、Webpack、Next.js 等集成 该工具旨在适用于从小型副项目到大型设计系统和企业单体仓库的各种场景。 非常希望听到 HN 社区的反馈 – 无论是星标、问题,还是对改进方向的想法。 在线实时基准测试链接:https://faezemohades.github.io/svger-cli/ 谢谢!
1作者: soroucsh大约 1 个月前原帖
嗨,HN,我创建了VectorVid,因为我多次看到团队将Whisper和向量数据库结合在一起,以便在网络研讨会和演示中进行搜索。 问题是:你有超过100小时的视频。你想为RAG(检索增强生成)进行索引。但是流程很混乱——转录、帧采样、OCR、分块、嵌入,然后再接入你自己的向量数据库。 VectorVid只做一件事:将视频转换为RAG准备好的JSON格式。 输入:视频URL(网络研讨会、讲座、演示) 输出:{ chunks: [{ start_sec, end_sec, text, scene_description, ocr_text, embedding }] } 它是如何工作的: - 转录 + 说话者分离(Whisper/Deepgram) - 帧采样(每5秒1帧) + OCR(EasyOCR/Claude) - 提供视觉上下文的场景描述 - 包含嵌入(OpenAI) MVP是一个实时演示——你可以在2007年iPhone发布会上进行搜索,并查看确切的JSON API输出。 技术:Next.js前端、异步处理、Supabase pgvector,部署在Vercel上。 我看到的用例包括: - SaaS团队:“搜索我们的帮助视频” → 强化内部搜索/聊天 - 教育科技:“学生找到特定幻灯片” → 直接跳转到图表 - 销售:“定价幻灯片出现了吗?” → 自动化演示审核 希望得到早期反馈。试试这个演示,告诉我你会在此基础上构建什么。