返回首页

一周热榜

2作者: smoovb6 天前原帖
首先,我不是开发者——但我是一位非常技术型的、超过50岁的产品经理和企业家。<p>这个项目在Claude Code推出不久后便开始了。我之前已经参与了几个其他的AI编码项目,决定看看自己能在端到端的过程中走多远。虽然我得到了开发者的帮助,但我逐渐感到自己能够承担更多的工作。因此,这个项目经过大约9个月的筹备,过去两个月我全职投入其中。<p>技术栈:<p>Postgres,Render上的Next.js。一个包含前端和后端服务的单体仓库。<p>使用Claude Code进行这个项目的一些收获:<p>- 我直接在前端JavaScript中构建了所有项目页面,使用了模拟数据——没有使用Figma或其他布局工具。<p>- 在早期阶段,项目范围失控;我很快意识到,Claude往往会过度构建,除非有严格的限制。<p>- 起初,我使用Claude Desktop来优化Claude Code的提示。<p>- 我对Git、SQL、Docker以及本地/远程环境的技能起初不太扎实,但现在已经不再是问题。<p>- 使用Flowbite CSS节省了很多麻烦,使我能够快速制作出相对高质量的设计。<p>- 细节的把控一直依赖于推动他人,而现在这个责任完全落在我身上。<p>- 大约六个月后,我采用了功能核心与命令外壳的方法,并在claude.md中进行了文档记录(灵感来源于这篇HN帖子:<a href="https://news.ycombinator.com/item?id=45701901">https://news.ycombinator.com/item?id=45701901</a>)。<p>- 在花时间制定详细的待办事项规范并遵循上述方法后,我在一天内构建了一个类似Airbnb的推荐程序。<p>Jetogo的功能:<p>- 为您提供长期的数据专用eSIM,用于移动数据。<p>Jetogo的目的:<p>- 节省旅行漫游数据费用。<p>- 供次要设备使用(例如,孩子的iPad、笔记本电脑或备用连接)。<p>我们构建的功能:<p>- 解析CDR使用数据以准确计算用户账单。<p>- 使用Stripe实施按需付费和订阅选项。<p>- 订阅支持滚存和超额使用,在每个账单周期结束时应用。<p>- 构建推荐、奖励和优惠券程序。<p>- 在单一账户下聚合多个eSIM的使用情况,并呈现统一的总计。<p>现已上线:<a href="https://jetogo.com" rel="nofollow">https://jetogo.com</a>
2作者: 2dogsanerd4 天前原帖
我在过去几个月中为一个受监管的环境设计了一个RAG系统。虽然我不是专业开发人员,但我以严格的“系统工程”和审计思维来处理这个项目。 大多数教程仅停留在“LangChain + VectorDB”阶段,但我发现要使这个系统在法律上具有可辩护性并在操作上稳定,需要大约40个以上的额外组件。 我们从一个简单的数据摄取脚本转变为一个“多通道共识引擎”(受六西格玛启发),因为标准的OCR/提取对于我们的用例来说容易出现幻觉。我们必须构建广泛的审计、细化到文档级别的基于角色的访问控制(RBAC),以及混合图形+向量检索,以达到可接受的准确性。 当前的架构包括: - 数据摄取:4条并行提取通道(视觉、布局、文本、法律),配备一个仅索引由多个来源确认的数据的共识引擎(“所罗门”)。 - 检索:混合Neo4j(图形)+ ChromaDB(向量),采用互惠排名融合。 - 性能:语义缓存(Redis),专门用于相似意义查询(速度提升40倍)。 - 安全性:全面的RBAC、每个提示/检索的审计日志记录,以及个人身份信息(PII)掩码。 我记录了完整的功能列表和差距分析。 我的问题是: 根据这个列表——“稳健的生产工程”和“过度工程”之间的界限在哪里? 对于在金融科技/医疗科技RAG领域工作的人:我在这个列表中还有哪些关键的故障模式是遗漏的?
2作者: BleedingXiko4 天前原帖
嗨,HN, 我在开发一个自托管的媒体服务器时,构建了GhostStream,希望能找到一种简单的方法将视频转码任务卸载到网络上可用的任何硬件上。 GhostStream是一个开源的视频转码服务器,具有以下特点: - 零配置启动 - 自动检测GPU/编码器(NVENC、QuickSync、AMF、VideoToolbox) - 实时HLS流媒体、ABR和批处理模式 - 如果硬件编码失败,自动回退到CPU - 一个小型的HTTP + WebSocket API用于进度更新 它设计为本地运行(无云依赖),并且作为轻量级媒体服务器的侧车运行效果良好。 如果你想快速看到它的工作效果,代码库中包含一个演示,能够从公共视频URL开始转码并自动打开播放: ```python python examples/demo.py ``` 我主要希望获得关于API接口、硬件检测和实际转码边缘案例的反馈。
2作者: vood7 天前原帖
我买了 Pixel 10 Pro,想在上面运行鹦鹉(parakeet)或耳语(whisper)模型进行语音转文本。我正在开发一个人工智能听写应用(aidictation.com)。我在寻找在设备上运行这个模型的方法时遇到了困难。不得不使用 groq API,这并不是最理想的选择。<p>有什么建议吗?
2作者: calebevans6 天前原帖
Cordon使用变换器嵌入和密度评分来识别日志文件中语义上独特的内容,过滤掉重复的噪声。 核心观点:一个关键错误重复出现1000次是“正常的”(语义上密集)。而一个奇怪的偶发事件则是异常的(语义上孤立)。 输出带有异常评分的XML标记块。旨在减少大型日志,作为LLM分析的预处理形式。 架构:<a href="https://github.com/calebevans/cordon/blob/main/docs/architecture.md" rel="nofollow">https://github.com/calebevans/cordon/blob/main/docs/architecture.md</a> 基准测试:<a href="https://github.com/calebevans/cordon/blob/main/benchmark/results/README.md" rel="nofollow">https://github.com/calebevans/cordon/blob/main/benchmark/results/README.md</a> 权衡:故意忽略重复模式,使用基于百分位的阈值(相对的,而非绝对的)。
2作者: deklesen4 天前原帖
我发现,能够快速地将我所说的内容进行本地转录对我的工作流程非常有帮助,尤其是在进行氛围编码或与人工智能模型聊天时,因为小的转录错误通常不是问题。<p>因此,我开发了YapType。它的代码总共不到200行。只需按下一个快捷键,它就会在本地进行转录,并在你的文本编辑器中打开结果——就是这么简单。