返回首页

一周热榜

3作者: indie_max7 天前原帖
嗨,HN, 我是Linn,ToolKuai的创始人([https://toolkuai.com](https://toolkuai.com))。 和许多人一样,我一直对“免费”的在线文件转换器保持警惕。大多数转换器都是黑箱:你将私密的文档或图片上传到远程服务器,而你根本不知道这些数据最终会去哪里,或如何被用来训练模型。 我想构建一套完全在浏览器中运行的工具(视频/图片压缩、OCR、AI 背景去除)。没有文件会离开你的机器。 技术栈 为了使其性能足以与服务器端处理相媲美,我大量使用了现代网页API: - AI 背景去除:我使用的是在本地通过Transformers.js运行的ONNX模型(Xenova/modnet和ISNet)。处理过程是100%客户端的,当WebGPU不可用时会回退到WASM。 - 前端:使用SvelteKit(Svelte 5)构建,因其轻量和快速反应。 - 存储与交付:AI模型自托管在Cloudflare R2上,以避免巨大的带宽成本并确保快速交付。 当前统计(上线13天): 该网站仅上线2周。令人惊讶的是,我发现来自台湾和香港的自然流量非常强劲。当前平均停留时间约为3.5分钟,这表明用户实际上在处理多个文件,确认客户端速度达到了预期。 未来与盈利模式 该工具是免费的。我决定避免“专业版/高级版”订阅模式,因为我相信这些实用工具应该是可访问的。我正在探索非侵入性广告来覆盖基础设施成本(主要是R2和Vercel)。 我希望能从HN社区获得一些反馈: - 在不同硬件上的性能(特别是基于WebGPU的视频压缩器)。 - 隐私问题或建议,如何进一步加强“No-Server”的承诺。 - 你认为在“仅客户端”生态系统中目前缺少的任何特定媒体工具。 链接:[https://toolkuai.com](https://toolkuai.com) 谢谢!
3作者: difc5 天前原帖
我正在构建Nucleus,因为大多数“代理安全”仍然只是政策层面的:一个配置文件上写着“不要做坏事”,而代理仍然可以做这些事情。 Nucleus是一个开源实验,它将一个小型的、组合式的权限模型与运行时强制执行相结合:*副作用只能通过一个强制工具代理访问*,并且是在Firecracker微虚拟机内。这个封装是*非升级的*:它只能收紧或终止,绝不会默默放松。 目前有效的功能包括: * MCP工具代理,具有*读取/写入/运行*(在微虚拟机内强制执行) * 默认拒绝出口 + DNS白名单 + Linux上的iptables漂移检测(失败关闭) * 强制执行时间和预算上限 * 哈希链审计日志 + HMAC批准令牌(范围限定,过期)用于受限操作 目前缺失的部分(直言不讳): * web/搜索工具在模型中存在,但尚未与MCP连接 * 远程追加审计存储 + 验证仍在规划中 * 早期/粗略;目标是“安全地运行在敏感代码库上”,而不是“替代你的本地终端” 大部分代码是使用Anthropic工具编写的;我一直依赖测试/模糊测试/属性测试来保持代码的可靠性。 希望能收到关于以下方面的反馈:(1)除了致命三合一之外,还有哪些危险的能力组合,(2)你希望首先关闭哪些强制执行的漏洞,(3)你会如何评估这个与仅限网关的方法相比。
3作者: ogig5 天前原帖
大家好; 在这个周末,我使用Claude Code创建了这个应用。它是一个耳朵训练应用,旨在教导像我这样不太有天赋的音乐人音准和音程。我花了很多年弹吉他,却对音准的真正含义没有清晰的理解。直到我进行了一些弦的调音练习后,我才明白过来。频率滑入正确的位置,感受到那种准确性。我希望这个应用能够帮助其他人第一次感受到这一点,或者提高对不太常见音程的识别能力。任何反馈都非常感谢。
3作者: cope1233 天前原帖
最近,我对当前加密货币和黄金的状态感到非常不安。加密货币的波动性与传统“避风港”资产如黄金的不确定性结合在一起,让人很难理解现在真正的稳定性在哪里。感觉每个选择都带来了不同类型的风险。我很好奇其他人如何看待这个时刻——你们是继续投资、减少风险敞口,还是完全转向其他投资?我有点害怕可能会爆发战争。
3作者: pgedge_postgres3 天前原帖
您对使用MCP服务器与Postgres有什么问题?<p>我们还为PostgreSQL创建了一个开源的MCP服务器(适用于任何新开发的应用程序或现有数据库),名为pgedge-postgres-mcp(https://github.com/pgEdge/pgedge-postgres-mcp)——在这里提出问题和反馈都非常欢迎。<p>今年二月,我们将安排一个网络研讨会,届时项目的工程师将会参与。他会回答在这个讨论串中提出的问题以及在会议结束时问答环节中提出的问题。<p>请关注这里的安排:https://www.pgedge.com/webinars<p>让我们为大家创造一个有趣的交流环境——如果您有任何问题或反馈,请回复或联系community@pgedge.com。
3作者: mesmertech5 天前原帖
我之前看到Remotion Claude技能的发布,老实说,尽管一些结果让我感到惊讶,但我最终没有尝试使用Claude代码,因为我知道我需要设置Remotion、打包工具等。如果我已经要做这些,我想不如把它变成一个网站,让任何人都可以写消息并生成视频,而不需要任何前置条件。 我也知道Claude代码并不是每个人都有,设置Remotion也很麻烦。从这整个经历中我学到的一个重要教训是,即使有技能,Opus在设计任务上其实并不是那么出色。我现在使用Gemini来进行Framecall,甚至在某些情况下,Flash(快速模式)产生的结果有时比Opus更好,这让人感到惊讶,考虑到成本差异。 我还了解到,动态视频与编写优质代码或使用Claude代码作为气氛编码器与了解所使用框架的人之间存在相同的“问题”。如果你只是说“制作一个关于X的漂亮视频”,最终结果是否优秀通常是个赌注,就像你说“用Claude代码给我做一个X应用”一样。你需要对设计有敏锐的眼光,并掌握一些术语,以明确你想要实现的目标。 K2.5、ZLM和大多数开源模型在制作视频方面表现得相当糟糕,即使有技能,所以我最终没有将它们作为选项添加。 定价的原因是,结果显示每个动画需要2-5千个以上的代码输出,再加上1-2千个用于Remotion技能的输入,这样的成本确实不低。我本来希望能把这个作为一个免费的产品提供,因为我本来就是为了好玩而做的,但没办法。
3作者: jchung2 天前原帖
我看到一些独立程序员已经完全转向使用人工智能进行编码,但我对大型工程团队的情况很感兴趣。如果你在一个团队(比如说5名以上的工程师)中,已经采用了Claude Code、Cursor、Codex或其他类似工具,能否分享一下你们的情况?你们是否看到更多的代码行数(LOC)被创建?合并请求(PR)的速度或复杂性有变化吗?你发现自己在处理合并请求上花费的时间是相同的、更少还是更多?
3作者: dragonman6 天前原帖
我是一名DevOps工程师,最近开始认真尝试使用AI辅助编码,以了解它在实际工作中的实用性。 它检查以下内容: - HTTPS重定向 - SSL证书有效性 - 混合内容 - 基本安全头部 - HTTP/3支持 AI在速度上帮助很大——搭建框架、生成样板代码和快速迭代。但在测试、边缘案例和审查与安全相关的逻辑时,我很快意识到,AI并不能替代理解。你仍然需要对自己发布的每一行代码负责。 这主要是一个学习项目,并不打算替代完整的安全扫描工具。我非常欢迎任何反馈、错误报告或关于缺失或误导内容的想法。 请查看: https://httpsornot.com