返回首页
最新
嗨,HN,
这是我第一次在这里分享这样的内容。我开发了 TiniText,旨在解决我自己反复遇到的问题:我需要简单的转录、摘要和草稿工具,但大多数选项在日常使用中感觉过于复杂。
我没有构建一个大型平台,而是专注于小型的、单一目的的工具,具有可预测的行为和最小的设置。
该应用支持:
- 音频转录(单人和多人)
- 可调细节的文本摘要
- 简单的草稿生成(博客/会议记录)
- 一些实用的文本工具
它已经准备好投入生产,但仍处于早期阶段,我非常希望能得到反馈:
- 用户体验中哪些部分显得多余
- 实际使用中缺少什么
- “小型专注工具”是否仍然是一个吸引人的方向
欢迎提问。
为了使人工智能系统的自动分析、复制和学习变得困难,编程语言应该具备哪些特征?你有什么想法吗?
我一直在研究隐私技术,并注意到了一些奇怪的现象:
<p>存在相机滑动保护壳(如Spy-Fy等)——它们可以阻止物理相机的访问,但并不提供信号保护。</p>
<p>存在法拉第袋(如SLNT、Mission Darkness等)——它们可以阻挡所有射频信号,但你必须将手机从保护壳中取出并放入袋子里。</p>
<p>但是没有人制造出一种合身的iPhone保护壳,能够将这两者结合起来——一种可以一直留在手机上的保护壳,配备一个可展开的法拉第屏蔽,可以在不取下设备的情况下随时开启或关闭。</p>
<p>我花了一些时间进行市场调研,并制作了一份完整的概念方案,如果有人感兴趣,我很乐意分享。竞争空白似乎确实存在:</p>
- 当前隐私保护壳市场:$30-40的相机滑动保护壳
- 当前法拉第袋市场:$60-100的袋子
- 集成双模式保护壳:价格在$149-249之间</p>
<p>使用场景似乎很明显:那些希望随时获得全面隐私(相机+信号),而不想麻烦地将手机从保护壳中取出并放入袋子的人。</p>
<p>所以我想问HN社区:</p>
<p>为什么这种产品不存在?</p>
<p>是因为:</p>
- 工程上不可能?(无法通过可展开机制获得合适的射频密封?)
- 市场太小众?(相机隐私和信号屏蔽之间的需求重叠太小?)
- 有人尝试过但失败了?
- 法律/监管问题?
- 我只是遗漏了一些明显的东西?</p>
<p>我并不打算去开发这个(没有硬件经验),只是出于好奇,想知道为什么会有这样的市场空白。</p>
<p>如果有人对拆解我的完整概念方案和市场分析感兴趣,我很乐意分享。</p>
<p>谢谢!</p>
文本:
我们之前发布了 Vectorly(<a href="https://news.ycombinator.com/item?id=46209538">https://news.ycombinator.com/item?id=46209538</a>),这是我们开源的应用程序,可以将网站逆向工程为可重用的 API。核心理念是:与其像人类一样通过用户界面点击,不如通过底层的 HTTP 端点与网站互动。这样更快、更便宜、更可靠。
通过记录浏览器会话来构建例程的方式效果很好,但精炼过程仍然是手动的。因此,我们构建了 Guide,一个会话代理,带您完成整个过程:
- 描述您的任务,代理会帮助您确定范围
- 在云浏览器中录制,只需正常使用网站
- 代理分析会话,识别后端端点,提取参数,构建可重用的例程
- 通过聊天进行精炼,提出编辑建议,审查差异,无需手动编辑任何内容
当前的网页自动化方法是使用计算机代理像人类一样点击和输入。我们认为这种方法是错误的。Web 应用的实现千差万别,但它们都与结构化的后端 API 进行通信。大型语言模型(LLM)在读取代码和推断结构方面表现出色,因此我们在构建时使用它们来逆向工程这些 API,然后生成的例程在运行时不需要 AI 的介入。
我们很想听听您的想法,并乐意回答有关该方法的任何问题! :)
- GitHub: <a href="https://github.com/VectorlyApp/bluebox-sdk" rel="nofollow">https://github.com/VectorlyApp/bluebox-sdk</a>
- 更详细的博客文章: <a href="https://vectorly.app/blog/introducing-guide-agent" rel="nofollow">https://vectorly.app/blog/introducing-guide-agent</a>
- 尝试一下: <a href="https://console.vectorly.app/guide" rel="nofollow">https://console.vectorly.app/guide</a>
在我看来,Show HN 上充斥着低质量的“看看我给 Claude 提示了什么”的帖子——没有创新,没有真正的创作,只是又一个复制品。如果你要给大型语言模型(LLM)提供提示,至少应该想出一些原创的东西,而不是第百万个文本编辑器。