返回首页
最新
你是否在使用这些产品?你觉得它们有价值吗?它们是否做了一些基础模型公司没有做的事情?
我大约一年前就对此产生了疑问,今天想重新探讨一下这个问题。
今天我在Product Hunt上做了一些研究,还浏览了最近的一些YC公司。让我立刻感到惊讶的是——哇!——有一些非常优秀的设计师(或者说是现在的AI)制作了精美的产品演示和1-3分钟的视频。我遇到的大多数产品都是针对各种需求的AI工具,比如创建办公文档、发送电子邮件、制作演示文稿、网络爬虫、开发移动应用、管理会议和人际关系等。
然而,当我超越表面的华丽,开始深入调查时,我并没有看到这些产品有什么特别之处,或者在某些情况下,它们与基础模型加上简单的RAG有什么不同。事实上,许多与文件相关和依赖记忆的应用程序,今天通过基础的Open AI聊天网站都能很好地完成。值得肯定的是,我认为这些产品通过各种提示工程技巧提供了更好的“流程”。但是否足以让我为它们支付比我现有的OAI/Anthropic订阅更高的月费,我就不太确定了。
但总体来说,当我看到这些产品时,我的感觉是它们可能并不是初创公司,至少不是我认为能持久的那种。它们必须越来越细分,以摆脱日益强大的基础模型的影响。那些看起来能够持久并且表现良好的大公司是Perplexity和Cursor,它们似乎在早期迅速成长,吸引了大量资源和人才来不断开发新功能。因此,也许基础模型只能完成它们大约60%的工作,而我上面描述的产品/初创公司的数字更接近90%。我的结论是对“GPT包装”持有一定的悲观态度,也许在更多创新想法(例如物理世界的应用案例)实现之前,因为SaaS领域似乎竞争激烈。
让我们一起创造一些酷炫的东西吧!
我正在开发一个基于JavaScript的游戏。在你们和其他人工智能的帮助下,我们一定能让这个世界变得更美好。
大家好!我们是Empromptu.ai,一款AI应用构建工具,能够构建AI应用(每个应用中都内置了RAG、模型和评估功能)。
演示视频:<a href="https://www.youtube.com/watch?v=w25XhUaPfls" rel="nofollow">https://www.youtube.com/watch?v=w25XhUaPfls</a>
我们创建Empromptu的初衷是因为在使用其他AI构建工具时,耗费了大量的积分,却始终面临同样的问题:虽然原型或演示看起来很酷,但在真实用户中却无法正常工作。
问题不在于构建过程,而在于准确性。大多数AI应用的可靠性停留在60%左右,这对于原型来说可以接受,但在生产环境中则无法使用。我们意识到这些工具其实并不是真正的“AI应用构建器”,而是恰好使用了AI的网站构建器。
我们希望先解决最棘手的问题:让AI应用真正可靠地工作。
我们的解决方案围绕我们称之为动态优化的概念展开。我们的系统根据上下文进行适应,而不是将所有可能的场景塞入一个庞大的提示中(这会让大型语言模型感到困惑)。例如,一个旅行聊天机器人会自动知道在提到洛杉矶时应该提到LAX,而在提到多伦多时则提到Pearson。这种方法的准确性始终保持在90%左右,而行业标准仅为60%左右。
但仅有准确性是不够的,因为我们还需要解决构建者之间的差距:
- 简单的构建工具(如Lovable、Bolt):只能创建静态网站,而非AI应用。
- 复杂的机器学习工具:需要专门的团队,而大多数初创公司并不具备(如Arize、Voxel51)。我们也听到过技术和非技术创始人反映这些工具非常复杂。
- 缺失的工具:能够构建嵌入AI功能的应用程序的工具。
因此,我们构建了内置优化的AI代理。用户只需输入想要构建的内容,我们的代理将处理整个开发流程:创建嵌入模型、RAG和智能处理的应用程序。您可以通过Netlify、GitHub将其部署到自己的基础设施上,或者直接下载,因为您可以在本地运行它。
结果是:初创公司、独立开发者和企业可以在不雇佣专门的机器学习团队的情况下构建生产就绪的AI应用。
候补名单:<a href="https://empromptu.ai" rel="nofollow">https://empromptu.ai</a>
我们非常希望听到HN社区的反馈,尤其是如果您遇到过类似的准确性问题或对我们的技术方案有任何想法。