返回首页
最新
不久前,我在寻找有关一款鲜为人知且短暂存在的英国计算机的信息时,发现了一篇文章[1],它位于《BYTE》杂志的档案中[2]。我立刻被过去时代的科技广告所吸引。这促使我开展了一个长期的副项目,希望能够在一个可搜索的地方查看所有10万页的《BYTE》杂志。<p>[1]: <a href="https://byte.tsundoku.io/#198502-381" rel="nofollow">https://byte.tsundoku.io/#198502-381</a>
[2]: <a href="https://news.ycombinator.com/item?id=17683184">https://news.ycombinator.com/item?id=17683184</a>
嘿,HN,
我是Tony,Cosmic的首席执行官(YC W19)。我们很高兴地宣布推出Cosmic AI平台,这是一个革命性的系统,改变了你创建内容、构建和部署应用程序的方式。
Cosmic AI平台重新定义了内容管理系统(CMS)的概念——它现在是一个完整的AI驱动的应用程序开发和部署平台。你可以使用自然语言在几分钟内构建和部署任何你能想象的东西。
主要功能:
- AI内容工作室:根据自然语言描述生成完整的内容模型和内容
- AI驱动的开发:使用AI构建基于Next.js、React、Astro和Vue.js的应用程序
- 完整的部署管道:GitHub集成、Vercel部署、环境管理和域名服务
该平台现在在所有Cosmic账户上可用。我们将免费套餐的额度提高到30万个令牌(从1万个提升),以便你可以尝试这些新功能。
登录Cosmic仪表板进行体验: [https://app.cosmicjs.com/login](https://app.cosmicjs.com/login),并在这里阅读更多关于此次发布的信息:[https://www.cosmicjs.com/blog/introducing-the-cosmic-ai-platform](https://www.cosmicjs.com/blog/introducing-the-cosmic-ai-platform)。我们期待你的反馈!
Tony
大家好,HN!我们是Antonio和Luca,非常高兴向大家介绍Smooth,这是一款先进的浏览器代理,它的速度是Browser Use的<i>5倍</i>,成本是其<i>7倍更低</i>(<a href="https://docs.circlemind.co/performance">https://docs.circlemind.co/performance</a>)。
我们开发Smooth是因为现有的浏览器代理速度慢、成本高且不可靠。即使是简单的任务也可能需要几分钟,并消耗大量的API积分。
我们最初是Browser Use的用户,但很快就意识到其中的问题。因此,我们开发了更好的解决方案。Smooth不仅速度快、成本低,而且更可靠。在这个过程中,我们发现了两个使代理真正有效的原则。
(1) 像LLM一样思考(<a href="https://x.com/karpathy/status/1937902205765607626" rel="nofollow">https://x.com/karpathy/status/1937902205765607626</a>)。
最重要的是要站在LLM的角度考虑问题。这在设计上下文时尤其重要。你如何向LLM呈现问题决定了它是成功还是失败。想象一下和LLM下棋。你可以用无数种方式表示棋盘——图像、Markdown、JSON等。你选择哪种方式比系统的其他部分更为重要。清晰、直观的上下文是关键。我们称之为LLM-Ex。
(2) 让它们写代码(<a href="https://arxiv.org/pdf/2401.07339" rel="nofollow">https://arxiv.org/pdf/2401.07339</a>)。
工具调用是有限的。如果你想要能够处理复杂逻辑并可靠地操作对象的代理,就需要代码。编程提供了更丰富、更可组合的操作空间。突然间,为代理设计的感觉更像是为人类开发者设计,这使一切变得更简单。
通过严格应用这两个原则,我们意识到并不需要庞大的模型就能获得可靠的结果。小而高效的模型可以在提供更高可靠性的同时,实现人类速度的导航和巨大的成本降低。
工作原理:
1. 提取:我们查看网页并通过渲染页面提取所有相关元素。
2. 过滤和清理:然后,我们使用一些简单的启发式方法来清理网页。如果某个元素不可交互,例如因为一个横幅遮挡了它,我们就将其移除。
3. 递归分离部分:我们使用多种启发式方法以一种既对LLM友好又尽可能接近人类视觉的方式表示网页。
我们将Smooth打包成一个易于使用的API,提供即时浏览器启动、自定义代理、持久会话和自动验证码解决方案。我们的目标是为您提供这个基础设施,让您能够专注于重要的事情:为您的用户构建出色的应用。
在我们开发这个之前,Antonio曾在亚马逊工作,Luca在牛津大学完成博士学位,我们多年来一直对可靠的AI代理充满热情。现在我们知道:如果你想让代理可靠地工作,就要关注上下文。
欢迎免费试用:<a href="https://zero.circlemind.co/developer">https://zero.circlemind.co/developer</a>
文档在这里:<a href="https://docs.circlemind.co">https://docs.circlemind.co</a>
演示视频:<a href="https://youtu.be/18v65oORixQ" rel="nofollow">https://youtu.be/18v65oORixQ</a>
我们期待您的反馈 :)
MCP-UI 还处于早期阶段,但我对大型语言模型(LLM)聊天界面不再只是文字堆砌,而是包含视觉元素的想法感到非常兴奋。
MCP-UI 所能实现的上限非常高,因为它几乎可以是任何东西,但这也使得想象变得困难。
对我来说,考虑 MCP-UI 提供的基础功能更具吸引力。它填补了 Google 搜索在某些方面超越 LLM 聊天的空白,比如一些小的功能性用户界面小部件,例如计时器和转换工具。这个代码库是一个示例证明,展示了 MCP-UI 的实用性。
同时,分叉并构建你自己的自定义小部件也应该很简单!
我所知道的网络上最大的API词汇表包含15000个单词,涵盖四种方言(埃及方言、黎凡特方言、现代标准阿拉伯语和达里贾方言)。
最近我们开始在 npm 注册表中看到 429 错误。<p>有没有人知道最近 npm 的速率限制有何变化?