返回首页
最新
发现《沙爆!方块拼图》,这是一款创新的拼图游戏,拥有令人满意的沙子物理效果和多彩的方块。尽情享受无尽的无广告游戏体验,支持离线游戏,并为各个年龄段提供战略挑战。
我最近注意到了一些事情。
在过去两年里,大部分科技行业一直处于收缩状态。我们看到各大公司裁员,重心转向核心业务优先事项,以及对任何非直接可盈利项目的普遍怀疑。研发经费减少,“登月计划”变成了笑话。人们变得谨慎——这也是情有可原的。
但现在,情况发生了变化。这种变化悄然无声,几乎在背景中进行。
我们看到新奇工作的回归。
不仅仅是在初创公司。在大型科技公司中也是如此。
我认为发生了以下几件事情:
大型科技公司正在重新招聘。不是无差别地招聘,也不是为了重建他们刚刚裁掉的那些层级。他们在有选择地招聘——寻找能够帮助他们探索的人。
因为一些新的机会正在出现。
像GPT-4o(o3)这样的工具改变了游戏规则。曾经需要几个月的准备时间——研究一个领域、运行原型、测试假设——现在可以在一周内完成。如果你积极应用这个模型,特别是使用针对新奇的提示,它不仅仅是一个生产力工具,更是一个发现引擎。它缩短了从想法到可行性的时间。
这种压缩是重要的。它创造了战略紧迫感。
大型科技公司感受到了这种紧迫感。当全新的机会出现时——新的用户体验范式、新的AI原生工作流程、新的消费者行为——仅仅优化现有产品线是不够的。你必须抢先一步。而为此,你需要那些能够在不确定空间中工作的人。他们不怕模糊,能够横向融合想法,并适度交付以证明下一步的方向。
有趣的是,正是那些在一年前缩减了前沿研发团队的公司,现在却在悄悄地重建这些团队——因为前沿本身已经发生了变化。
这不仅仅是关于招聘。
我们还看到资本重新回到探索性工作中。AI原生的创始人们再次通过叙事筹集资金——基于信念,而不仅仅是收入。他们之所以能做到这一点,是因为测试的时间缩短了。他们可以在一个月内探索四个产品方向,并知道哪个方向有市场。这种杠杆效应吸引了资本的回流。
所以,是的,“科技衰退”已经结束。但这并不是旧意义上的周期重置。资本的回归不仅仅是资金的回流,而是想象力的回归。
接下来将由那些能够快速探索、低成本失败并跨界综合的人来构建。
如果这就是你——那么现在就是你的时刻。
这个产品存在吗?<p>为什么人们选择在屋顶上安装太阳能电池板,而不是投资于大规模的太阳能项目,然后根据他们的投资所产生的电力获得相应的分红呢?<p>难道我不能说,资助全球某个地方的1万美元太阳能发电项目,然后每个月收到一张我帮助生产的电力的支票吗?<p>对我来说,这比在屋顶上安装电池板更有意义,因为这样可以避免所有额外的成本。
我对我们媒体的质量感到沮丧,它往往对一方提出强有力的论据,而对另一方则采用稻草人论证。因此,我开发了一个工具,让大型语言模型(LLMs)就辩论的对立双方进行辩论,以更深入地探讨一个话题。
每一方随机分配一个模型(支持或反对),目的是从两个角度提出最佳论据。
目前,该工具使用的是GPT-4、Gemini 2.5 Flash和Grok-3。我非常希望能收到任何反馈或建议,以便改进这个工具。
<a href="https://www.botbicker.com" rel="nofollow">https://www.botbicker.com</a>
我使用这个工具已经两年了,现在它真的成了一把多功能的“瑞士军刀”。我相信它可以帮助许多开发者。
和你们中的许多人一样,我正在通过服务器发送事件(SSE)逐个令牌地流式传输来自大型语言模型(LLMs)的响应。
保持SSE连接在页面刷新时不变的最佳方法是什么?
我没有看到很多关于这个的文档或示例。在我使用的大多数支持LLM的应用中,如果令牌正在流式传输而页面刷新或更改,流就会中断。
我想到的一个主意是将流式传输的令牌写入某种队列或Kafka主题,然后将我的用户界面连接到该队列,从那里流式传输令牌。但这似乎工作量很大。
大多数人是如何做到这一点的?
大家好,我是来自Leaping AI的阿尔卡迪(Arkadiy),我们的官网是<a href="https://leapingai.com">https://leapingai.com</a>。Leaping允许您以多阶段、图形化的格式构建语音AI代理,这使得测试和改进变得更加容易。通过评估通话的每个阶段,我们可以将错误和回归追溯到特定阶段。然后,我们会自主调整该阶段的提示并进行A/B测试,从而使代理能够随着时间的推移自我改进。
您可以直接与我们的一个机器人对话,网址是<a href="https://leapingai.com">https://leapingai.com</a>,还有一个演示视频可以在<a href="https://www.youtube.com/watch?v=xSajXYJmxW4" rel="nofollow">https://www.youtube.com/watch?v=xSajXYJmxW4</a>观看。
大型公司对AI开始接听电话自然是有所顾虑——这项技术在某种程度上是有效的,但往往效果不佳。如果他们真的下定决心,通常会花费数月时间来调整仅一个用例的提示,有时甚至最终不会发布语音机器人。
问题是双向的:用简单的语言准确地指定机器人应该如何行为并非易事,同时确保大型语言模型(LLM)始终按照您的意图执行指令也是一项繁琐的工作。
现有的语音AI解决方案在复杂用例的设置上非常麻烦。它们需要数月时间来处理所有边缘案例,然后再花几个月时间进行监控和改进提示。我们通过运行持续的分析和测试循环,比人类提示者做得更好、更快。
我们的技术大致分为三个子组件:核心库、语音服务器和自我改进逻辑。核心库负责建模和执行多阶段(类似n8n风格)的语音代理。对于语音服务器,我们使用传统的STT(语音转文本)->LLM(大型语言模型)->TTS(文本转语音)级联方式。我们尝试过语音对语音模型,虽然与之对话的体验非常好,但功能调用的性能显然较差,因此我们仍在等待它们的改进。
自我改进的工作原理是首先收集对话指标和评估结果,以生成“反馈”,即关于如何改进语音代理设置的具体想法。在收集到足够的反馈后,我们会触发一个专门的自我改进代理进行运行。它是一种光标风格的AI,能够访问各种工具,改变主要的语音代理。它可以重写提示,配置一个阶段使用摘要对话而不是完整对话,等等。每次迭代都会生成代理的新快照,使我们能够将一小部分流量引导到它上面,并在情况良好时将其推广到生产环境。这个循环可以在没有任何人工干预的情况下运行,从而使代理能够自我改进。
Leaping对用例没有特定限制,但我们目前专注于入站客户支持(旅游、零售、房地产等)和潜在客户预筛选(医疗保险、家庭服务、绩效营销),因为我们在这些领域有很多成功案例。
我们最初在德国起步,因为我们在大学时在那里,但最初的增长面临挑战。我们决定立即针对企业客户,但他们对将语音AI作为公司前台“面孔”的接受度不高。此外,对于每天有成千上万通电话的企业来说,监控所有电话并手动调整代理是不可行的。为了应对他们非常合理的担忧,我们将所有精力投入到可靠性上——至今仍未提供自助访问,这也是我们尚未制定固定定价的原因之一。(此外,对于某些客户,我们采用基于结果的定价,即对于未转化为潜在客户的电话不收取任何费用,仅对成功转化的电话收费。)
自从我们进入YC并搬到美国以来,事情开始加速发展,但如果您试图向大型企业销售,谨慎的情绪在这里也依然存在。我们相信,出色地进行评估、模拟和A/B测试是我们的竞争优势,也是我们能够解决大型、敏感用例的关键。
我们非常希望听到您的想法和反馈!
嘿,HN,我们是一家YC创业公司,正在构建一个开源、以隐私为首要考虑的Perplexity Comet替代品。
<p>与其他许多产品不同,我们没有邀请系统——你可以今天就从我们的网站或GitHub上下载它:<a href="https://github.com/browseros-ai/BrowserOS">https://github.com/browseros-ai/BrowserOS</a>
<p>--- 为什么要构建一个替代品?我们相信,浏览器将成为新的操作系统,我们将大量工作交给AI代理。但这些代理将能够访问你所有的敏感数据——电子邮件、文档,以及你的浏览历史。需要存在开源、以隐私为首的替代品。
<p>我们不是搜索或广告公司,因此没有奇怪的激励机制。你的数据保留在你的机器上。<i>你可以使用Ollama的本地LLM。</i>我们还支持BYOK(自带密钥),所以没有每月200美元的计划。
<p>与Perplexity Comet的另一个重大区别是:我们的代理在你的浏览器中本地运行(而不是在他们的服务器上)。你可以实际看到它点击和执行操作,这非常酷!短演示在这里:<a href="https://bit.ly/browserOS-demo" rel="nofollow">https://bit.ly/browserOS-demo</a>
<p>--- 我们是如何构建的?我们对Chromium的C++源代码进行了补丁修改,因此我们拥有与Google Chrome相同的安全性。我们还为安全补丁和定期更新提供了自动更新程序。
<p>处理Chromium的1500万行C++代码是另一个有趣的冒险,我正在为此写一篇博客文章。在这个规模下,Cursor/VSCode会崩溃,所以我们又回到了使用grep来查找和修改内容。Claude代码的表现也出乎意料地好。
<p>构建二进制文件大约需要3小时,在我们的M4 Max MacBook上。
<p>--- 接下来呢?我们只有两个人,面临大量工作(Firefox最初是由3名黑客创建的,历史总是有相似之处!)。但我们坚信,拥有本地LLM支持的以隐私为首的浏览器比以往任何时候都更重要——因为代理将能够访问如此多的敏感数据。
<p>期待任何和所有的评论!