看起来OpenAI的公关机器运转得非常出色。Cursor的首席执行官表示这是最好的,Simon Willison也有类似的看法(https://simonwillison.net/2025/Aug/7/gpt-5/)。
但我发现它非常糟糕。在Cursor中进行编码时,它运行缓慢,工具调用经常失败(没有MCP,只有标准的Cursor工具),并且在globalThis中存储了一些新的应用状态——这是在过去一年多的Cursor/Claude Code使用中,没有任何模型尝试过的事情。
对于我正在开发的摘要/洞察API,它的表现远不如gpt-4.1-mini。我尝试了mini和完整的gpt-5,使用了不同的推理设置。它没有遵循指示,输出在我所有的评估中都更差,即使经过了大量的提示调整。我进行了大量采样,结果客观上很糟糕。
我是不是唯一一个这样想的人?有没有人看到GPT-5相比其他模型的实际好处?
返回首页
最新
Brainrot Game 是一款免费的浏览器游戏中心,提供即时的、以迷因为主题的迷你游戏——想象一下穿着运动鞋的意大利鲨鱼、Tralalero Tralala 混音关卡以及 Tung Tung Sahur 拼图混乱——所有这一切都无需下载、登录或付费墙。每个 Brainrot 游戏都基于轻量级的 HTML5 技术,因此你可以直接在 Chromebook、手机或电脑上畅玩,无论是在学校、工作还是家中。Brainrot Game 每周更新新出现的热门角色和流行音效,持续带来多巴胺的刺激,让你的脑洞不断扩展。
你还有其他想玩的游戏吗?
我一直遇到同样的问题。我会保存一些想尝试的锻炼、我喜欢的食谱视频,或者是我打算稍后阅读的短文章……但当我真正想要它们时,却不知道自己把它们保存在哪里。
有些在Instagram的收藏帖子里,有些在YouTube的点赞中,还有一些埋在我的备忘录或截图里。我花在寻找它们上的时间比使用它们的时间还要多。
于是我制作了Bookmarq——一个简单的地方来存放我保存的所有内容。短视频、博客、食谱、文章,统统都在一个地方。我可以给它们打标签、搜索,真正找到它们。
没有登录、没有账户、没有广告。只有我的东西,井然有序,触手可及。
我创建这个应用是为了整理我自己的混乱,但我分享出来是希望能帮助那些厌倦了丢失保存内容的人。
下载应用:<a href="https://play.google.com/store/apps/details?id=com.bookmarqspace.app">https://play.google.com/store/apps/details?id=com.bookmarqsp...</a>
网站:<a href="https://bookmarq.space" rel="nofollow">https://bookmarq.space</a>
嗨,HN!这是一件非常有趣的事情。我把它当作一种爱好。<p>我在以新闻通讯的形式每周制作一个谜题。解谜的结果将在下周揭晓,给读者留足了时间去解决。<p>这是我的创意出口。我喜欢解谜、逃脱房间,并且在大学期间组织了很多寻宝活动。<p>期待你们的反馈!!订阅后每周都会收到待解的谜题。
对于那些在终端工作流中使用LLM CLI工具的朋友们,无论是用于辅助执行Shell命令、处理文件还是其他用途,你们使用的是哪一个,为什么?<p>我注意到市面上有不少这样的工具,例如:
1. [sigoden/aichat](https://github.com/sigoden/aichat)
2. [simonw/llm](https://github.com/simonw/llm)
3. [charmbracelet/mods](https://github.com/charmbracelet/mods)
4. [dh1011/llm-term](https://github.com/dh1011/llm-term)
5. [gorilla-llm/gorilla-cli](https://github.com/gorilla-llm/gorilla-cli)<p>你最喜欢哪一个?还有其他我遗漏的好工具吗?
这里不卖任何东西。只是想戒掉电子烟,不想一个人孤单地面对。欢迎加入。
在新模型发布之前,我每天使用这个应用程序多次,进行各种任务和对话。<p>GPT-5 的语音对话存在很多问题,重复自定义个性化指令,就像一个自我推销的多层次营销机器人。与 4o 及其他专业模型相比,这次的用户体验非常糟糕。<p>我从一开始就是付费订阅用户,但今天我取消了订阅,并转向 API / 游乐场。<p>我真的希望他们能恢复模型选择器,如果恢复的话我会重新订阅,但目前我不得不关闭个性化设置,并将“个性”设置为机器人——直到我的付费订阅到期。