1作者: tactics66552 个月前原帖
1. 严重的幻觉 它无法正确编写任何文档。我让它为我正在构建的解释器编写API文档。它虚构了不存在的函数,并且所有参数列表都错误。像 `shouldClose`、`swapBuffers`、`pollEvents`、`terminate` 这样的函数根本不在我的解释器中,但它却把这些函数放进了文档,并且每个参数都错了。 2. 擅长创建重复的函数 在C语言中,重复的函数名无法编译,但它似乎大约60%的时间都会创建重复的函数。它甚至在 `switch` 语句中创建重复的 `case` 标签。它常常在不同的名称下生成相同的代码。 3. 出色地制造错误 它创建 `struct`,初始化它们,赋值,然后当被要求初始化并运行或实现SSR反射时,它将alpha设置为全透明,导致整个GLB变得透明;或者当被要求制作玻璃材质时,它只是将其设置为不透明(我尝试了15次后放弃了)。他们声称它达到了专业工程师的水平——什么,幼儿园水平的工程师? 4. 从不提供真正可用的代码 即使是读取单个文件的代码也是一团糟,充满了错误;自己实现要快得多。它在这里那里做了一些空值检查,但也许应该先检查其他内容,而不是在这些上浪费时间。 5. 严重的内存泄漏 它生成的代码存在内存泄漏。使用Claude Opus 4.5让我感到非常沮丧,以至于我在提示中写了很多脏话。 6. 添加我没有要求的内容 它在阴影中添加噪声,声称这样看起来更自然,但实际上只是显得脏乱。我甚至看到它通过在地板上放置一个白色平面来“修复”反射,并称之为光反射。 7. 莫扎特的骰子级别的创作 想要得到可靠的代码真是太难了——一切都是缺陷重重、支离破碎的混乱。 8. 只要它不崩溃,这就是最重要的 如果一个函数应该返回一个浮点数,那就把它当作整数比较——所以把函数的返回类型改为整数!Claude Opus 4.5真是太神奇了!它可能很快就会达到AGI的水平!
3作者: osigurdson2 个月前原帖
嗨,HN, 有几个工具可以帮助你搜索Hacker News上每月的“谁在招聘”帖子。这个工具的主要区别在于它包含了聊天功能、语义搜索以及语义地图可视化(从下拉菜单中选择“商业”并展开,以了解如何使用这个功能)。在后台,它使用大语言模型(LLM)指令批量提取、格式化和标记职位帖子,计算UMAP以便一切都能被搜索。 你可以使用基本的文本搜索快速过滤结果,或者使用语义搜索(通过搜索栏中的按钮切换)。 最后,你还可以与职位帖子进行聊天(点击聊天按钮)。它有一个基本的RAG类型管道,同时还包括一些工具,使你能够提出更广泛的问题,比如“这个月职位帖子中的一般主题是什么?”并从那里深入探讨。 无论如何,我希望大家觉得这个工具有用。欢迎任何反馈(可以直接在这里留言,或者随时使用这个联系页面 <a href="https:&#x2F;&#x2F;nthesis.ai&#x2F;contact" rel="nofollow">https:&#x2F;&#x2F;nthesis.ai&#x2F;contact</a>,它使用相同的机制 - 不需要联系信息)。 如果你想构建类似的工具,这里有一个API和一个不错的(在我看来)CLI工具,可以用来获取数据、搜索或聊天。
1作者: EvoAgentX2 个月前原帖
经过几个月的开发,我们即将推出HowOne的私人测试版,这是一个用于构建能够自我优化和随时间演变的智能应用的平台。 核心理念是:在几分钟内将一个想法转化为一个功能齐全的智能应用。该平台开箱即用,包含用户管理、数据库、工具和支付集成。无需编写粘合代码,也无需基础设施设置。 我们正在寻找300名愿意进行压力测试、发现问题并告诉我们缺失之处的早期技术用户(邀请码:CD0AP6)。这不是一次市场推广活动——我们需要来自关注自动化、智能工作流程和快速产品迭代的开发者的真实反馈。 测试版包括: • 3个月的专业访问权限 • 创始用户徽章 + 终身折扣 • 提前访问实验模块 • 对产品路线图优先级的意见反馈 • 在模板市场中的推荐展示位置 • 一对一的工作流程或应用设计辅导 如果您正在构建自动化、AI工具或智能工作流程,我们非常期待您的反馈。
1作者: zyncl192 个月前原帖
我非常喜欢葡萄酒,但我的知识并不广泛,尤其是在加州以外的葡萄酒方面更是如此。即使在我熟悉的品种和地区,我也不总是知道从特定瓶装酒中可以期待什么样的特征——这款齐纳酒会有胡椒味吗?果汁味呢?等等。 为此,我开发了一款应用程序来简化这个过程。你只需设置你想要的葡萄酒类型和价格区间,拍一张酒单的照片,应用程序会处理其余的内容。它会根据以下几个方面对菜单进行排名: - 一致性:与您的口味偏好的匹配程度。 - 价值:与零售价格相比的加价。 - 质量:评论家的评分和在线评价。 它还提供每款葡萄酒的完整描述和品鉴笔记,而许多酒单往往会忽略这些信息。 技术栈: - 客户端:React Native - 后端:FastAPI,部署在Google Cloud Run上 - 数据库:Firestore和Algolia 以下是管道的主要组成部分: 图像到酒单:这是标准OCR和智能图像识别的结合。仅使用OCR无法正确解析布局(将价格与正确的项目分组),而“智能识别”往往会出现字符幻觉。我使用了Google Vision来提取原始文本,并使用Gemini 2.5 Flash Lite进行结构化。 匹配(酒单→数据库):实际上这是最难的部分。酒单在命名上有很大的自由度,很难判断模糊匹配是否足够接近。我在这里使用了Algolia,并设置了自定义排名规则。 智能增强:我有一个预构建的数据库,但为了实时填补缺失的条目,我需要实时搜索。我尝试了Tavily、Perplexity和Google Search Grounding。最终,Perplexity(Sonar Pro)在准确性和性能之间达到了最佳平衡。 推荐:使用Gemini 2.5 Flash Lite进行风味轮廓匹配,使用传统数学计算基于价值和评分的分数。 总结: AI需要保护措施:如果你在小剂量下使用真实输入数据,它的效果非常好。但目前还无法直接从照片生成推荐列表而不出现幻觉。 延迟权衡:同时获得速度和质量是很困难的。由于这是为餐厅环境设计的,我必须努力减少大型语言模型的调用,以避免让用户感觉迟缓。