返回首页
最新
我每天都在使用大型语言模型(LLMs)来处理一些事情,比如:
- 解决一些只需要应用知识的任务(“这是我 Python 导入结构的粘贴。我不常写 Python,我知道我在这里做错了什么,因为我收到了这个错误,请告诉我如何正确组织这个包。”)。
- 编写自包含的临时代码片段(“这是我 DESCRIBE TABLE 输出的粘贴,写一个 SQL 查询来显示中位数……”)。
- 作为调试伙伴(“我可以直接 SSH 到这个主机,但 Ansible 连接失败并出现这个错误,这种差异可能是什么原因?”)。
所有这些用例都运行得很好,我节省了很多时间。但在我主要的代码编写工作中,我几乎从未取得过成功。我尝试过:
- Cursor(不记得具体使用哪个模型,默认的)
- Google 的 Jules
- OpenAI Codex 的 o4 版本
我发现,在所有情况下,模型的基本能力显然是存在的(模型可以理解和编写代码),但整体价值却远远不够。它可以编写出“有效”的代码,但要让它生成我愿意维护并“署名”的代码所花的时间比我自己写代码还要长。
我不得不对它们进行无尽的微管理(“确保重新运行格式化工具,确保所有测试通过”和“请遵循代码库的编码风格”。“你添加了无关的注释,去掉这些。” “你重构了大部分文件,但忘记了一个函数。”)。在琐碎问题上需要进行很多次迭代,而由于这些迭代进展缓慢,这意味着我不得不频繁切换上下文,这也让人感到疲惫。
基本上,这就像有一个实习生,他成功地掌握了编程的核心技能,但在良好的协作能力上却不太行,需要时刻有人照看。
我问了一些热衷于编码的朋友,他们基本上说“你的标准太高了”。
这里成功的模型是否是你只需说“我不在乎代码质量,因为我不需要维护它,因为我也会用 LLMs 来处理这个?”我是不是没有正确使用这些工具?
最初是作为一个计时器,用来记录我的自由职业编码时间并保持专注。它是本地使用的,无需登录,设计简约。目前还没有盈利计划,只是想看看其他人是否觉得它有用。欢迎反馈。
嗨,HN!<p>我刚刚推出了StayUpAI,这是一个全方位的平台,旨在帮助您在人工智能领域保持领先。它汇集了来自多个来源的AI新闻(文章、研究论文、YouTube),然后利用AI每天或每周对所有新闻进行总结。<p>核心功能:<p>- 统一的AI新闻源(带有来源/语言/主题过滤器)
- 每日和每周的AI摘要邮件
- 每条新闻的摘要(论文、YouTube、文章)
- 多语言新闻(带翻译)
- 免费试用,无需个人信息即可快速测试<p>我创建这个工具是因为跟踪AI新闻令人感到不堪重负,我希望有一个工具可以为我进行内容筛选(和总结)。<p>非常希望能收到反馈,特别是关于:<p>- 作为读者,哪些信息/过滤器/功能对您最有用?
- 对于新闻源或摘要的设计/用户体验建议?
- 您理想的AI新闻聚合器缺少什么?<p>您可以在这里试用 → <a href="https://stayup.ai" rel="nofollow">https://stayup.ai</a>
谢谢!
每个人都有过失败的项目——无论是创业、兼职项目还是被忽视的功能。
你最近的失败是什么?你从中得到了什么启示?不仅仅是“早期验证”,而是一些改变你思维方式的见解。很想听听你的经历并从中学习。
嘿,朋友们。我觉得很有意思的是,openrouter 提供了一些完全免费的模型,例如:https://openrouter.ai/mistralai/devstral-small:free……这些模型的意义是什么?是谁在托管它们并提供这些免费的资源?它们有什么缺点?我明白它们可能不是最好的,但在我看来,它们似乎足够好了。为什么我还要付费使用 OpenAI 的 API,而可以免费使用这些呢?