返回首页
最新
大家好!我制作了一份关于微调OpenAI开源模型的指南,还包括了错误修复的内容!另外,我还创建了一个免费的Colab笔记本,可以在不到14GB的显存下微调20B模型!
我有一个详细的 Figma 设计,想用 next.js 或 remix 来构建一个网站。作为一个实验,我想尝试仅使用 agentic 和 vibe 编码工具来搭建这个网站。然而,我在将设计转化为代码时遇到了很多问题。目前我在使用 Claude Code(在 VSCode 中)和 Figma MCP,甚至尝试了一个 Figma 扩展来将设计转换为 JSON,但仍然遇到许多困难。网站在不断改进,但与设计相比仍然差距很大。
有没有尝试过类似方法的人能给我一些建议或提示?
萨姆昨天说,ChatGPT 每周处理大约 7 亿用户。同时,我连一个 GPT-4 级别的模型都无法在本地运行,除非有巨大的显存,否则速度会慢得令人痛苦。
当然,他们有庞大的 GPU 集群,但肯定还有其他的技术在发挥作用——模型优化、分片、定制硬件、巧妙的负载均衡等等。
在如此大规模的情况下,是什么工程技巧使得这一切成为可能,同时保持低延迟?
我很想听听那些构建过大规模机器学习系统的人的见解。
ChatGPT-4 可以解决这个问题。即使使用 API 中的 GPT-5 也能得到正确的结果。似乎是 ChatGPT 前端提示存在问题。
<p>示例:</p>
<p>提示:解方程 5.9 = x + 5.11</p>
<p>答案:</p>
<p>要解这个方程:</p>
<p>5.9 = x + 5.11</p>
<p>从两边减去 5.11:</p>
<p>5.9 - 5.11 = x</p>
<p>-0.21 = x</p>
<p>最终答案:</p>
<p>\boxed{x = -0.21}</p>