返回首页
最新
五天前,我们的精细调优2.5 Flash模型的延迟突然增加了5倍。对于不太熟悉的人来说,这种精细调优的模型通常用于在特定任务上接近大型模型的性能,同时延迟和成本大大降低。这意味着它们通常用于实时生产场景,这些场景使用频繁,需要快速响应用户。否则,精细调优通常是不值得的。许多人在为一个这样的任务精细调优模型上花费几千美元(至少)。
五天前,谷歌向世界发布了Nano Banana Pro(Gemini 3.0图像预览)。自那时起,我们现有的精细调优模型的延迟突然增加了五倍。我们与其他也使用精细调优2.5 Flash模型的初创公司进行了交谈,他们也遇到了同样的情况,甚至在不同地区也是如此。显然,这对我们所有的产品都有很大影响。
从谷歌方面来看,除了沉默一无所获,甚至在付费支持方面也是如此。对初始支持请求的回复只是要求提供已经在该请求中提供的基本信息,或者是显而易见的内容。从那时起,已经超过48小时没有任何进展。
当然,这个时机可能纯属巧合——尽管我们以前从未见过这种延迟不稳定的情况——但我们都能看出最可能的原因;Nano Banana Pro和Gemini 3预览消耗了大量计算资源,而它们显然是以牺牲精细调优模型的输出为代价来实现这一点。在经历了这一切之后,想要将他们视为商业用途的合作伙伴几乎是不可能的,谁知道他们下次会做什么。尽管存在许多缺陷,OpenAI在稳定性方面一直是一个堡垒,尽管它是所有前沿模型提供商中最专注于B2C的。谷歌的Vertex声称专注于企业,却为了让消费者更快地获取Ghibli图像而破坏了其商业客户的产品。他们肯定收到了很多关于此问题的支持请求,考虑到谷歌的工程能力,他们一定有自动监控系统能够立即发现如此巨大的延迟增加。短暂的故障是可以理解的,发生在各处,最近AWS和Cloudflare也有类似情况,但5天以上的5倍延迟——即使他们修复了——实际上就是服务的5天以上的停机。
我发布这个主要是为了警告其他初创公司,今后不要依赖谷歌Vertex来满足用户面向的模型需求。
大家好。我最近在做一个小实验,想和大家分享一下。
Jelly是一个完全通过SSH加入的社交空间。
没有网页,没有应用程序,没有登录流程。
你的SSH公钥就是你的身份。
我想要一个感觉像早期互联网社区的东西。简单,没有算法,没有挑衅性内容,没有抓取,没有AI生成的内容。只是人们在终端中实时交流。
目前的功能:
通过以下方式加入:ssh jellyssh.xyz
如果你没有密钥:ssh-keygen -t ed25519
公钥会自动创建账户
全球实时更新的动态
话题标签变成频道(前5个活跃话题)
ASCII头像 + 个人主题
留言簿 / 前8名(怀旧MySpace)
使用Bubble Tea构建的TUI
由Wish提供的SSH服务器
sqlite后端,无追踪或分析
不存储密码、电子邮件或个人数据
目前还很早,功能有些粗糙,但足够稳定,可以试用。
仍在完善输入处理、速率限制和防崩溃机制。
如果你去试试,我很想听听你的想法和反馈。
这是我一个人在做,我会边做边学习。
ssh jellyssh.xyz
感谢阅读。
嗨,HN,
我之所以开发这个工具,是因为我厌倦了将个人照片上传到第三方服务器进行压缩。我希望有一个尊重隐私的工具,能够100%在客户端完成所有操作。
这个工具完全在您的浏览器中运行(没有数据离开您的设备),因此没有文件大小限制或上传等待时间。目前支持批量压缩 JPG、PNG 和 WebP 格式的文件。
我正在 ToolboxNest 开发更大一套工具。非常期待听到您对压缩质量和用户界面的反馈!