返回首页
最新
五天前,我们的精细调优2.5 Flash模型的延迟突然增加了5倍。对于不太熟悉的人来说,这种精细调优的模型通常用于在特定任务上接近大型模型的性能,同时延迟和成本大大降低。这意味着它们通常用于实时生产场景,这些场景使用频繁,需要快速响应用户。否则,精细调优通常是不值得的。许多人在为一个这样的任务精细调优模型上花费几千美元(至少)。
五天前,谷歌向世界发布了Nano Banana Pro(Gemini 3.0图像预览)。自那时起,我们现有的精细调优模型的延迟突然增加了五倍。我们与其他也使用精细调优2.5 Flash模型的初创公司进行了交谈,他们也遇到了同样的情况,甚至在不同地区也是如此。显然,这对我们所有的产品都有很大影响。
从谷歌方面来看,除了沉默一无所获,甚至在付费支持方面也是如此。对初始支持请求的回复只是要求提供已经在该请求中提供的基本信息,或者是显而易见的内容。从那时起,已经超过48小时没有任何进展。
当然,这个时机可能纯属巧合——尽管我们以前从未见过这种延迟不稳定的情况——但我们都能看出最可能的原因;Nano Banana Pro和Gemini 3预览消耗了大量计算资源,而它们显然是以牺牲精细调优模型的输出为代价来实现这一点。在经历了这一切之后,想要将他们视为商业用途的合作伙伴几乎是不可能的,谁知道他们下次会做什么。尽管存在许多缺陷,OpenAI在稳定性方面一直是一个堡垒,尽管它是所有前沿模型提供商中最专注于B2C的。谷歌的Vertex声称专注于企业,却为了让消费者更快地获取Ghibli图像而破坏了其商业客户的产品。他们肯定收到了很多关于此问题的支持请求,考虑到谷歌的工程能力,他们一定有自动监控系统能够立即发现如此巨大的延迟增加。短暂的故障是可以理解的,发生在各处,最近AWS和Cloudflare也有类似情况,但5天以上的5倍延迟——即使他们修复了——实际上就是服务的5天以上的停机。
我发布这个主要是为了警告其他初创公司,今后不要依赖谷歌Vertex来满足用户面向的模型需求。
大家好。我最近在做一个小实验,想和大家分享一下。
Jelly是一个完全通过SSH加入的社交空间。
没有网页,没有应用程序,没有登录流程。
你的SSH公钥就是你的身份。
我想要一个感觉像早期互联网社区的东西。简单,没有算法,没有挑衅性内容,没有抓取,没有AI生成的内容。只是人们在终端中实时交流。
目前的功能:
通过以下方式加入:ssh jellyssh.xyz
如果你没有密钥:ssh-keygen -t ed25519
公钥会自动创建账户
全球实时更新的动态
话题标签变成频道(前5个活跃话题)
ASCII头像 + 个人主题
留言簿 / 前8名(怀旧MySpace)
使用Bubble Tea构建的TUI
由Wish提供的SSH服务器
sqlite后端,无追踪或分析
不存储密码、电子邮件或个人数据
目前还很早,功能有些粗糙,但足够稳定,可以试用。
仍在完善输入处理、速率限制和防崩溃机制。
如果你去试试,我很想听听你的想法和反馈。
这是我一个人在做,我会边做边学习。
ssh jellyssh.xyz
感谢阅读。
嗨,HN,
我之所以开发这个工具,是因为我厌倦了将个人照片上传到第三方服务器进行压缩。我希望有一个尊重隐私的工具,能够100%在客户端完成所有操作。
这个工具完全在您的浏览器中运行(没有数据离开您的设备),因此没有文件大小限制或上传等待时间。目前支持批量压缩 JPG、PNG 和 WebP 格式的文件。
我正在 ToolboxNest 开发更大一套工具。非常期待听到您对压缩质量和用户界面的反馈!
最近,我一直在参与各种开源项目的工作。大多数情况下,我专注于标记为“适合新手的问题”。在开始处理一个问题之前,我通常会查看其他人之前的尝试。如果这个问题存在超过一年,通常我能找到几条PR(拉取请求)或评论。通过查看工作历史,通常可以明显看出之前的尝试为何没有成功:有人完全误解了任务,走了错误的方向;有人几乎不会编码;还有人只是不断提醒贡献者,而不是实际做工作[1]。令我感到惊讶的是,维护者几乎总能抽出时间回答每一个问题,审查那些极其糟糕和错误的PR,并花费数天时间与贡献者(包括我)沟通,提供关于工作的反馈,而他们自己完全可以在不到一个小时的时间内解决这个问题。老实说,我不明白为什么一个拥有10年以上经验的人会花时间审查我的“适合新手的问题”的PR,好像他们没有其他事情可做。我想要有所贡献并学习,但我不想打扰任何人或浪费任何人的时间,这就是我想知道维护者为什么会花时间审查我的代码的原因。他们的动机是什么?<p>[1] https://github.com/tensorflow/tensorflow/issues/22926#issuecomment-2888463504
我使用 status.cafe 已经有一段时间了,我非常喜欢这个平台,但让我感到困扰的一点是,无法导出我多年来发布的所有状态更新。如果有一天这个网站出现故障,那些历史记录就会消失。
带着这个想法,我创建了 kibun.social,这是一个类似于 status.cafe 的简约服务,基于 atmosphere 构建,这也是 Bluesky 使用的开放社交协议。
由于它是去中心化的,您发布的每条状态都会直接存储在您的个人数据存储(PDS)中。您可以导出这些状态,迁移到其他应用程序,或者将来构建自己的前端。这个平台基本上只是一个在您数据之上的查看器/写入器。
更新状态非常简单,只需几秒钟。您可以使用您的 atproto 账号登录,选择一个表情符号并发布状态。如果您想在其他地方关注这些状态,您还可以获得自己的 RSS 订阅源。
虽然现在还处于早期阶段,但我很想听听大家的想法,特别是那些喜欢小型社交空间和去中心化网络的人。