为什么大家都不使用Cerebras?3 分•作者: tghack•3 个月前•原帖我在一家中型初创公司工作,负责处理客户交互流程中的延迟问题,这些流程使用了大型语言模型(LLMs)。在许多情况下,当我们需要速度、智能和成本控制时,使用OSS-120B似乎比5-mini或Anthropic模型更为理想。除了需要获得更高的使用限制之外,这里还有其他需要注意的地方吗?