返回首页
一周热榜
如果追溯大型语言模型(LLMs)从技术专家的梦想,到早期文本生成玩具,再到改变世界的ChatGPT发布,最后成为现代编程的日常工具(如Sonnet、Opus)的时间线,这一切发生的时间不到十年。这是一个令人兴奋、几乎难以置信的故事。
让我们看看我们是如何走到今天的,以及行业目前所面临的壁垒。
- **梦想阶段(2010-2016年)**。在上一个十年的黎明(2011年),发生了一件有趣的事情。维基百科和Stack Overflow这两个平台开始获得巨大的关注,大家在这些平台上合作,公开交流知识。回首往事,这似乎是人类更理想、以社区为驱动的发展路径——而我们却放弃了,转向了今天的集中式架构。
- **颠覆阶段(2016-2021年)**。一系列无关事件的完美风暴为人工智能铺平了道路。到2017年,新程序员们对Stack Overflow严格的政策、主观的问题拒绝和资深程序员的教条主义感到深深的沮丧。回想起来,那些严格的版主为后来的Copilot和ChatGPT奠定了基础。如果社区不愿意回答初学者的问题而选择降级,那么一个私人LLM乐意提供帮助。
再加上谷歌在2017年发布的里程碑论文《Attention Is All You Need》,解锁了Transformer架构,以及2020年COVID-19强制隔离的影响。突然间,虚拟助手作为孤立开发者的编程伙伴的土壤变得肥沃。
- **吸引阶段(2023-2025年)**。ChatGPT的发布毫无疑问地展示了“吸引”的简单性。对于非技术人员来说,这简直是魔法。像Copilot、Claude和Deepseek这样的专业LLM迅速成为程序员工具箱中不可或缺的一部分。与此同时,OpenAI仍在宣传其“非营利”根基,大家普遍认为这纯粹是为了赋能人类。
- **终局阶段(2025年至今/未来)**。到这个时候,人工智能公司在许多事情上都出现了误判。他们在优化“长期”目标,但正如约翰·梅纳德·凯恩斯多年前所说的,“从长远来看,我们都死了”。今天,风险投资者失去了耐心,因为尽管技术本身已经获得了广泛的普及和认可,但收入增长却没有那么快。吸引的效果在某种程度上奏效,但并未完全实现。
大多数前沿模型,如Sonnet、Opus和GPT 5.5,仍在“补贴模式”下运行。他们向用户收取的每月订阅费用(每月10/20/30美元)与运行这些“思考...”和“沉思...”的计算和内存需求相比,微不足道。为了真正显示利润并摆脱补贴模式,他们必须根据输入/输出令牌的规模进行收费,而这似乎很困难。很少有公司能够维持如此不确定的硬件扩展预算,最近的Uber故事正好展示了他们尝试这样做时发生的事情。
前沿模型试图替代人类历史上从未成功委托或自动化的东西——人类大脑的最高认知技能,如推理、演绎和逻辑。然而,努力仍在继续,目标是长期的。困境在于,如果他们停止补贴,吸引阶段可能会被逆转——人们很可能会回归到维基百科/Stack Overflow的旧方式,或者完全转向可以在自己硬件上本地运行的开源“干燥/学术”模型,如Llama和Qwen。然而,他们也无法无限期地继续补贴和耗尽资金。
当补贴的镜子破裂时,会发生什么?
大家好!
我是mistral.rs的维护者。我刚刚实现了通过/v1/skills端点支持与OpenAI兼容的代理技能,并且它可以与本地开放模型一起使用。
到目前为止,技能基本上只能用于封闭模型,而随着私有本地智能变得越来越重要,这个功能允许您使用本地模型进行XYZ操作。
它与OpenAI的/v1/skills API完全兼容,因此您可以轻松地将mistral.rs集成到现有代码中。
我们也支持相关工具:/v1/files或input_file用于将文件附加到您的提示中,mistral.rs还允许模型使用与OpenAI兼容的方法发送生成的文件。
尝试mistral.rs比以往任何时候都更简单:我们提供了适用于NVIDIA CUDA、Apple Silicon和CPU的预构建二进制文件!
# Linux/Mac
> curl --proto '=https' --tlsv1.2 -sSf [https://raw.githubusercontent.com/EricLBuehler/mistral.rs/master/install.sh](https://raw.githubusercontent.com/EricLBuehler/mistral.rs/master/install.sh) | sh
# Windows
> irm [https://raw.githubusercontent.com/EricLBuehler/mistral.rs/master/install.ps1](https://raw.githubusercontent.com/EricLBuehler/mistral.rs/master/install.ps1) | iex
然后:
mistralrs serve --agent --isq 4 -m google/gemma-4-E4B-it
我非常期待您尝试这个功能,并欢迎任何反馈!您对下一个版本有什么建议吗?
请查看GitHub:[https://github.com/EricLBuehler/mistral.rs](https://github.com/EricLBuehler/mistral.rs)
文档与快速入门:[https://ericlbuehler.github.io/mistral.rs/](https://ericlbuehler.github.io/mistral.rs/)
大家好,我是扎克 :wave:。我一直在思考误导性人工智能拉取请求的问题,想提出一个可能的解决方案,欢迎大家反馈。基本上,CleverCrow 允许支持者向 GitHub 仓库(或该仓库中的一组问题)赠送代币,供维护者用来构建或修复内容。实现过程中的有趣挑战在于如何实现代币池的动态管理,并确保维护者掌控全局,同时激励支持者继续支持他们的工作。