返回首页

一周热榜

1作者: lanakim94102 天前原帖
我厌倦了在自己的AI会话之间来回照顾上下文,还要为了不同的目的复制粘贴摘要或更新MD文件。因此,我构建了这个。<p>演示:<a href="https://youtube.com/shorts/i8xgbrY_Y0g" rel="nofollow">https://youtube.com/shorts/i8xgbrY_Y0g</a><p>目前仅限邀请,如果你想在这个月免费试用,请留言,我会给你发送一个代码。
1作者: rozumbrada6 天前原帖
我在思考恶意软件和网络蠕虫的未来。我敢打赌,它们将会是自我变异的,并能够根据当地环境进行适应,利用本地模型(一旦这些模型被嵌入到所有设备中,并在未来几年内性能足够强大)。基本上,这几乎就像一种真正的生物体,类似于真实的生物病毒。在这种情况下,大型语言模型(LLM)的非确定性反而成了一种特性。每次感染都可能走上不同的发展路径——一半可能会死亡,另一半可能会存活。可以想象这就像是基因编程,但它是自主的,并且是“加强版”的。对于一些非技术(甚至是技术)人员来说,这让人想起了天网,令人着迷的是,我们正处于一个这样的轨迹上,这种情况突然变得可以想象,并且理论上很快就能实现。 那么,为什么现在还没有发生呢?推理仍然很昂贵,本地模型尚未成熟,因此在大规模应用中没有投资回报。但一旦推理变得像电力或自来水一样便宜且本地化,这将是自然的发展。那么,我们该如何阻止这种传播呢? 现在是否已经有一些文献记录的实验?
1作者: arzt2 天前原帖
在过去一年中,我与一些非技术背景的人(传统金融人士、顾问)进行了几次对话,他们希望能有一个简单的解释,来了解GPT的工作原理。这些人通常能够快速掌握新概念,但不一定具备深入研究所需的数学背景,他们希望有一个比“它们预测单词”更强的框架。 我之前通常会推荐他们去看Karpathy的内容、《Illustrated Transformer》以及其他YouTube视频,但我觉得提供一些更直观的、无需数学基础的解释可能更适合解答诸如“为什么要进行矩阵乘法?”这样的问题。 因此,我制作了一个简单的互动课程,时长约60到70分钟,并附带了一些演示材料,可以分享给他们。我发现这个课程在帮助他们理解术语和概念方面非常有效,适合作为他们进一步学习Karpathy等内容的初步引导。 这个课程是免费的,无需注册。我非常希望能收到反馈,了解在哪些方面可能会让非技术读者感到困惑,以及从事这一领域的专业人士认为我在哪些地方简化得过头,失去了准确性。 了解更多信息请访问:understandgpt.xyz