返回首页
最新
在过去几个月里,我尝试了许多潜在的替代变压器(transformers)的方法,其中之一是所谓的脉冲神经网络(Spiking Neural Networks,SNNs)。对于不熟悉它们的人来说,这是一种旨在使人工智能尽可能接近人脑的方式。换句话说,变压器、递归神经网络(RNN)和长短期记忆网络(LSTM)是以结果为导向的(并不寻求1:1模拟人类),而脉冲神经网络则试图精确模仿人类学习的方式。将它们用于自然语言处理(NLP)的想法并不完全新颖(可以查找SpikeGPT),然而据我所知,尚未有人尝试以下内容:
* 在脉冲神经网络中每n个标记后加入情节性长期记忆(这是我自己的想法);
* 在没有Torch/TensorFlow的情况下,使用C和C#进行实现(SpikeGPT是用Python和Torch编写的);
* 多种类型的“注意力”机制、训练模式和记忆模式;
* 无需反向传播的训练/学习;
* 在CPU友好的意义上,虽然速度仍然有点慢(不幸的是),但至少不需要GPU。
以下是C# Windows窗体实现和C/Cygwin移植的屏幕截图,以及关于该程序的Claude Sonnet 4.6和Gemini Pro 3.1的两张随机截图:
https://imgur.com/a/SAQqKmm
为什么从种子生成的文本仍然远未完美?有两个原因:语料库非常小,且C#的准确率低于100%。
不过,令人惊喜的是:似乎语法和语义都被学习到了,这与我想要加入长期情节记忆的方法结合起来,可以轻松扩展到数千个标记,而不会降低速度——这可能使其成为一个实用的程序。生成速度也非常快。
未来的工作:
* BPE(字节对编码),现在只是一个单词分词器……不适合代码;
* 我说过“代码”吗?这可能在编码方面完全失败……或者也许不是:完全未经测试;
* 该程序实际上有两个版本,另一个版本明显与这个版本不同,并且有C和甚至F#的移植,然而F#的移植根本无法工作……它总是产生完全的胡言乱语……这是一个重大错误;
* 从未在实际的神经形态CPU上测试过,只是在老旧的英特尔通用笔记本电脑上测试过;
* Python移植应该是可行的;
* 最后一个重大测试:大型文本语料库(以兆字节计)和超过95%的准确率——这是最终测试。
简而言之:我建立了一个网站,允许用户跟踪他们参加过的音乐会。如果你对工程/设计或如何记录演出(如音乐节、场馆等)有强烈的看法,我非常希望能听到你的意见!
在过去大约五年里,我一直在我的个人网站上跟踪我参加的演出(链接:<a href="https://love-music-will-travel.henryrobbins.com" rel="nofollow">https://love-music-will-travel.henryrobbins.com</a>)。看到我旅行的距离以及我去过某些场馆的次数非常有趣。我知道很多朋友也通过笔记、票根、Excel等方式记录他们的演出……我一直很沮丧,无法自己查看他们的演出数据……
showcount.com 是我满足这一需求的解决方案。它本质上是我旧个人网站的公共版本,任何人都可以创建账户并管理演出列表(我的账户是 <a href="https://www.showcount.com/user/love-music-will-travel" rel="nofollow">https://www.showcount.com/user/love-music-will-travel</a>)。
我目前正在寻找其他热爱现场音乐和/或数据分析的人来试用这个网站,并对各种设计选择提供意见。如果以下任何主题对你感兴趣,请联系我!
- 应该如何处理场馆名称/位置的变更?
- 音乐节应该如何处理?
- 我有一个初步版本的AI解析器,用于加载现有的演出列表;如何使其更加健壮?
- 还有什么应该拥有一流的跟踪支持(例如,出席的朋友)?
顺便提一下,这个项目也是我第一次尝试全面的氛围编码/架构工程。我开始这个项目时使用了Cursor,然后切换到Claude Code。我编程已经快十年了,主要使用Python和Java。全栈开发对我来说相对较新。以下是我的技术栈。大多数决策都是基于我认为能尽快实现网站初始版本的务实考虑。
- 基于Vercel托管的Next.js网页应用
- 基于Railway托管的Fast API后端服务(用于AI解析)
- Supabase
- 通过Axiom(日志记录)、PostHog(分析)和Sentry(监控)实现可观察性
- Clerk用于用户身份验证
- Google Maps API用于场馆位置
- Claude API用于AI解析器
- Terraform用于基础设施即代码
嗨,HN!<p>Druids(<a href="https://github.com/fulcrumresearch/druids" rel="nofollow">https://github.com/fulcrumresearch/druids</a>)是一个开源库,用于构建和运行多代理编码工作流。Druids 通过抽象化所有虚拟机基础设施、代理配置和通信,使这一过程变得简单。您可以在这里观看我们的演示视频(<a href="https://www.youtube.com/watch?v=EVJqW-tvSy4" rel="nofollow">https://www.youtube.com/watch?v=EVJqW-tvSy4</a>),了解它的样子。<p>从高层次来看:<p>- 用户可以编写 Python 程序,定义代理的角色以及它们之间的互动方式。<p>- 一个程序由事件组成——清晰的状态转换,代理或客户端可以调用这些事件来修改状态。每个事件都作为代理工具暴露出来。<p>- Druids 提供完整的虚拟机,以便代理能够持续运行并有效沟通。<p>我们创建 Druids 是因为我们在使用代理开发大量内部编码工具时,发现每次都要重新布线非常麻烦。<p>在构建 Druids 的过程中,我们意识到许多内部工具更容易用事件驱动架构来表达——将确定性控制流与代理行为分离——这种设计也使得多个代理能够可靠地协同工作。<p>我们在扩展并发代理数量时遇到了问题,因此决定让每个程序在一个隔离的沙箱程序运行时中运行,类似于运行 Modal 函数的方式。然后,每个代理使用代理令牌调用运行时,该令牌检查谁可以与谁通信或在虚拟机之间发送文件,然后应用工具调用。<p>我们的早期用户发现这个库在以下方面非常有用:<p>- 运行多个代理进行性能优化<p>- 构建自定义自动化软件管道,例如代码审查、渗透测试、大规模迁移等...<p>我们听说前沿实验室拥有快速启动 100 个代理并让它们以各种方式顺利协调的基础设施。我们希望 Druids 能成为使这一基础设施更易于访问的起点。
我们都知道谷歌一直在试图淘汰他们的免费旧版 Google Workspace 账户。之前他们几乎完全实现了这一点,但在最后一刻又撤回了这个决定。
我从那时起就拥有一个这样的账户,当时它被称为 Google Apps For Your Domain。这是我和几个朋友的主要谷歌账户。那时我们并没有将其用于商业,现在也没有。我只想拥有一个普通的消费者免费谷歌账户,但我也希望我和我的朋友能够在我们的电子邮件地址上使用自己的域名,而不是 gmail.com。正因为如此,我们在 Google Workspace 中被困了整整二十年。这真是个大错误。如果我有一台时光机,可以回去阻止自己就好了。
就在上周,我收到了一封电子邮件,称我们的免费 Google Workspace 账户因违反个人非商业使用政策而被标记。我们要么升级到付费账户,要么账户被删除,要么提出上诉。
当然,我提出了上诉,但并没有抱太大希望。上诉时没有任何方式可以添加信息,只是一个按钮。是的,我上诉了。
上诉结果不出所料地被拒绝了。没有解释,没有证据。只是一个简单的拒绝,没有进一步的选项或信息提供。
你想看看政策吗?他们提供的链接在这里:
https://knowledge.workspace.google.com/admin/billing/transition-from-a-free-edition
我在那个页面上找到的唯一政策是“个人非商业使用”这句话。如果有人有更详细的政策解释链接,以便我能找到我们可能违反的任何线索,请告诉我。
现在对我和少数朋友来说,我们唯一的选择似乎是支付每个用户每月 7 美元的荒谬费用,以获得与消费者 Gmail 账户几乎相同的服务,唯一的区别是我们的电子邮件地址使用自定义域名。至少在我们经历大量的 Google 数据导出和重新导入到其他地方的巨大努力之前是这样。是的,我有自动备份,因为我早已为这种情况做好准备。但这仍然是一个痛苦的迁移,我宁愿一开始就不必经历。
我知道人们有时会在 HN 上发布这样的故事,希望大科技公司的某个有权人士会注意到并来解决这个问题。我不能否认,如果那样发生我不会抱怨。但我对此没有任何期待。我也不喜欢获得特殊待遇。我真正想要的是所有用户都能得到公平对待。
与其乞求帮助,我更希望倡导法律救济。我实际上同意私营公司应该能够为其服务设定几乎任何使用政策,并在任何时候以几乎任何理由禁止任何人。然而,我认为他们有法律义务完整地公布这些政策。如果用户被发现违反了这些政策,公司应该被要求明确指出违反了政策的哪一部分。此外,他们还应该被要求提供导致其决定的证据。
我还认为,如果他们被要求提供一个真实的人类上诉流程,那将是理想的。但至少如果他们引用政策并提供证据,将使用户更容易通过法律系统或仲裁(如果有约束性仲裁条款)寻求救济。
最后,我想提醒大家。每当你注册一个你无法控制的平台时,请始终准备好这些账户随时可能被删除而没有任何警告。这就是我很久以前就建立备份流程的原因。这也是我停止注册新的专有平台的原因。我现在仍在使用的那些平台将是我最后使用的。尽管自我托管的设置过程很麻烦,但我向你保证,这比被迫逃离一个专有平台要轻松得多,因为它不可避免地会将你踢出或关闭。