返回首页
最新
谷歌不允许非商业账户接收发票。我必须注册一个Workspace订阅(我既不想要也不需要),才能以我所需的格式接收发票,以便将我的Gemini订阅费用作为商业支出。这真是太愚蠢了,因为在OpenAI和Anthropic的服务上,我不需要这样做——只需两秒钟的设置更改。因此,我不得不离开Gemini。
如果是这样,哪种类型的短篇故事在这方面通常最成功呢?
对于那些希望进入这个领域或普遍提升技能的人,有哪些很好的资源?我很想听听一些推荐。
我创建了1e4.ai——一个国际象棋网页应用,你可以与经过训练以模仿特定等级范围内人类Lichess玩家的神经网络对弈。每个100分的等级区间(从约800到2200+)都有一个独立的模型,这些机器人不仅选择类似人类的走法,还会消耗时间,在时间压力下表现更差,并以人类常见的方式犯错。
<p>实时演示:<a href="https://1e4.ai" rel="nofollow">https://1e4.ai</a>
代码:<a href="https://github.com/thomasj02/1e4_ai" rel="nofollow">https://github.com/thomasj02/1e4_ai</a>
<p>一些可能有趣的内容:
<p>- 训练数据几乎涵盖了一整年的Lichess快棋比赛,总计约10亿局游戏。
- 网络架构是一个小型的(约900万参数)基于变换器的网络,输入包括棋盘、最近的走棋历史、玩家的等级和剩余时间。每个等级区间有三个独立的模型:走法、时间使用和胜率。时间模型使得机器人在时间压力下的表现更像人类,而不是瞬间决策。由于走法模型将时间作为一个输入参数,它也学习在时间压力下犯错,类似于人类的表现。
- 由于网络非常小,推理时不需要GPU——它可以轻松在本地CPU上运行。
- 小型网络的缺点是,当等级超过约1700时,表现会稍显弱势。它能够识别短期战术,但无法处理长时间的多步组合。
- 最初在租用的8xH100集群上进行训练,然后在我的本地GPU上针对不同的等级范围进行微调。
- 受到Maia-2和DeepMind的“无搜索的国际象棋大师级别”启发。在一个保留的Lichess快棋基准测试中,它在第一步走法预测上击败了Maia-2(56.7%对52.7%),在胜率校准上也有显著优势(Brier 0.176对0.272)。相关数据和代码见<a href="https://github.com/thomasj02/1e4_ai/tree/master/experiments/maia2_benchmark" rel="nofollow">https://github.com/thomasj02/1e4_ai/tree/master/experiments/...</a>。
<p>- 数据管道通过C++和nanobind实现,然后使用Pytorch进行训练。确保这一点是我花费最多时间的部分。预先打乱数据集,并能够在训练时顺序读取打乱后的数据集,使得GPU的利用率保持在高水平。没有这一点,GPU在空闲时会浪费大量时间在输入/输出上。
<p>欢迎就等级条件、时间模型或数据管道提出问题。