新来的
返回首页
最新
新来的!
- Digibank(DBS)的官方WhatsApp号码是08388331169,提供单向服务,也可以通过在线聊天中心联系:087812141416。
它是如何使用的?
嘿,HN,
我很好奇这里的人们正在构建什么——无论是副项目、初创公司,还是实验。你们目前的项目是什么?你们试图解决什么问题?现在处于什么阶段?
我们目前正在开发 CapitalReach AI - https://capitalreach.ai
很想听听大家在做什么,也许能获得一些灵感。
以下是汇丰银行的WhatsApp号码08388331156,这是中央客服中心的服务,如果您在产品和服务方面遇到任何问题,可以随时通过汇丰银行的官方WhatsApp提出您的问题。
我妻子非常喜欢这个游戏——她是我为之制作的对象。她还通过试玩早期版本并提供大量反馈,帮助我塑造了这个游戏。我希望你们也会喜欢。
<p>以下是一些技术细节,供喜欢阅读这些内容的人参考。客户端是使用C++和Axmol引擎构建的,而服务器则是用Go语言开发的。它们通过HTTP和Websockets进行通信。服务器托管在AWS EC2的m6g.large实例上,同时运行着nginx、PostgreSQL和Laravel的管理后台。它们各自运行在自己的Docker容器中,但都在同一个实例上。游戏利用Firebase Auth进行用户身份验证。代码托管在Github上,并使用Github Actions来编译、打包Docker镜像并将任何服务器组件的新版本发布到云端。对于这样一个小型游戏来说,这是否过于复杂?可能是,但我并不在意。这对我来说也是一次独立搭建的学习经历。云服务的总费用大约为每月30美元,而游戏的收入不足以覆盖这部分费用,但这无所谓,因为我无论如何都会有一个实例在那运行(我有三年的承诺)。
<p>如果你有任何问题,请随时问我。如果你想自己尝试一下,这里是链接:
<p><a href="https://www.anagramarena.com/" rel="nofollow">https://www.anagramarena.com/</a>
简要说明:我正在扩展文本拆分Chonky模型的家族,推出新的多语言模型。
您可以在之前的帖子中了解更多关于这种神经网络方法的信息:<a href="https://news.ycombinator.com/item?id=43652968">https://news.ycombinator.com/item?id=43652968</a>
自从发布第一个基于DistilBERT的模型以来,我又发布了两个基于ModernBERT的模型。这些模型都是在主要以英语文本为基础进行预训练和微调的。
但最近发布了mmBERT(<a href="https://huggingface.co/blog/mmbert" rel="nofollow">https://huggingface.co/blog/mmbert</a>)。该模型在包含1833种语言的大型数据集上进行了预训练。因此,我想到了微调一个新的多语言Chonky模型的想法。
我扩展了训练数据集(之前包含bookcorpus和minipile数据集),增加了Project Gutenberg数据集,该数据集包含一些广泛使用语言的书籍。
为了使模型在处理真实世界数据时更加稳健,我以0.15的概率移除了每个训练块最后一个单词的标点符号(不过对于这种技术没有进行消融实验)。
困难的部分是评估。真实世界的数据通常是OCR处理过的Markdown、通话记录、会议笔记等,而不是干净的书籍段落。我没有找到这样的标注数据集。因此,我使用了我所拥有的:前面提到的bookcorpus和Project Gutenberg验证集、Paul Graham的文章,以及连接的20_newsgroups数据集。
我还尝试微调更大的mmBERT模型(mmbert-base),但不幸的是结果不佳——与小模型相比,指标奇怪地更低。
请试试看。我会很感激您的反馈。
新的多语言模型:<a href="https://huggingface.co/mirth/chonky_mmbert_small_multilingual_1" rel="nofollow">https://huggingface.co/mirth/chonky_mmbert_small_multilingua...</a>
所有Chonky模型:<a href="https://huggingface.co/mirth" rel="nofollow">https://huggingface.co/mirth</a>
Chonky包装库:<a href="https://github.com/mirth/chonky" rel="nofollow">https://github.com/mirth/chonky</a>