返回首页
最新
我在一个半月前发布了这个内容:
<a href="https://news.ycombinator.com/item?id=45876742">https://news.ycombinator.com/item?id=45876742</a>
我对其进行了重写,使其更加简洁,从951行代码减少到仅364行,且核心功能和生成质量没有损失。
我还添加了一个小型的GPT实现作为对比(灵感来自Andrej Karpathy的代码)。这两个模型的实现大约有80%是相同的,主要的区别在于生成和获取批次的函数。模型架构、训练循环等仅在19行代码上有所不同。
训练好的权重已包含在内,因此你可以直接克隆并在本地运行。GPT模型的连贯性稍强,但扩散模型在其规模下的质量也相当不错。
Supabase曾是我的首选,但我在想是否还有其他更简单的现成解决方案我还没有考虑到。我正在研究Clerk,也询问过大型语言模型,但我想听听那些真正参与开发的开发者对哪些方案有效、哪些方案简单的真实看法。
从网页中提取主要内容并转换为Markdown格式。
对于JavaScript重的网站使用Puppeteer,使用Pandoc确保转换质量。<p>演示:<a href="https://downmark.fly.dev" rel="nofollow">https://downmark.fly.dev</a><p>API:curl "<a href="https://downmark.fly.dev/markdown?q=URL" rel="nofollow">https://downmark.fly.dev/markdown?q=URL</a>"
代码:<a href="https://github.com/adhipk/downmark" rel="nofollow">https://github.com/adhipk/downmark</a><p>欢迎反馈。
新年快乐!这是我为孩子们制作的一个小海龟图形游戏,我想分享给大家。你可以编写海龟的“DNA”,然后观察会发生什么。<p>欢迎任何评论或建议!