1作者: potofski7 个月前原帖
我构建了一个骑行训练生成器,采用了两阶段的语言模型架构。 第一阶段:草稿生成器接收用户输入,创建高层次的训练结构,包括各个环节。 第二阶段:专业处理器(热身专家、间歇专家等)将每个环节转换为精确的功率目标和时间安排。 关键见解: - 使用模式(schemas)时,语言模型在生成结构化的JSON方面表现出色。 - 将复杂任务拆分为更小、更专注的语言模型调用,比使用单一的提示效果更好。 - 每个专业处理器都有独立的上下文,确保输出内容自成体系。 最终结果:“4x4分钟阈值间歇”变成了精确的功率区间和持续时间,能够直接与Wahoo Element自行车电脑同步。 还有其他人发现结构化输出在复杂数据生成方面出奇可靠吗?
1作者: jongoiko7 个月前原帖
几周前,我产生了一个愚蠢的想法:在任天堂游戏机Game Boy上进行神经网络推理。我选择了MNIST手写数字数据集,研究了int8量化,并开始动手制作。 最终的结果是一个可玩的ROM,大小适合单个ROM内存块(16 KB),其中包含了一个训练好的神经网络和推理代码。在Game Boy上运行的神经网络在MNIST测试集上的准确率达到了93.86%;虽然对于MNIST来说这个结果并不算好(因为这是一个相对简单的分类任务),但对于在Game Boy上运行的模型来说,已经相当不错了。 你可以在发布页面找到编译好的ROM(<a href="https://github.com/jongoiko/gb-nn/releases">https://github.com/jongoiko/gb-nn/releases</a>),欢迎试用!