4作者: tudorizer6 个月前原帖
在编写代码的单一背景下,历史上我们曾多次尝试生成代码,通常是在非常严格的约束条件下。<p>生成式人工智能(GenAI)也处于同一领域,但它有额外的步骤、优点和缺点。它并不是“一个初级开发者”,而是一种新的工具。<p>工匠喜欢这把新工具,挑战它的极限,深入研究其复杂性。工具在磨损和成本方面都有其限制。<p>初级开发者是人类,寻求生存和发展。他们比大多数人更快地掌握新工具。唯一的障碍依然是:获取这些工具的机会和对结果的可见性。<p>过度拟人化一把锤子的好处是什么呢?
15作者: zaidqureshi6 个月前原帖
嗨,HN,我们是Zaid、Muhammad和Hammad,Uplift AI的联合创始人(<a href="https://upliftai.org">https://upliftai.org</a>)。我们构建能够使用被忽视语言的模型——目前支持乌尔都语、信德语和俾路支语。 全球有十亿人无法阅读。在像巴基斯坦这样的国家——世界第五人口大国——42%的成年人是文盲。这阻碍了整个经济的发展:患者无法阅读医疗报告,父母无法帮助孩子完成作业,银行无法全面数字化,农民无法研究最佳实践,人们只能记住智能手机应用的按钮序列。语音人工智能接口可以解决这些问题,我们认为这可能是现代人工智能的伟大益处之一。 目前,现有的语音模型几乎无法支持这些语言,而大型科技公司进展缓慢。 Uplift AI最初是一个侧项目,旨在为翻译和语音模型制作数据集。对我们来说,这只是一个“有趣的副业”,并不是一个“重要的全职项目”。借助一些初步数据,我们在WhatsApp上快速搭建了一个乌尔都语语音机器人,并将其提供给一位家政工人。两天内就有800人使用了它。当我们深入了解用户时,我们发现文本接口对许多人来说并不适用。因此,我们开始全职运营Uplift AI以解决这个问题。 最具挑战性的部分是,构建优秀语音模型所需的所有基础组件在这些语言中都存在问题。例如,如果你正在创建一个语音合成模型,你会从YouTube抓取大量数据,并使用转录模型进行自动标注……在英语中这都非常简单。但在被忽视的语言中,由于转录模式不准确,这种方法并不奏效。 还有许多其他挑战。例如,当你雇佣人工转录员来标注数据时,他们通常没有适用于自己语言的拼写校正工具,这会在数据中产生大量噪音……使得在数据量少的情况下训练模型变得困难。在音素、静音检测、附加符号等方面还有更多挑战。 我们通过制作优秀的内部工具来帮助数据标注来解决这些问题。此外,我们自己获取数据,而不是购买。这看似反直觉,但相较于那些购买数据后再进行训练的公司,这是一个巨大的优势。通过自行获取数据,我们能够创建正确的数据分布,并用更少的数据获得更好的模型。通过在内部完成整个过程(数据、标注、训练、部署),我们能够更快地取得进展。 今天,我们公开提供乌尔都语、信德语和俾路支语的文本转语音API。这里有一个展示这一点的视频:<a href="https://www.loom.com/share/dcd5020967444c228e9c127151e7a9f5" rel="nofollow">https://www.loom.com/share/dcd5020967444c228e9c127151e7a9f5</a>。 可汗学院正在使用我们的技术将视频配音成乌尔都语(<a href="https://ur.khanacademy.org" rel="nofollow">https://ur.khanacademy.org</a>)。 我们的模型在信息性用例(如AI机器人)方面表现出色,但在情感性用例(如诗歌)方面还需要更多的工作。 我们已经向很多人提供了私密的测试访问,今天我们将公开发布我们的模型。我们相信这将是我们最快了解表现不佳领域的方式,以便迅速进行改进。 我们非常希望听到大家的反馈,尤其是关于你们在被忽视语言(不仅仅是我们开始的巴基斯坦语言)方面的经验,以及你们的总体意见。