展示HN:图像到图像的翻译模型1 分•作者: ykjs•8 个月前•原帖我们推出了图像到图像翻译API的第一个版本(v1),该API通过替换现有文本来翻译图像上的文字。 对于v1,它基本上是一个模型流程: OCR识别当前文本 -> 生成掩膜 -> 擦除文本 -> 翻译文本 -> 使用嵌入比较找到相似字体 -> 将文本映射回图像。 v1更像是一个原型,已经超越了许多由谷歌、Azure等提供的类似服务。 我们正在开发v2,计划训练一个扩散模型来翻译图像上的文本。目前,我们已经为英语和中文建立了工作流程,现在正在为其他语言构建数据集。