2作者: sherdil20228 个月前原帖
我已经使用过大多数现有的工具,但我讨厌它们的用户界面和用户体验。它们就像是90年代的产物,没有什么吸引力。<p>我可以自己构建一个(实际上是半成品的代码)——但在此之前,我想先了解是否有任何现代的工具(可选的移动友好型,因为我知道小屏幕和家谱不太兼容)。
1作者: ykjs8 个月前原帖
我们推出了图像到图像翻译API的第一个版本(v1),该API通过替换现有文本来翻译图像上的文字。 对于v1,它基本上是一个模型流程: OCR识别当前文本 -> 生成掩膜 -> 擦除文本 -> 翻译文本 -> 使用嵌入比较找到相似字体 -> 将文本映射回图像。 v1更像是一个原型,已经超越了许多由谷歌、Azure等提供的类似服务。 我们正在开发v2,计划训练一个扩散模型来翻译图像上的文本。目前,我们已经为英语和中文建立了工作流程,现在正在为其他语言构建数据集。