返回首页
最新
我一直在实验一个许多人在谷歌/Gemini生态系统中随意称为“Nano Banana 2”(也称为Nano Banana Pro)的图像模型,并围绕它建立了一个小型网页游乐场:
<a href="https://www.nanobananapro.site" rel="nofollow">https://www.nanobananapro.site</a>
Nano Banana Pro是一个下一代图像模型,专注于更高的保真度和更好的推理能力。与早期的“Nano Banana”图像API相比,它旨在在几个特定领域进行改进:
- 原生2K输出,干净的4K放大
- 更清晰的微细节和更逼真的材质
- 更稳定的文本渲染(标签、用户界面、海报等)
- 针对复杂提示的意图驱动构图
- 灵活的宽高比(1:1、4:5、16:9、21:9、9:16等)
- 更好的角色身份和风格一致性
- 更强的图像修补/扩展能力,具备场景感知编辑
该网站旨在作为一个简单的游乐场,用于:
- 测试复杂场景的提示工程(在一个提示中包含多个角色、动作和约束)
- 尝试排版和布局(横幅、用户界面模型、带多行文本的海报)
- 探索编辑工作流程,如遮罩、扩展场景或精细化图像的某些部分
- 比较它在物理/空间逻辑处理方面与您使用的其他图像模型的表现
我特别希望听到以下方面的反馈:
- 建立生产级创意工具或用户生成内容管道(头像、封面、营销视觉)的人员
- 关注文本渲染和布局质量的人士
- 任何在当前图像模型的宽高比、一致性或编辑方面遇到限制的人
我希望得到反馈的问题:
- 为了在实际工作流程中有用,还缺少什么?
- 您希望暴露哪些调节项(引导、构图控制、宽高比预设、编辑工具)?
- 有什么可以使您更容易将这样的工具集成到自己的产品或管道中?
如果您尝试并成功找到了问题(或发现其表现不佳的情况),我非常希望能得到示例和想法。
在Ledger Labs,我们与使用多种软件的会计师合作,这些软件包括QuickBooks、Xero和Zoho Books。选择通常取决于易用性、自动化程度以及无缝集成,这些因素有助于简化日常会计工作。