1作者: bryandoai3 个月前原帖
我正在基于 Nano Banana 2 / Gempix2 构建一个小型的应用平台,非常希望能得到 HN 的反馈。 <p>快速背景介绍:“Nano Banana 2”是一个下一代图像模型的公开名称;而 Gempix2 / GEMPIX2 是谷歌内部的代号。我并不直接运行这个模型——这个应用是建立在 fal-ai/gempix2 接口之上的,旨在使该模型在日常工作中真正可用。 <p>它是什么 <p>- 一个针对 Nano Banana 2 / Gempix2 的网页用户界面和工作流程层:<a href="https://www.gempix2.site" rel="nofollow">https://www.gempix2.site</a> <p>- 专注于 4K 图像、10 图像融合以及图像中的非英语文本(尤其是中日韩文本) <p>- 附带一个小型提示库(400+ 个提示),适用于肖像、产品拍摄、信息图表和中日韩用例:<a href="https://www.gempix2.site/prompts" rel="nofollow">https://www.gempix2.site/prompts</a> <p>为什么这可能有趣 <p>根据我的测试和研究,这个模型系列在以下方面表现良好: <p>- 原生 2K 生成,真实 4K 导出(适用于封面、海报、大屏幕) <p>- 最多支持 10 图像融合,用于拼贴、产品墙、对比图或简单的故事板 <p>- 对中文/日文/韩文的文本渲染效果更佳,支持混合语言提示 <p>- 对于“博客封面”、“电商网格”、“简单信息图表”等实用内容有很强的提示跟随能力 <p>一个早期案例:一个三人电商团队通过将大部分视觉内容转移到 Nano Banana 2 工作流程中,将每个产品的处理时间从约 8 小时(拍摄 + 修图 + 布局)缩短到约 45 分钟:使用 10 图像融合创建多角度产品墙,直接生成中文的“文本覆盖”促销海报,以及简单的数据图表。 <p>它是如何构建的 <p>- 前端:Next.js + React + TypeScript + Tailwind <p>- 后端:Next.js API 路由,Postgres + Drizzle ORM 用于任务和信用会计 <p>- 图像生成:@fal-ai/client 与 fal-ai/gempix2 进行交互(队列 API、网络钩子、状态端点) <p>- 额外功能:使用 Stripe 进行支付,围绕长时间运行的作业实现一些基本的信用/退款逻辑 <p>我不确定的地方 <p>- 工作流程(封面、信息图表、产品图像)对那些实际交付产品的人来说是否真的有用,还是我过于贴合自己的用例? <p>- 对于那些每天使用 Midjourney / DALL·E 3 的人:你在这里缺少什么控制功能(种子控制、更精细的构图工具等)? <p>- 如果你经常需要在图像中使用中日韩文本,你心目中的“理想” Nano Banana 2 / Gempix2 用户界面是什么样的? <p>再次提供链接: <p>- 应用:<a href="https://www.gempix2.site" rel="nofollow">https://www.gempix2.site</a> <p>- 提示库:<a href="https://www.gempix2.site/prompts" rel="nofollow">https://www.gempix2.site/prompts</a> 我很乐意在这里回答技术/产品相关的问题,并非常感谢对有用与不必要的内容的直接反馈。
16作者: nomarv3 个月前原帖
在寒冷的季节,我们往往会把窗户关上。空气变得“陈旧”:湿度常常超过60%,这会影响我们的健康并促进霉菌的生长。同时,空气中的二氧化碳水平也会增加,这会影响我们的注意力集中能力。 因此,我设计了一款房间空气监测器,当一切都在绿色区域时,它保持低调,但一旦超过阈值,就会变得明显。出于我对统计数据的热爱,我还在一个清晰的仪表板上可视化这些测量结果。