4作者: GavCo2 个月前原帖
新的 Gemini 3 Pro 图像模型(又称 Nano Banana)在生成幻灯片方面表现出色,因此我想创建一个命令行工具,让用户可以用简单的英语编辑 PDF 演示文稿。该工具将您想要编辑的页面转换为图像,随后将其与您的提示一起发送到模型 API,以生成编辑后的图像,然后再将更新后的图像转换回来并拼接到原始文档中。 示例: - `nano-pdf edit deck.pdf 5 "更新收入图表,显示第三季度为250万美元"` - `nano-pdf add deck.pdf 15 "创建一个包含5个要点的执行摘要幻灯片"` 功能: - 支持并行编辑多个页面 - 添加与您的演示文稿风格匹配的全新幻灯片 - 默认启用 Google 搜索,以便模型查找当前数据 - 保留文本层,方便复制/粘贴和搜索 该工具可以处理任何类型的 PDF,但我预计它在快速编辑演示文稿或类似内容时最为有用。 GitHub: [https://github.com/gavrielc/Nano-PDF](https://github.com/gavrielc/Nano-PDF)