Files
nexus/wiki/entities/Gemini.md
2026-04-28 08:02:54 +08:00

1.3 KiB
Raw Blame History

title, type, tags, sources, last_updated
title type tags sources last_updated
Gemini API entity
google
image-generation
ai
gemini
carousel
marketing-carousel-growth-engine
我用-gemini-3-一口气做了-10-个应用-附教程
2026-04-26

Definition

Google 的多模态 AI 模型 API支持文本和图像生成。在 marketing-carousel-growth-engine 中用于生成 TikTok/Instagram 轮播图。

Key Details

  • Slide 1: 纯文本 prompt 生成首张幻灯片,定义视觉 DNA
  • Slides 2-6: 图生图模式,以 slide-1.jpg 作为 --input-image 参考输入,保持视觉连贯性
  • Output: 768x1376 (9:16) JPG 格式轮播图
  • Script: generate-slides.sh 编排管道,generate_image.pyPython via uv)调用 API

技术规格

参数
分辨率 768×1376 (9:16 竖版)
格式 JPGTikTok 拒绝 PNG
视觉连贯性 第一张定义 DNA后续图生图
免费层 可用(需 Google AI Studio API Key

Aliases

  • Gemini
  • Google Gemini
  • Gemini 3.1 Flash Image