Models

Gemini 3 Pro Image Preview (Nano Banana Pro)

Descripción General

Gemini 3 Pro Image Preview (también conocido como Nano Banana Pro) está diseñado para producción de activos profesionales e instrucciones complejas. Este modelo cuenta con razonamiento avanzado "Thinking" que refina la composición antes de la generación, fundamentación en el mundo real usando Google Search, y puede generar imágenes con resolución de hasta 4K.

Mejor para: diseño gráfico complejo, maquetas de productos de alta fidelidad, renderizado preciso de texto y visualizaciones de datos que requieren fundamentación en el mundo real.

Variantes del Modelo

ModeloResoluciónCréditos / ImagenDescripción
gemini-3-pro-image-preview1K (1024px)8Calidad profesional con Thinking
gemini-3-pro-image-preview-2k2K (2048px)8Salida profesional de alta resolución
gemini-3-pro-image-preview-4k4K (4096px)16Calidad de estudio ultra alta resolución

Las variantes Nano Banana Pro 1K y 2K tienen el mismo precio, haciendo que 2K sea la mejor opción por defecto cuando se necesita mayor resolución sin costo adicional. La variante 4K duplica el costo de créditos pero entrega una salida de calidad de estudio adecuada para impresiones de gran formato.

Capacidades

CaracterísticaSoporte
Texto a Imagen✅ Soportado
Edición de Imagen✅ Soportado
Generación por Lotes✅ Hasta 9 imágenes por solicitud
Máx. Imágenes de Entrada5 (alta fidelidad), hasta 14 en total
Thinking✅ Soportado (activado por defecto)
Search Grounding✅ Soportado

Relaciones de Aspecto Soportadas

1:1 · 16:9 · 9:16 · 4:3 · 3:4 · 2:3 · 3:2 · 4:5 · 5:4

Precios

Todos los precios se basan en el costo por imagen a través de la API de NanoBanana, significativamente más baratos que los canales oficiales.

VarianteNuestro PrecioPrecio OficialAhorro
1K (1024px)~$0.08~$0.134~40%
2K (2048px)~$0.08~$0.134~40%
4K (4096px)~$0.16~$0.268~40%

Dado que las variantes Nano Banana Pro 1K y 2K comparten el mismo precio, no hay razón para usar 1K a menos que necesites específicamente archivos más pequeños o tiempos de respuesta más rápidos.

Funciones Avanzadas

Modo Thinking de Nano Banana Pro

Nano Banana Pro incluye un paso de razonamiento incorporado llamado "Thinking" que planifica la composición de la imagen antes del renderizado. El paso Thinking analiza el prompt para:

  • Relaciones espaciales: Dónde deben colocarse los objetos en relación entre sí
  • Consistencia de iluminación: Asegurar que las fuentes de luz y sombras se alineen correctamente
  • Disposición del texto: Planificar dónde aparece el texto en la composición para evitar superposiciones
  • Coherencia de estilo: Mantener estilos artísticos a través de todos los elementos de la imagen

El modo Thinking está activado por defecto y generalmente produce resultados más precisos y detallados comparado con modelos sin esta capacidad.

Search Grounding

Cuando la fundamentación está habilitada, el modelo puede incorporar conocimiento del mundo real desde Google Search en el proceso de generación. Esto es particularmente valioso para:

  • Lugares reales: Generar representaciones precisas de monumentos, ciudades y sitios naturales
  • Eventos actuales: Crear imágenes que hagan referencia a acontecimientos recientes con precisión visual
  • Precisión de productos: Generar imágenes de productos reales con marca, colores y proporciones correctos
  • Precisión histórica: Producir imágenes apropiadas para la época con vestimenta, arquitectura y artefactos correctos

Mejores Prácticas

Cuándo Usar Este Modelo

Elige Nano Banana Pro sobre el nivel Flash cuando tu proyecto requiera:

  • Renderizado preciso de texto: Posters, infografías o cualquier imagen que contenga texto legible
  • Composiciones complejas: Escenas con múltiples sujetos, disposiciones espaciales específicas o detalle intrincado
  • Precisión factual: Imágenes que deben reflejar información del mundo real (ubicaciones, productos, datos)
  • Salida de calidad de estudio: Activos de marketing, presentaciones profesionales o entregables para clientes

Consejos de Prompts para Resultados Profesionales

  • Describe la iluminación explícitamente: Especifica "luz suave difusa del norte" o "iluminación lateral dramática con sombras profundas".
  • Incluye descriptores de materiales: Frases como "superficie de aluminio cepillado", "acabado cerámico mate" o "impresión de revista brillante" ayudan al modelo a producir texturas realistas.
  • Referencia estilos de composición: Menciona estilos específicos de fotografía como "fotografía de producto en fondo sin costuras" o "disposición editorial de moda".

Casos de Uso

  • Producción de activos profesionales — Imágenes de calidad de estudio para campañas publicitarias comerciales
  • Diseño gráfico complejo — Seguir instrucciones intrincadas de múltiples pasos con precisión para posters y empaques
  • Renderizado preciso de texto — Texto preciso para anuncios, infografías y gráficos de redes sociales
  • Maquetas de productos — Fotografía comercial de alta fidelidad con integración precisa de logos y marca
  • Visualizaciones basadas en datos — Generar gráficos, diagramas e infografías fundamentados con datos reales de Google Search
  • Transferencia de estilo — Mezclar y fusionar estilos artísticos en una sola composición usando imágenes de referencia
  • Contenido editorial — Portadas de revistas, ilustraciones de libros y encabezados de artículos con acabado profesional
  • Visualización arquitectónica — Renderizar conceptos de diseño interior y exterior con iluminación y materiales realistas

Inicio Rápido

Reemplaza YOUR_API_KEY con tu clave API real. ¿Aún no tienes una? Crea tu clave API aquí.

curl -X POST "https://api.nanobananaapi.dev/v1/images/generate" \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "prompt": "A professional product shot of a sleek perfume bottle on a marble surface with dramatic studio lighting",
    "num": 1,
    "model": "gemini-3-pro-image-preview",
    "image_size": "4:3"
  }'
const res = await fetch('https://api.nanobananaapi.dev/v1/images/generate', {
  method: 'POST',
  headers: {
    Authorization: 'Bearer YOUR_API_KEY',
    'Content-Type': 'application/json',
  },
  body: JSON.stringify({
    prompt: 'A professional product shot of a sleek perfume bottle on a marble surface with dramatic studio lighting',
    num: 1,
    model: 'gemini-3-pro-image-preview',
    image_size: '4:3',
  }),
});

const result = await res.json();
console.log(result.data.url);
import requests

res = requests.post(
  'https://api.nanobananaapi.dev/v1/images/generate',
  headers={
    'Authorization': 'Bearer YOUR_API_KEY',
    'Content-Type': 'application/json',
  },
  json={
    'prompt': 'A professional product shot of a sleek perfume bottle on a marble surface with dramatic studio lighting',
    'num': 1,
    'model': 'gemini-3-pro-image-preview',
    'image_size': '4:3',
  },
  timeout=60,
)

result = res.json()
print(result['data']['url'])

Referencia de Parámetros API

ParámetroTipoRequeridoDescripción
promptstringDescripción de texto de la imagen a generar
modelstringIdentificador del modelo (ver variantes arriba)
numintegerNoNúmero de imágenes a generar (1–9, por defecto 1)
image_sizestringNoRelación de aspecto (por defecto 1:1)
ref_imagesarrayNoImágenes de referencia para guía de estilo o personaje

Preguntas Frecuentes

¿Por qué Nano Banana Pro cuesta más que el nivel Flash? El nivel Pro utiliza un pipeline más sofisticado con un paso adicional de razonamiento (Thinking) y acceso a Google Search para fundamentación. Esto produce resultados de mayor calidad pero requiere más recursos computacionales por imagen.

¿Cuándo debería usar resolución 4K? Usa 4K para materiales listos para imprenta, displays de gran formato (vallas publicitarias, banners de ferias) y cualquier escenario donde la imagen será vista de cerca en una pantalla de alto DPI.

¿Puedo desactivar el modo Thinking? El modo Thinking está activado por defecto y se recomienda para mejores resultados. Desactivarlo puede reducir la latencia pero puede resultar en composiciones menos coherentes.

¿Qué tan preciso es el renderizado de texto? Para frases cortas y titulares, la precisión es generalmente muy alta. Para párrafos más largos o tamaños de texto pequeños, considera usar una herramienta dedicada de superposición de texto después de la generación.

Relacionados