Gemini 3 Pro Image Preview (Nano Banana Pro)
Descripción General
Gemini 3 Pro Image Preview (también conocido como Nano Banana Pro) está diseñado para producción de activos profesionales e instrucciones complejas. Este modelo cuenta con razonamiento avanzado "Thinking" que refina la composición antes de la generación, fundamentación en el mundo real usando Google Search, y puede generar imágenes con resolución de hasta 4K.
Mejor para: diseño gráfico complejo, maquetas de productos de alta fidelidad, renderizado preciso de texto y visualizaciones de datos que requieren fundamentación en el mundo real.
Variantes del Modelo
| Modelo | Resolución | Créditos / Imagen | Descripción |
|---|---|---|---|
gemini-3-pro-image-preview | 1K (1024px) | 8 | Calidad profesional con Thinking |
gemini-3-pro-image-preview-2k | 2K (2048px) | 8 | Salida profesional de alta resolución |
gemini-3-pro-image-preview-4k | 4K (4096px) | 16 | Calidad de estudio ultra alta resolución |
Las variantes Nano Banana Pro 1K y 2K tienen el mismo precio, haciendo que 2K sea la mejor opción por defecto cuando se necesita mayor resolución sin costo adicional. La variante 4K duplica el costo de créditos pero entrega una salida de calidad de estudio adecuada para impresiones de gran formato.
Capacidades
| Característica | Soporte |
|---|---|
| Texto a Imagen | ✅ Soportado |
| Edición de Imagen | ✅ Soportado |
| Generación por Lotes | ✅ Hasta 9 imágenes por solicitud |
| Máx. Imágenes de Entrada | 5 (alta fidelidad), hasta 14 en total |
| Thinking | ✅ Soportado (activado por defecto) |
| Search Grounding | ✅ Soportado |
Relaciones de Aspecto Soportadas
1:1 · 16:9 · 9:16 · 4:3 · 3:4 · 2:3 · 3:2 · 4:5 · 5:4
Precios
Todos los precios se basan en el costo por imagen a través de la API de NanoBanana, significativamente más baratos que los canales oficiales.
| Variante | Nuestro Precio | Precio Oficial | Ahorro |
|---|---|---|---|
| 1K (1024px) | ~$0.08 | ~$0.134 | ~40% |
| 2K (2048px) | ~$0.08 | ~$0.134 | ~40% |
| 4K (4096px) | ~$0.16 | ~$0.268 | ~40% |
Dado que las variantes Nano Banana Pro 1K y 2K comparten el mismo precio, no hay razón para usar 1K a menos que necesites específicamente archivos más pequeños o tiempos de respuesta más rápidos.
Funciones Avanzadas
Modo Thinking de Nano Banana Pro
Nano Banana Pro incluye un paso de razonamiento incorporado llamado "Thinking" que planifica la composición de la imagen antes del renderizado. El paso Thinking analiza el prompt para:
- Relaciones espaciales: Dónde deben colocarse los objetos en relación entre sí
- Consistencia de iluminación: Asegurar que las fuentes de luz y sombras se alineen correctamente
- Disposición del texto: Planificar dónde aparece el texto en la composición para evitar superposiciones
- Coherencia de estilo: Mantener estilos artísticos a través de todos los elementos de la imagen
El modo Thinking está activado por defecto y generalmente produce resultados más precisos y detallados comparado con modelos sin esta capacidad.
Search Grounding
Cuando la fundamentación está habilitada, el modelo puede incorporar conocimiento del mundo real desde Google Search en el proceso de generación. Esto es particularmente valioso para:
- Lugares reales: Generar representaciones precisas de monumentos, ciudades y sitios naturales
- Eventos actuales: Crear imágenes que hagan referencia a acontecimientos recientes con precisión visual
- Precisión de productos: Generar imágenes de productos reales con marca, colores y proporciones correctos
- Precisión histórica: Producir imágenes apropiadas para la época con vestimenta, arquitectura y artefactos correctos
Mejores Prácticas
Cuándo Usar Este Modelo
Elige Nano Banana Pro sobre el nivel Flash cuando tu proyecto requiera:
- Renderizado preciso de texto: Posters, infografías o cualquier imagen que contenga texto legible
- Composiciones complejas: Escenas con múltiples sujetos, disposiciones espaciales específicas o detalle intrincado
- Precisión factual: Imágenes que deben reflejar información del mundo real (ubicaciones, productos, datos)
- Salida de calidad de estudio: Activos de marketing, presentaciones profesionales o entregables para clientes
Consejos de Prompts para Resultados Profesionales
- Describe la iluminación explícitamente: Especifica "luz suave difusa del norte" o "iluminación lateral dramática con sombras profundas".
- Incluye descriptores de materiales: Frases como "superficie de aluminio cepillado", "acabado cerámico mate" o "impresión de revista brillante" ayudan al modelo a producir texturas realistas.
- Referencia estilos de composición: Menciona estilos específicos de fotografía como "fotografía de producto en fondo sin costuras" o "disposición editorial de moda".
Casos de Uso
- Producción de activos profesionales — Imágenes de calidad de estudio para campañas publicitarias comerciales
- Diseño gráfico complejo — Seguir instrucciones intrincadas de múltiples pasos con precisión para posters y empaques
- Renderizado preciso de texto — Texto preciso para anuncios, infografías y gráficos de redes sociales
- Maquetas de productos — Fotografía comercial de alta fidelidad con integración precisa de logos y marca
- Visualizaciones basadas en datos — Generar gráficos, diagramas e infografías fundamentados con datos reales de Google Search
- Transferencia de estilo — Mezclar y fusionar estilos artísticos en una sola composición usando imágenes de referencia
- Contenido editorial — Portadas de revistas, ilustraciones de libros y encabezados de artículos con acabado profesional
- Visualización arquitectónica — Renderizar conceptos de diseño interior y exterior con iluminación y materiales realistas
Inicio Rápido
Reemplaza YOUR_API_KEY con tu clave API real. ¿Aún no tienes una? Crea tu clave API aquí.
curl -X POST "https://api.nanobananaapi.dev/v1/images/generate" \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"prompt": "A professional product shot of a sleek perfume bottle on a marble surface with dramatic studio lighting",
"num": 1,
"model": "gemini-3-pro-image-preview",
"image_size": "4:3"
}'const res = await fetch('https://api.nanobananaapi.dev/v1/images/generate', {
method: 'POST',
headers: {
Authorization: 'Bearer YOUR_API_KEY',
'Content-Type': 'application/json',
},
body: JSON.stringify({
prompt: 'A professional product shot of a sleek perfume bottle on a marble surface with dramatic studio lighting',
num: 1,
model: 'gemini-3-pro-image-preview',
image_size: '4:3',
}),
});
const result = await res.json();
console.log(result.data.url);import requests
res = requests.post(
'https://api.nanobananaapi.dev/v1/images/generate',
headers={
'Authorization': 'Bearer YOUR_API_KEY',
'Content-Type': 'application/json',
},
json={
'prompt': 'A professional product shot of a sleek perfume bottle on a marble surface with dramatic studio lighting',
'num': 1,
'model': 'gemini-3-pro-image-preview',
'image_size': '4:3',
},
timeout=60,
)
result = res.json()
print(result['data']['url'])Referencia de Parámetros API
| Parámetro | Tipo | Requerido | Descripción |
|---|---|---|---|
prompt | string | Sí | Descripción de texto de la imagen a generar |
model | string | Sí | Identificador del modelo (ver variantes arriba) |
num | integer | No | Número de imágenes a generar (1–9, por defecto 1) |
image_size | string | No | Relación de aspecto (por defecto 1:1) |
ref_images | array | No | Imágenes de referencia para guía de estilo o personaje |
Preguntas Frecuentes
¿Por qué Nano Banana Pro cuesta más que el nivel Flash? El nivel Pro utiliza un pipeline más sofisticado con un paso adicional de razonamiento (Thinking) y acceso a Google Search para fundamentación. Esto produce resultados de mayor calidad pero requiere más recursos computacionales por imagen.
¿Cuándo debería usar resolución 4K? Usa 4K para materiales listos para imprenta, displays de gran formato (vallas publicitarias, banners de ferias) y cualquier escenario donde la imagen será vista de cerca en una pantalla de alto DPI.
¿Puedo desactivar el modo Thinking? El modo Thinking está activado por defecto y se recomienda para mejores resultados. Desactivarlo puede reducir la latencia pero puede resultar en composiciones menos coherentes.
¿Qué tan preciso es el renderizado de texto? Para frases cortas y titulares, la precisión es generalmente muy alta. Para párrafos más largos o tamaños de texto pequeños, considera usar una herramienta dedicada de superposición de texto después de la generación.
Relacionados
- API de Texto a Imagen — Referencia completa de la API para generación de imágenes
- API de Imagen a Imagen — Edición y transformación de imágenes
- Gemini 2.5 Flash Image — Mayor velocidad, menor costo
- Gemini 3.1 Flash Image Preview — Alta eficiencia con resoluciones extendidas
Gemini 2.5 Flash Image
Nano Banana — motor de generación de imágenes de alta velocidad optimizado para eficiencia, baja latencia y flujos de trabajo económicos por lotes.
Gemini 3.1 Flash Image Preview
Nano Banana 2 — generación de imágenes de alta calidad con resoluciones extendidas de 512px a 4K y relaciones de aspecto ultra anchas.