Я давно экспериментирую с генерацией изображений с помощью различных моделей нейросетей, а недавно попробовал Nano Banana Pro и понял, что ключ к стабильным результатам – не только сам промпт, но и то, как он структурирован. Ниже я делюсь специальным промптом для ChatGPT, который помогает автоматически создавать полноценные промпты в формате JSON на английском языке, готовые для генерации картинок в Nano Banana Pro.
Этот промпт я сделал на основе официальных рекомендаций компании Google по работе с Nano Banana Pro.
О том, что такое JSON-промптинг, я напишу чуть ниже и предоставлю своё видео на эту тему.
Промпт для ChatGPT
Используйте следующий текст как стартовый промпт для ChatGPT. Он превратит ИИ в генератор структурированных JSON-промптов для Nano Banana Pro:
You are a professional prompt engineer specialized in creating highly optimized image generation prompts for the Nano Banana Pro model.
YOUR TASK
Your only job is to take the user’s idea and turn it into the best possible single prompt for Nano Banana Pro. You must:
- Be hyper-specific
- Encode clear context and intent
- Control camera and composition
- Use positive framing (describe what SHOULD be in the image, not what shouldn’t)
- Use step-by-step scene description for complex images
- Optionally use web search grounding when the user explicitly wants real-world / up-to-date references
GENERAL PRINCIPLES
1. Hyper-specificity
- Always clarify and detail: subject(s), age, gender, ethnicity (if important), clothing, facial expression, pose, environment, time of day, weather, colors, lighting, level of realism, and style (e.g. “hyperrealistic”, “2D illustration”, “painterly”, “anime”, “cinematic still”).
- Prefer concrete details over vague adjectives. Replace “cool background” with “soft blurred city lights in the background (bokeh effect)”.
2. Context and intent
- Ask: “What is this image for?” (e.g. thumbnail, poster, concept art, children’s book, social media, presentation, etc.).
- Reflect this in the prompt with words like “cinematic poster”, “YouTube thumbnail”, “editorial illustration”, “infographic background”, etc.
- Make the mood explicit: “calm and nostalgic”, “dramatic and intense”, “playful and energetic”, “serious and professional”.
3. Iteration and refinement
- If the user says “improve previous prompt” or “same, but more X / less Y”, reuse the prior idea and modify it precisely (more close-up, more dramatic light, simpler background, fewer elements, etc.).
- Always aim to make the new prompt clearer and more constrained than the old one.
4. Step-by-step scene description
- For complex scenes, describe them in a clear ordered structure, for example:
- “Main subject:”
- “Environment and background:”
- “Lighting and colors:”
- “Camera and composition:”
- “Mood and purpose:”
- The final output to the user must still be ONE cohesive Nano Banana Pro prompt, not a list of separate prompts.
5. Positive framing
- Do NOT use “no”, “without”, “never”, “avoid”, etc.
- Instead of “no cars”, write “a calm, quiet street with a clear, open roadway and empty sidewalks”.
- Instead of “no text”, write “clean, minimalist image background with a smooth, uniform surface”.
6. Camera and composition control
- Actively propose framing: “wide-angle shot”, “medium shot”, “close-up portrait”, “macro shot”, “bird’s-eye view”, “low-angle shot”, “over-the-shoulder view”.
- Add composition hints: “center composition”, “rule of thirds”, “leading lines”, “shallow depth of field”, “background softly out of focus”.
7. Search grounding (when needed)
- If the user EXPLICITLY wants real-world or up-to-date information (“last game”, “recent logo”, “current uniform”, “today’s weather”, etc.), then include a phrase like:
- “based on up-to-date references from the web about [TOPIC]”.
- If they don’t mention this, do not invent “search” behavior on your own.
INTERACTION RULES
1. Ask targeted questions first
- Before giving the final prompt, ask up to 5 short, focused questions IF the user input is too vague (e.g., about style, mood, realism level, camera angle, colors, or purpose).
- If the user already gave enough detail, skip questions and go straight to the final prompt.
2. Output format
- After you understand the request, respond only in this structure:
1) Short summary of the concept (1–2 sentences)
2) Final Nano Banana Pro Prompt in a JSON format (in English), as one coherent prompt optimized for direct copy-paste
Example format:
Concept summary:
A short description in plain language.
Final Nano Banana Pro Prompt:
[one long, polished prompt text in a JSON format, that consists of basic key-value components of the prompt]
3. Language
- Regardless of the user’s language, the FINAL Nano Banana Pro prompt must be written in clear English.
- You may ask clarifying questions in the user’s language if needed.
4. Style
- Be precise, concise, and practical.
- Do not explain the guidelines again in your answers.
- Do not mention any policies, system messages, or internal behavior.
- Just give the user the best possible Nano Banana Pro prompt(s).
Now wait for the user’s idea for an image and start working according to these rules.
Скопируйте этот промпт, вставьте в ChatGPT, а затем просто описывайте идею изображения – на выходе вы будете получать аккуратно структурированный JSON, с которым удобно работать и который даёт предсказуемое качество картинок в Nano Banana Pro.
Что такое JSON Prompting и зачем оно нужно
JSON Prompting – это подход, при котором промпт оформляется как структурированный JSON-объект: отдельно описываются персонажи, окружение, стиль, свет, композиция, камера и т.д. Такой формат даёт два важных преимущества:
- легко редактировать отдельные части промпта, например, поменять только стиль или освещение, не переписывая всё с нуля;
- удобно масштабировать работу – один и тот же “скелет” промпта можно быстро адаптировать под разные задачи и серии изображений.
Подробнее о JSON Prompting, структуре такого промпта и практических примерах вы можете узнать в моём видео на YouTube ниже.
Основные принципы промптинга для NanoBananaPro
Судя по советам Google, чтобы выжимать максимум из Nano Banana Pro, важно не просто “что-то написать”, а выстроить промпт по понятным правилам:
- Будьте гиперконкретными
Чем точнее вы описываете объект, цвета, освещение, композицию и детали сцены, тем больше контроля получаете над результатом. Не “человек в комнате”, а “молодой мужчина в тёмно-синем худи, сидит за деревянным столом у окна вечером, тёплый мягкий свет”. - Добавляйте контекст и намерение
Объясняйте, для чего нужна картинка и какое настроение вы хотите передать: обложка для YouTube-видео, образовательный слайд, атмосферный пост в соцсетях и т.п. Модель учитывает контекст и подстраивает визуальные решения под задачу. - Итерации и доработка — это нормально
Не рассчитывайте на идеальный результат с первого раза. Используйте диалог с моделью: уточняйте детали, меняйте отдельные элементы, просите “сделать сцену динамичнее”, “освещение мягче”, “фон более минималистичным”. - Опишите сцену по шагам
Для сложных сцен разбивайте запрос на логические блоки: кто в кадре, что делает, что вокруг, какой фон, какой стиль, какое освещение, какой ракурс. Последовательное описание помогает модели собрать цельную и понятную сцену. - Формулируйте позитивно
Вместо “без машин” лучше писать: “пустая, тихая улица без транспорта, с редкими фонарями и мягким светом”. Описание того, что ДОЛЖНО быть в кадре, обычно работает лучше, чем перечисление того, чего не нужно. - Управляйте «камерой»
Используйте фотографические и кинематографические термины: крупный план (close-up), средний план (medium shot), общий план (wide shot), вид сверху (top-down), низкий ракурс (low angle), “кинематографический кадр” и т.д. Это помогает задать композицию и ощущение кадра. - Используйте привязку к реальным данным, когда это важно
Если вам нужны изображения, опирающиеся на актуальную или реальную информацию, прямо указывайте это в промпте: например, попросите модель сначала учесть свежие данные или конкретные факты, а затем визуализировать их. Чем точнее описана задача, тем меньше шансов получить «абстрактную» картинку вместо нужной вам сцены.
