nano banana
nano banana — راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

Nano Banana یه اسم عجیبه برای یه محصول جدی — این مدل تولید تصویر Googleست که در آگوست ۲۰۲۵ معرفی شد و بخشی از اکوسیستم Gemini به حساب میاد. اگه با Midjourney، DALL-E 3، یا Stable Diffusion آشنایی داری، Nano Banana رقیب مستقیم اوناست — با این تفاوت که پشتش یه شرکت با infrastructure جهانیست و مستقیم توی Google AI Studio قابل دسترسه.
چرا اسمش Nano Bananaست؟
Google سابقهای از نامگذاریهای غیررسمی و آزمایشگاهی داره. «Nano Banana» یه اسم کدنامهایه که تیم داخلی برای این مدل انتخاب کرد و بعد از انتشار عمومی موند. شاید ترسناکترین نام ممکن برای یه مدل تصویرسازی نباشه، ولی حالا توی community AI بهعنوان «مدل تصویر Google» شناخته میشه.
خانواده Nano Banana
Google سه نسخه از این مدل داره:
Nano Banana (نسخه پایه)
اولین نسخه. قیمت: حدود ۰.۰۳۹ دلار به ازای هر تصویر. برای استفادههای معمولی مناسبه، ولی کیفیتش زیر Pro هست.
Nano Banana Pro
پرچمدار خانواده. قیمت بر اساس رزولوشن:
- رزولوشن 1K: حدود ۰.۱۳۴ دلار
- رزولوشن 2K: حدود ۰.۱۳۴ دلار
- رزولوشن 4K: حدود ۰.۲۴ دلار
Pro روی موتور Gemini 3 Pro ساخته شده. این یعنی مدل وقتی تصویر میسازه، از سیستم استدلال Gemini برای فهمیدن prompt استفاده میکنه — نتیجهاش اینه که ترکیببندیهای پیچیده، رندر متن داخل تصویر، و سبکهای خاص رو بهتر handle میکنه.
Nano Banana 2
جدیدترین نسخه (اوایل ۲۰۲۶). قیمت: حدود ۰.۰۶۷ دلار. ادعای Google اینه که کیفیت Pro رو با سرعت Flash ترکیب کرده. برای کاربردهایی که حجم بالا دارن (مثلاً تولید تصویر برای کاتالوگ محصول) گزینه بهتریه.
قابلیتهای کلیدی
رندر متن: یکی از ضعفهای تاریخی مدلهای تصویرسازی رندر درست متن بود — اسامی مارک، علامتهای تجاری، حروف خاص. Nano Banana Pro توی این کار بهتر از اکثر رقباست.
multi-round editing: میشه روی یه تصویر چند دور اعمال تغییر کرد با دستورات زبانی. مثلاً: «رنگ پسزمینه رو آبی کن» → «یه درخت سمت چپ اضافه کن» → «نور رو طلاییتر کن».
multi-reference generation: میتونی چند تصویر مرجع بدی (مثلاً سبک یه تصویر + محتوای یه تصویر دیگه) و مدل ترکیبشون کنه.
سه tier رزولوشن: 1K، 2K، و 4K بدون افت کیفیت — که برای چاپ و استفاده حرفهای مهمه.
چطور به Nano Banana دسترسی پیدا کنی
سه روش وجود داره:
Google AI Studio: رابط وب رایگانه. برای آزمایش و پروژههای غیرحرفهای کافیه. ولی مثل اکثر سرویسهای Google، از ایران مستقیم در دسترس نیست.
Gemini API: برای توسعهدهندهها. REST API با SDK برای Python، JavaScript، و Go. نیاز به API key داره.
Vertex AI: نسخه enterprise که روی infrastructure Google Cloud اجرا میشه. برای تیمهایی که نیاز به SLA و مقیاس بالا دارن.
مقایسه با رقبا
| ابزار | قیمت تقریبی | نقطه قوت |
|---|---|---|
| Nano Banana Pro | ۰.۱۳ دلار/تصویر | استدلال + متن + کیفیت |
| DALL-E 3 (OpenAI) | ۰.۰۴-۰.۱۲ دلار | یکپارچگی با ChatGPT |
| Midjourney | اشتراک ماهانه | زیبایی هنری |
| Stable Diffusion | رایگان/هزینه compute | سفارشیسازی کامل |
| Imagen 4 (Google) | مشابه | کیفیت فتورئالیسم |
Nano Banana Pro وقتی بهترین انتخابه که نیاز به ترکیب کیفیت بالا + رندر متن دقیق + تغییرات مکالمهای داشته باشی.
چالش دسترسی از ایران
مثل اکثر سرویسهای Google، Nano Banana هم از ایران مستقیم در دسترس نیست. API calls نیاز به IP غیرایرانی و کارت اعتباری بینالمللی دارن. این واقعیتیه که نمیشه ازش فرار کرد — هر ابزاری که برای تصویرسازی AI استفاده میکنی، این چالش وجود داره.
فارسی چطوره؟
Nano Banana Pro میتونه متن فارسی رو داخل تصویر رندر کنه، ولی کیفیتش متغیره. برای خطوط ساده مثل عنوان یه پوستر، قابل قبوله. برای متن فارسی طولانی یا خط نستعلیق، هنوز نتایج ناهمگون میده. prompt نویسی به فارسی هم میشه، ولی معمولاً انگلیسی نتایج بهتری میده.
همچنین بخوان
ادامهٔ مسیر
همهٔ مقالهها ←
تولید تصویر با هوش مصنوعی چیست
تولید تصویر با هوش مصنوعی چیست — راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

Midjourney — راهنمای کامل
Midjourney — راهنمای کامل — راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

DALL-E 3 — راهنمای عمیق
DALL-E 3 — راهنمای عمیق — راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

Stable Diffusion
Stable Diffusion — راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.
بیشتر در «تصویر و ویدیو»
- Flux از Black Forest Labs
- Veo گوگل — راهنمای ویدیو
- Sora OpenAI — راهنمای ویدیو
- Kling — تولید ویدیو با AI
- Runway — استودیوی ویدیویی AI
- Higgsfield — کنترل دوربین در ویدیوی AI
- Hailuo (Minimax)
- Pika
- Leonardo و Ideogram
- ControlNet — کنترل دقیق Stable Diffusion
- Lip sync و face swap
- پرامپتنویسی برای تولید تصویر
- AI video editing
- AI برای موسیقی — Suno و Udio
- اخلاق در deepfake