تصویر و ویدیو

nano banana

nano banana — راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

نوشتهٔ به‌روزرسانی: ۳ دقیقه مطالعه
تصویر مقالهٔ nano banana

Nano Banana یه اسم عجیبه برای یه محصول جدی — این مدل تولید تصویر Google‌ست که در آگوست ۲۰۲۵ معرفی شد و بخشی از اکوسیستم Gemini به حساب میاد. اگه با Midjourney، DALL-E 3، یا Stable Diffusion آشنایی داری، Nano Banana رقیب مستقیم اوناست — با این تفاوت که پشتش یه شرکت با infrastructure جهانی‌ست و مستقیم توی Google AI Studio قابل دسترسه.

چرا اسمش Nano Banana‌ست؟

Google سابقه‌ای از نام‌گذاری‌های غیررسمی و آزمایشگاهی داره. «Nano Banana» یه اسم کدنامه‌ایه که تیم داخلی برای این مدل انتخاب کرد و بعد از انتشار عمومی موند. شاید ترسناک‌ترین نام ممکن برای یه مدل تصویرسازی نباشه، ولی حالا توی community AI به‌عنوان «مدل تصویر Google» شناخته می‌شه.

خانواده Nano Banana

Google سه نسخه از این مدل داره:

Nano Banana (نسخه پایه)

اولین نسخه. قیمت: حدود ۰.۰۳۹ دلار به ازای هر تصویر. برای استفاده‌های معمولی مناسبه، ولی کیفیتش زیر Pro هست.

Nano Banana Pro

پرچمدار خانواده. قیمت بر اساس رزولوشن:

  • رزولوشن 1K: حدود ۰.۱۳۴ دلار
  • رزولوشن 2K: حدود ۰.۱۳۴ دلار
  • رزولوشن 4K: حدود ۰.۲۴ دلار

Pro روی موتور Gemini 3 Pro ساخته شده. این یعنی مدل وقتی تصویر می‌سازه، از سیستم استدلال Gemini برای فهمیدن prompt استفاده می‌کنه — نتیجه‌اش اینه که ترکیب‌بندی‌های پیچیده، رندر متن داخل تصویر، و سبک‌های خاص رو بهتر handle می‌کنه.

Nano Banana 2

جدیدترین نسخه (اوایل ۲۰۲۶). قیمت: حدود ۰.۰۶۷ دلار. ادعای Google اینه که کیفیت Pro رو با سرعت Flash ترکیب کرده. برای کاربردهایی که حجم بالا دارن (مثلاً تولید تصویر برای کاتالوگ محصول) گزینه بهتریه.

قابلیت‌های کلیدی

رندر متن: یکی از ضعف‌های تاریخی مدل‌های تصویرسازی رندر درست متن بود — اسامی مارک، علامت‌های تجاری، حروف خاص. Nano Banana Pro توی این کار بهتر از اکثر رقباست.

multi-round editing: می‌شه روی یه تصویر چند دور اعمال تغییر کرد با دستورات زبانی. مثلاً: «رنگ پس‌زمینه رو آبی کن» → «یه درخت سمت چپ اضافه کن» → «نور رو طلایی‌تر کن».

multi-reference generation: می‌تونی چند تصویر مرجع بدی (مثلاً سبک یه تصویر + محتوای یه تصویر دیگه) و مدل ترکیبشون کنه.

سه tier رزولوشن: 1K، 2K، و 4K بدون افت کیفیت — که برای چاپ و استفاده حرفه‌ای مهمه.

چطور به Nano Banana دسترسی پیدا کنی

سه روش وجود داره:

Google AI Studio: رابط وب رایگانه. برای آزمایش و پروژه‌های غیرحرفه‌ای کافیه. ولی مثل اکثر سرویس‌های Google، از ایران مستقیم در دسترس نیست.

Gemini API: برای توسعه‌دهنده‌ها. REST API با SDK برای Python، JavaScript، و Go. نیاز به API key داره.

Vertex AI: نسخه enterprise که روی infrastructure Google Cloud اجرا می‌شه. برای تیم‌هایی که نیاز به SLA و مقیاس بالا دارن.

مقایسه با رقبا

ابزارقیمت تقریبینقطه قوت
Nano Banana Pro۰.۱۳ دلار/تصویراستدلال + متن + کیفیت
DALL-E 3 (OpenAI)۰.۰۴-۰.۱۲ دلاریکپارچگی با ChatGPT
Midjourneyاشتراک ماهانهزیبایی هنری
Stable Diffusionرایگان/هزینه computeسفارشی‌سازی کامل
Imagen 4 (Google)مشابهکیفیت فتورئالیسم

Nano Banana Pro وقتی بهترین انتخابه که نیاز به ترکیب کیفیت بالا + رندر متن دقیق + تغییرات مکالمه‌ای داشته باشی.

چالش دسترسی از ایران

مثل اکثر سرویس‌های Google، Nano Banana هم از ایران مستقیم در دسترس نیست. API calls نیاز به IP غیرایرانی و کارت اعتباری بین‌المللی دارن. این واقعیتیه که نمی‌شه ازش فرار کرد — هر ابزاری که برای تصویرسازی AI استفاده می‌کنی، این چالش وجود داره.

فارسی چطوره؟

Nano Banana Pro می‌تونه متن فارسی رو داخل تصویر رندر کنه، ولی کیفیتش متغیره. برای خطوط ساده مثل عنوان یه پوستر، قابل قبوله. برای متن فارسی طولانی یا خط نستعلیق، هنوز نتایج ناهمگون می‌ده. prompt نویسی به فارسی هم می‌شه، ولی معمولاً انگلیسی نتایج بهتری می‌ده.

همچنین بخوان

#تصویر و ویدیو

ادامهٔ مسیر

همهٔ مقاله‌ها ←

بیشتر در «تصویر و ویدیو»