تصویر و ویدیو

Midjourney — راهنمای کامل

Midjourney — راهنمای کامل — راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

نوشتهٔ به‌روزرسانی: ۴ دقیقه مطالعه
تصویر مقالهٔ Midjourney — راهنمای کامل

Midjourney در حال حاضر یکی از قدرتمندترین ابزارهای تولید تصویر با هوش مصنوعیه — اما برای کاربر ایرانی یه سری مشکل خاص داره که باید صادقانه باهاشون روبه‌رو شیم. این مقاله هم نحوهٔ کار Midjourney رو توضیح می‌ده، هم شرایط واقعی دسترسی از ایران رو.

Midjourney چیه؟

Midjourney یه سرویس تولید تصویر AI محبوبه که توسط شرکت مستقل Midjourney Inc (به رهبری David Holz) ساخته شده. ورودیش یه متن ساده‌ست و خروجیش تصویرهای بصری با کیفیت بالاست. نسخهٔ فعلی (V6.1 به بعد) با ابزارهایی مثل Stable Diffusion و DALL-E 3 رقابت جدی داره و اغلب در تست‌های بصری نتایج «هنری‌تری» تولید می‌کنه.

بزرگ‌ترین تفاوت Midjourney با رقباش اینه که رابط اصلی‌اش Discord بود — و اخیراً یه وب اپ مستقل هم راه انداخته. این ساختار عجیب، دسترسی از ایران رو سخت‌تر می‌کنه.

دسترسی از ایران — واقعیت‌ها

این بخش رو باید صادقانه بگم:

چالش ۱ — Discord: Midjourney تا مدت‌ها فقط از طریق دیسکورد کار می‌کرد. دیسکورد برای کاربران ایرانی بدون VPN عملاً قابل استفاده نیست.

چالش ۲ — پرداخت: Midjourney پرداخت فقط با کارت اعتباری بین‌المللی (Visa/Mastercard) رو می‌پذیره. کارت‌های ایرانی کار نمی‌کنن. باید از واسطه‌های خرید یا کارت‌های مجازی ارزی استفاده کنی.

چالش ۳ — تحریم: Midjourney رسماً کاربران ایرانی رو تحریم نکرده، ولی سرویس از IP ایرانی در دسترس نیست.

راه‌حل عملی: یه VPN باکیفیت (ترجیحاً با IP آمریکا یا اروپا) + کارت مجازی ارزی. این کار ممکنه ولی دردسر داره.

اگه می‌خوای راحت‌تر به تولید تصویر AI برسی، گزینه‌های جایگزین مثل DALL-E 3 یا Flux از Black Forest Labs رو هم در نظر بگیر.

پلن‌ها و قیمت‌گذاری

Midjourney چهار پلن داره (قیمت‌ها دلاریه):

پلنقیمت ماهانهویژگی اصلی
Basic۱۰ دلار۲۰۰ تصویر در ماه
Standard۳۰ دلارتولید نامحدود (slow) + ۱۵ ساعت fast
Pro۶۰ دلارstealth mode (تصاویر خصوصی) + ۳۰ ساعت fast
Mega۱۲۰ دلار۶۰ ساعت fast

پلن رایگان دیگه وجود نداره — از اواخر ۲۰۲۳ حذف شد.

نحوهٔ کار با Midjourney

پرامپت پایه

وقتی به ربات Midjourney (در Discord یا وب‌اپ) دسترسی داری، با /imagine شروع می‌کنی:

/imagine a Persian tea house interior, warm golden lighting, ornate tiles, 
Isfahan architecture style, photorealistic, 8k

زبان پرامپت انگلیسی خیلی بهتر از فارسی کار می‌کنه. Midjourney روی متون انگلیسی آموزش دیده و درک بهتری از توصیف‌های انگلیسی داره.

پارامترهای مهم

بعد از پرامپت اصلی می‌تونی پارامتر اضافه کنی:

  • --ar 16:9 — نسبت تصویر (برای بنر و پست‌های افقی)
  • --ar 9:16 — عمودی (برای استوری اینستاگرام)
  • --ar 1:1 — مربع
  • --v 6.1 — مشخص کردن نسخه
  • --style raw — کمتر «هنری‌سازی»، نزدیک‌تر به واقعیت
  • --no text — جلوگیری از اضافه شدن متن در تصویر
  • --quality 2 — کیفیت بالاتر (هزینهٔ بیشتر)

مثال پرامپت فارسی برای کسب‌وکار

اگه می‌خوای برای یه برند فارسی محتوا بسازی:

/imagine minimalist product photography, Iranian saffron in a ceramic bowl, 
clean white background, professional studio lighting, top-down view, 
commercial photography style --ar 1:1 --style raw
/imagine Persian calligraphy artwork, modern interpretation, 
deep blue and gold colors, geometric patterns inspired by Shiraz tile work,
digital art --ar 4:5

تکنیک Image Prompting

می‌تونی یه تصویر بارگذاری کنی و از Midjourney بخوای ازش الهام بگیره:

/imagine [لینک تصویر] Iranian garden landscape, impressionist painting style --iw 0.5

--iw شدت تأثیر تصویر اولیه رو تنظیم می‌کنه (۰ تا ۲).

Vary و Upscale

وقتی چهار خروجی اولیه رو می‌گیری:

  • دکمه‌های U1-U4: بزرگ‌نمایی (Upscale) هر کدام از تصاویر
  • دکمه‌های V1-V4: ساخت چهار تصویر جدید مشابه اون تصویر

اشتباهات رایج

۱. پرامپت خیلی کوتاه: «یه گربه» نتیجهٔ متوسطی می‌ده. «a Persian cat sitting on a rooftop in Tehran at dusk, warm orange sky, photorealistic» خروجی بهتری داره.

۲. نسبت تصویر غلط: برای اینستاگرام فراموش نکن --ar 4:5 یا --ar 9:16 رو بذاری.

۳. ناسازگاری سبک: اگه «realistic» و «cartoon» رو با هم بذاری، نتیجه گیج‌کننده می‌شه.

۴. بی‌توجهی به نسخه: پیش‌فرض معمولاً آخرین نسخه‌ست، ولی اگه نتیجه رو دوست نداری، --v 5.2 امتحان کن.

Midjourney در مقابل گزینه‌های دیگه

برای کاربر ایرانی که دسترسیش محدوده:

  • DALL-E 3 (از طریق ChatGPT Plus): دسترسی راحت‌تر، کیفیت خوب، فارسی بهتر می‌فهمه
  • Stable Diffusion (رایگان، روی سخت‌افزار خودت): نیاز به GPU داره، پیچیده‌تره، ولی رایگانه
  • Flux: مدل‌های open-source باکیفیت که روی Replicate یا Fal.ai اجرا می‌شن
  • Adobe Firefly: اگه اشتراک Adobe داری، قانونی‌تر از نظر حق مؤلف

همچنین بخوان

#تصویر و ویدیو

ادامهٔ مسیر

همهٔ مقاله‌ها ←

بیشتر در «تصویر و ویدیو»