تصویر و ویدیو

Leonardo و Ideogram

Leonardo و Ideogram، راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

نوشتهٔ تیم آیرا•۱۴ اسفند ۱۴۰۴به‌روزرسانی: ۱۵ فروردین ۱۴۰۵•۳ دقیقه مطالعه

دو ابزار از متفاوت‌ترین گوشه‌های دنیای تولید تصویر با AI: Leonardo.ai که برای طراحی بازی و assets خلاقانه شروع کرد، و Ideogram که یه مشکل قدیمی AI رو هدف گرفت، نوشتن متن خوانا روی تصویر. این دو رو مقایسه کنیم تا بفهمیم کِی از کدوم باید استفاده کنی.

Leonardo.ai چیست؟

Leonardo یه پلتفرم تولید تصویر با AI‌ه که سال ۲۰۲۳ راه‌اندازی شد. تفاوتش با Midjourney یا DALL-E اینه که از ابتدا روی نیازهای گرافیست‌های بازی فوکوس کرد: character design، concept art، texture، و asset‌های بازی.

چه مدل‌هایی دارد؟

Leonardo چند مدل اختصاصی خودش رو داره (مثل Leonardo Diffusion، Alchemy، Phoenix) و علاوه بر اون اجازه می‌ده مدل‌های Stable Diffusion رو هم فاین‌تیون کنی و توی پلتفرمشون اجرا کنی.

مدل Phoenix که در ۲۰۲۴ معرفی شد، نسبت به نسل‌های قبلی کیفیت واقع‌گرایانه‌تری داره و prompt following بهتری نشون می‌ده.

ویژگی‌های کلیدی Leonardo

Fine-tuning آسان: می‌تونی با ۱۵ تا ۲۰ عکس یه مدل شخصی بسازی که سبک بصری خودت رو یاد گرفته. برای کسی که می‌خواد consistency در پروژه داشته باشه خیلی مهمه.

Canvas و Inpainting: یه editor داخلی داره که می‌تونی بخش‌هایی از تصویر رو جایگزین کنی، extend کنی (outpainting)، یا جزئیات اضافه کنی.

ControlNet داخلی: بدون نیاز به نصب، می‌تونی pose، edge، یا depth map به عنوان راهنما بدی.

Real-time generation: یه حالت آزمایشگاهی داره که با تایپ کردن prompt، تصویر به‌صورت real-time تغییر می‌کنه.

قیمت‌گذاری Leonardo

طرح رایگان ۱۵۰ token در روز می‌ده، کافیه برای آزمایش. پلن‌های پولی از حدود ۱۰ دلار در ماه شروع می‌شن. برای کاربر ایرانی پرداخت مستقیم ممکن نیست و باید از سرویس‌های واسط استفاده کرد.

Ideogram چیست؟

Ideogram یه استارتاپ کانادایی‌ه (تأسیس ۲۰۲۳) که یه مشکل خاص رو هدف گرفت: تمام ابزارهای تولید تصویر AI در نوشتن متن خوانا ضعیف بودن. Midjourney «hello» می‌نوشت ولی «helo» یا «helllo» در می‌اومد. Ideogram این مشکل رو جدی گرفت.

چرا متن روی تصویر سخته؟

مدل‌های Diffusion برای تولید تصویر آموزش می‌بینن، نه برای رندر کردن حروف. حروف از نظر مدل مجموعه‌ای از شکل‌های بصری‌ان، نه نمادهای معنادار. به همین دلیل «SALE» روی یه بنر می‌شد «SLAE» یا هر ترکیب تصادفی دیگه.

Ideogram با رویکردی متفاوت این رو آدرس داد، ترکیب یه مکانیزم رندر متن با مدل Diffusion.

نسخه‌های Ideogram

Ideogram 1.0 (2023): اولین ورژن عمومی، خروجی‌های قابل قبول برای متن ساده

Ideogram 2.0 (اوایل ۲۰۲۴): کیفیت کلی تصویر خیلی بهتر شد، نه فقط متن. در این نسخه Ideogram با DALL-E 3 و Midjourney رقابتی شد

Ideogram 3.0 (اواخر ۲۰۲۴): کیفیت واقع‌گرایانه بالاتر، پشتیبانی بهتر از فونت‌های مختلف، و typography پیچیده‌تر

کاربردهای واقعی Ideogram

طراحی لوگو و brand identity: می‌تونی نام برند رو بدی و لوگوهای مختلف ببینی
پوستر و بنر تبلیغاتی: متن خوانا + تصویر جذاب بدون نیاز به ویرایش دستی
جلد کتاب و مجله
تی‌شرت و merchandise design
تصاویر شبکه‌های اجتماعی با caption

محدودیت‌های Ideogram

متن فارسی؟ ضعیف. مدل برای حروف RTL آموزش کافی ندیده. اگه می‌خوای متن فارسی روی تصویر، باید بعد از تولید با ابزاری مثل Canva یا Photoshop اضافه کنی.

مقایسه: کِی از کدوم استفاده کنیم؟

نیاز	Leonardo	Ideogram
Character design برای بازی	عالی	متوسط
Fine-tuning با سبک شخصی	داره	ندارد
متن خوانا روی تصویر	ضعیف	عالی
پوستر تبلیغاتی	متوسط	عالی
Inpainting و ویرایش	عالی	محدود
طرح رایگان	۱۵۰ token/روز	۱۰ prompt/روز
API برای توسعه‌دهنده	دارد	دارد

دسترسی از ایران

هر دو ابزار با IP ایران مسدود نیستن ولی پرداخت مستقیم کارت ایرانی رو قبول نمی‌کنن. با VPN می‌شه وارد شد و از طرح رایگان استفاده کرد. برای اشتراک پولی به کارت ارزی یا سرویس واسط نیاز داری.

یه نکتهٔ عملی: Leonardo یه جامعهٔ بزرگ داره که مدل‌های fine-tuned شده رو public می‌کنن. خیلی اوقات بدون نیاز به fine-tuning خودت، یه مدل که کسی دیگه‌ای ساخته رو می‌تونی استفاده کنی.

چه چیزی از این دو یاد گرفتیم؟

بهترین ابزار تصویرسازی AI یه ابزار عمومی نیست، هر کدوم یه niche دارن. Leonardo برای کسیه که workflow بصری پیچیده و نیاز به consistency داره؛ Ideogram برای کسیه که متن و typography بخش مهمی از طراحیشه.

اگه داری محتوای بصری می‌سازی، ممکنه از هر دو در جاهای مختلف استفاده کنی، نه به عنوان رقیب، بلکه به عنوان ابزارهای مکمل.

همچنین بخوان

#تصویر و ویدیو

ادامهٔ مسیر

همهٔ مقاله‌ها ←

تصویر و ویدیو

تولید تصویر با هوش مصنوعی چیست

تولید تصویر با هوش مصنوعی چیست، راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

تصویر و ویدیو

Midjourney، راهنمای کامل

Midjourney، راهنمای کامل، راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

تصویر و ویدیو

DALL-E 3، راهنمای عمیق

DALL-E 3، راهنمای عمیق، راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

تصویر و ویدیو

Stable Diffusion

Stable Diffusion، راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

Leonardo.ai چیست؟

چه مدل‌هایی دارد؟

ویژگی‌های کلیدی Leonardo

قیمت‌گذاری Leonardo

Ideogram چیست؟

چرا متن روی تصویر سخته؟

نسخه‌های Ideogram

کاربردهای واقعی Ideogram

محدودیت‌های Ideogram

مقایسه: کِی از کدوم استفاده کنیم؟

دسترسی از ایران

چه چیزی از این دو یاد گرفتیم؟

همچنین بخوان

ادامهٔ مسیر

تولید تصویر با هوش مصنوعی چیست

Midjourney، راهنمای کامل

DALL-E 3، راهنمای عمیق

Stable Diffusion

بیشتر در «تصویر و ویدیو»