Leonardo و Ideogram
Leonardo و Ideogram — راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

دو ابزار از متفاوتترین گوشههای دنیای تولید تصویر با AI: Leonardo.ai که برای طراحی بازی و assets خلاقانه شروع کرد، و Ideogram که یه مشکل قدیمی AI رو هدف گرفت — نوشتن متن خوانا روی تصویر. این دو رو مقایسه کنیم تا بفهمیم کِی از کدوم باید استفاده کنی.
Leonardo.ai چیست؟
Leonardo یه پلتفرم تولید تصویر با AIه که سال ۲۰۲۳ راهاندازی شد. تفاوتش با Midjourney یا DALL-E اینه که از ابتدا روی نیازهای گرافیستهای بازی فوکوس کرد: character design، concept art، texture، و assetهای بازی.
چه مدلهایی دارد؟
Leonardo چند مدل اختصاصی خودش رو داره (مثل Leonardo Diffusion، Alchemy، Phoenix) و علاوه بر اون اجازه میده مدلهای Stable Diffusion رو هم فاینتیون کنی و توی پلتفرمشون اجرا کنی.
مدل Phoenix که در ۲۰۲۴ معرفی شد، نسبت به نسلهای قبلی کیفیت واقعگرایانهتری داره و prompt following بهتری نشون میده.
ویژگیهای کلیدی Leonardo
Fine-tuning آسان: میتونی با ۱۵ تا ۲۰ عکس یه مدل شخصی بسازی که سبک بصری خودت رو یاد گرفته. برای کسی که میخواد consistency در پروژه داشته باشه خیلی مهمه.
Canvas و Inpainting: یه editor داخلی داره که میتونی بخشهایی از تصویر رو جایگزین کنی، extend کنی (outpainting)، یا جزئیات اضافه کنی.
ControlNet داخلی: بدون نیاز به نصب، میتونی pose، edge، یا depth map به عنوان راهنما بدی.
Real-time generation: یه حالت آزمایشگاهی داره که با تایپ کردن prompt، تصویر بهصورت real-time تغییر میکنه.
قیمتگذاری Leonardo
طرح رایگان ۱۵۰ token در روز میده — کافیه برای آزمایش. پلنهای پولی از حدود ۱۰ دلار در ماه شروع میشن. برای کاربر ایرانی پرداخت مستقیم ممکن نیست و باید از سرویسهای واسط استفاده کرد.
Ideogram چیست؟
Ideogram یه استارتاپ کاناداییه (تأسیس ۲۰۲۳) که یه مشکل خاص رو هدف گرفت: تمام ابزارهای تولید تصویر AI در نوشتن متن خوانا ضعیف بودن. Midjourney «hello» مینوشت ولی «helo» یا «helllo» در میاومد. Ideogram این مشکل رو جدی گرفت.
چرا متن روی تصویر سخته؟
مدلهای Diffusion برای تولید تصویر آموزش میبینن، نه برای رندر کردن حروف. حروف از نظر مدل مجموعهای از شکلهای بصریان، نه نمادهای معنادار. به همین دلیل «SALE» روی یه بنر میشد «SLAE» یا هر ترکیب تصادفی دیگه.
Ideogram با رویکردی متفاوت این رو آدرس داد — ترکیب یه مکانیزم رندر متن با مدل Diffusion.
نسخههای Ideogram
Ideogram 1.0 (2023): اولین ورژن عمومی، خروجیهای قابل قبول برای متن ساده
Ideogram 2.0 (اوایل ۲۰۲۴): کیفیت کلی تصویر خیلی بهتر شد، نه فقط متن. در این نسخه Ideogram با DALL-E 3 و Midjourney رقابتی شد
Ideogram 3.0 (اواخر ۲۰۲۴): کیفیت واقعگرایانه بالاتر، پشتیبانی بهتر از فونتهای مختلف، و typography پیچیدهتر
کاربردهای واقعی Ideogram
- طراحی لوگو و brand identity: میتونی نام برند رو بدی و لوگوهای مختلف ببینی
- پوستر و بنر تبلیغاتی: متن خوانا + تصویر جذاب بدون نیاز به ویرایش دستی
- جلد کتاب و مجله
- تیشرت و merchandise design
- تصاویر شبکههای اجتماعی با caption
محدودیتهای Ideogram
متن فارسی؟ ضعیف. مدل برای حروف RTL آموزش کافی ندیده. اگه میخوای متن فارسی روی تصویر، باید بعد از تولید با ابزاری مثل Canva یا Photoshop اضافه کنی.
مقایسه: کِی از کدوم استفاده کنیم؟
| نیاز | Leonardo | Ideogram |
|---|---|---|
| Character design برای بازی | عالی | متوسط |
| Fine-tuning با سبک شخصی | داره | ندارد |
| متن خوانا روی تصویر | ضعیف | عالی |
| پوستر تبلیغاتی | متوسط | عالی |
| Inpainting و ویرایش | عالی | محدود |
| طرح رایگان | ۱۵۰ token/روز | ۱۰ prompt/روز |
| API برای توسعهدهنده | دارد | دارد |
دسترسی از ایران
هر دو ابزار با IP ایران مسدود نیستن ولی پرداخت مستقیم کارت ایرانی رو قبول نمیکنن. با VPN میشه وارد شد و از طرح رایگان استفاده کرد. برای اشتراک پولی به کارت ارزی یا سرویس واسط نیاز داری.
یه نکتهٔ عملی: Leonardo یه جامعهٔ بزرگ داره که مدلهای fine-tuned شده رو public میکنن. خیلی اوقات بدون نیاز به fine-tuning خودت، یه مدل که کسی دیگهای ساخته رو میتونی استفاده کنی.
چه چیزی از این دو یاد گرفتیم؟
بهترین ابزار تصویرسازی AI یه ابزار عمومی نیست — هر کدوم یه niche دارن. Leonardo برای کسیه که workflow بصری پیچیده و نیاز به consistency داره؛ Ideogram برای کسیه که متن و typography بخش مهمی از طراحیشه.
اگه داری محتوای بصری میسازی، ممکنه از هر دو در جاهای مختلف استفاده کنی — نه به عنوان رقیب، بلکه به عنوان ابزارهای مکمل.
همچنین بخوان
ادامهٔ مسیر
همهٔ مقالهها ←
تولید تصویر با هوش مصنوعی چیست
تولید تصویر با هوش مصنوعی چیست — راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

Midjourney — راهنمای کامل
Midjourney — راهنمای کامل — راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

DALL-E 3 — راهنمای عمیق
DALL-E 3 — راهنمای عمیق — راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

Stable Diffusion
Stable Diffusion — راهنمای فارسی از مجموعهٔ «تصویر و ویدیو» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.
بیشتر در «تصویر و ویدیو»
- Flux از Black Forest Labs
- nano banana
- Veo گوگل — راهنمای ویدیو
- Sora OpenAI — راهنمای ویدیو
- Kling — تولید ویدیو با AI
- Runway — استودیوی ویدیویی AI
- Higgsfield — کنترل دوربین در ویدیوی AI
- Hailuo (Minimax)
- Pika
- ControlNet — کنترل دقیق Stable Diffusion
- Lip sync و face swap
- پرامپتنویسی برای تولید تصویر
- AI video editing
- AI برای موسیقی — Suno و Udio
- اخلاق در deepfake