بهترین مدلهای open source
بهترین مدلهای open source — راهنمای فارسی از مجموعهٔ «بهترین ابزارها» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

مدلهای متنباز دیگه فقط «جایگزین ارزونقیمت» نیستن. Llama 4 و DeepSeek-V3 عملاً با بهترین مدلهای تجاری رقابت میکنن — با این تفاوت که میتونی اونها رو روی سرور خودت اجرا کنی، دادههات رو به هیچ شرکتی ندی، و بدون کارت اعتباری دلاری ازشون استفاده کنی.
چرا open-weight برای کاربر ایرانی مهمتره؟
تحریم و مشکلات دسترسی یه واقعیته. وقتی مدل رو میتونی locally یا روی سرور شخصی اجرا کنی، دیگه نه نگران IP بن شدن هستی، نه نگران پرداخت دلاری، نه نگران اینکه ترمز سرویس بخوری. Open-weight بودن یعنی آزادی عمل.
معیارهای این رتبهبندی
- کیفیت کلی — در بنچمارکهای عمومی (MMLU، HumanEval، MATH) چه امتیازی داره؟
- فارسیخوانی — فارسی محاورهای و کتابی رو چقدر خوب میفهمه و تولید میکنه؟
- قابلیت self-host — با Ollama، vLLM یا llama.cpp قابل اجراست؟ حداقل VRAM چقدر لازمه؟
- مجوز — استفادهٔ تجاری آزاده یا محدودیت داره؟
۱. Llama 4 (Meta)
Meta در ۲۰۲۵ Llama 4 رو با معماری MoE (Mixture of Experts) منتشر کرد و قضیه تغییر کرد. Llama 4 Scout (۱۷B فعال از ۱۰۹B کل) روی یه GPU ۸۰GB اجرا میشه و با بنچمارکهای GPT-4o رقابت میکنه. Llama 4 Maverick (۱۷B فعال از ۴۰۰B کل) قویتره ولی به سرور چندگانه نیاز داره.
مجوز: برای پروژههای زیر ۷۰۰ میلیون کاربر ماهانه استفادهٔ تجاری آزاده. فارسیاش در مقایسه با Llama 3 بهتر شده ولی هنوز با مدلهای تخصصیتر فارسی فاصله داره.
۲. DeepSeek-V3 / DeepSeek-R1
DeepSeek یه شرکت چینیه که مدلهایی با performance باورنکردنی و قیمت بسیار پایین منتشر کرده. DeepSeek-V3 در کدنویسی و ریاضی با GPT-4o رقابت مستقیم داره. DeepSeek-R1 مدل استدلالی (reasoning) اونهاست که با o1 مقایسه میشه.
مجوز: MIT — کاملاً آزاد. میتونی locally با Ollama اجراش کنی (Q4 نسخهٔ کوچیکترش). فارسیش قابل قبوله ولی نه در سطح مدلهای تخصصی. اگه برای کدنویسی یا ریاضی میخوای و self-host مهمته، DeepSeek-V3 در این لیست جایگاه ویژهای داره.
۳. Qwen 2.5 / Qwen 3 (Alibaba)
خانوادهٔ Qwen از Alibaba Cloud یکی از قویترین مجموعههای open-weightه. Qwen2.5-72B در بیشتر بنچمارکها از Llama 3 70B جلوتره. Qwen2.5-Coder-32B مخصوص کدنویسیه و نتایج خیلی خوبی داره. Qwen 3 با MoE معماری جدیدی آورده.
یه مزیت کلیدی: فارسی Qwen نسبتاً خوبه چون روی دادههای چندزبانه آسیایی آموزش دیده که فارسی هم شامل میشه. مجوز: Apache 2.0 برای اکثر مدلها.
۴. Mistral / Mistral Large 2
Mistral یه شرکت فرانسویه که مدلهای کارآمد و کوچک میسازه. Mistral 7B هنوز یکی از بهترین مدلها در اندازهٔ خودشه برای اجرا روی لپتاپ. Mixtral 8x7B با معماری MoE performance خوبی با حجم کمتر داره. Mistral Large 2 مدل flagshipشونه که با GPT-4o رقابت میکنه.
مجوز: اکثر مدلهای کوچیکتر Apache 2.0 هستن. فارسیشون متوسطه — اگه کار تخصصی فارسی داری، Qwen یا Llama انتخاب بهتریه.
۵. Gemma 3 (Google)
Gemma 3 سری مدلهای open-source گوگله که روی Tensor Processing Unitهای گوگل تنظیم شدن. مزیت اصلی: بهینه برای اجرا روی سختافزار محدود — نسخههای ۱B، ۴B، ۱۲B و ۲۷B وجود داره. Gemma 3 27B توی لپتاپهای با GPU متوسط اجرا میشه.
مجوز: Gemma License (استفادهٔ تجاری با محدودیتهایی). فارسیش متوسطه ولی برای on-device inference خوبه.
۶. Command-R (Cohere)
Command-R و Command-R+ از Cohere برای RAG و کارهای enterprise طراحی شدن. context window بزرگ (۱۲۸K) و قابلیت grounding در documents داره. برای ساخت سیستمهای جستجوی داخلی شرکتها گزینهٔ جدیه.
مجوز: CC-BY-NC (غیرتجاری آزاد). فارسیش کمتر از رقبا تست شده، ولی برای متن انگلیسی enterprise عالیه.
۷. Aya (Cohere for AI)
Aya پروژهای تحقیقاتیه از Cohere for AI که مخصوص زبانهای کممنبع (low-resource) ساخته شده — و فارسی جزو زبانهای مورد توجهشه. Aya-23 روی ۲۳ زبان از جمله فارسی تنظیم شده و برای تولید متن فارسی طبیعی نتایج بهتری از مدلهای عمومی داره.
مجوز: Apache 2.0. اگه میخوای یه مدل open-source برای تولید محتوای فارسی بسازی یا chatbot فارسی پیادهسازی کنی، Aya نقطهٔ شروع خوبیه.
مقایسهٔ سریع
| مدل | اندازه (active) | فارسی | مجوز | بهترین برای |
|---|---|---|---|---|
| Llama 4 Scout | 17B | متوسط+ | رایگان تجاری | عمومی، multimodal |
| DeepSeek-V3 | MoE کارآمد | قابل قبول | MIT | کدنویسی، ریاضی |
| Qwen 2.5-72B | 72B | خوب | Apache 2.0 | عمومی + فارسی |
| Mistral 7B | 7B | متوسط | Apache 2.0 | سبک، local |
| Gemma 3 27B | 27B | متوسط | Gemma License | on-device |
| Command-R+ | 104B | متوسط | CC-BY-NC | RAG enterprise |
| Aya-23 | 35B | خوب | Apache 2.0 | فارسی تخصصی |
چطور self-host کنی؟
سادهترین مسیر: Ollama رو نصب کن و مدل موردنظر رو pull کن:
ollama pull qwen2.5:72b
ollama pull deepseek-v3
برای inference سریعتر روی سرور: vLLM یا llama.cpp گزینههای بهترین.
همچنین بخوان
- مدلهای open-source در مقابل closed-source — کِی کدوم رو انتخاب کنی؟
- تاریخچهٔ مدلهای زبانی فارسی — مسیر تا اینجا
- شناخت پیوسته در هوش مصنوعی — چرا مدل بدون memory بلندمدت ناقصه
- fine-tuning مدلهای فارسی با Llama — گامبهگام
self-host کردن مدلهای open-weight یه آزادی واقعیه — ولی اگه میخوای روی یه سرویس تمامشدهٔ فارسی با حافظهٔ بلندمدت، آیراچت همون رو بدون دردسر setup ارائه میده.
ادامهٔ مسیر
همهٔ مقالهها ←
بهترین هوش مصنوعی ۱۴۰۵
بهترین هوش مصنوعی ۱۴۰۵ — راهنمای فارسی از مجموعهٔ «بهترین ابزارها» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

بهترین هوش مصنوعی ایرانی
بهترین هوش مصنوعی ایرانی — راهنمای فارسی از مجموعهٔ «بهترین ابزارها» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

بهترین هوش مصنوعی رایگان
بهترین هوش مصنوعی رایگان — راهنمای فارسی از مجموعهٔ «بهترین ابزارها» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

بهترین هوش مصنوعی فارسی
بهترین هوش مصنوعی فارسی — راهنمای فارسی از مجموعهٔ «بهترین ابزارها» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.
بیشتر در «بهترین ابزارها»
- بهترین AI برای کدنویسی
- بهترین AI برای تصویر
- بهترین AI برای ویدیو
- بهترین AI برای صدا
- بهترین AI برای ترجمه
- بهترین AI برای خلاصهسازی
- بهترین AI برای نویسندگی
- بهترین AI برای تحقیق
- بهترین AI برای دانشجویان
- بهترین AI برای کسبوکار
- بهترین AI برای بازاریابی
- بهترین جایگزین ChatGPT
- بهترین جایگزین Claude
- بهترین جایگزین گپچت
- مقایسهٔ مدلهای هوش مصنوعی — ماهانه
- اخبار هفتگی هوش مصنوعی
- AI release tracker
- بهترین چتباتهای ایرانی
- بهترین AI برای محتوای شبکهٔ اجتماعی
- بهترین AI برای رزومه و کاریابی