بهترین ابزارها

بهترین مدل‌های open source

بهترین مدل‌های open source، راهنمای فارسی از مجموعهٔ «بهترین ابزارها» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

نوشتهٔ تیم آیرا•۱۶ اسفند ۱۴۰۴به‌روزرسانی: ۲۴ اسفند ۱۴۰۴•۴ دقیقه مطالعه

مدل‌های متن‌باز دیگه فقط «جایگزین ارزون‌قیمت» نیستن. Llama 4 و DeepSeek-V3 عملاً با بهترین مدل‌های تجاری رقابت می‌کنن، با این تفاوت که می‌تونی اون‌ها رو روی سرور خودت اجرا کنی، داده‌هات رو به هیچ شرکتی ندی، و بدون کارت اعتباری دلاری ازشون استفاده کنی.

چرا open-weight برای کاربر ایرانی مهم‌تره؟

تحریم و مشکلات دسترسی یه واقعیت‌ه. وقتی مدل رو می‌تونی locally یا روی سرور شخصی اجرا کنی، دیگه نه نگران IP بن شدن هستی، نه نگران پرداخت دلاری، نه نگران اینکه ترمز سرویس بخوری. Open-weight بودن یعنی آزادی عمل.

معیارهای این رتبه‌بندی

کیفیت کلی، در بنچمارک‌های عمومی (MMLU، HumanEval، MATH) چه امتیازی داره؟
فارسی‌خوانی، فارسی محاوره‌ای و کتابی رو چقدر خوب می‌فهمه و تولید می‌کنه؟
قابلیت self-host، با Ollama، vLLM یا llama.cpp قابل اجراست؟ حداقل VRAM چقدر لازمه؟
مجوز، استفادهٔ تجاری آزاده یا محدودیت داره؟

۱. Llama 4 (Meta)

Meta در ۲۰۲۵ Llama 4 رو با معماری MoE (Mixture of Experts) منتشر کرد و قضیه تغییر کرد. Llama 4 Scout (۱۷B فعال از ۱۰۹B کل) روی یه GPU ۸۰GB اجرا می‌شه و با بنچمارک‌های GPT-4o رقابت می‌کنه. Llama 4 Maverick (۱۷B فعال از ۴۰۰B کل) قوی‌تره ولی به سرور چندگانه نیاز داره.

مجوز: برای پروژه‌های زیر ۷۰۰ میلیون کاربر ماهانه استفادهٔ تجاری آزاده. فارسی‌اش در مقایسه با Llama 3 بهتر شده ولی هنوز با مدل‌های تخصصی‌تر فارسی فاصله داره.

۲. DeepSeek-V3 / DeepSeek-R1

DeepSeek یه شرکت چینیه که مدل‌هایی با performance باورنکردنی و قیمت بسیار پایین منتشر کرده. DeepSeek-V3 در کدنویسی و ریاضی با GPT-4o رقابت مستقیم داره. DeepSeek-R1 مدل استدلالی (reasoning) اون‌هاست که با o1 مقایسه می‌شه.

مجوز: MIT، کاملاً آزاد. می‌تونی locally با Ollama اجراش کنی (Q4 نسخهٔ کوچیک‌ترش). فارسیش قابل قبوله ولی نه در سطح مدل‌های تخصصی. اگه برای کدنویسی یا ریاضی می‌خوای و self-host مهمته، DeepSeek-V3 در این لیست جایگاه ویژه‌ای داره.

۳. Qwen 2.5 / Qwen 3 (Alibaba)

خانوادهٔ Qwen از Alibaba Cloud یکی از قوی‌ترین مجموعه‌های open-weight‌ه. Qwen2.5-72B در بیشتر بنچمارک‌ها از Llama 3 70B جلوتره. Qwen2.5-Coder-32B مخصوص کدنویسیه و نتایج خیلی خوبی داره. Qwen 3 با MoE معماری جدیدی آورده.

یه مزیت کلیدی: فارسی Qwen نسبتاً خوبه چون روی داده‌های چندزبانه آسیایی آموزش دیده که فارسی هم شامل می‌شه. مجوز: Apache 2.0 برای اکثر مدل‌ها.

۴. Mistral / Mistral Large 2

Mistral یه شرکت فرانسویه که مدل‌های کارآمد و کوچک می‌سازه. Mistral 7B هنوز یکی از بهترین مدل‌ها در اندازهٔ خودشه برای اجرا روی لپ‌تاپ. Mixtral 8x7B با معماری MoE performance خوبی با حجم کمتر داره. Mistral Large 2 مدل flagship‌شونه که با GPT-4o رقابت می‌کنه.

مجوز: اکثر مدل‌های کوچیک‌تر Apache 2.0 هستن. فارسیشون متوسطه، اگه کار تخصصی فارسی داری، Qwen یا Llama انتخاب بهتریه.

۵. Gemma 3 (Google)

Gemma 3 سری مدل‌های open-source گوگله که روی Tensor Processing Unit‌های گوگل تنظیم شدن. مزیت اصلی: بهینه برای اجرا روی سخت‌افزار محدود، نسخه‌های ۱B، ۴B، ۱۲B و ۲۷B وجود داره. Gemma 3 27B توی لپ‌تاپ‌های با GPU متوسط اجرا می‌شه.

مجوز: Gemma License (استفادهٔ تجاری با محدودیت‌هایی). فارسیش متوسطه ولی برای on-device inference خوبه.

۶. Command-R (Cohere)

Command-R و Command-R+ از Cohere برای RAG و کارهای enterprise طراحی شدن. context window بزرگ (۱۲۸K) و قابلیت grounding در documents داره. برای ساخت سیستم‌های جستجوی داخلی شرکت‌ها گزینهٔ جدیه.

مجوز: CC-BY-NC (غیرتجاری آزاد). فارسیش کمتر از رقبا تست شده، ولی برای متن انگلیسی enterprise عالیه.

۷. Aya (Cohere for AI)

Aya پروژه‌ای تحقیقاتیه از Cohere for AI که مخصوص زبان‌های کم‌منبع (low-resource) ساخته شده، و فارسی جزو زبان‌های مورد توجه‌شه. Aya-23 روی ۲۳ زبان از جمله فارسی تنظیم شده و برای تولید متن فارسی طبیعی نتایج بهتری از مدل‌های عمومی داره.

مجوز: Apache 2.0. اگه می‌خوای یه مدل open-source برای تولید محتوای فارسی بسازی یا chatbot فارسی پیاده‌سازی کنی، Aya نقطهٔ شروع خوبیه.

مقایسهٔ سریع

مدل	اندازه (active)	فارسی	مجوز	بهترین برای
Llama 4 Scout	17B	متوسط+	رایگان تجاری	عمومی، multimodal
DeepSeek-V3	MoE کارآمد	قابل قبول	MIT	کدنویسی، ریاضی
Qwen 2.5-72B	72B	خوب	Apache 2.0	عمومی + فارسی
Mistral 7B	7B	متوسط	Apache 2.0	سبک، local
Gemma 3 27B	27B	متوسط	Gemma License	on-device
Command-R+	104B	متوسط	CC-BY-NC	RAG enterprise
Aya-23	35B	خوب	Apache 2.0	فارسی تخصصی

چطور self-host کنی؟

ساده‌ترین مسیر: Ollama رو نصب کن و مدل موردنظر رو pull کن:

ollama pull qwen2.5:72b
ollama pull deepseek-v3

برای inference سریع‌تر روی سرور: vLLM یا llama.cpp گزینه‌های بهتری‌ن.

همچنین بخوان

مدل‌های open-source در مقابل closed-source، کِی کدوم رو انتخاب کنی؟
تاریخچهٔ مدل‌های زبانی فارسی، مسیر تا اینجا
شناخت پیوسته در هوش مصنوعی، چرا مدل بدون memory بلندمدت ناقصه
fine-tuning مدل‌های فارسی با Llama، گام‌به‌گام

self-host کردن مدل‌های open-weight یه آزادی واقعیه، ولی اگه می‌خوای روی یه سرویس تمام‌شدهٔ فارسی با حافظهٔ بلندمدت، آیراچت همون رو بدون دردسر setup ارائه می‌ده.

#بهترین ابزارها

ادامهٔ مسیر

همهٔ مقاله‌ها ←

بهترین ابزارها

بهترین هوش مصنوعی ۱۴۰۵

بهترین هوش مصنوعی ۱۴۰۵، راهنمای فارسی از مجموعهٔ «بهترین ابزارها» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

بهترین ابزارها

آوال‌ای و بهترین هوش مصنوعی ایرانی

آوال‌ای، آیرا، گپ‌جی‌پی‌تی و بقیه؛ مقایسهٔ صادقانهٔ بهترین هوش مصنوعی‌های ایرانی با پرداخت تومانی و دسترسی بدون فیلترشکن.

بهترین ابزارها

بهترین هوش مصنوعی رایگان

بهترین هوش مصنوعی رایگان، راهنمای فارسی از مجموعهٔ «بهترین ابزارها» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

بهترین ابزارها

بهترین هوش مصنوعی فارسی

بهترین هوش مصنوعی فارسی، راهنمای فارسی از مجموعهٔ «بهترین ابزارها» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

چرا open-weight برای کاربر ایرانی مهم‌تره؟

معیارهای این رتبه‌بندی

۱. Llama 4 (Meta)

۲. DeepSeek-V3 / DeepSeek-R1

۳. Qwen 2.5 / Qwen 3 (Alibaba)

۴. Mistral / Mistral Large 2

۵. Gemma 3 (Google)

۶. Command-R (Cohere)

۷. Aya (Cohere for AI)

مقایسهٔ سریع

چطور self-host کنی؟

همچنین بخوان

ادامهٔ مسیر

بهترین هوش مصنوعی ۱۴۰۵

آوال‌ای و بهترین هوش مصنوعی ایرانی

بهترین هوش مصنوعی رایگان

بهترین هوش مصنوعی فارسی

بیشتر در «بهترین ابزارها»