بهترین ابزارها

بهترین مدل‌های open source

بهترین مدل‌های open source — راهنمای فارسی از مجموعهٔ «بهترین ابزارها» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

نوشتهٔ به‌روزرسانی: ۴ دقیقه مطالعه
تصویر مقالهٔ بهترین مدل‌های open source

مدل‌های متن‌باز دیگه فقط «جایگزین ارزون‌قیمت» نیستن. Llama 4 و DeepSeek-V3 عملاً با بهترین مدل‌های تجاری رقابت می‌کنن — با این تفاوت که می‌تونی اون‌ها رو روی سرور خودت اجرا کنی، داده‌هات رو به هیچ شرکتی ندی، و بدون کارت اعتباری دلاری ازشون استفاده کنی.

چرا open-weight برای کاربر ایرانی مهم‌تره؟

تحریم و مشکلات دسترسی یه واقعیت‌ه. وقتی مدل رو می‌تونی locally یا روی سرور شخصی اجرا کنی، دیگه نه نگران IP بن شدن هستی، نه نگران پرداخت دلاری، نه نگران اینکه ترمز سرویس بخوری. Open-weight بودن یعنی آزادی عمل.

معیارهای این رتبه‌بندی

  • کیفیت کلی — در بنچمارک‌های عمومی (MMLU، HumanEval، MATH) چه امتیازی داره؟
  • فارسی‌خوانی — فارسی محاوره‌ای و کتابی رو چقدر خوب می‌فهمه و تولید می‌کنه؟
  • قابلیت self-host — با Ollama، vLLM یا llama.cpp قابل اجراست؟ حداقل VRAM چقدر لازمه؟
  • مجوز — استفادهٔ تجاری آزاده یا محدودیت داره؟

۱. Llama 4 (Meta)

Meta در ۲۰۲۵ Llama 4 رو با معماری MoE (Mixture of Experts) منتشر کرد و قضیه تغییر کرد. Llama 4 Scout (۱۷B فعال از ۱۰۹B کل) روی یه GPU ۸۰GB اجرا می‌شه و با بنچمارک‌های GPT-4o رقابت می‌کنه. Llama 4 Maverick (۱۷B فعال از ۴۰۰B کل) قوی‌تره ولی به سرور چندگانه نیاز داره.

مجوز: برای پروژه‌های زیر ۷۰۰ میلیون کاربر ماهانه استفادهٔ تجاری آزاده. فارسی‌اش در مقایسه با Llama 3 بهتر شده ولی هنوز با مدل‌های تخصصی‌تر فارسی فاصله داره.


۲. DeepSeek-V3 / DeepSeek-R1

DeepSeek یه شرکت چینیه که مدل‌هایی با performance باورنکردنی و قیمت بسیار پایین منتشر کرده. DeepSeek-V3 در کدنویسی و ریاضی با GPT-4o رقابت مستقیم داره. DeepSeek-R1 مدل استدلالی (reasoning) اون‌هاست که با o1 مقایسه می‌شه.

مجوز: MIT — کاملاً آزاد. می‌تونی locally با Ollama اجراش کنی (Q4 نسخهٔ کوچیک‌ترش). فارسیش قابل قبوله ولی نه در سطح مدل‌های تخصصی. اگه برای کدنویسی یا ریاضی می‌خوای و self-host مهمته، DeepSeek-V3 در این لیست جایگاه ویژه‌ای داره.


۳. Qwen 2.5 / Qwen 3 (Alibaba)

خانوادهٔ Qwen از Alibaba Cloud یکی از قوی‌ترین مجموعه‌های open-weight‌ه. Qwen2.5-72B در بیشتر بنچمارک‌ها از Llama 3 70B جلوتره. Qwen2.5-Coder-32B مخصوص کدنویسیه و نتایج خیلی خوبی داره. Qwen 3 با MoE معماری جدیدی آورده.

یه مزیت کلیدی: فارسی Qwen نسبتاً خوبه چون روی داده‌های چندزبانه آسیایی آموزش دیده که فارسی هم شامل می‌شه. مجوز: Apache 2.0 برای اکثر مدل‌ها.


۴. Mistral / Mistral Large 2

Mistral یه شرکت فرانسویه که مدل‌های کارآمد و کوچک می‌سازه. Mistral 7B هنوز یکی از بهترین مدل‌ها در اندازهٔ خودشه برای اجرا روی لپ‌تاپ. Mixtral 8x7B با معماری MoE performance خوبی با حجم کمتر داره. Mistral Large 2 مدل flagship‌شونه که با GPT-4o رقابت می‌کنه.

مجوز: اکثر مدل‌های کوچیک‌تر Apache 2.0 هستن. فارسیشون متوسطه — اگه کار تخصصی فارسی داری، Qwen یا Llama انتخاب بهتریه.


۵. Gemma 3 (Google)

Gemma 3 سری مدل‌های open-source گوگله که روی Tensor Processing Unit‌های گوگل تنظیم شدن. مزیت اصلی: بهینه برای اجرا روی سخت‌افزار محدود — نسخه‌های ۱B، ۴B، ۱۲B و ۲۷B وجود داره. Gemma 3 27B توی لپ‌تاپ‌های با GPU متوسط اجرا می‌شه.

مجوز: Gemma License (استفادهٔ تجاری با محدودیت‌هایی). فارسیش متوسطه ولی برای on-device inference خوبه.


۶. Command-R (Cohere)

Command-R و Command-R+ از Cohere برای RAG و کارهای enterprise طراحی شدن. context window بزرگ (۱۲۸K) و قابلیت grounding در documents داره. برای ساخت سیستم‌های جستجوی داخلی شرکت‌ها گزینهٔ جدیه.

مجوز: CC-BY-NC (غیرتجاری آزاد). فارسیش کمتر از رقبا تست شده، ولی برای متن انگلیسی enterprise عالیه.


۷. Aya (Cohere for AI)

Aya پروژه‌ای تحقیقاتیه از Cohere for AI که مخصوص زبان‌های کم‌منبع (low-resource) ساخته شده — و فارسی جزو زبان‌های مورد توجه‌شه. Aya-23 روی ۲۳ زبان از جمله فارسی تنظیم شده و برای تولید متن فارسی طبیعی نتایج بهتری از مدل‌های عمومی داره.

مجوز: Apache 2.0. اگه می‌خوای یه مدل open-source برای تولید محتوای فارسی بسازی یا chatbot فارسی پیاده‌سازی کنی، Aya نقطهٔ شروع خوبیه.


مقایسهٔ سریع

مدلاندازه (active)فارسیمجوزبهترین برای
Llama 4 Scout17Bمتوسط+رایگان تجاریعمومی، multimodal
DeepSeek-V3MoE کارآمدقابل قبولMITکدنویسی، ریاضی
Qwen 2.5-72B72BخوبApache 2.0عمومی + فارسی
Mistral 7B7BمتوسطApache 2.0سبک، local
Gemma 3 27B27BمتوسطGemma Licenseon-device
Command-R+104BمتوسطCC-BY-NCRAG enterprise
Aya-2335BخوبApache 2.0فارسی تخصصی

چطور self-host کنی؟

ساده‌ترین مسیر: Ollama رو نصب کن و مدل موردنظر رو pull کن:

ollama pull qwen2.5:72b
ollama pull deepseek-v3

برای inference سریع‌تر روی سرور: vLLM یا llama.cpp گزینه‌های بهتری‌ن.


همچنین بخوان


self-host کردن مدل‌های open-weight یه آزادی واقعیه — ولی اگه می‌خوای روی یه سرویس تمام‌شدهٔ فارسی با حافظهٔ بلندمدت، آیراچت همون رو بدون دردسر setup ارائه می‌ده.

#بهترین ابزارها

ادامهٔ مسیر

همهٔ مقاله‌ها ←

بیشتر در «بهترین ابزارها»