یادگیری ماشین چیست؟
یادگیری ماشین چیست؟ — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

یادگیری ماشین (Machine Learning یا ML) شاخهای از هوش مصنوعی است که در آن به جای اینکه برنامهنویس قانون دقیق بنویسد، به ماشین داده میدهیم تا خودش قانون پیدا کند. این تغییر ظاهراً ساده، دنیای کامپیوتر را متحول کرد.
مشکلی که یادگیری ماشین حل کرد
قبل از ML، برنامهنویس برای هر مسئله باید قانون مینوشت. مثلاً برای تشخیص هرزنامه:
اگر «رایگان» + «تبریک» + «برنده شدید» → هرزنامه
این رویکرد برای مسائل ساده کار میکرد. ولی برای تشخیص تصویر سگ از گربه؟ یا تشخیص تومور در عکس MRI؟ نوشتن قانون دستی ممکن نبود — هزاران استثنا وجود داشت.
یادگیری ماشین گفت: به جای نوشتن قانون، هزاران عکس سگ و گربه به من بده. مدل خودش قانون پیدا میکند.
چطور کار میکند؟
فرایند ML سه مرحلهٔ اصلی دارد:
۱. آموزش (Training): دادهٔ برچسبخورده به مدل داده میشود. مثلاً ۱۰۰۰۰ تصویر گربه با برچسب «گربه» و ۱۰۰۰۰ تصویر سگ با برچسب «سگ». مدل پارامترهای خود را تنظیم میکند تا خطا کمینه شود.
۲. اعتبارسنجی (Validation): مدل روی دادههایی که ندیده آزمایش میشود. این مهم است — اگر فقط روی دادهٔ آموزشی تست کنی، مدل ممکن است «حفظ کرده باشد» نه «یاد گرفته».
۳. استنتاج (Inference): مدل آموزشدیده روی دادهٔ واقعی جدید اعمال میشود.
انواع یادگیری ماشین
یادگیری با ناظر (Supervised Learning): دادهٔ برچسبخورده داری. مثال: تشخیص اسپم (هر ایمیل برچسب «اسپم/نهاسپم» دارد)، پیشبینی قیمت خانه، تشخیص بیماری از تصویر پزشکی.
یادگیری بدون ناظر (Unsupervised Learning): داده برچسب ندارد. مدل سعی میکند الگو پیدا کند. مثال: دستهبندی مشتریان بر اساس رفتار خرید، تشخیص نقاط غیرعادی در ترافیک شبکه.
یادگیری تقویتی (Reinforcement Learning): مدل با محیط تعامل میکند و بر اساس پاداش/جریمه یاد میگیرد. مثال: AlphaGo، رباتهای بازیباز، و بخشی از آموزش LLMها (RLHF — تقویت از بازخورد انسانی).
الگوریتمهای کلاسیک ML
قبل از موج یادگیری عمیق، این الگوریتمها رایج بودند و هنوز هم در بسیاری از مسائل کاربرد دارند:
- Decision Tree / Random Forest: درخت تصمیمگیری. تفسیرپذیر است و برای دادهٔ جدولی خوب کار میکند.
- SVM (Support Vector Machine): مرز بهینه بین کلاسها پیدا میکند. در دادههای با ابعاد بالا مؤثر بود.
- Regression خطی/لجستیک: برای پیشبینی عدد یا احتمال. ساده، سریع، تفسیرپذیر.
- k-Nearest Neighbors: هر نمونهٔ جدید را با k همسایهٔ نزدیکش در دادهٔ آموزشی مقایسه میکند.
چه زمانی ML انتخاب درست است؟
یادگیری ماشین همیشه پاسخ نیست. سؤالاتی که باید بپرسی:
- آیا دادهٔ کافی دارم؟ (برای ML سنتی حداقل چند صد نمونه، برای deep learning معمولاً چند هزار تا چند میلیون)
- آیا قانون دستی واقعاً نمیتوانم بنویسم؟
- آیا خطا پذیرفتنی است؟ (مدلهای ML همیشه درصدی خطا دارند — در پزشکی این مهم است)
اگر جواب اول «نه» است یا جواب سوم «خیر» — احتمالاً ML انتخاب درست نیست.
یادگیری ماشین در دنیای LLMها
مدلهای زبانی بزرگ (LLM) مثل GPT-4 و Claude نوع خاصی از یادگیری ماشین هستند — دقیقاً «یادگیری عمیق» با معماری Transformer. اما مدلهای ML کلاسیک هنوز زندهاند و در بسیاری جاها بهتر کار میکنند:
- پیشبینی چرن مشتری در CRM
- تشخیص تقلب در تراکنشهای مالی
- پیشبینی خرابی تجهیزات صنعتی
در این موارد دادهٔ جدولی ساختاریافته دارید و Decision Tree یا XGBoost سریعتر، ارزانتر، و تفسیرپذیرتر از یک LLM است.
ارتباط با هوش مصنوعی
نقشهٔ رابطهها این است:
هوش مصنوعی (AI)
└── یادگیری ماشین (ML)
└── یادگیری عمیق (Deep Learning)
└── LLM / مدلهای زبانی
یادگیری ماشین زیرمجموعهٔ AI است. یادگیری عمیق زیرمجموعهٔ ML. LLMها زیرمجموعهٔ یادگیری عمیق. وقتی مردم میگویند «هوش مصنوعی»، معمولاً از LLM یا یادگیری عمیق حرف میزنند — اما فراموش نکن لایههای زیرین وجود دارند.
فارسی و ML
مدلهای ML برای فارسی چالشهایی دارند:
- توکنسازی (Tokenization): فارسی حروف چسبنده دارد. «میرود» یک کلمه است یا سه؟ هر tokenizer متفاوت پاسخ میدهد.
- کمبود داده: corpus فارسی نسبت به انگلیسی بسیار کمتر است.
- دستور زبان: ترتیب فعل-مفعول-فاعل در فارسی (SOV) با انگلیسی (SVO) فرق دارد.
اینها دلایلی هستند که مدلهای fine-tune شده روی فارسی مثل ParsBERT اهمیت دارند.
جمعبندی
یادگیری ماشین پایهٔ اکثر هوش مصنوعی مدرن است. از تشخیص اسپم ایمیل تا مدلهای زبانی میلیارددلاری، همه از همین اصل ساده استفاده میکنند: به جای نوشتن قانون، از داده یاد بگیر. شناختن این پایه به تو کمک میکند ابزارها را بهتر انتخاب کنی و از محدودیتهایشان آگاه باشی.
همچنین بخوان
ادامهٔ مسیر
همهٔ مقالهها ←
هوش مصنوعی چیست؟ راهنمای کامل فارسی برای شروع در ۱۴۰۵
هوش مصنوعی به زبان ساده: تاریخچه، انواع، مدلهای زبانی بزرگ، شبکههای عصبی و چرا ۱۴۰۵ نقطهٔ عطف کاربر فارسیزبان است.

LLM چیست؟ راهنمای فارسی مدلهای زبانی بزرگ
LLM چیست؟ راهنمای فارسی مدلهای زبانی بزرگ — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر
شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

یادگیری عمیق چیست؟
یادگیری عمیق چیست؟ — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.
بیشتر در «هوش مصنوعی»
- پردازش زبان طبیعی (NLP) چیست؟
- ترنسفورمر چیست؟ معماری انقلابی LLMها
- تاریخچهٔ هوش مصنوعی — از تورینگ تا GPT-5
- اخلاق در هوش مصنوعی
- AGI، ASI و ANI — انواع هوش مصنوعی به زبان ساده
- انواع هوش مصنوعی
- آیندهٔ هوش مصنوعی
- RAG چیست؟ ترکیب بازیابی و تولید در LLM
- Embedding چیست؟ نمایش معنایی متن در فضای برداری
- Fine-tuning چیست؟
- توهم در هوش مصنوعی — چرا AI دروغ میسازد
- Prompt injection و امنیت LLM
- AI alignment و safety به زبان ساده
- تأثیر هوش مصنوعی بر کار و مشاغل
- تأثیر هوش مصنوعی بر آموزش
- هوش مصنوعی و مغز انسان
- RLHF — آموزش با بازخورد انسانی
- مکانیزم Attention در ترنسفورمر
- هوش مصنوعی open source در مقابل closed source
- Quantization و فشردهسازی مدلها
- هوش مصنوعی چندوجهی (Multimodal AI)