هوش مصنوعی

یادگیری ماشین چیست؟

یادگیری ماشین چیست؟ — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

نوشتهٔ به‌روزرسانی: ۳ دقیقه مطالعه
تصویر مقالهٔ یادگیری ماشین چیست؟

یادگیری ماشین (Machine Learning یا ML) شاخه‌ای از هوش مصنوعی است که در آن به جای اینکه برنامه‌نویس قانون دقیق بنویسد، به ماشین داده می‌دهیم تا خودش قانون پیدا کند. این تغییر ظاهراً ساده، دنیای کامپیوتر را متحول کرد.

مشکلی که یادگیری ماشین حل کرد

قبل از ML، برنامه‌نویس برای هر مسئله باید قانون می‌نوشت. مثلاً برای تشخیص هرزنامه:

اگر «رایگان» + «تبریک» + «برنده شدید» → هرزنامه

این رویکرد برای مسائل ساده کار می‌کرد. ولی برای تشخیص تصویر سگ از گربه؟ یا تشخیص تومور در عکس MRI؟ نوشتن قانون دستی ممکن نبود — هزاران استثنا وجود داشت.

یادگیری ماشین گفت: به جای نوشتن قانون، هزاران عکس سگ و گربه به من بده. مدل خودش قانون پیدا می‌کند.

چطور کار می‌کند؟

فرایند ML سه مرحلهٔ اصلی دارد:

۱. آموزش (Training): داده‌ٔ برچسب‌خورده به مدل داده می‌شود. مثلاً ۱۰۰۰۰ تصویر گربه با برچسب «گربه» و ۱۰۰۰۰ تصویر سگ با برچسب «سگ». مدل پارامترهای خود را تنظیم می‌کند تا خطا کمینه شود.

۲. اعتبارسنجی (Validation): مدل روی داده‌هایی که ندیده آزمایش می‌شود. این مهم است — اگر فقط روی داده‌ٔ آموزشی تست کنی، مدل ممکن است «حفظ کرده باشد» نه «یاد گرفته».

۳. استنتاج (Inference): مدل آموزش‌دیده روی داده‌ٔ واقعی جدید اعمال می‌شود.

انواع یادگیری ماشین

یادگیری با ناظر (Supervised Learning): داده‌ٔ برچسب‌خورده داری. مثال: تشخیص اسپم (هر ایمیل برچسب «اسپم/نه‌اسپم» دارد)، پیش‌بینی قیمت خانه، تشخیص بیماری از تصویر پزشکی.

یادگیری بدون ناظر (Unsupervised Learning): داده برچسب ندارد. مدل سعی می‌کند الگو پیدا کند. مثال: دسته‌بندی مشتریان بر اساس رفتار خرید، تشخیص نقاط غیرعادی در ترافیک شبکه.

یادگیری تقویتی (Reinforcement Learning): مدل با محیط تعامل می‌کند و بر اساس پاداش/جریمه یاد می‌گیرد. مثال: AlphaGo، ربات‌های بازی‌باز، و بخشی از آموزش LLMها (RLHF — تقویت از بازخورد انسانی).

الگوریتم‌های کلاسیک ML

قبل از موج یادگیری عمیق، این الگوریتم‌ها رایج بودند و هنوز هم در بسیاری از مسائل کاربرد دارند:

  • Decision Tree / Random Forest: درخت تصمیم‌گیری. تفسیرپذیر است و برای داده‌ٔ جدولی خوب کار می‌کند.
  • SVM (Support Vector Machine): مرز بهینه بین کلاس‌ها پیدا می‌کند. در داده‌های با ابعاد بالا مؤثر بود.
  • Regression خطی/لجستیک: برای پیش‌بینی عدد یا احتمال. ساده، سریع، تفسیرپذیر.
  • k-Nearest Neighbors: هر نمونهٔ جدید را با k همسایهٔ نزدیکش در داده‌ٔ آموزشی مقایسه می‌کند.

چه زمانی ML انتخاب درست است؟

یادگیری ماشین همیشه پاسخ نیست. سؤالاتی که باید بپرسی:

  • آیا داده‌ٔ کافی دارم؟ (برای ML سنتی حداقل چند صد نمونه، برای deep learning معمولاً چند هزار تا چند میلیون)
  • آیا قانون دستی واقعاً نمی‌توانم بنویسم؟
  • آیا خطا پذیرفتنی است؟ (مدل‌های ML همیشه درصدی خطا دارند — در پزشکی این مهم است)

اگر جواب اول «نه» است یا جواب سوم «خیر» — احتمالاً ML انتخاب درست نیست.

یادگیری ماشین در دنیای LLMها

مدل‌های زبانی بزرگ (LLM) مثل GPT-4 و Claude نوع خاصی از یادگیری ماشین هستند — دقیقاً «یادگیری عمیق» با معماری Transformer. اما مدل‌های ML کلاسیک هنوز زنده‌اند و در بسیاری جاها بهتر کار می‌کنند:

  • پیش‌بینی چرن مشتری در CRM
  • تشخیص تقلب در تراکنش‌های مالی
  • پیش‌بینی خرابی تجهیزات صنعتی

در این موارد داده‌ٔ جدولی ساختاریافته دارید و Decision Tree یا XGBoost سریع‌تر، ارزان‌تر، و تفسیرپذیرتر از یک LLM است.

ارتباط با هوش مصنوعی

نقشهٔ رابطه‌ها این است:

هوش مصنوعی (AI)
    └── یادگیری ماشین (ML)
            └── یادگیری عمیق (Deep Learning)
                    └── LLM / مدل‌های زبانی

یادگیری ماشین زیرمجموعهٔ AI است. یادگیری عمیق زیرمجموعهٔ ML. LLMها زیرمجموعهٔ یادگیری عمیق. وقتی مردم می‌گویند «هوش مصنوعی»، معمولاً از LLM یا یادگیری عمیق حرف می‌زنند — اما فراموش نکن لایه‌های زیرین وجود دارند.

فارسی و ML

مدل‌های ML برای فارسی چالش‌هایی دارند:

  • توکن‌سازی (Tokenization): فارسی حروف چسبنده دارد. «می‌رود» یک کلمه است یا سه؟ هر tokenizer متفاوت پاسخ می‌دهد.
  • کمبود داده: corpus فارسی نسبت به انگلیسی بسیار کمتر است.
  • دستور زبان: ترتیب فعل-مفعول-فاعل در فارسی (SOV) با انگلیسی (SVO) فرق دارد.

این‌ها دلایلی هستند که مدل‌های fine-tune شده روی فارسی مثل ParsBERT اهمیت دارند.

جمع‌بندی

یادگیری ماشین پایهٔ اکثر هوش مصنوعی مدرن است. از تشخیص اسپم ایمیل تا مدل‌های زبانی میلیارددلاری، همه از همین اصل ساده استفاده می‌کنند: به جای نوشتن قانون، از داده یاد بگیر. شناختن این پایه به تو کمک می‌کند ابزارها را بهتر انتخاب کنی و از محدودیت‌هایشان آگاه باشی.

همچنین بخوان

#هوش مصنوعی#machine learning

ادامهٔ مسیر

همهٔ مقاله‌ها ←

بیشتر در «هوش مصنوعی»