توهم در هوش مصنوعی — چرا AI دروغ میسازد
توهم در هوش مصنوعی — چرا AI دروغ میسازد — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

اگه تا حالا از ChatGPT یا هر مدل زبانی دیگهای خواستی منبعی رو معرفی کنه و یه مقالهای بهت داده که اصلاً وجود نداشته، با توهم هوش مصنوعی (AI Hallucination) روبهرو شدی. این پدیده یکی از جدیترین چالشهای مدلهای زبانیه — نه یه باگ که با آپدیت بعدی رفع میشه، بلکه یه ویژگی ذاتی روش کار این مدلهاست.
توهم چیست؟
مدلهای زبانی بزرگ (LLM) بر اساس یه اصل ساده کار میکنن: «با توجه به متن قبلی، محتملترین کلمه بعدی کدومه؟» این مدلها حقیقت رو نمیدونن — آمار توزیع کلمات در دادههای آموزشی رو بلدن.
وقتی مدل اطلاعاتی نداره اما سؤالی ازش میپرسی، به جای «نمیدونم» گفتن، یه جواب محتمل و خوشساخت میسازه. این اتفاق رو توهم میگیم — مدل چیزی رو با اطمینان بیان میکنه که یا کاملاً جعله، یا نادقیقه، یا ترکیبی از واقعیت و خیاله.
چرا این اتفاق میافتد؟
سه دلیل اصلی داره:
۱. یادگیری از الگو، نه واقعیت مدلها روی متون انسانی آموزش میبینن. در این متون، وقتی کسی سؤالی میپرسه معمولاً یه جواب هم وجود داره. مدل این الگو رو یاد گرفته: «سؤال ← جواب». حتی وقتی جوابی وجود نداره.
۲. بریدگی اطلاعاتی (Knowledge Cutoff) مدلها یه تاریخ قطع دارن — یعنی از اتفاقات بعد از اون تاریخ خبر ندارن. ولی وقتی سؤال میکنی، این محدودیت رو صادقانه اعلام نمیکنن. یه جواب ساختهوپرداخته میدن.
۳. اعتمادبهنفس کاذب آموزش دیده مدلها از متنهایی آموزش دیدن که نویسندگانشون با اطمینان حرف میزدن. مدل هم همین سبک رو یاد گرفته. نتیجه: اطلاعات غلط با همون لحن مطمئن بیان میشه.
توهمها چه شکلهایی دارن؟
توهم واقعی: اختراع کامل اطلاعات
«کتاب «فیزیک کوانتوم برای مبتدیان» اثر حسین شریعتی، ۱۳۹۸ — منبع خوبیه» (این کتاب و نویسنده وجود ندارن)
توهم منبعی: ساختن DOI، لینک، یا مشخصات مقاله تحقیقاتی
یه مقاله با عنوان و نویسنده و سال درست اما DOI جعلی میسازه
توهم ریاضی: خطا در محاسبه با اطمینان کامل
«۱۷ ضربدر ۱۸ میشه ۳۰۶» — ولی گاهی همین رو هم اشتباه میگه
توهم برنامهنویسی: کد نوشتن با تابعهایی که در هیچ کتابخانهای وجود ندارن
توهم تاریخی: ترکیب رویدادهای واقعی با جزئیات ساختگی
مثالهای عملی برای کاربر ایرانی
وقتی از AI میخوای:
- «منابع فارسی در مورد X بده» ← لینکهای جعلی وبسایتهای ایرانی میسازه
- «آخرین آمار جمعیت ایران رو بده» ← عدد قدیمی یا اشتباه میده
- «فلان استاد دانشگاه تهران چه مقالاتی داره؟» ← مقالات جعلی میسازه
- «قانون فلان در ایران چیه؟» ← ممکنه قانون را با جزئیات غلط بیان کنه
چطور با توهم کنار بیایی؟
راههای کاهش توهم در پرامپت:
۱. بخواه «نمیدونم» بگه: «اگر مطمئن نیستی، صریح بگو که نمیدونی» ۲. منبعپذیری: «فقط اطلاعاتی بده که میتونی منبعش رو مستقیماً تأیید کنی» ۳. محدود کردن حوزه: به جای سؤال کلی، سؤال خاص بپرس ۴. هر چیز مهمی رو چک کن: عدد، نام، تاریخ، لینک — همه باید مستقل تأیید بشن
ابزارهایی که توهم رو کم میکنن:
- مدلهای با جستجوی وب (مثل ChatGPT Search یا Perplexity) که اطلاعات رو در لحظه میکشن
- سیستمهای RAG (بازیابی اطلاعات + تولید متن) که مدل رو به اسناد واقعی وصل میکنن
- مدلهای با citations مثل Claude که میتونه متن منبع رو مستقیم نشون بده
آیا توهم کاملاً رفع میشود؟
نه. مدلهای جدیدتر (GPT-4o، Claude 3.5، Gemini 1.5) توهم کمتری دارن اما صفر نمیشه. تکنیکهایی مثل RLHF، Constitutional AI و Retrieval-Augmented Generation کمک میکنن ولی حذف نمیکنن.
یه قانون طلایی: هرچه سؤال خاصتر و قابلتأییدتر باشه، توهم کمتره. هرچه سؤال مبهمتر و پر از جزئیات کوچیک تاریخی یا منبعی باشه، توهم بیشتره.
توهم در مقابل اشتباه معمولی
توهم با «اشتباه کردن» فرق داره. اشتباه یعنی مدل محاسبه رو غلط انجام داده. توهم یعنی مدل یه واقعیت جعلی ساخته و با اطمینان بیانش کرده. این تفاوت مهمه چون توهم به آدم حس درستی میده و همین خطرناکشه.
نقش حافظه بلندمدت در کاهش توهم
یکی از دلایل توهم اینه که مدل زمینه (context) کافی نداره. آیرا با شناخت پیوسته — ذخیره تاریخچه مکالمات و اطلاعات شخصیسازی شده — این مشکل رو برای حوزههای مشخص کاهش میده. مدل وقتی زمینه بیشتری داره، کمتر نیاز داره اختراع کنه.
همچنین بخوان
ادامهٔ مسیر
همهٔ مقالهها ←
هوش مصنوعی چیست؟ راهنمای کامل فارسی برای شروع در ۱۴۰۵
هوش مصنوعی به زبان ساده: تاریخچه، انواع، مدلهای زبانی بزرگ، شبکههای عصبی و چرا ۱۴۰۵ نقطهٔ عطف کاربر فارسیزبان است.

LLM چیست؟ راهنمای فارسی مدلهای زبانی بزرگ
LLM چیست؟ راهنمای فارسی مدلهای زبانی بزرگ — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر
شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

یادگیری ماشین چیست؟
یادگیری ماشین چیست؟ — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.
بیشتر در «هوش مصنوعی»
- یادگیری عمیق چیست؟
- پردازش زبان طبیعی (NLP) چیست؟
- ترنسفورمر چیست؟ معماری انقلابی LLMها
- تاریخچهٔ هوش مصنوعی — از تورینگ تا GPT-5
- اخلاق در هوش مصنوعی
- AGI، ASI و ANI — انواع هوش مصنوعی به زبان ساده
- انواع هوش مصنوعی
- آیندهٔ هوش مصنوعی
- RAG چیست؟ ترکیب بازیابی و تولید در LLM
- Embedding چیست؟ نمایش معنایی متن در فضای برداری
- Fine-tuning چیست؟
- Prompt injection و امنیت LLM
- AI alignment و safety به زبان ساده
- تأثیر هوش مصنوعی بر کار و مشاغل
- تأثیر هوش مصنوعی بر آموزش
- هوش مصنوعی و مغز انسان
- RLHF — آموزش با بازخورد انسانی
- مکانیزم Attention در ترنسفورمر
- هوش مصنوعی open source در مقابل closed source
- Quantization و فشردهسازی مدلها
- هوش مصنوعی چندوجهی (Multimodal AI)