هوش مصنوعی

توهم در هوش مصنوعی، چرا AI دروغ می‌سازد

توهم در هوش مصنوعی، چرا AI دروغ می‌سازد، راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

نوشتهٔ تیم آیرا•۱۷ بهمن ۱۴۰۴به‌روزرسانی: ۱۲ اردیبهشت ۱۴۰۵•۳ دقیقه مطالعه

تصویر مقالهٔ توهم در هوش مصنوعی، چرا AI دروغ می‌سازد

اگه تا حالا از ChatGPT یا هر مدل زبانی دیگه‌ای خواستی منبعی رو معرفی کنه و یه مقاله‌ای بهت داده که اصلاً وجود نداشته، با توهم هوش مصنوعی (AI Hallucination) روبه‌رو شدی. این پدیده یکی از جدی‌ترین چالش‌های مدل‌های زبانیه، نه یه باگ که با آپدیت بعدی رفع می‌شه، بلکه یه ویژگی ذاتی روش کار این مدل‌هاست.

توهم چیست؟

مدل‌های زبانی بزرگ (LLM) بر اساس یه اصل ساده کار می‌کنن: «با توجه به متن قبلی، محتمل‌ترین کلمه بعدی کدومه؟» این مدل‌ها حقیقت رو نمی‌دونن، آمار توزیع کلمات در داده‌های آموزشی رو بلدن.

وقتی مدل اطلاعاتی نداره اما سؤالی ازش می‌پرسی، به جای «نمی‌دونم» گفتن، یه جواب محتمل و خوش‌ساخت می‌سازه. این اتفاق رو توهم می‌گیم، مدل چیزی رو با اطمینان بیان می‌کنه که یا کاملاً جعله، یا نادقیقه، یا ترکیبی از واقعیت و خیاله.

چرا این اتفاق می‌افتد؟

سه دلیل اصلی داره:

۱. یادگیری از الگو، نه واقعیت مدل‌ها روی متون انسانی آموزش می‌بینن. در این متون، وقتی کسی سؤالی می‌پرسه معمولاً یه جواب هم وجود داره. مدل این الگو رو یاد گرفته: «سؤال ← جواب». حتی وقتی جوابی وجود نداره.

۲. بریدگی اطلاعاتی (Knowledge Cutoff) مدل‌ها یه تاریخ قطع دارن، یعنی از اتفاقات بعد از اون تاریخ خبر ندارن. ولی وقتی سؤال می‌کنی، این محدودیت رو صادقانه اعلام نمی‌کنن. یه جواب ساخته‌وپرداخته می‌دن.

۳. اعتمادبه‌نفس کاذب آموزش دیده مدل‌ها از متن‌هایی آموزش دیدن که نویسندگانشون با اطمینان حرف می‌زدن. مدل هم همین سبک رو یاد گرفته. نتیجه: اطلاعات غلط با همون لحن مطمئن بیان می‌شه.

توهم‌ها چه شکل‌هایی دارن؟

توهم واقعی: اختراع کامل اطلاعات

«کتاب «فیزیک کوانتوم برای مبتدیان» اثر حسین شریعتی، ۱۳۹۸، منبع خوبیه» (این کتاب و نویسنده وجود ندارن)

توهم منبعی: ساختن DOI، لینک، یا مشخصات مقاله تحقیقاتی

یه مقاله با عنوان و نویسنده و سال درست اما DOI جعلی می‌سازه

توهم ریاضی: خطا در محاسبه با اطمینان کامل

«۱۷ ضربدر ۱۸ می‌شه ۳۰۶»، ولی گاهی همین رو هم اشتباه می‌گه

توهم برنامه‌نویسی: کد نوشتن با تابع‌هایی که در هیچ کتابخانه‌ای وجود ندارن

توهم تاریخی: ترکیب رویدادهای واقعی با جزئیات ساختگی

مثال‌های عملی برای کاربر ایرانی

وقتی از AI می‌خوای:

«منابع فارسی در مورد X بده» ← لینک‌های جعلی وبسایت‌های ایرانی می‌سازه
«آخرین آمار جمعیت ایران رو بده» ← عدد قدیمی یا اشتباه می‌ده
«فلان استاد دانشگاه تهران چه مقالاتی داره؟» ← مقالات جعلی می‌سازه
«قانون فلان در ایران چیه؟» ← ممکنه قانون را با جزئیات غلط بیان کنه

چطور با توهم کنار بیایی؟

راه‌های کاهش توهم در پرامپت:

۱. بخواه «نمی‌دونم» بگه: «اگر مطمئن نیستی، صریح بگو که نمی‌دونی» ۲. منبع‌پذیری: «فقط اطلاعاتی بده که می‌تونی منبعش رو مستقیماً تأیید کنی» ۳. محدود کردن حوزه: به جای سؤال کلی، سؤال خاص بپرس ۴. هر چیز مهمی رو چک کن: عدد، نام، تاریخ، لینک، همه باید مستقل تأیید بشن

ابزارهایی که توهم رو کم می‌کنن:

مدل‌های با جستجوی وب (مثل ChatGPT Search یا Perplexity) که اطلاعات رو در لحظه می‌کشن
سیستم‌های RAG (بازیابی اطلاعات + تولید متن) که مدل رو به اسناد واقعی وصل می‌کنن
مدل‌های با citations مثل Claude که می‌تونه متن منبع رو مستقیم نشون بده

آیا توهم کاملاً رفع می‌شود؟

نه. مدل‌های جدیدتر (GPT-4o، Claude 3.5، Gemini 1.5) توهم کمتری دارن اما صفر نمی‌شه. تکنیک‌هایی مثل RLHF، Constitutional AI و Retrieval-Augmented Generation کمک می‌کنن ولی حذف نمی‌کنن.

یه قانون طلایی: هرچه سؤال خاص‌تر و قابل‌تأیید‌تر باشه، توهم کمتره. هرچه سؤال مبهم‌تر و پر از جزئیات کوچیک تاریخی یا منبعی باشه، توهم بیشتره.

توهم در مقابل اشتباه معمولی

توهم با «اشتباه کردن» فرق داره. اشتباه یعنی مدل محاسبه رو غلط انجام داده. توهم یعنی مدل یه واقعیت جعلی ساخته و با اطمینان بیانش کرده. این تفاوت مهمه چون توهم به آدم حس درستی می‌ده و همین خطرناکشه.

نقش حافظه بلندمدت در کاهش توهم

یکی از دلایل توهم اینه که مدل زمینه (context) کافی نداره. آیرا با شناخت پیوسته، ذخیره تاریخچه مکالمات و اطلاعات شخصی‌سازی شده، این مشکل رو برای حوزه‌های مشخص کاهش می‌ده. مدل وقتی زمینه بیشتری داره، کمتر نیاز داره اختراع کنه.

همچنین بخوان

#هوش مصنوعی#hallucination

ادامهٔ مسیر

همهٔ مقاله‌ها ←

هوش مصنوعی

هوش مصنوعی چیست؟ راهنمای کامل فارسی برای شروع در ۱۴۰۵

هوش مصنوعی به زبان ساده: تاریخچه، انواع، مدل‌های زبانی بزرگ، شبکه‌های عصبی و چرا ۱۴۰۵ نقطهٔ عطف کاربر فارسی‌زبان است.

هوش مصنوعی

LLM چیست؟ راهنمای فارسی مدل‌های زبانی بزرگ

LLM چیست؟ راهنمای فارسی مدل‌های زبانی بزرگ، راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

هوش مصنوعی

شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر

شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر، راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

هوش مصنوعی

یادگیری ماشین چیست؟

یادگیری ماشین چیست؟، راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

توهم چیست؟

چرا این اتفاق می‌افتد؟

توهم‌ها چه شکل‌هایی دارن؟

مثال‌های عملی برای کاربر ایرانی

چطور با توهم کنار بیایی؟

آیا توهم کاملاً رفع می‌شود؟

توهم در مقابل اشتباه معمولی

نقش حافظه بلندمدت در کاهش توهم

همچنین بخوان

ادامهٔ مسیر

هوش مصنوعی چیست؟ راهنمای کامل فارسی برای شروع در ۱۴۰۵

LLM چیست؟ راهنمای فارسی مدل‌های زبانی بزرگ

شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر

یادگیری ماشین چیست؟

بیشتر در «هوش مصنوعی»