اخلاق در هوش مصنوعی
اخلاق در هوش مصنوعی — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

وقتی ChatGPT از نوشتن بدافزار سر باز میزنه، وقتی Gemini در توصیف چهرهها محتاطانه رفتار میکنه، یا وقتی یه مدل از جواب دادن به یه سوال امتناع میکنه — همه اینها محصول تصمیمگیریهای اخلاقیه که قبلاً گرفته شده. اخلاق در هوش مصنوعی فقط یه بحث فلسفی نیست؛ هر روز روی تجربهٔ کاربری تأثیر مستقیم داره.
چرا اخلاق AI مطرح شد
مدلهای زبانی اولیه هیچ محدودیتی نداشتن. GPT-2 وقتی در ۲۰۱۹ منتشر شد، OpenAI نگران بود که برای تولید اخبار جعلی استفاده بشه — به همین دلیل اولش دسترسی محدود بود. بعدها مشخص شد که مشکلات عمیقتری هم هست:
- Bias (سوگیری): مدلها روی دادههای انسانی آموزش دیدن و تعصبهای انسانی رو هم یاد گرفتن. مثلاً مدلهای اولیه در جملهی «پزشک گفت...» ضمیر مذکر میگذاشتن.
- Hallucination: وقتی مدل چیزی میگه که درست نیست — و با اطمینان میگه — این خودش یه مشکل اخلاقیه، بهخصوص در حوزههای پزشکی و حقوقی.
- محتوای مضر: تولید دستورالعمل سلاح، محتوای سوءاستفاده از کودک، فریب و دستکاری.
- نقض حریم خصوصی: مدلهایی که اطلاعات آموزشی شخصی رو «یادشه» و میتونه بازتولید کنه.
سه رویکرد اصلی
۱. RLHF (تقویت با بازخورد انسانی) انسانها خروجیهای مدل رو ارزیابی میکنن و میگن کدوم بهتره. مدل یاد میگیره خروجیهایی که انسانها ترجیح میدن بیشتر تولید کنه. ChatGPT و Claude هر دو از این روش استفاده میکنن. مشکل: «ترجیح انسانی» دقیقاً چیه؟ چه انسانی؟ با چه ارزشهایی؟
۲. Constitutional AI (هوش مصنوعی قانونمحور) Anthropic این رویکرد رو برای Claude ابداع کرد. به جای اتکای صرف به ارزیابی انسانی، یه «قانون اساسی» از اصول تعریف میشه — مثلاً «مضر نباش»، «صادق باش»، «به استقلال انسان احترام بذار». مدل یاد میگیره خروجیهای خودش رو بر اساس این اصول نقد کنه. Constitutional AI اولینبار در ۲۰۲۲ توسط Anthropic منتشر شد.
۳. Red Teaming تیمی از انسانها (یا مدلهای دیگه) سعی میکنن مدل رو به انجام کارهای نامناسب وادار کنن. آسیبپذیریها پیدا میشن و قبل از انتشار برطرف میشن.
مرز میان «محافظت» و «سانسور»
یکی از اصلیترین تنشهای اخلاق AI اینجاست: چه زمانی یه مدل «به درستی» جواب نمیده، و چه زمانی «بیش از حد» محدود میشه؟
چند مثال واقعی:
- یه مدل از توضیح «چطور قفل شکسته» امتناع میکنه — ولی این اطلاعات توی هر کتاب قفلسازی هست
- یه مدل نمیتونه درباره داروها صحبت کنه — ولی پزشک و بیمار به این اطلاعات نیاز دارن
- یه مدل از نوشتن داستان خشونتآمیز امتناع میکنه — ولی ادبیات جدی اغلب خشونت داره
هیچ پاسخ سادهای وجود نداره. هر شرکت تعادل متفاوتی انتخاب میکنه. Claude نسبت به ChatGPT کمی محتاطتره در بعضی موارد، ولی در موضوعات بحثی سیاسی محافظهکارانهتر.
تعصب و نمایندگی
مدلها روی دادههای اینترنت آموزش دیدن. اینترنت انگلیسی-محور، غرب-محور، و نمایندهٔ دیدگاههای شهری طبقهٔ متوسط و بالاست. این یعنی:
- زبانهای کمتر رایج (مثل فارسی، کُردی، بلوچی) کیفیت پایینتری دارن
- دیدگاههای غیرغربی کمتر نمایندگی میشن
- مفاهیمی که در فرهنگهای مختلف معانی متفاوت دارن ممکنه به شکل یهجانبه توضیح داده بشن
برای کاربر ایرانی این مهمه: وقتی از مدلهای خارجی درباره مسائل ایران میپرسی، خروجی ممکنه با واقعیت تجربهشده تفاوت داشته باشه.
اخلاق در کاربردهای خاص
تشخیص پزشکی: اگه مدل اشتباه کنه، پیامد جدیه. به همین دلیل شرکتهای تخصصی مثل Google Health و Microsoft Healthcare مدلهای جداگانه با آموزش تخصصی دارن.
سیستمهای قضایی: در آمریکا از الگوریتم COMPAS برای پیشبینی احتمال تکرار جرم استفاده شد. بعداً مشخص شد این الگوریتم نسبت به افراد سیاهپوست سوگیری داشته. این نمونهٔ کلاسیک «bias پنهان در داده» است.
ابزارهای استخدام: آمازون یه سیستم AI استخدامی ساخت که رزومهها رو رتبهبندی میکرد. پروژه متوقف شد چون مشخص شد به نفع مردان سوگیری داره — چون دادههای آموزشی از ۱۰ سال استخدام قبلی بود که اکثراً مرد بودن.
Deepfake و دستکاری: تولید ویدیوی جعلی از افراد واقعی یکی از مشکلات فعلی AI است. قوانین تازهای در اروپا (EU AI Act) این موارد رو مستقیماً آدرس میده.
EU AI Act — قانون جدید اروپا
در ۲۰۲۴ اتحادیهٔ اروپا قانون AI Act رو تصویب کرد — اولین چارچوب قانونی جامع برای تنظیم هوش مصنوعی در دنیا. کاربردهای AI به ۴ سطح ریسک تقسیم شدن:
- غیرقابل قبول: شناسایی احساسات در محیطهای کاری، امتیازدهی اجتماعی (مثل مدل چین)، تشخیص چهرهٔ بلادرنگ در اماکن عمومی
- ریسک بالا: AI در حوزهٔ پزشکی، قضایی، استخدام — نیاز به ثبت و ارزیابی دارن
- ریسک محدود: chatbot باید اعلام کند AI است
- ریسک کم: بازیهای ویدیویی، فیلترهای spam
چرا باید بهش اهمیت بدی
اگه توسعهدهندهای، تصمیمات اخلاقی مستقیماً بر کار تو اثر میذاره: کدوم مدل انتخاب کنی، چطور prompt بنویسی، چطور خروجیها رو فیلتر کنی.
اگه کاربر عادیای، فهم این مباحث کمک میکنه بدونی چرا مدل گاهی جواب نمیده، چطور bias رو تشخیص بدی، و چقدر به خروجیها اعتماد کنی.
در ایران، این بحث لایهٔ اضافهای داره: وقتی از مدلهای خارجی استفاده میکنی، ارزشها و محدودیتهای آنها محصول تصمیمهای شرکتهای آمریکایی و اروپاییان — نه لزوماً نمایندهٔ ارزشهای فرهنگی کاربر ایرانی.
همچنین بخوان
ادامهٔ مسیر
همهٔ مقالهها ←
هوش مصنوعی چیست؟ راهنمای کامل فارسی برای شروع در ۱۴۰۵
هوش مصنوعی به زبان ساده: تاریخچه، انواع، مدلهای زبانی بزرگ، شبکههای عصبی و چرا ۱۴۰۵ نقطهٔ عطف کاربر فارسیزبان است.

LLM چیست؟ راهنمای فارسی مدلهای زبانی بزرگ
LLM چیست؟ راهنمای فارسی مدلهای زبانی بزرگ — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر
شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

یادگیری ماشین چیست؟
یادگیری ماشین چیست؟ — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.
بیشتر در «هوش مصنوعی»
- یادگیری عمیق چیست؟
- پردازش زبان طبیعی (NLP) چیست؟
- ترنسفورمر چیست؟ معماری انقلابی LLMها
- تاریخچهٔ هوش مصنوعی — از تورینگ تا GPT-5
- AGI، ASI و ANI — انواع هوش مصنوعی به زبان ساده
- انواع هوش مصنوعی
- آیندهٔ هوش مصنوعی
- RAG چیست؟ ترکیب بازیابی و تولید در LLM
- Embedding چیست؟ نمایش معنایی متن در فضای برداری
- Fine-tuning چیست؟
- توهم در هوش مصنوعی — چرا AI دروغ میسازد
- Prompt injection و امنیت LLM
- AI alignment و safety به زبان ساده
- تأثیر هوش مصنوعی بر کار و مشاغل
- تأثیر هوش مصنوعی بر آموزش
- هوش مصنوعی و مغز انسان
- RLHF — آموزش با بازخورد انسانی
- مکانیزم Attention در ترنسفورمر
- هوش مصنوعی open source در مقابل closed source
- Quantization و فشردهسازی مدلها
- هوش مصنوعی چندوجهی (Multimodal AI)