هوش مصنوعی

اخلاق در هوش مصنوعی

اخلاق در هوش مصنوعی، راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

نوشتهٔ تیم آیرا•۲۲ بهمن ۱۴۰۴به‌روزرسانی: ۱۲ فروردین ۱۴۰۵•۴ دقیقه مطالعه

وقتی ChatGPT از نوشتن بدافزار سر باز می‌زنه، وقتی Gemini در توصیف چهره‌ها محتاطانه رفتار می‌کنه، یا وقتی یه مدل از جواب دادن به یه سوال امتناع می‌کنه، همه این‌ها محصول تصمیم‌گیری‌های اخلاقیه که قبلاً گرفته شده. اخلاق در هوش مصنوعی فقط یه بحث فلسفی نیست؛ هر روز روی تجربهٔ کاربری تأثیر مستقیم داره.

چرا اخلاق AI مطرح شد

مدل‌های زبانی اولیه هیچ محدودیتی نداشتن. GPT-2 وقتی در ۲۰۱۹ منتشر شد، OpenAI نگران بود که برای تولید اخبار جعلی استفاده بشه، به همین دلیل اولش دسترسی محدود بود. بعدها مشخص شد که مشکلات عمیق‌تری هم هست:

Bias (سوگیری): مدل‌ها روی داده‌های انسانی آموزش دیدن و تعصب‌های انسانی رو هم یاد گرفتن. مثلاً مدل‌های اولیه در جمله‌ی «پزشک گفت...» ضمیر مذکر می‌گذاشتن.
Hallucination: وقتی مدل چیزی می‌گه که درست نیست، و با اطمینان می‌گه، این خودش یه مشکل اخلاقیه، به‌خصوص در حوزه‌های پزشکی و حقوقی.
محتوای مضر: تولید دستورالعمل سلاح، محتوای سوءاستفاده از کودک، فریب و دستکاری.
نقض حریم خصوصی: مدل‌هایی که اطلاعات آموزشی شخصی رو «یادشه» و می‌تونه بازتولید کنه.

سه رویکرد اصلی

۱. RLHF (تقویت با بازخورد انسانی) انسان‌ها خروجی‌های مدل رو ارزیابی می‌کنن و می‌گن کدوم بهتره. مدل یاد می‌گیره خروجی‌هایی که انسان‌ها ترجیح می‌دن بیشتر تولید کنه. ChatGPT و Claude هر دو از این روش استفاده می‌کنن. مشکل: «ترجیح انسانی» دقیقاً چیه؟ چه انسانی؟ با چه ارزش‌هایی؟

۲. Constitutional AI (هوش مصنوعی قانون‌محور) Anthropic این رویکرد رو برای Claude ابداع کرد. به جای اتکای صرف به ارزیابی انسانی، یه «قانون اساسی» از اصول تعریف می‌شه، مثلاً «مضر نباش»، «صادق باش»، «به استقلال انسان احترام بذار». مدل یاد می‌گیره خروجی‌های خودش رو بر اساس این اصول نقد کنه. Constitutional AI اولین‌بار در ۲۰۲۲ توسط Anthropic منتشر شد.

۳. Red Teaming تیمی از انسان‌ها (یا مدل‌های دیگه) سعی می‌کنن مدل رو به انجام کارهای نامناسب وادار کنن. آسیب‌پذیری‌ها پیدا می‌شن و قبل از انتشار برطرف می‌شن.

مرز میان «محافظت» و «سانسور»

یکی از اصلی‌ترین تنش‌های اخلاق AI اینجاست: چه زمانی یه مدل «به درستی» جواب نمی‌ده، و چه زمانی «بیش از حد» محدود می‌شه؟

چند مثال واقعی:

یه مدل از توضیح «چطور قفل شکسته» امتناع می‌کنه، ولی این اطلاعات توی هر کتاب قفل‌سازی هست
یه مدل نمی‌تونه درباره داروها صحبت کنه، ولی پزشک و بیمار به این اطلاعات نیاز دارن
یه مدل از نوشتن داستان خشونت‌آمیز امتناع می‌کنه، ولی ادبیات جدی اغلب خشونت داره

هیچ پاسخ ساده‌ای وجود نداره. هر شرکت تعادل متفاوتی انتخاب می‌کنه. Claude نسبت به ChatGPT کمی محتاط‌تره در بعضی موارد، ولی در موضوعات بحثی سیاسی محافظه‌کارانه‌تر.

تعصب و نمایندگی

مدل‌ها روی داده‌های اینترنت آموزش دیدن. اینترنت انگلیسی-محور، غرب-محور، و نمایندهٔ دیدگاه‌های شهری طبقهٔ متوسط و بالاست. این یعنی:

زبان‌های کمتر رایج (مثل فارسی، کُردی، بلوچی) کیفیت پایین‌تری دارن
دیدگاه‌های غیرغربی کمتر نمایندگی می‌شن
مفاهیمی که در فرهنگ‌های مختلف معانی متفاوت دارن ممکنه به شکل یه‌جانبه توضیح داده بشن

برای کاربر ایرانی این مهمه: وقتی از مدل‌های خارجی درباره مسائل ایران می‌پرسی، خروجی ممکنه با واقعیت تجربه‌شده تفاوت داشته باشه.

اخلاق در کاربردهای خاص

تشخیص پزشکی: اگه مدل اشتباه کنه، پیامد جدیه. به همین دلیل شرکت‌های تخصصی مثل Google Health و Microsoft Healthcare مدل‌های جداگانه با آموزش تخصصی دارن.

سیستم‌های قضایی: در آمریکا از الگوریتم COMPAS برای پیش‌بینی احتمال تکرار جرم استفاده شد. بعداً مشخص شد این الگوریتم نسبت به افراد سیاه‌پوست سوگیری داشته. این نمونهٔ کلاسیک «bias پنهان در داده» است.

ابزارهای استخدام: آمازون یه سیستم AI استخدامی ساخت که رزومه‌ها رو رتبه‌بندی می‌کرد. پروژه متوقف شد چون مشخص شد به نفع مردان سوگیری داره، چون داده‌های آموزشی از ۱۰ سال استخدام قبلی بود که اکثراً مرد بودن.

Deepfake و دستکاری: تولید ویدیوی جعلی از افراد واقعی یکی از مشکلات فعلی AI است. قوانین تازه‌ای در اروپا (EU AI Act) این موارد رو مستقیماً آدرس می‌ده.

EU AI Act، قانون جدید اروپا

در ۲۰۲۴ اتحادیهٔ اروپا قانون AI Act رو تصویب کرد، اولین چارچوب قانونی جامع برای تنظیم هوش مصنوعی در دنیا. کاربردهای AI به ۴ سطح ریسک تقسیم شدن:

غیرقابل قبول: شناسایی احساسات در محیط‌های کاری، امتیازدهی اجتماعی (مثل مدل چین)، تشخیص چهرهٔ بلادرنگ در اماکن عمومی
ریسک بالا: AI در حوزهٔ پزشکی، قضایی، استخدام، نیاز به ثبت و ارزیابی دارن
ریسک محدود: chatbot باید اعلام کند AI است
ریسک کم: بازی‌های ویدیویی، فیلترهای spam

چرا باید بهش اهمیت بدی

اگه توسعه‌دهنده‌ای، تصمیمات اخلاقی مستقیماً بر کار تو اثر می‌ذاره: کدوم مدل انتخاب کنی، چطور prompt بنویسی، چطور خروجی‌ها رو فیلتر کنی.

اگه کاربر عادی‌ای، فهم این مباحث کمک می‌کنه بدونی چرا مدل گاهی جواب نمی‌ده، چطور bias رو تشخیص بدی، و چقدر به خروجی‌ها اعتماد کنی.

در ایران، این بحث لایهٔ اضافه‌ای داره: وقتی از مدل‌های خارجی استفاده می‌کنی، ارزش‌ها و محدودیت‌های آن‌ها محصول تصمیم‌های شرکت‌های آمریکایی و اروپایی‌ان، نه لزوماً نمایندهٔ ارزش‌های فرهنگی کاربر ایرانی.

همچنین بخوان

#هوش مصنوعی#اخلاق

ادامهٔ مسیر

همهٔ مقاله‌ها ←

هوش مصنوعی

هوش مصنوعی چیست؟ راهنمای کامل فارسی برای شروع در ۱۴۰۵

هوش مصنوعی به زبان ساده: تاریخچه، انواع، مدل‌های زبانی بزرگ، شبکه‌های عصبی و چرا ۱۴۰۵ نقطهٔ عطف کاربر فارسی‌زبان است.

هوش مصنوعی

LLM چیست؟ راهنمای فارسی مدل‌های زبانی بزرگ

LLM چیست؟ راهنمای فارسی مدل‌های زبانی بزرگ، راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

هوش مصنوعی

شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر

شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر، راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

هوش مصنوعی

یادگیری ماشین چیست؟

یادگیری ماشین چیست؟، راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

چرا اخلاق AI مطرح شد

سه رویکرد اصلی

مرز میان «محافظت» و «سانسور»

تعصب و نمایندگی

اخلاق در کاربردهای خاص

EU AI Act، قانون جدید اروپا

چرا باید بهش اهمیت بدی

همچنین بخوان

ادامهٔ مسیر

هوش مصنوعی چیست؟ راهنمای کامل فارسی برای شروع در ۱۴۰۵

LLM چیست؟ راهنمای فارسی مدل‌های زبانی بزرگ

شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر

یادگیری ماشین چیست؟

بیشتر در «هوش مصنوعی»