هوش مصنوعی

تاریخچهٔ هوش مصنوعی، از تورینگ تا GPT-5

تاریخچهٔ هوش مصنوعی، از تورینگ تا GPT-5، راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

نوشتهٔ تیم آیرا•۴ فروردین ۱۴۰۵به‌روزرسانی: ۸ اردیبهشت ۱۴۰۵•۵ دقیقه مطالعه

تصویر مقالهٔ تاریخچهٔ هوش مصنوعی، از تورینگ تا GPT-5

هوش مصنوعی یه شبه به وجود نیومده. از یه سوال فلسفی در دهه‌ٔ ۱۹۵۰ تا مدل‌هایی که امروز کد می‌نویسن و تصویر می‌سازن، یه مسیر ۷۰ ساله طی شده، با فرازونشیب‌های جدی. این مقاله اون مسیر رو به‌صورت صادقانه و بدون اغراق دنبال می‌کنه.

۱۹۵۰: آلن تورینگ و یه سوال که هنوز جواب نداره

آلن تورینگ در ۱۹۵۰ مقاله‌ای منتشر کرد با عنوان «آیا ماشین می‌تواند فکر کند؟» و در اون Turing Test رو پیشنهاد داد: اگه یه انسان نتونه از طریق مکالمه‌ٔ متنی بفهمه که طرفش ماشینه یا انسان، اون ماشین «هوشمند» است.

این سوال خیلی‌ها رو به فکر واداشت. کامپیوترها در اون زمان فقط محاسبات ریاضی می‌کردن، ایده که روزی بتونن «فکر کنن» هیجان‌انگیز و ترسناک بود هم‌زمان.

۱۹۵۶: تابستان دارتموث و تولد رسمی AI

در تابستان ۱۹۵۶ در دانشگاه دارتموث، جمعی از محققان به رهبری جان مک‌کارتی دور هم جمع شدن. مک‌کارتی پیشنهاد داد اسم این حوزهٔ جدید «هوش مصنوعی» (Artificial Intelligence) باشه. همین نشست به‌عنوان لحظه‌ٔ تولد رسمی AI شناخته می‌شه.

خروجی‌های اولیه هم آمدن: برنامه‌هایی که بازی شطرنج می‌کردن، مسائل هندسی حل می‌کردن، و زبان طبیعی ساده پردازش می‌کردن. خوش‌بینی زیاد بود، شاید خیلی زیاد.

دهه‌های ۶۰ و ۷۰: اولین «زمستان هوش مصنوعی»

محققان پیش‌بینی‌های جاه‌طلبانه‌ای داشتن: «تا ۱۰ سال دیگه ماشین‌ها از انسان باهوش‌تر می‌شن.» این پیش‌بینی‌ها محقق نشد.

دلایل واقعی شکست:

قدرت محاسباتی کافی نبود
داده کافی وجود نداشت
مسائل واقعی دنیا بسیار پیچیده‌تر از آزمایشگاه بودن

در اواخر دهه‌ٔ ۷۰، بودجه‌ها کات شدن و یه دوره‌ٔ رکود جدی آمد که اسمش «زمستان هوش مصنوعی» شد.

دهه‌ٔ ۸۰: Expert Systems، موج دوم

با وجود رکود، یه رویکرد جدید امیدوارکننده بود: سیستم‌های خبره (Expert Systems). ایده ساده بود: قوانین دانش یه متخصص رو به‌صورت if-then rules کد کن.

پروژه‌هایی مثل MYCIN (تشخیص بیماری‌های عفونی) و XCON (پیکربندی کامپیوترهای DEC) نتایج قابل قبولی داشتن و چند شرکت بزرگ روی این تکنولوژی سرمایه‌گذاری کردن.

ولی این هم پایدار نموند، نگهداری پایگاه‌های دانش دشوار بود، و سیستم‌ها در موقعیت‌های خارج از قوانین از پیش تعریف‌شده شکست می‌خوردن. زمستان دوم در اواخر دهه‌ٔ ۸۰ آمد.

۱۹۸۶-۱۹۹۰: شبکه‌های عصبی بر می‌گردن

در این دوره Backpropagation (پس‌انتشار خطا) رواج پیدا کرد، الگوریتمی که به شبکه‌های عصبی مصنوعی می‌آموخت چطور از اشتباهاتشون یاد بگیرن. جیوفری هینتون و یان لکون از پیشگامان این دوره بودن.

شبکه‌های عصبی شروع کردن به حل مسائلی که قوانین دستی نمی‌تونستن حل کنن، مثل تشخیص دست‌خط. ولی هنوز قدرت محاسباتی محدودیت اصلی بود.

۱۹۹۷: Deep Blue شطرنج قهرمان رو شکست داد

IBM با کامپیوتر Deep Blue در ۱۹۹۷ گری کاسپاروف، قهرمان شطرنج دنیا، رو شکست داد. این یه لحظه‌ٔ نمادین بود، برای اولین بار ماشین در یه حوزه‌ٔ فکری به انسان غلبه کرده بود.

ولی Deep Blue «هوشمند» نبود، فقط میلیون‌ها حرکت رو در ثانیه بررسی می‌کرد. این تفاوت بین «هوش» و «قدرت محاسباتی خالص» مهمه.

۲۰۱۲: لحظه‌ای که همه چیز تغییر کرد، AlexNet

اگه بخواهیم یه نقطه‌ٔ عطف تعریف کنیم، ۲۰۱۲ هست. AlexNet در مسابقه ImageNet شرکت کرد، مسابقه‌ای برای تشخیص تصویر، و با فاصله‌ٔ زیادی از رقبا برنده شد.

دلیل: GPU و دادهٔ بزرگ. هینتون و تیمش فهمیده بودن که شبکه‌های عصبی عمیق با GPU می‌تونن مسائل تصویری رو با دقت انسانی حل کنن. این آغاز Deep Learning بود.

از این لحظه به بعد، سرمایه‌گذاری در AI انفجاری شد.

۲۰۱۷: Transformer، معماری که AI مدرن رو ساخت

محققان Google مقاله‌ای منتشر کردن با اسم «Attention is All You Need» که معماری Transformer رو معرفی کرد. این معماری امروز پشت تقریباً همه‌ٔ مدل‌های بزرگ زبانی هست.

قبل از Transformer، مدل‌های زبانی از شبکه‌های LSTM استفاده می‌کردن که پردازش موازی سختی داشتن. Transformer با مکانیزم Attention این مشکل رو حل کرد، می‌تونه کل sequence رو هم‌زمان پردازش کنه.

۲۰۱۸-۲۰۲۰: GPT-1، BERT، GPT-2، GPT-3

OpenAI و Google یه رقابت جدی رو شروع کردن:

GPT-1 (2018): اولین نسل. نشون داد که pre-training روی متن انبوه کار می‌کنه.
BERT (2018): Google. برای درک زبان (نه تولید) بهینه شده. هنوز در search engines استفاده می‌شه.
GPT-2 (2019): OpenAI اول اعلام کرد این مدل «خطرناکه» و انتشار کامل نمی‌ده. بعداً معلوم شد بیشتر یه حرکت PR بود تا خطر واقعی.
GPT-3 (2020): یه جهش بزرگ. ۱۷۵ میلیارد پارامتر. اولین باری بود که یه مدل زبانی به‌قدری قوی بود که کاربران غیرتخصصی هم حیرت‌زده می‌شدن.

۲۰۲۲: ChatGPT، AI وارد زندگی روزمره شد

در نوامبر ۲۰۲۲، OpenAI ChatGPT رو منتشر کرد. در ۵ روز یه میلیون کاربر داشت، در دو ماه ۱۰۰ میلیون. هیچ محصولی در تاریخ این‌قدر سریع رشد نکرده بود.

ChatGPT با GPT-3.5 کار می‌کرد و از RLHF (Reinforcement Learning from Human Feedback) برای مفیدتر و بی‌خطرتر شدن استفاده کرده بود. برای اولین بار AI به یه ابزار «مکالمه» تبدیل شده بود که عموم می‌تونستن باهاش کار کنن.

۲۰۲۳: سال انقلاب، GPT-4، Claude، Gemini

GPT-4 (مارس ۲۰۲۳): multimodal شد، می‌تونست تصویر هم بفهمه. در آزمون‌های استاندارد عملکرد انسانی داشت.
Claude (Anthropic): رقیب جدی با تمرکز بر safety و context window بلند.
Gemini (Google): Google دیر عمل کرده بود، حالا تلاش می‌کرد جا رو پس بگیره.

همه‌ٔ شرکت‌های بزرگ تکنولوژی وارد رقابت شدن.

۲۰۲۴: Reasoning Models و AI Agents

o1 و o3 (OpenAI): «فکر کردن» قبل از پاسخ، chain-of-thought داخلی که دقت در مسائل پیچیده رو به‌شدت بالا برد.
Claude 3.5 Sonnet: احتمالاً قوی‌ترین مدل کدنویسی سال.
AI Agents: مدل‌ها شروع کردن به انجام اقدامات واقعی در دنیا، نه فقط پاسخ دادن، بلکه browse کردن، کد نوشتن، فایل ساختن.

۲۰۲۵: مدل‌های «فکور» و AGI Debate

GPT-4o، Claude 3.7 Sonnet با Thinking، Gemini 2 Ultra، مدل‌ها به‌شدت قوی‌تر شدن. بحث AGI (General AI) جدی‌تر شد. Dario Amodei، CEO آنتروپیک، گفت AGI ممکنه تا ۲۰۲۷ برسه، جمله‌ای که واکنش‌های متفاوتی در جامعه‌ٔ AI داشت.

همچنین مدل‌های متن‌باز مثل DeepSeek R1 نشون دادن که بدون بودجه‌های چند میلیاردی هم می‌شه مدل‌های رقابتی ساخت.

یه الگوی تکرارشونده

اگه به این تاریخ نگاه کنی، یه الگو می‌بینی: موج خوش‌بینی → رکود → موج بعدی با پیشرفت واقعی‌تر. این بار تفاوتی هست: مدل‌ها الان در زندگی واقعی میلیاردها نفر ادغام شدن. رکود احتمالی بعدی کمتر «صنعت AI می‌خوابه» و بیشتر «انتظارات تنظیم می‌شن» خواهد بود.

همچنین بخوان

#هوش مصنوعی#تاریخچه

ادامهٔ مسیر

همهٔ مقاله‌ها ←

هوش مصنوعی

هوش مصنوعی چیست؟ راهنمای کامل فارسی برای شروع در ۱۴۰۵

هوش مصنوعی به زبان ساده: تاریخچه، انواع، مدل‌های زبانی بزرگ، شبکه‌های عصبی و چرا ۱۴۰۵ نقطهٔ عطف کاربر فارسی‌زبان است.

هوش مصنوعی

LLM چیست؟ راهنمای فارسی مدل‌های زبانی بزرگ

LLM چیست؟ راهنمای فارسی مدل‌های زبانی بزرگ، راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

هوش مصنوعی

شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر

شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر، راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

هوش مصنوعی

یادگیری ماشین چیست؟

یادگیری ماشین چیست؟، راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

۱۹۵۰: آلن تورینگ و یه سوال که هنوز جواب نداره

۱۹۵۶: تابستان دارتموث و تولد رسمی AI

دهه‌های ۶۰ و ۷۰: اولین «زمستان هوش مصنوعی»

دهه‌ٔ ۸۰: Expert Systems، موج دوم

۱۹۸۶-۱۹۹۰: شبکه‌های عصبی بر می‌گردن

۱۹۹۷: Deep Blue شطرنج قهرمان رو شکست داد

۲۰۱۲: لحظه‌ای که همه چیز تغییر کرد، AlexNet

۲۰۱۷: Transformer، معماری که AI مدرن رو ساخت

۲۰۱۸-۲۰۲۰: GPT-1، BERT، GPT-2، GPT-3

۲۰۲۲: ChatGPT، AI وارد زندگی روزمره شد

۲۰۲۳: سال انقلاب، GPT-4، Claude، Gemini

۲۰۲۴: Reasoning Models و AI Agents

۲۰۲۵: مدل‌های «فکور» و AGI Debate

یه الگوی تکرارشونده

همچنین بخوان

ادامهٔ مسیر

هوش مصنوعی چیست؟ راهنمای کامل فارسی برای شروع در ۱۴۰۵

LLM چیست؟ راهنمای فارسی مدل‌های زبانی بزرگ

شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر

یادگیری ماشین چیست؟

بیشتر در «هوش مصنوعی»