تاریخچهٔ هوش مصنوعی — از تورینگ تا GPT-5
تاریخچهٔ هوش مصنوعی — از تورینگ تا GPT-5 — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

هوش مصنوعی یه شبه به وجود نیومده. از یه سوال فلسفی در دههٔ ۱۹۵۰ تا مدلهایی که امروز کد مینویسن و تصویر میسازن، یه مسیر ۷۰ ساله طی شده — با فرازونشیبهای جدی. این مقاله اون مسیر رو بهصورت صادقانه و بدون اغراق دنبال میکنه.
۱۹۵۰: آلن تورینگ و یه سوال که هنوز جواب نداره
آلن تورینگ در ۱۹۵۰ مقالهای منتشر کرد با عنوان «آیا ماشین میتواند فکر کند؟» و در اون Turing Test رو پیشنهاد داد: اگه یه انسان نتونه از طریق مکالمهٔ متنی بفهمه که طرفش ماشینه یا انسان، اون ماشین «هوشمند» است.
این سوال خیلیها رو به فکر واداشت. کامپیوترها در اون زمان فقط محاسبات ریاضی میکردن — ایده که روزی بتونن «فکر کنن» هیجانانگیز و ترسناک بود همزمان.
۱۹۵۶: تابستان دارتموث و تولد رسمی AI
در تابستان ۱۹۵۶ در دانشگاه دارتموث، جمعی از محققان به رهبری جان مککارتی دور هم جمع شدن. مککارتی پیشنهاد داد اسم این حوزهٔ جدید «هوش مصنوعی» (Artificial Intelligence) باشه. همین نشست بهعنوان لحظهٔ تولد رسمی AI شناخته میشه.
خروجیهای اولیه هم آمدن: برنامههایی که بازی شطرنج میکردن، مسائل هندسی حل میکردن، و زبان طبیعی ساده پردازش میکردن. خوشبینی زیاد بود — شاید خیلی زیاد.
دهههای ۶۰ و ۷۰: اولین «زمستان هوش مصنوعی»
محققان پیشبینیهای جاهطلبانهای داشتن: «تا ۱۰ سال دیگه ماشینها از انسان باهوشتر میشن.» این پیشبینیها محقق نشد.
دلایل واقعی شکست:
- قدرت محاسباتی کافی نبود
- داده کافی وجود نداشت
- مسائل واقعی دنیا بسیار پیچیدهتر از آزمایشگاه بودن
در اواخر دههٔ ۷۰، بودجهها کات شدن و یه دورهٔ رکود جدی آمد که اسمش «زمستان هوش مصنوعی» شد.
دههٔ ۸۰: Expert Systems — موج دوم
با وجود رکود، یه رویکرد جدید امیدوارکننده بود: سیستمهای خبره (Expert Systems). ایده ساده بود: قوانین دانش یه متخصص رو بهصورت if-then rules کد کن.
پروژههایی مثل MYCIN (تشخیص بیماریهای عفونی) و XCON (پیکربندی کامپیوترهای DEC) نتایج قابل قبولی داشتن و چند شرکت بزرگ روی این تکنولوژی سرمایهگذاری کردن.
ولی این هم پایدار نموند — نگهداری پایگاههای دانش دشوار بود، و سیستمها در موقعیتهای خارج از قوانین از پیش تعریفشده شکست میخوردن. زمستان دوم در اواخر دههٔ ۸۰ آمد.
۱۹۸۶-۱۹۹۰: شبکههای عصبی بر میگردن
در این دوره Backpropagation (پسانتشار خطا) رواج پیدا کرد — الگوریتمی که به شبکههای عصبی مصنوعی میآموخت چطور از اشتباهاتشون یاد بگیرن. جیوفری هینتون و یان لکون از پیشگامان این دوره بودن.
شبکههای عصبی شروع کردن به حل مسائلی که قوانین دستی نمیتونستن حل کنن — مثل تشخیص دستخط. ولی هنوز قدرت محاسباتی محدودیت اصلی بود.
۱۹۹۷: Deep Blue شطرنج قهرمان رو شکست داد
IBM با کامپیوتر Deep Blue در ۱۹۹۷ گری کاسپاروف، قهرمان شطرنج دنیا، رو شکست داد. این یه لحظهٔ نمادین بود — برای اولین بار ماشین در یه حوزهٔ فکری به انسان غلبه کرده بود.
ولی Deep Blue «هوشمند» نبود — فقط میلیونها حرکت رو در ثانیه بررسی میکرد. این تفاوت بین «هوش» و «قدرت محاسباتی خالص» مهمه.
۲۰۱۲: لحظهای که همه چیز تغییر کرد — AlexNet
اگه بخواهیم یه نقطهٔ عطف تعریف کنیم، ۲۰۱۲ هست. AlexNet در مسابقه ImageNet شرکت کرد — مسابقهای برای تشخیص تصویر — و با فاصلهٔ زیادی از رقبا برنده شد.
دلیل: GPU و دادهٔ بزرگ. هینتون و تیمش فهمیده بودن که شبکههای عصبی عمیق با GPU میتونن مسائل تصویری رو با دقت انسانی حل کنن. این آغاز Deep Learning بود.
از این لحظه به بعد، سرمایهگذاری در AI انفجاری شد.
۲۰۱۷: Transformer — معماری که AI مدرن رو ساخت
محققان Google مقالهای منتشر کردن با اسم «Attention is All You Need» که معماری Transformer رو معرفی کرد. این معماری امروز پشت تقریباً همهٔ مدلهای بزرگ زبانی هست.
قبل از Transformer، مدلهای زبانی از شبکههای LSTM استفاده میکردن که پردازش موازی سختی داشتن. Transformer با مکانیزم Attention این مشکل رو حل کرد — میتونه کل sequence رو همزمان پردازش کنه.
۲۰۱۸-۲۰۲۰: GPT-1، BERT، GPT-2، GPT-3
OpenAI و Google یه رقابت جدی رو شروع کردن:
- GPT-1 (2018): اولین نسل. نشون داد که pre-training روی متن انبوه کار میکنه.
- BERT (2018): Google. برای درک زبان (نه تولید) بهینه شده. هنوز در search engines استفاده میشه.
- GPT-2 (2019): OpenAI اول اعلام کرد این مدل «خطرناکه» و انتشار کامل نمیده. بعداً معلوم شد بیشتر یه حرکت PR بود تا خطر واقعی.
- GPT-3 (2020): یه جهش بزرگ. ۱۷۵ میلیارد پارامتر. اولین باری بود که یه مدل زبانی بهقدری قوی بود که کاربران غیرتخصصی هم حیرتزده میشدن.
۲۰۲۲: ChatGPT — AI وارد زندگی روزمره شد
در نوامبر ۲۰۲۲، OpenAI ChatGPT رو منتشر کرد. در ۵ روز یه میلیون کاربر داشت، در دو ماه ۱۰۰ میلیون. هیچ محصولی در تاریخ اینقدر سریع رشد نکرده بود.
ChatGPT با GPT-3.5 کار میکرد و از RLHF (Reinforcement Learning from Human Feedback) برای مفیدتر و بیخطرتر شدن استفاده کرده بود. برای اولین بار AI به یه ابزار «مکالمه» تبدیل شده بود که عموم میتونستن باهاش کار کنن.
۲۰۲۳: سال انقلاب — GPT-4، Claude، Gemini
- GPT-4 (مارس ۲۰۲۳): multimodal شد — میتونست تصویر هم بفهمه. در آزمونهای استاندارد عملکرد انسانی داشت.
- Claude (Anthropic): رقیب جدی با تمرکز بر safety و context window بلند.
- Gemini (Google): Google دیر عمل کرده بود، حالا تلاش میکرد جا رو پس بگیره.
همهٔ شرکتهای بزرگ تکنولوژی وارد رقابت شدن.
۲۰۲۴: Reasoning Models و AI Agents
- o1 و o3 (OpenAI): «فکر کردن» قبل از پاسخ — chain-of-thought داخلی که دقت در مسائل پیچیده رو بهشدت بالا برد.
- Claude 3.5 Sonnet: احتمالاً قویترین مدل کدنویسی سال.
- AI Agents: مدلها شروع کردن به انجام اقدامات واقعی در دنیا — نه فقط پاسخ دادن، بلکه browse کردن، کد نوشتن، فایل ساختن.
۲۰۲۵: مدلهای «فکور» و AGI Debate
GPT-4o، Claude 3.7 Sonnet با Thinking، Gemini 2 Ultra — مدلها بهشدت قویتر شدن. بحث AGI (General AI) جدیتر شد. Dario Amodei، CEO آنتروپیک، گفت AGI ممکنه تا ۲۰۲۷ برسه — جملهای که واکنشهای متفاوتی در جامعهٔ AI داشت.
همچنین مدلهای متنباز مثل DeepSeek R1 نشون دادن که بدون بودجههای چند میلیاردی هم میشه مدلهای رقابتی ساخت.
یه الگوی تکرارشونده
اگه به این تاریخ نگاه کنی، یه الگو میبینی: موج خوشبینی → رکود → موج بعدی با پیشرفت واقعیتر. این بار تفاوتی هست: مدلها الان در زندگی واقعی میلیاردها نفر ادغام شدن. رکود احتمالی بعدی کمتر «صنعت AI میخوابه» و بیشتر «انتظارات تنظیم میشن» خواهد بود.
همچنین بخوان
ادامهٔ مسیر
همهٔ مقالهها ←
هوش مصنوعی چیست؟ راهنمای کامل فارسی برای شروع در ۱۴۰۵
هوش مصنوعی به زبان ساده: تاریخچه، انواع، مدلهای زبانی بزرگ، شبکههای عصبی و چرا ۱۴۰۵ نقطهٔ عطف کاربر فارسیزبان است.

LLM چیست؟ راهنمای فارسی مدلهای زبانی بزرگ
LLM چیست؟ راهنمای فارسی مدلهای زبانی بزرگ — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر
شبکهٔ عصبی چیست؟ از نورون تا ترنسفورمر — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

یادگیری ماشین چیست؟
یادگیری ماشین چیست؟ — راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.
بیشتر در «هوش مصنوعی»
- یادگیری عمیق چیست؟
- پردازش زبان طبیعی (NLP) چیست؟
- ترنسفورمر چیست؟ معماری انقلابی LLMها
- اخلاق در هوش مصنوعی
- AGI، ASI و ANI — انواع هوش مصنوعی به زبان ساده
- انواع هوش مصنوعی
- آیندهٔ هوش مصنوعی
- RAG چیست؟ ترکیب بازیابی و تولید در LLM
- Embedding چیست؟ نمایش معنایی متن در فضای برداری
- Fine-tuning چیست؟
- توهم در هوش مصنوعی — چرا AI دروغ میسازد
- Prompt injection و امنیت LLM
- AI alignment و safety به زبان ساده
- تأثیر هوش مصنوعی بر کار و مشاغل
- تأثیر هوش مصنوعی بر آموزش
- هوش مصنوعی و مغز انسان
- RLHF — آموزش با بازخورد انسانی
- مکانیزم Attention در ترنسفورمر
- هوش مصنوعی open source در مقابل closed source
- Quantization و فشردهسازی مدلها
- هوش مصنوعی چندوجهی (Multimodal AI)