شناخت پیوسته

حافظهٔ بلندمدت در هوش مصنوعی: اولین لایهٔ شناخت پیوسته

حافظهٔ بلندمدت چطور در LLMها کار می‌کند، چه تفاوتی با context window دارد و چرا تنها لایهٔ اول از چهار لایهٔ شناخت پیوسته است.

نوشتهٔ تیم آیرا•۲۵ فروردین ۱۴۰۵به‌روزرسانی: ۲۱ اردیبهشت ۱۴۰۵•۳ دقیقه مطالعه

تصویر مقالهٔ حافظهٔ بلندمدت در هوش مصنوعی: اولین لایهٔ شناخت پیوسته

اگه با چت جی پی تی، کلاد یا جمنای کار کرده باشی، حتماً یه بار به این موضوع برخوردی: «این مدل چرا یادش نمونده؟» جواب کوتاهش اینه که اون مدل اصلاً برای یادآوری بین جلسه‌ها طراحی نشده. ولی جواب طولانی‌ترش پیچیده‌تره، و دقیقاً همینجاست که حافظهٔ بلندمدت در AI به‌عنوان اولین لایهٔ شناخت پیوسته معنا پیدا می‌کنه.

حافظهٔ بلندمدت در AI یعنی چی

تو معماری LLMها، context window یه نوع حافظهٔ کوتاه‌مدته. وقتی گفتگو رو می‌بندی، اون حافظه پاک می‌شه. حافظهٔ بلندمدت یعنی یه لایهٔ مجزا که اطلاعات رو بین گفتگوها نگه می‌داره.

این کار با سه روش انجام می‌شه:

External memory store، یه دیتابیس بیرونی که حقایق و گزیده‌ها رو نگه می‌داره
Vector embeddings، متن تبدیل می‌شه به یه بردار معنایی، در یه vector database ذخیره می‌شه
Structured profile، یه فایل JSON یا متن ساختاریافته دربارهٔ کاربر

هر سه روش، یه چیز مشترک دارن: ذخیرهٔ صریح. یعنی یه چیزی نوشته می‌شه، بعداً خونده می‌شه.

تفاوت با Context Window

این تفاوت رو با مثال روشن می‌کنم:

Context Window	حافظهٔ بلندمدت
فقط در همین گفتگو فعاله	بین گفتگوها می‌مونه
۸k تا ۲۰۰k توکن	محدودیت اصلی نداره
رایگان توی هر inference	هزینهٔ retrieval اضافه می‌کنه
اتومات همراه مکالمه‌ست	باید explicit ذخیره بشه

پس Context Window یه workspace کوتاه‌مدته، حافظهٔ بلندمدت یه archive درازمدت.

چرا حافظهٔ بلندمدت به‌تنهایی کافی نیست

ChatGPT Memory و Gemini App Memory دقیقاً همینی هستن که توصیف کردم: یه یادداشت ساده که چند ده تا حقیقت دربارهٔ کاربر نگه می‌داره.

این مفیده، ولی شناخت نیست. چرا؟

یادداشت، استاتیکه. آپدیت نمی‌شه مگه با درخواست explicit.
یادداشت، یک‌بعدیه. ترتیب رخدادها، اولویت‌ها، tradeoffها رو ذخیره نمی‌کنه.
یادداشت، تفسیر نداره. خود مدل باید هر بار از نو تفسیرش کنه.
یادداشت، فقط حقایق صریحه. سبک کاری، الگوی فکر، حساسیت‌های پنهان رو ذخیره نمی‌کنه.

برای همینه که در مقالهٔ بنیادی شناخت پیوسته گفتیم: حافظه اولین لایه‌ست، نه راه‌حل کامل.

چهار نوع حافظه در CogX

موتور CogX که زیر آیرا کار می‌کنه، چهار نوع حافظهٔ متفاوت رو جدا می‌کنه:

حافظهٔ معنایی (Semantic Memory)

حقایق دربارهٔ کاربر و دنیاش. «اسمش پارسا است»، «در تهران زندگی می‌کنه»، «روی محصولی به اسم آیراکد کار می‌کنه». این نزدیک‌ترین چیز به ChatGPT Memory است.

حافظهٔ رویدادی (Episodic Memory)

ترتیب رخدادها در گفتگوها. «دو هفته پیش از فلان موضوع گله داشت»، «سه ماه پیش این تصمیم رو رد کرد». این لایه، زمانی است، می‌فهمه چی قبل از چی اومده.

حافظهٔ روالی (Procedural Memory)

الگوهای رفتاری تکرارشونده. «معمولاً قبل از deploy یه پاس testing می‌خواد»، «وقتی روی بک‌اند کار می‌کنه، اول schema رو می‌نویسه، بعد API»، «وقتی feature کوچک رو شیپ می‌کنه، PR رو خودش merge می‌کنه». این لایه، الگوهای کاری شخصی رو ذخیره می‌کنه.

حافظهٔ بنیادی (Foundational Memory)

ارزش‌ها، اصول و انتخاب‌های اساسی. «امنیت کاربر همیشه بالاتر از سرعت تحویله»، «UX over performance». این عمیق‌ترین لایه است، تغییر نمی‌کنه با هر گفتگو، ولی پایهٔ همهٔ تصمیم‌گیری‌هاست.

این چهار نوع حافظه، روی هم سوار می‌شن. حافظهٔ روالی روی حافظهٔ رویدادی و معنایی ساخته می‌شه. حافظهٔ بنیادی، فیلتر همهٔ بقیه‌ست.

چطور می‌تونی حافظهٔ بلندمدت آیرا رو ببینی

اگه کاربر آیراچتی، یه صفحهٔ کامل به اسم حافظهٔ آیرا داری. اونجا می‌تونی:

هر چهار نوع حافظه رو جداگانه ببینی
جستجو کنی بر اساس محتوا
هر آیتم رو ویرایش، حذف، یا «فراموش» کنی
کل حافظه رو به‌صورت JSONL صادر کنی

این proof ـه. بقیه ادعا می‌کنن «ما حافظه داریم»، ما نشون می‌دیم. هر کاربر آیراچت می‌تونه دقیقاً ببینه آیرا چی ازش می‌دونه.

از حافظه به شناخت

حافظهٔ بلندمدت لایهٔ اوله. لایه‌های بعدی روی این سواره:

زمینه‌فهمی، فهمیدن چرا حقایق مهم‌اند
مدل شناختی شخصی، ساخت یه مدل از سبک فکر کردن کاربر
تداوم رابطه، هر گفتگو ادامهٔ قبلی

اگه می‌خوای کل مسیر رو از حافظه به شناخت دنبال کنی، مقالهٔ بنیادی شناخت پیوسته نقطهٔ شروعه.

و اگه می‌خوای خودت تجربه کنی: آیراچت رو امتحان کن. توی همون اولین گفتگو یه چیزی خواهی دید، توی پنجمین، یه چیز کاملاً متفاوت.

#حافظه بلندمدت#شناخت پیوسته#CogX#هوش مصنوعی

سوالات متداول

پاسخ کوتاه و مستقیم به پرتکرارترین سوال‌ها دربارهٔ شناخت پیوسته.

+حافظهٔ بلندمدت در هوش مصنوعی چیست؟

حافظهٔ بلندمدت یعنی توانایی هوش مصنوعی برای نگه‌داشتن اطلاعات بین مکالمه‌های جداگانه. برخلاف context window که فقط در یک گفتگو فعال است، حافظهٔ بلندمدت در پایگاه دادهٔ vector + text ذخیره می‌شود و در گفتگوهای بعدی قابل بازیابی است.

+تفاوت حافظهٔ بلندمدت با context window چیست؟

context window حافظهٔ کوتاه‌مدت یک گفتگوست (مثل RAM)، حافظهٔ بلندمدت پایگاه دانش پایدار است (مثل دیسک). context window با بستن چت پاک می‌شود؛ حافظهٔ بلندمدت برای همیشه می‌ماند.

+آیا حافظهٔ بلندمدت همان RAG است؟

RAG (Retrieval-Augmented Generation) یک تکنیک پیاده‌سازی حافظهٔ بلندمدت است. اما حافظهٔ بلندمدت کامل شامل لایه‌های بیشتری است: استخراج فکت، حذف موارد قدیمی، حل تناقض و وزن‌دهی به اطلاعات بر اساس تازگی و اهمیت.

+آیا حافظهٔ بلندمدت برای حریم خصوصی خطرناک است؟

بستگی به پیاده‌سازی دارد. آیرا حافظه را به‌صورت متعلق به کاربر طراحی کرده، همیشه قابل مشاهده، ویرایش و حذف. هیچ دادهٔ خصوصی بدون کنترل کاربر باقی نمی‌ماند.

ادامهٔ مسیر

همهٔ مقاله‌ها ←

شناخت پیوسته

شناخت پیوسته در هوش مصنوعی چیست؟ چرا چت‌بات‌های معمولی تو را واقعاً نمی‌شناسند

شناخت پیوسته، دستهٔ تازه‌ای از هوش مصنوعی است که فراتر از حافظهٔ ساده می‌رود. چهار لایه: حافظه، زمینه‌فهمی، مدل شناختی شخصی و تداوم رابطه، این چیزی است که آیرا دارد و چت جی پی تی، کلاد و جمنای ندارند.

شناخت پیوسته

زمینه‌فهمی در هوش مصنوعی: دومین لایهٔ شناخت پیوسته

زمینه‌فهمی یعنی فهمیدن «چرا» پشت داده‌ها، نه فقط ذخیرهٔ آن‌ها. لایهٔ دوم شناخت پیوسته توضیح داده شد.

هوش مصنوعی

RAG چیست؟ ترکیب بازیابی و تولید در LLM

RAG چیست؟ ترکیب بازیابی و تولید در LLM، راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

هوش مصنوعی

Embedding چیست؟ نمایش معنایی متن در فضای برداری

Embedding چیست؟ نمایش معنایی متن در فضای برداری، راهنمای فارسی از مجموعهٔ «هوش مصنوعی» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

حافظهٔ بلندمدت در AI یعنی چی

تفاوت با Context Window

چرا حافظهٔ بلندمدت به‌تنهایی کافی نیست

چهار نوع حافظه در CogX

حافظهٔ معنایی (Semantic Memory)

حافظهٔ رویدادی (Episodic Memory)

حافظهٔ روالی (Procedural Memory)

حافظهٔ بنیادی (Foundational Memory)

چطور می‌تونی حافظهٔ بلندمدت آیرا رو ببینی

از حافظه به شناخت

سوالات متداول

ادامهٔ مسیر

شناخت پیوسته در هوش مصنوعی چیست؟ چرا چت‌بات‌های معمولی تو را واقعاً نمی‌شناسند

زمینه‌فهمی در هوش مصنوعی: دومین لایهٔ شناخت پیوسته

RAG چیست؟ ترکیب بازیابی و تولید در LLM

Embedding چیست؟ نمایش معنایی متن در فضای برداری

بیشتر در «شناخت پیوسته»