کلاد

Context window های طولانی در Claude

Context window های طولانی در Claude — راهنمای فارسی از مجموعهٔ «کلاد» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

نوشتهٔ به‌روزرسانی: ۳ دقیقه مطالعه
تصویر مقالهٔ Context window های طولانی در Claude

وقتی Anthropic از Claude 3 به بعد اعلام کرد که context window رو به ۲۰۰ هزار توکن رسونده، خیلی‌ها فکر کردن این فقط یه عدد بزرگ برای تبلیغاته. ولی اگه واقعاً باهاش کار کرده باشی، می‌فهمی که ۲۰۰K توکن یعنی می‌تونی کل یه کتاب ۵۰۰ صفحه‌ای رو داخل یه مکالمه بریزی و ازش بپرسی — نه خلاصه‌ش، خود کتاب.

context window دقیقاً چیه؟

هر بار که با یه مدل زبانی صحبت می‌کنی، مدل فقط «اون چیزی رو می‌بینه» که داخل پنجرهٔ context قرار داره. اگه مکالمه‌ات از این سقف بزنه بیرون، مدل اول مکالمه رو فراموش می‌کنه.

توکن یه واحد متنیه — تقریباً ۰.۷۵ کلمهٔ انگلیسی، ولی برای فارسی معمولاً هر کلمه ۱.۵ تا ۳ توکن می‌خوره. یعنی ۲۰۰K توکن برای متن فارسی چیزی حدود ۷۰-۱۳۰ هزار کلمه‌ست — که هنوز هم خیلی زیاده.

Claude چقدر context داره؟

در زمان نوشتن این مقاله (۱۴۰۵):

  • Claude 3.5 Sonnet / Claude 3.5 Haiku: 200,000 توکن
  • Claude 3 Opus: 200,000 توکن
  • Claude 3 Haiku: 200,000 توکن

برای مقایسه: GPT-4o حدود ۱۲۸K توکن داره و Gemini 1.5 Pro تا ۱ میلیون توکن رو (روی API) ساپورت می‌کنه. پس کلاد از نظر خام context نه اول هست و نه آخر — ولی کیفیت استفاده از اون context مهم‌تر از عدده.

«Lost in the middle» — مشکلی که کمتر بهش اشاره می‌شه

تحقیقات Stanford نشون داده که بیشتر LLMها اطلاعات اول و آخر context رو بهتر به یاد میارن تا وسط. این مشکل «lost in the middle» نام داره. آنتروپیک ادعا می‌کنه که Claude برای این مشکل بهینه شده — و تست‌های مستقل هم نسبتاً این ادعا رو تأیید می‌کنن. یعنی اگه اسناد مهمی رو وسط یه prompt طولانی بذاری، کلاد احتمالاً کمتر از GPT-4 اونا رو از دست می‌ده.

چه کارهایی با long context واقعاً سود می‌بره؟

تحلیل کد بزرگ: می‌تونی کل یه codebase چند فایله رو توی یه prompt بریزی و بگی «باگ این‌جاست، ریشه‌ش کجاست؟» — بدون اینکه هی فایل به فایل کپی-پیست کنی.

بررسی قرارداد یا سند حقوقی: اسناد طولانی رو می‌شه یکجا گذاشت و پرسید «ماده‌ای هست که با ماده ۱۲ تناقض داشته باشه؟»

ترجمه و ویرایش کتاب: بجای ترجمهٔ فصل‌به‌فصل که سبک رو از دست می‌ده، می‌تونی کل متن رو داخل context نگه داری.

تحلیل مکالمات طولانی یا لاگ: مثلاً چند هفته تیکت پشتیبانی رو یکجا بریزی و بگی «رایج‌ترین مشکل چیه؟»

وقتی context window جواب نمی‌ده

long context جایگزین حافظهٔ واقعی نیست. وقتی یه مکالمه تموم می‌شه، کلاد همه چیز رو فراموش می‌کنه — فرقی نمی‌کنه چقدر اطلاعات توی اون session بوده. دفعهٔ بعد از صفر شروع می‌شه.

این فرق اساسی با شناخت پیوسته هست. context window یه ابزار برای یه کار بزرگ در یه session‌ه؛ حافظهٔ بلندمدت یه چیز دیگه‌ست که نیاز به معماری مجزا داره.

علاوه بر این، context طولانی‌تر = هزینهٔ بیشتر. بریدن ۱۵۰K توکن از هر API call هزینه داره، و در پلن‌های رایگان یا پایه معمولاً محدودیت هست. اگه بخوای از این قابلیت جدی استفاده کنی، به پلن Pro یا API نیاز داری.

چطور بهترین نتیجه رو بگیری؟

چند تا best practice واقعی:

۱. مهم‌ترین چیز رو اول یا آخر بذار: به خاطر «lost in the middle»، اگه یه سند خاص خیلی مهمه، اونو اول بذار نه وسط انبوه فایل‌ها.

۲. ساختار بده: بجای ریختن متن خام، با هدر مشخص کن «این بخش از کدام فایل هست» — مدل بهتر navigate می‌کنه.

۳. سؤال دقیق بپرس: context طولانی یعنی مدل باید از اطلاعات بیشتری نتیجه بگیره — سؤال مبهم نتیجهٔ مبهم می‌ده.

۴. برای پروژه‌های تکراری از Projects استفاده کن: Claude Projects اجازه می‌ده که یه system prompt و چند فایل ثابت داشته باشی که توی همه مکالمه‌هات حضور داشته باشن — اگه‌چه این هنوز حافظهٔ واقعی نیست.

خلاصه

Context window 200K کلاد یه ابزار جدیه که کارهای خاصی رو واقعاً ساده‌تر می‌کنه — از تحلیل کدبیس گرفته تا بررسی اسناد. ولی محدودیت‌های واقعی هم داره: هزینه، فراموشی بین session‌ها، و کاهش دقت در وسط context. برای کارهایی که به حافظهٔ پایدار بین جلسات نیاز داری، باید دنبال راه‌حل‌های دیگه‌ای باشی.


همچنین بخوان

#کلاد

ادامهٔ مسیر

همهٔ مقاله‌ها ←

بیشتر در «کلاد»