کلاد

Claude API برای توسعه‌دهنده‌ها

Claude API برای توسعه‌دهنده‌ها — راهنمای فارسی از مجموعهٔ «کلاد» در وبلاگ آیرا. بازنویسی‌شده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

نوشتهٔ به‌روزرسانی: ۴ دقیقه مطالعه
تصویر مقالهٔ Claude API برای توسعه‌دهنده‌ها

Claude API یکی از قابل‌اعتمادترین APIهای هوش مصنوعی برای توسعه‌دهنده‌هاست — context window یک میلیون توکن، Extended Thinking، و قیمت‌گذاری شفاف per-token. این راهنما واقعاً چطور شروع کنی، چه هزینه‌ای داری، و چند تا نکتهٔ بهینه‌سازی که اغلب کسی توضیح نمی‌ده رو پوشش می‌ده.

قدم اول — کلید API گرفتن

به console.anthropic.com برو، یه حساب بساز، و از بخش API Keys یه کلید جدید بگیر. اگه اولین باره، Anthropic معمولاً یه credit اولیه کوچیک می‌ده که می‌تونی باهاش شروع کنی.

برای کاربر ایرانی: پرداخت روی Anthropic مستقیماً با کارت ایرانی کار نمی‌کنه. باید از کارت ارزی، یا سرویس‌های واسط استفاده کنی. اگه می‌خوای از کاربرانت در ایران پشتیبانی کنی، گزینهٔ راحت‌تر استفاده از AiraCode یا آیراچت هست که دسترسی به مدل‌های Anthropic رو با پرداخت تومانی فراهم می‌کنن.

ساختار یه request ساده

import anthropic

client = anthropic.Anthropic(api_key="your-key")

message = client.messages.create(
    model="claude-sonnet-4-6-20260219",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "این کد پایتون رو بررسی کن و باگ احتمالی رو بگو"}
    ]
)

print(message.content[0].text)

همین. Claude API خیلی تمیزه — نیازی به پیکربندی پیچیده نداری.

مدل‌ها و قیمت‌ها (۲۰۲۶)

مدلInput (MTok)Output (MTok)مناسب برای
claude-haiku-4-5$1$5سرعت بالا، حجم زیاد
claude-sonnet-4-6$3$15تعادل کیفیت/قیمت
claude-opus-4-7$5$25بیشترین هوشمندی

قیمت‌ها per million token (MTok) هستن و جداگانه برای input و output محاسبه می‌شن.

سه روش بهینه‌سازی هزینه

۱. Batch Processing — ۵۰٪ ارزان‌تر

اگه نیازی به پاسخ بلادرنگ نداری (مثلاً پردازش ۵۰۰۰ متن شبانه)، از Message Batches API استفاده کن. همه‌ٔ مدل‌ها رو با نصف قیمت استاندارد پشتیبانی می‌کنه.

batch = client.beta.messages.batches.create(
    requests=[
        {"custom_id": f"req-{i}", "params": {"model": "claude-haiku-4-5", 
         "max_tokens": 100, "messages": [{"role": "user", "content": texts[i]}]}}
        for i in range(len(texts))
    ]
)

۲. Prompt Caching — تا ۹۰٪ کاهش هزینهٔ input

اگه یه system prompt یا context بلند داری که در هر request تکرار می‌شه، Prompt Caching هزینهٔ توکن‌های cache شده رو ۹۰٪ کم می‌کنه. فقط باید یه cache_control به پیام اضافه کنی:

messages=[
    {
        "role": "user",
        "content": [
            {
                "type": "text",
                "text": long_document,  # این بخش cache می‌شه
                "cache_control": {"type": "ephemeral"}
            },
            {"type": "text", "text": "سؤال من اینه..."}
        ]
    }
]

با ترکیب Batch + Caching می‌تونی تا ۹۵٪ هزینه رو روی workloadهای واجد شرایط کاهش بدی.

۳. انتخاب مدل درست

قبل از اینکه همه چیز رو به Opus بفرستی، تست کن که آیا Sonnet جواب مناسب می‌ده. در بیشتر موارد جواب بله‌ست. این ساده‌ترین راه کاهش هزینه‌ست.

Extended Thinking

Sonnet 4.6 و Opus 4.7 هر دو Extended Thinking دارن. با فعال کردنش، مدل قبل از پاسخ دادن یه فرآیند استدلال داخلی انجام می‌ده که در پاسخ‌های پیچیده — مثل باگ‌یابی یا تحلیل معماری — قابل توجهه:

response = client.messages.create(
    model="claude-sonnet-4-6-20260219",
    max_tokens=16000,
    thinking={
        "type": "enabled",
        "budget_tokens": 10000  # حداکثر توکن برای فکر کردن
    },
    messages=[{"role": "user", "content": "این معماری میکروسرویس رو آنالیز کن..."}]
)

Context Window یک میلیون توکن

Sonnet 4.6 و Opus 4.7 هر دو context window یک میلیون توکن دارن. این یعنی می‌تونی یه codebase کامل، یه کتاب، یا صدها صفحه سند رو در یه request بفرستی. Haiku 4.5 محدود به ۲۰۰K توکنه.

یه نکتهٔ عملی: context طولانی = قیمت input بالاتر. برای codebaseها، RAG با Haiku اغلب اقتصادی‌تره از دمپ کردن همه چیز به Opus.

ابزارها (Tool Use)

Claude API از function calling پشتیبانی می‌کنه — می‌تونی ابزارهایی تعریف کنی که مدل می‌تونه صدا بزنه:

tools = [
    {
        "name": "search_database",
        "description": "جستجو در پایگاه داده محصولات",
        "input_schema": {
            "type": "object",
            "properties": {
                "query": {"type": "string", "description": "عبارت جستجو"}
            },
            "required": ["query"]
        }
    }
]

این قابلیت پایهٔ ساخت agentهای واقعیه. مقاله ساخت اولین ایجنت گام‌به‌گام نشون می‌ده چطور.

رفع خطاهای رایج

خطای ۴۲۹ (Rate Limit): هر حساب یه محدودیت requests-per-minute داره. با افزایش tier حساب یا implement کردن exponential backoff حلش کن.

خروجی انگلیسی با prompt فارسی: صریح بگو "لطفاً به فارسی جواب بده" یا در system prompt مشخص کن: "You always respond in Persian (Farsi)." کلاد دستورالعمل‌ها رو خوب دنبال می‌کنه.

توکن‌های ناکافی در max_tokens: اگه جواب‌ها ناگهان قطع می‌شن، مقدار max_tokens رو بالا ببر. برای خروجی‌های بلند حداقل ۴۰۹۶ بذار.

کلاد روی ابزارهای کدنویسی

اگه داری با کدنویسی کار می‌کنی و می‌خوای از Claude API مستقیم در ترمینال استفاده کنی، AiraCode یه coding agent فارسی‌زبانه که روی Claude ساخته شده — با memory پروژه و دسترسی از ایران. بررسی کاملش در AiraCode چیست هست.

همچنین بخوان

#کلاد

ادامهٔ مسیر

همهٔ مقاله‌ها ←

بیشتر در «کلاد»