Claude API برای توسعهدهندهها
Claude API برای توسعهدهندهها — راهنمای فارسی از مجموعهٔ «کلاد» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

Claude API یکی از قابلاعتمادترین APIهای هوش مصنوعی برای توسعهدهندههاست — context window یک میلیون توکن، Extended Thinking، و قیمتگذاری شفاف per-token. این راهنما واقعاً چطور شروع کنی، چه هزینهای داری، و چند تا نکتهٔ بهینهسازی که اغلب کسی توضیح نمیده رو پوشش میده.
قدم اول — کلید API گرفتن
به console.anthropic.com برو، یه حساب بساز، و از بخش API Keys یه کلید جدید بگیر. اگه اولین باره، Anthropic معمولاً یه credit اولیه کوچیک میده که میتونی باهاش شروع کنی.
برای کاربر ایرانی: پرداخت روی Anthropic مستقیماً با کارت ایرانی کار نمیکنه. باید از کارت ارزی، یا سرویسهای واسط استفاده کنی. اگه میخوای از کاربرانت در ایران پشتیبانی کنی، گزینهٔ راحتتر استفاده از AiraCode یا آیراچت هست که دسترسی به مدلهای Anthropic رو با پرداخت تومانی فراهم میکنن.
ساختار یه request ساده
import anthropic
client = anthropic.Anthropic(api_key="your-key")
message = client.messages.create(
model="claude-sonnet-4-6-20260219",
max_tokens=1024,
messages=[
{"role": "user", "content": "این کد پایتون رو بررسی کن و باگ احتمالی رو بگو"}
]
)
print(message.content[0].text)
همین. Claude API خیلی تمیزه — نیازی به پیکربندی پیچیده نداری.
مدلها و قیمتها (۲۰۲۶)
| مدل | Input (MTok) | Output (MTok) | مناسب برای |
|---|---|---|---|
| claude-haiku-4-5 | $1 | $5 | سرعت بالا، حجم زیاد |
| claude-sonnet-4-6 | $3 | $15 | تعادل کیفیت/قیمت |
| claude-opus-4-7 | $5 | $25 | بیشترین هوشمندی |
قیمتها per million token (MTok) هستن و جداگانه برای input و output محاسبه میشن.
سه روش بهینهسازی هزینه
۱. Batch Processing — ۵۰٪ ارزانتر
اگه نیازی به پاسخ بلادرنگ نداری (مثلاً پردازش ۵۰۰۰ متن شبانه)، از Message Batches API استفاده کن. همهٔ مدلها رو با نصف قیمت استاندارد پشتیبانی میکنه.
batch = client.beta.messages.batches.create(
requests=[
{"custom_id": f"req-{i}", "params": {"model": "claude-haiku-4-5",
"max_tokens": 100, "messages": [{"role": "user", "content": texts[i]}]}}
for i in range(len(texts))
]
)
۲. Prompt Caching — تا ۹۰٪ کاهش هزینهٔ input
اگه یه system prompt یا context بلند داری که در هر request تکرار میشه، Prompt Caching هزینهٔ توکنهای cache شده رو ۹۰٪ کم میکنه. فقط باید یه cache_control به پیام اضافه کنی:
messages=[
{
"role": "user",
"content": [
{
"type": "text",
"text": long_document, # این بخش cache میشه
"cache_control": {"type": "ephemeral"}
},
{"type": "text", "text": "سؤال من اینه..."}
]
}
]
با ترکیب Batch + Caching میتونی تا ۹۵٪ هزینه رو روی workloadهای واجد شرایط کاهش بدی.
۳. انتخاب مدل درست
قبل از اینکه همه چیز رو به Opus بفرستی، تست کن که آیا Sonnet جواب مناسب میده. در بیشتر موارد جواب بلهست. این سادهترین راه کاهش هزینهست.
Extended Thinking
Sonnet 4.6 و Opus 4.7 هر دو Extended Thinking دارن. با فعال کردنش، مدل قبل از پاسخ دادن یه فرآیند استدلال داخلی انجام میده که در پاسخهای پیچیده — مثل باگیابی یا تحلیل معماری — قابل توجهه:
response = client.messages.create(
model="claude-sonnet-4-6-20260219",
max_tokens=16000,
thinking={
"type": "enabled",
"budget_tokens": 10000 # حداکثر توکن برای فکر کردن
},
messages=[{"role": "user", "content": "این معماری میکروسرویس رو آنالیز کن..."}]
)
Context Window یک میلیون توکن
Sonnet 4.6 و Opus 4.7 هر دو context window یک میلیون توکن دارن. این یعنی میتونی یه codebase کامل، یه کتاب، یا صدها صفحه سند رو در یه request بفرستی. Haiku 4.5 محدود به ۲۰۰K توکنه.
یه نکتهٔ عملی: context طولانی = قیمت input بالاتر. برای codebaseها، RAG با Haiku اغلب اقتصادیتره از دمپ کردن همه چیز به Opus.
ابزارها (Tool Use)
Claude API از function calling پشتیبانی میکنه — میتونی ابزارهایی تعریف کنی که مدل میتونه صدا بزنه:
tools = [
{
"name": "search_database",
"description": "جستجو در پایگاه داده محصولات",
"input_schema": {
"type": "object",
"properties": {
"query": {"type": "string", "description": "عبارت جستجو"}
},
"required": ["query"]
}
}
]
این قابلیت پایهٔ ساخت agentهای واقعیه. مقاله ساخت اولین ایجنت گامبهگام نشون میده چطور.
رفع خطاهای رایج
خطای ۴۲۹ (Rate Limit): هر حساب یه محدودیت requests-per-minute داره. با افزایش tier حساب یا implement کردن exponential backoff حلش کن.
خروجی انگلیسی با prompt فارسی: صریح بگو "لطفاً به فارسی جواب بده" یا در system prompt مشخص کن: "You always respond in Persian (Farsi)." کلاد دستورالعملها رو خوب دنبال میکنه.
توکنهای ناکافی در max_tokens: اگه جوابها ناگهان قطع میشن، مقدار max_tokens رو بالا ببر. برای خروجیهای بلند حداقل ۴۰۹۶ بذار.
کلاد روی ابزارهای کدنویسی
اگه داری با کدنویسی کار میکنی و میخوای از Claude API مستقیم در ترمینال استفاده کنی، AiraCode یه coding agent فارسیزبانه که روی Claude ساخته شده — با memory پروژه و دسترسی از ایران. بررسی کاملش در AiraCode چیست هست.
همچنین بخوان
ادامهٔ مسیر
همهٔ مقالهها ←آیرا در برابر کلاد (Claude) — تفاوت شناخت پیوسته با حافظهٔ گسسته
مقایسهٔ تخصصی آیرا و Claude Anthropic در پنج محور: حافظه، فارسی، دسترسی در ایران، توانایی نوشتن طولانی و قیمت.

کلاد چیست؟ راهنمای کامل Claude
کلاد چیست؟ راهنمای کامل Claude — راهنمای فارسی از مجموعهٔ «کلاد» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

Anthropic — سازندهٔ کلاد
Anthropic — سازندهٔ کلاد — راهنمای فارسی از مجموعهٔ «کلاد» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.

Claude 4.7، Sonnet، Opus، Haiku — تفاوتها
Claude 4.7، Sonnet، Opus، Haiku — تفاوتها — راهنمای فارسی از مجموعهٔ «کلاد» در وبلاگ آیرا. بازنویسیشده با تمرکز روی کاربر ایرانی و روایت شناخت پیوسته.
بیشتر در «کلاد»
- کلاد در ایران — راهنمای دسترسی
- تحریم Claude و راهحلها
- اشتراک Claude و قیمت
- Claude Code — همراه کدنویسی Anthropic
- Claude Skills — کتابخانهٔ مهارتها
- MCP — Model Context Protocol چیست
- Computer Use در Claude
- Claude Projects و مرز شناخت — تا کجا تو رو میشناسه؟
- Constitutional AI — فلسفهٔ ایمنی Anthropic
- کلاد در مقابل چت جی پی تی
- Context window های طولانی در Claude
- Prompt caching در Claude — کاهش هزینه
- Anthropic در مقابل OpenAI
- Dario Amodei و فلسفهٔ Anthropic