ההחלטה שמשפיעה על כל בקשת API שתשלח
רוב המפתחים בוחרים מודל פעם אחת ומשתמשים בו לכל דבר. זו טעות יקרה. ל-Anthropic יש שלושה מודלים פעילים כרגע, ובין הזול לביניים לבין היקר ביותר יש פער עלות של פי 5. ההבדל בביצועים על משימות רוטיניות? כמעט אפס. שיעור זה מלמד אחת לאחת מתי להשתמש בכל מודל, לפי נתונים אמיתיים.
המשפחה הנוכחית, אפריל 2026
נכון לאפריל 2026, שלושת המודלים הפעילים הם:
| מודל | API ID | Context | מחיר input / output (1M) | Output מקסימלי |
|---|---|---|---|---|
| Claude Opus 4.7 | claude-opus-4-7 | 1M טוקנים | $5 / $25 | 128k |
| Claude Sonnet 4.6 | claude-sonnet-4-6 | 1M טוקנים | $3 / $15 | 64k |
| Claude Haiku 4.5 | claude-haiku-4-5-20251001 | 200k טוקנים | $1 / $5 | 64k |
שימו לב: Sonnet 4 ו-Opus 4 הוצאו מהשימוש ויורדו ב-15 ביוני 2026. אם אתם עדיין משתמשים ב-claude-sonnet-4-20250514, הגיע הזמן לשדרג.
Haiku 4.5, מהיר, זול, ומספיק לרוב הדברים הפשוטים
Haiku הוא המודל שרוב המפתחים מזלזלים בו בתחילה ואז לא יכולים בלעדיו. ב-$1/$5 לטוקן הוא זול פי 5 מ-Opus. על משימות פשוטות, הביצועים כמעט זהים.
מתאים ל:
- Classification, tagging, NER extraction, הגדרת קטגוריה לכל פריט
- Batch processing של אלפי רשומות, סיווג אימיילים נכנסים, ניתוח sentiment
- Sub-agents בתוך multi-agent pipeline, בתפקיד של screener ראשוני
- Real-time chatbot responses, כשה-latency קריטי
- CI/CD code review ראשוני, בדיקת כתיב, סגנון, שגיאות טריוויאליות
לא מתאים ל: reasoning רב-שלבי, הסברים מורכבים, קונטקסט מעל 200k טוקנים, אדריכלות מערכות.
כפי שאחד המפתחים תיאר את זה: "Haiku is shockingly good for classification and extraction pipelines. At $1/$5 per million, I ran 2M requests last month for under $15."
Sonnet 4.6, ברירת המחדל הנכונה לרוב ה-Production
אם יש לכם ספק, בחרו Sonnet 4.6. הוא מטפל ב-90% ממשימות ה-coding בלי פשרה, מהיר לשיחה בזמן אמת, ו-$3/$15 הוא מחיר הגיוני לאפליקציה production.
מתאים ל:
- כתיבת קוד, debugging, code review מעמיק
- כתיבת תוכן, ניסוח אימיילים, ניתוח נתונים
- API integrations ו-developer tools
- רוב אפליקציות ה-production שאינן דורשות reasoning עמוק
- Extended Thinking ו-Adaptive Thinking, שניהם זמינים
Sonnet 4.6 גם תומך ב-1M context window, גדול בהרבה מהיכולת של Haiku (200k). Context window רחב מאפשר לשלוח מסמך שלם, codebase גדול, או היסטוריית שיחה ארוכה.
Opus 4.7, רק כשזה באמת מצדיק את המחיר
Opus 4.7 יצא ב-16 באפריל 2026 עם שיפור משמעותי ב-agentic coding: מ-80.8% ל-87.6% ב-SWE-bench Verified, ו-70% ב-CursorBench. ראייה חדה פי 3 מ-Opus 4.6. אבל יש פה מלכודת.
טוקנייזר חדש = עלות אפקטיבית גבוהה יותר: Opus 4.7 משתמש בטוקנייזר חדש. אותו טקסט מייצר עד 35% יותר טוקנים. כלומר, גם אם מחיר הטוקן לא השתנה, החשבון שלכם יכול לעלות ב-20-35% לאחר מיגרציה מ-Opus 4.6.
מתאים ל:
- Agentic coding מורכב, multi-step autonomous programming tasks
- ארכיטקטורת מערכות ותכנון מורכב
- Orchestrator ב-multi-agent systems
- ניתוח מסמכים משפטיים וחוזים ארוכים
- Adaptive Thinking לבעיות שדורשות זמן חשיבה (אין extended thinking ב-Opus 4.7)
שימו לב: Opus 4.7 תומך ב-adaptive thinking בלבד, manual/extended thinking הוסרו. אם הקוד שלכם משתמש ב-thinking: {type: "enabled"} עם Opus 4.6, תצטרכו לשנות ל-adaptive.
Decision Tree, איך לבחור בפועל
שאלו שלוש שאלות לפני כל בחירת מודל:
- כמה בקשות יש לכם בחודש? מעל 100K בקשות, כל שקל משנה. Haiku על הפשוט, Sonnet על הבינוני.
- האם המשימה דורשת reasoning רב-שלבי? אם לא, Haiku מספיק. אם כן, Sonnet לרוב, Opus לקשה באמת.
- מה ה-context שנדרש? מעל 200k טוקנים, רק Sonnet או Opus.
דוגמה מהשוק הישראלי: סטארטאפ ת"א שבנה בוט שירות לקוחות בעברית לחברת ביטוח: classification של פניות → Haiku ($0.001 לאלף פניות), ניסוח תגובות → Sonnet ($0.003 לתגובה), ניתוח תיקים מורכבים → Opus ($0.015). חיסכון של 65% לעומת שימוש ב-Opus לכל דבר.
חישוב עלות שנתית, מספרים אמיתיים
# 1M בקשות בשנה, 2,000 טוקנים ממוצע לבקשה (input + output)
# מחיר ממוצע משולב (input 60%, output 40%)
haiku_avg = 1 * 0.6 + 5 * 0.4 # = $2.6 / 1M tokens
sonnet_avg = 3 * 0.6 + 15 * 0.4 # = $7.8 / 1M tokens
opus_avg = 5 * 0.6 + 25 * 0.4 # = $13 / 1M tokens
# 1M requests * 2,000 tokens / 1,000,000 = 2M tokens total
print(f"Haiku: ${haiku_avg * 2:,.0f}/year") # $5,200
print(f"Sonnet: ${sonnet_avg * 2:,.0f}/year") # $15,600
print(f"Opus: ${opus_avg * 2:,.0f}/year") # $26,000
פער של ~$20,000 בשנה בין Haiku ל-Opus על אותה עבודה. על משימות פשוטות, Haiku נותן תוצאה זהה.
