AI Agents, בנה Agent משלך | בית הספר של Claude

למה 2026 היא שנת ה-Agent, ולמה זה משנה לך עכשיו

מפתחת בסטארטאפ fintech תל-אביבי בנתה agent שכל לילה בשעה 02:00: (1) מושך נתוני עסקאות מ-API של הבנק, (2) מזהה חריגות, (3) מייצר דוח PDF, ו-(4) שולח התראה ל-Slack. תהליך שלקח שעתיים ידנית, פועל עכשיו לבד כל לילה. AI Agent הוא LLM שיכול לנקוט פעולות בעולם האמיתי, לא רק לענות על שאלות.

ב-8 לאפריל 2026 Anthropic השיקה Claude Managed Agents, שירות ענן שמריץ agents בתשתית מנוהלת. לפי Anthropic, זה קיצר את זמן הפיתוח מחודשים לימים. Wisedocs דיווחה על 97% פחות שגיאות בזרימות עיבוד מסמכים. אבל כדי להשתמש בכלי הזה נכון, צריך להבין קודם מה agent בכלל עושה.

האנטומיה של Agent: LLM + כלים + לולאה

הגדרה פשוטה: Agent = LLM + כלים + לולאת החלטות. הLLM מחליט איזה כלי לקרוא, רואה את התוצאה, ומחליט מה הצעד הבא, עד שהמשימה הושלמה.

Anthropic מזהה חמישה דפוסי workflow עיקריים לפי המאמר Building Effective Agents:

דפוס	מתי להשתמש	דוגמה
Prompt Chaining	שלבים ידועים מראש	כתיבה → עריכה → פרסום
Routing	סיווג בקשות	שאלת תמיכה → מחלקה נכונה
Parallelization	משימות עצמאיות מקביליות	ניתוח 10 מסמכים בו-זמנית
Orchestrator-Workers	תכנון דינמי	מנהל שמאציל לסוכנים מיוחדים
Evaluator-Optimizer	שיפור איטרטיבי	כותב → מבקר → כותב מחדש

כלל אצבע מ-Anthropic: "Many applications actually benefit from optimized single LLM calls rather than full agent loops." לא כל בעיה צריכה agent. התחל פשוט.

ReAct Pattern, לב ה-Agent

ReAct (Reasoning + Acting) הוא הדפוס הסטנדרטי לכל agent:

THOUGHT: "צריך לבדוק מחיר TEVA ואז לבדוק חדשות"
ACTION: get_stock_price("TEVA")
OBSERVATION: {"price": 12.40, "change": -6.2%}
THOUGHT: "ירידה של 6.2%, מעל הסף. צריך לבדוק למה"
ACTION: get_news("Teva Pharmaceutical")
OBSERVATION: [{"title": "FDA delays approval..."}]
THOUGHT: "יש סיבה. שולח התראה."
ACTION: send_slack_alert(...)
STOP: task complete

Claude מיישם ReAct באופן טבעי כשמספקים לו tools ו-system prompt מתאים. הלולאה ממשיכה עד שהתוצאה מוכנה, או עד שמגיעים ל-stop condition.

עיצוב כלים טוב, הסוד שאנשים מפספסים

Anthropic מדגישה: "More tools don't always lead to better outcomes." Tool descriptions גרועות הן הגורם מספר אחד לכישלון agents.

אחד tool רחב > עשרה tools צרים: במקום list_events + check_availability + create_event, בנה schedule_event אחד שמטפל בכל הלוגיקה פנימית.
תיאורים מפורטים: כתוב כל tool description כאילו אתה מסביר לקולגה חדשה. כלול edge cases, מה מוחזר, ומה לא לעשות.
תגובות ממוקדות: החזר רק מידע רלוונטי. שדות כמו name ו-status עדיפים על technical IDs.
שמות ברורים: asana_projects_search עדיף על search, הקשר מוחלט מוריד שגיאות.

{"name": "search", "description": "searches for stuff", "parameters": {"query": {"type": "string"}}}

{"name": "crm_contacts_search", "description": "מחפש אנשי קשר ב-CRM לפי שם, אימייל, או שם חברה. מחזיר עד 10 תוצאות. השתמש כשצריך לאתר איש קשר לפני שליחת מייל או עדכון פרטים. אם אין תוצאות, נסה שם חלקי. לא מתאים לחיפוש פגישות או משימות.", "parameters": {"query": {"type": "string", "description": "שם מלא, חלקי, אימייל, או שם חברה"}, "max_results": {"type": "integer", "default": 5}}}

Claude Managed Agents, מה השתנה ב-2026

עד אפריל 2026 בניית agent דרשה לכתוב בעצמך: agent loop, sandbox, tool execution, state management, monitoring. Managed Agents שינה זאת.

ההשוואה לפי Anthropic Docs:

	Messages API (DIY)	Claude Managed Agents
שליטה	מלאה	מוגבלת לאפשרויות הגדרה
תשתית	בידיים שלך	מנוהל על ידי Anthropic
זמן הקמה	שבועות	ימים
עלות	tokens בלבד	$0.08/session-hour + tokens
מתאים ל-	tasks קצרים, שליטה מדויקת	tasks ארוכים, אסינכרוניים

Managed Agents מריץ כל agent בקונטיינר מבודד (gVisor), עם כלים מובנים: Bash, קבצים, web search, ו-MCP servers. אפשר לגשת דרך ה-header: managed-agents-2026-04-01.

Stop Conditions וה-Human-in-the-Loop

שני הכישלונות הנפוצים ביותר ב-agents:

Infinite loop: agent ממשיך לנסות כשאין פתרון. פתרון: max_iterations (בד"כ 15-25), timeout בשניות, וקריטריון "task complete" מפורש ב-system prompt.
פעולות הרסניות: agent שמוחק קבצים, שולח מיילים, או עדכן DB בלי אישור. פתרון: הוסף tool בשם request_human_approval(action, reason) שחייב להיקרא לפני כל פעולה בלתי הפיכה.

כלל פשוט: כל פעולה שאי אפשר ל-undo צריכה human checkpoint. Claude Sonnet מזהה היטב מתי לעצור ולשאול, אבל רק אם ה-system prompt מבקש זאת במפורש.

התנאי שמגדיר את פורמט התשובה הסופית

ה-API key שמגביל קריאות לכלים

התנאי שמסיים את הלולאה, בלעדיו agent עלול לרוץ לנצח ולשרוף תקציב

מנגנון rate limiting של Anthropic

ככל שיש יותר כלים, ה-agent יותר חכם

מספר כלים קטן עם תיאורים מדויקים עדיף על הרבה כלים מבולבלים

תמיד צריך בדיוק 5 כלים

agent לא צריך כלים אם הוא חכם מספיק

הוא משתמש במודל Claude חזק יותר

הוא זול יותר מ-Messages API

תשתית מנוהלת מלאה: sandbox, state, כלים מובנים, ללא פיתוח תשתית עצמי

הוא מבטל את הצורך ב-agent loop לחלוטין

טעויות נפוצות ואיך נמנעים מהן

tool descriptions לקויות: Claude בוחר tools לפי התיאור בלבד. תיאור כמו "searches for stuff" יגרום לבחירות שגויות. כתוב תיאורים ארוכים ומפורטים, זה לא בזבוז, זה השקעה.
agent ללא cost tracking: 20 iterations × 5 API calls = 100 קריאות בסשן אחד. הוסף cost cap בקוד לפני שמגיעים ל-production.
לוגים חסרים: כשagent כושל בלילה, בלי logs לא תדע מה קרה. log כל tool call עם input, output, ו-timestamp.

סיכום, מה לקחת מהשיעור הזה

Agent = LLM + כלים + לולאת ReAct. הפשטות של הארכיטקטורה היא יתרון.
Tool descriptions טובות הן ההשקעה הכי משתלמת בפיתוח agent. שם, תיאור, edge cases.
Stop conditions הם לא אופציונליים, הם safety net בסיסי.
לפעולות הרסניות: תמיד human-in-the-loop. Claude מבין זאת ומיישם אם מבקשים.
ב-2026 יש שתי אפשרויות: Messages API (שליטה מלאה) ו-Managed Agents (תשתית מנוהלת, $0.08/session-hour). בחר לפי ה-use case.