Orchestration Patterns, ניהול מערכות Multi-Agent

למה סוכן אחד לא מספיק

דמיינו צוות פיתוח בסטארטאפ תל-אביבי שמטיל על עובד אחד לכתוב קוד, לבדוק אותו, לכתוב תיעוד, ולעצב את ה-UI, בו-זמנית. כך נראית מערכת AI עם סוכן בודד שמנסה לבצע משימה מורכבת.

Multi-Agent Orchestration הוא הדרך לחלק את העבודה: סוכן מתמחה אחד חוקר, אחר כותב, אחר מבקר. Orchestration הוא האמנות של לנהל את החלוקה, התיאום, וחיבור התוצאות חזרה לפלט אחד.

נתוני Anthropic מהמחקר הפנימי שלהם: מערכת multi-agent (Claude Opus 4 כ-lead + Claude Sonnet 4 כסוכני עבודה) הפגינה שיפור של 90.2% לעומת סוכן Opus 4 בודד על אותן משימות. המחיר: צריכת טוקנים גבוהה פי 15.

חמשת דפוסי התיאום הרשמיים

Anthropic פרסמה מדריך רשמי לחמישה דפוסי תיאום. כל דפוס מתאים לסוג אחר של בעיה:

דפוס	מבנה	מתי מתאים	סיכון עיקרי
Orchestrator-Subagent	Lead מתכנן + מאציל; Subagents מבצעים משימות מוגדרות	משימות מורכבות עם חלוקה ברורה	ה-Orchestrator הופך ל-bottleneck
Generator-Verifier	אחד מייצר, אחד בודק לפי קריטריונים מדויקים	עבודה שדורשת איכות ודיוק גבוה	הבודק חייב קריטריונים ברורים
Agent Teams	סוכנים מתמידים לוקחים משימות מתור משותף	משימות מקביליות ארוכות-טווח	קשה לשתף ממצאים ביניים
Message Bus	סוכנים מפרסמים ומנויים על אירועים	מערכות גדלות עם workflow אסינכרוני	כשלים שקטים, דיבוג מורכב
Shared State	סוכנים קוראים וכותבים למאגר משותף	מחקר שבו ממצא אחד משפיע על האחרים	לולאות אינסופיות שצורכות טוקנים

ההמלצה של Anthropic: "Start with orchestrator-subagent, it handles the widest range with least overhead. Evolve toward other patterns only when specific limitations emerge."

דפוס 1 בעומק: Orchestrator-Subagent

זהו הדפוס הנפוץ ביותר, כ-70% ממערכות ה-multi-agent בפרודקשן. מנהל משאבי אנוש בחברת SaaS ישראלית יכול לבנות כך:

Orchestrator: קולט JD + תקציב + דרישות תרבות ארגונית, מחליט איך לחלק
Subagent 1, Screener: מסנן קורות חיים לפי קריטריונים טכניים בלבד
Subagent 2, Culture Fit: בודק התאמה ערכית על פי 5 שאלות מוגדרות
Subagent 3, Reporter: מחבר סיכום מובנה עם המלצות מדורגות

המפתח: כל subagent מקבל system prompt עם תפקיד, פורמט פלט, וגבולות גזרה מדויקים. בלי זה, הסוכן חורג מתחומו.

דפוס 2 בעומק: Fan-Out / Fan-In

ווריאנט של Orchestrator-Subagent שמניב את החיסכון הגדול ביותר בזמן. Anthropic מצאה ש-3-5 subagents מקבילים + 3 tool calls מקבילים הפחיתו זמן מחקר ב-90%.

דוגמה מעשית: ניתוח מתחרים לסטארטאפ פינטק ישראלי,

Fan-Out: 4 סוכנים עובדים במקביל, אחד מנתח Bit, אחד PayBox, אחד Pepper, אחד מנתח ביקורות
Fan-In: Orchestrator מאחד ל-Competitive Matrix אחת עם insights

הסיכון: אם משימות תלויות זו בזו (סוכן B צריך פלט של סוכן A), Fan-Out מוביל לכשל. השתמשו ב-Fan-Out רק כשהמשימות עצמאיות לחלוטין.

טיפול בשגיאות: Circuit Breaker

כשל של סוכן אחד בתוך pipeline יכול להפיל את הכל. הפתרון הסטנדרטי הוא דפוס Circuit Breaker:

Retry עם backoff: ניסיון 1 → 1s המתנה → ניסיון 2 → 2s → ניסיון 3 → 4s
Fallback graceful: אם 3 ניסיונות נכשלו, החזר שגיאה מובנית, אל תפיל את כל ה-pipeline
Partial results: Orchestrator ממשיך עם הסוכנים שהצליחו, מסמן את החסר

טעות נפוצה בישראל (ובכל מקום): מבנים pipeline ללא כל טיפול בשגיאות. בסביבת פרודקשן, כשל הוא ודאי, רק התזמון לא ידוע.

מתי לא להשתמש ב-Multi-Agent

הקהילה ב-Reddit הגיעה לקונסנזוס מפוכח: sub-agents הם "a scalpel, not a Swiss army knife." על פי ניסיון מעשי, multi-agent workflows לא מתאימים ל-95% ממשימות הפיתוח.

שאלו לפני שמבנים multi-agent:

האם המשימה גדולה מדי לחלון הקשר אחד? אם לא, סוכן אחד עם כלים מספיק.
האם ניתן לפרק למשימות עצמאיות? אם לא, pipeline סדרתי עדיף.
האם ה-ROI מצדיק עלות טוקנים פי 15? אם לא, אל תבנו.