Memory Systems לסוכנים, זיכרון ארוך טווח

📚 תת-סוכנים, Multi-Agent Systems ⏱️ 8 דק׳ 🎓 מתקדם ✓ חינם לגמרי
Memory Systems לסוכנים, זיכרון ארוך טווח

הבעיה: כל session מתחיל מאפס

כשאתה מריץ Claude Agent לטיפול בכרטיסי תמיכה, הוא לא זוכר שאתמול החלטת להגיב תמיד בעברית, שהלקוח מסוים כועסן, או שכבר ניסית טקטיקה מסוימת ולא עבדה. כל session מתחיל עם context window ריק לחלוטין.

זה לא באג, זה ה-design של LLMs. אבל סוכנים שצריכים לפעול לאורך זמן (שבועות, חודשים) חייבים ארכיטקטורת זיכרון מחוץ ל-context. ב-23 לאפריל 2026 השיקה Anthropic את Claude Managed Agents Memory ב-public beta, אחת ההוכחות שהתחום הזה הפך מחקרי לפרודקשן.

ארבעת שכבות הזיכרון, טבלת השוואה

סוגהיכן נשמרמשך חייםמתאים לעלות טוקנים
In-Contextבתוך ה-API requestשיחה נוכחית בלבדmulti-turn קצר, הקשר שיחהגבוהה, גדל עם כל turn
External Filesקבצי /memories (filesystem)לצמיתותהעדפות, progress log, SOPsנמוכה, נקרא רק כשצריך
Vector DBPinecone / pgvector / ChromaDBלצמיתותחיפוש סמנטי, אלפי זיכרונותנמוכה, top-k retrieval
Episodic LogDB / JSONלצמיתותaudit trail, "מה עשיתי ומתי"נמוכה, לפי שאילתה

Memory Tool הרשמי של Anthropic

ב-2025 פרסמה Anthropic כלי זיכרון רשמי שניתן לצרף לכל messages.create call. הוא עובד בצד הלקוח, אתה שולט על הגב-אנד (קבצים, DB, cloud storage). Claude מקבל הנחיה אוטומטית: "ALWAYS VIEW YOUR MEMORY DIRECTORY BEFORE DOING ANYTHING ELSE", כלומר הוא בודק מה שמור לפני שמתחיל בכל משימה.

כך מוסיפים אותו ל-request:

// Python
client.messages.create(
    model="claude-opus-4-7",
    max_tokens=2048,
    messages=[{"role": "user", "content": user_message}],
    tools=[{"type": "memory_20250818", "name": "memory"}]
)

Claude יכול לבצע 6 פעולות על directory /memories: viewcreatestr_replaceinsertdeleterename. הכל מגיע כ-tool_use call שה-application שלך מממש.

Episodic vs. Semantic, ההבדל שחשוב

"Episodic memory captures what happened. Semantic memory captures what is true." (Databricks Blog, 2026)

המעבר מ-Episodic ל-Semantic נקרא Memory Consolidation, תהליך שמתבצע לרוב בסוף session ומסכם את מה שנלמד. זה מה שמונע ניפוח של זיכרון עם noise.

דוגמה ישראלית: CRM Agent לצוות מכירות בסטארטאפ ת"א

נניח שבניתם CRM Agent עבור צוות מכירות ב-SaaS ישראלי. 5 Account Executives, כל אחד מנהל 80+ לקוחות. הבוט צריך לזכור:

  1. פרטי לקוח קבועים (שם, תחום, גודל חברה, שפה מועדפת) ← Semantic Store, נטען ל-System Prompt
  2. היסטוריית שיחות עם לקוח ("מה דיברנו עם מיקרוסופט IL לפני חצי שנה?") ← Vector DB עם semantic search
  3. Action Items שנולדו מכל שיחה ("שלח הצעה, קבע follow-up, העבר ל-Legal") ← Episodic Log, מובנה עם תאריכים
  4. Progress מהפגישה שנכנסת עכשיוIn-Context, נבנה בזמן אמת

כל שכבה ממלאת תפקיד שונה. טעות נפוצה: לשים הכל ב-context ולקרוס ב-50,000 tokens.

שגיאות נפוצות ואיך להימנע

רוצה ללמוד עם מעקב התקדמות, קוויזים ותעודה?

כל 130 השיעורים פתוחים בחינם, כולל נגן אינטראקטיבי, שמירת התקדמות ותעודה דיגיטלית בסיום.