כמעט כל צוות הנהלה מציג כיום שקפים מרשימים על ״פלטפורמות סוכני AI אוטונומיים״, אך לעיתים נדירות הם עונים על השאלה הקריטית עבור סמנכ"לי כספים ודירקטוריונים: האם מדובר בנכס סקלבילי, או במס קבוע על טוקנים - ויותר מכך, על כושר פירעון קוגניטיבי?
כמשקיע שעובד עם סטארטאפים צעירים שהם AI-native, כמו גם עם חברות בוגרות ומפוקחות רגולטורית בבניית אסטרטגיית סוכנים, אני מזהה את אותו דפוס משני הכיוונים. צוותים בשלבים מוקדמים נותנים לסוכנים לנהל כמעט הכול, ורק מאוחר יותר מגלים שהם לא באמת יכולים להסביר או לבקר התנהגויות קריטיות. מנגד, ארגונים גדולים בונים ליבה דטרמיניסטית זהירה מדי, משתמשים בסוכנים במשורה ומשיגים רק שבריר מהפוטנציאל. ברירת המחדל הנכונה אינה זהה עבור שני הצדדים, והטעות הנפוצה היא לא עצם הבחירה, אלא חוסר ההתאמה לשלב שבו הארגון נמצא.
שתי אסטרטגיות, שתי ברירות מחדל
ברמת המאקרו קיימות שתי אסטרטגיות אמינות:
Agent-first : הצבת סוכני AI ישירות בנתיב החם. סוכנים מתכננים, מפעילים כלים ומקבלים החלטות בזמן ריצה עבור רוב רכיבי המוצר.
Critical-core-first : החלטה שסט מצומצם של קבועים- תנועות כספיות, זהות משתמש, שלמות נתונים, בטיחות ורגולציה, ינוהל בקוד דטרמיניסטי, ניתן לביקורת ובבעלות אנושית. הסוכנים עדיין פועלים בשוליים ובשלב הבנייה, אך אינם המוח הראשי במקומות שבהם טעות אחת עלולה לחסל את העסק.
עבור רוב הסטארטאפים בשלבים מוקדמים, ברירת המחדל הרציונלית היא Agent-first. הסיכון העיקרי שלהם אינו רגולטור שדופק בדלת, אלא כישלון במציאת התאמה בין מוצר לשוק לפני שההון נגמר. קוד דטרמיניסטי מתנהג כמו הוצאה הונית: חודשים של הקשחת לוגיקה שכנראה תשתנה. לעומתו, חשיבה סוכנית בזמן אמת מתנהגת כהוצאה תפעולית: משלמים בטוקנים ובעלות אימות מוגבלת כדי להעמיד יכולות מול לקוחות כבר השבוע וללמוד מהר יותר מהמתחרים. ההבחנה הזו קריטית, לא רק טכנולוגית, אלא פיננסית וניהולית.
הצוותים המהירים ביותר שאני פוגש מציבים סוכנים כמעט בכל מקום שאינו קיומי: ניסויי תמחור, וריאציות של תהליכי עבודה, לוגיקה מותאמת-לקוח ואופרציה פנימית. החריגים היחידים הם תחומים שעלולים למוטט את החברה באירוע אחד- תזרים כספים, אימות משתמשים ותוכן לא חוקי או בעל פוטנציאל נזק גבוה. אלו עטופים בליבה דטרמיניסטית דקה שהסוכנים יכולים לקרוא לה, אך לא לשכתב. בפועל, יזמים מתייחסים לגישת Agent-first כאל הלוואה כנגד מורכבות עתידית.
הנקודה שבה ברירת המחדל מתהפכת
גישת Agent-first אינה בת-קיימא לטווח הארוך. ככל שהחברה גדלה, העלייה בטראפיק, בהכנסות ובחשיפה הרגולטורית מעלה את פרופיל הסיכון והעלות הכלכלית של טעויות. בשלב הזה, המערכת כולה הופכת קשה להבנה, וקבועים שמשתנים לאט מקבלים משקל קריטי. מקומם של אלו הוא בקוד דטרמיניסטי ובמדיניות מוצהרת, עם ממשקים ברורים שהסוכנים חייבים לכבד.
עבור בנקים, חברות ביטוח, ספקי שירותי בריאות ופלטפורמות SaaS בשלות, עמדת Critical-core-first היא לרוב היחידה האפשרית: ליבה קטנה, משעממת וניתנת לביקורת, המוקפת במעטפת סוכנית גמישה.
כושר פירעון קוגניטיבי: העלות שלא מופיעה בדו״ח
גם אם עלות הטוקנים תרד מחר לאפס, מערכות סוכניות לא יהיו חינמיות. המגבלה האמיתית היא כושר פירעון קוגניטיבי- היכולת של האנשים הבכירים להבין מה המערכת עושה כדי לאשר שינויים ולטפל בתקלות. סוכן יכול לייצר בשבוע יותר קוד ממה שצוות נהג לשחרר בחודש, אך סקירת התוצרים הללו יקרה ולעיתים קשה יותר מכתיבה ידנית. כך מהנדסים בכירים הופכים ל״קומפיילרים אנושיים״, עסוקים בתורי סקירה אינסופיים, ובפועל רבים מהם מגיעים ל״חותמת גומי״ ו״מס האימות״, בעלות שש-ספרתית, נערם לצד חשבון ה־LLM, גם אם איש בדירקטוריון לא רואה אותו.
צ׳ק-ליסט קצר לפני שמכניסים סוכן לנתיב החם
לפני שמכניסים סוכן AI לנתיב החם של תהליך משמעותי, כדאי לשאול ארבע שאלות:
- מה מחיר הטעות? פיננסית, תדמיתית ומול רגולטור. טעויות יקרות או בלתי הפיכות ← ברירת מחדל לקוד דטרמיניסטי, עם שכבה סוכנית צרה בלבד.
- באיזו תדירות הלוגיקה באמת משתנה? שינוי יומי/שבועי ← מתאים יותר להתנהגות סוכנית עם תצפיתיות חזקה ויכולת rollback. שינוי שנתי ← עדיף לבטא בקוד.
- האם אפשר לראות ולתקן מהר סטייה של הסוכן? אם לא ניתן לזהות drift ולהחזיר לאחור במהירות, הוא לא צריך להיות בנתיב החם.
- האם החשיבה “לפי בקשה” באמת מרוויחה את מקומה? פחות הסלמות, חוויית לקוח טובה יותר, ירידה מהותית בזמן טיפול, או שיפור מדיד בתוצאות סיכון. אם הערך עמום - להשאיר את הלוגיקה בקוד ולהשתמש בסוכנים בשלב הבנייה.
התאימו את ההימור לשלב שלכם
סטארטאפ AI-native מוקדם צריך לאמץ Agent-first, למעט תחומים שיכולים להוביל לפשיטת רגל או לאירוע פלילי, ולהיות מודע לכך שהוא לוקח הלוואה שתידרש החזרה באמצעות הקשחת הליבה בהמשך.לעומתם, חברות בוגרות או מפוקחות צריכות ליבה דטרמיניסטית קטנה ומוגדרת, ולהכניס סוכנים לנתיבים קריטיים רק עם הוכחות חותכות. בשני המקרים, בשני המקרים, המהלך בעל החרטה הנמוכה ביותר הוא אותו מהלך: שמרו על גבול ברור בין קבועים קריטיים לבין חלקי המערכת שבהם אתם מוכנים לשלם עבור קוגניציה לפי בקשה. הגבול הזה הוא מה שמאפשר להישען על סוכנים כשהם מצדיקים את עצמם בבירור, ולסגת לאחור כאשר הם לא. החברות שיצליחו להרחיב את השימוש בסוכנים בהצלחה, יהיו אלו שישמרו על כושר הפירעון הקוגניטיבי שלהן למשך הזמן הרב ביותר.