כמשקיעים, אנחנו נמצאים בעמדה ייחודית, אנחנו לא רק רואים את גל הסטארט-אפים של ה-AI אלא אנחנו מביטים ישירות אל התשתיות שמניעות אותו. מה שברור לנו, והופך למנוע ההשקעה, הוא שהאתגר הגדול ביותר אינו טמון עוד בבניית המודל, אלא ביכולת לנהל, לשמור, לשתף ולנקות את כמויות הדאטה העצומות המזינות אותו. המירוץ האמיתי ב-AI הוא מירוץ הדאטה.
הדאטה: המדד הבלתי מעורער להצלחה
בעשור האחרון, עולם ה-AI עבר ממהפכת המודלים המסורתיים ל-Generative AI ואף ל-Agentic AI. המעבר הזה מייצר אתגר חדש לגמרי- מודלים של AI הפכו במידה רבה לקומודיטי, וההבדל האמיתי בין החברות טמון ביכולת לנהל את הדאטה בחוכמה וביעילות. זהו שינוי תפיסתי , מעבר ממאגרי מידע סטטיים (Systems of Record) למערכות חיות ולומדות (Systems of Insight).
כמשקיעים שרואים את הנתונים, אנחנו עדים לכמה הופכת משימת ניהול הדאטה ל"כבדה יותר". כמויות הדאטה הנדרשות לאימון והפעלה של אפליקציות AI צמחו מגיגה-בייטים בודדים לפטה-בייטים של נתונים.
מרוץ החימוש החדש: איפה ההון זורם?
המספרים מדברים בעד עצמם- שוק ניהול הדאטה לאפליקציות AI צמח ל-25.1 מיליארד דולר ב-2023 וצפוי להגיע ל-70.2 מיליארד דולר עד 2028. זוהי צמיחה אקספוננציאלית שאנחנו מחויבים להיות חלק ממנה.
וההון זורם במהירות. רק ב-2024 גייסו חברות בתחום הליבה הזה כ-1.3 מיליארד דולר, עלייה של כמעט 200% לעומת 20239. עסקאות ענק, כמו זו של Vast Data, מאותתות שהשוק מוכן לתשתיות דאטה המספקות את הקצבים והגדלים הנדרשים ל-AI. אנו רואים את ההשקעות של ענקיות הטכנולוגיה, אך ההזדמנות הגדולה ביותר היא באקוסיסטם של הסטארט-אפים שמזהים קטגוריות חדשות.
ארבע קטגוריות ההשקעה הקריטיות שחייבות את הפתרון הבא
יזמים שחושבים על הפתרון הבא, צריכים להסתכל על הפערים שאנחנו כמשקיעים מחפשים:
- תשתיות ליבה לניהול דאטה (Data Infrastructure): מעבר לשחקנים הקיימים, כמו Vast Data ו- MIN.IO, אנו מחפשים פתרונות חדשים שיספקו יכולות עיבוד בקצבים מהירים, כמויות דאטה גדולות ממקורות מגוונים, בעלויות נוחות ואספקת תובנות בזמן אמת.
- תשתיות לעבודה עם LLMs: עם התפוצה של מודלי שפה גדולים, אנו משקיעים רבות במסדי נתונים וכלים ייעודיים שיודעים לנהל את הדאטה של המודלים הללו ביעילות. חברות כמו Redis ו-Pinecone הן דוגמאות למובילות בקטגוריה.
- ניהול גרסאות דאטה (Data Versioning): אם יזם אינו מנהל גרסאות של הדאטה שלו, הוא לא יכול ללמוד מטעויות או לשחזר מודלים בהצלחה. זו קטגוריה קריטית שאנו רואים בה צורך גובר, עם חברות כמו LakeFS ו-Airflow בחזית.
- מסחור והבניה של דאטה לא מובנה (Unstructured Data): מרבית הדאטה העולמי הוא לא מובנה. הצורך להמיר דאטה זה למידע מובנה ש-AI יכול לצרוך מייצר קטגוריה עם פוטנציאל אדיר. חברות ישראליות כמו Flexor ו-Unstructured.io כבר מציעות פתרונות מרשימים כאן.
אם אתם רוצים לפרוץ קדימה עם סטארט-אפ AI, אל תבזבזו זמן במודל קצה נוסף. התחילו לחשוב על הקטגוריה הבאה של ניהול דאטה שעדיין מחכה לפתרון. העולם רווי במודלים, אבל צמא לתשתיות חכמות שידעו לארגן, לנקות, לשתף ולהנגיש את המידע שמניע אותם.
החברות שיצליחו לפתור את האתגרים הללו, שיסגרו את הפער בין כוח המחשוב לכוח הדאטה, לא רק ישתלבו במהפכת ה-AI, אלא יובילו את הדור הבא של החדשנות. זה המקום שבו אנחנו, כמשקיעים, שמים את הכסף שלנו, וזה המקום שבו הדור הבא של החברות יצמח.
----------
על הכותב: בראל כפיר, שותף בקרן Dell Technologies Capital, מתמקד באיתור חברות טכנולוגיה בשלבים מוקדמים בתחומי התוכנות הארגוניות, עם דגש מיוחד על תשתיות ארגוניות, בינה מלאכותית (AI) ואבטחת סייבר. DTC - היא קרן ההון סיכון של מייקל דל, קרן השקעות אמריקאית מובילה עם נוכחות משמעותית בישראל וצוות שותפים ישראלי חזק. הקרן פועלת כ-SINGLE LP, עם צוות שותפים רב-תרבותי הכולל מומחים מישראל, ארה"ב. מאז הקמת הקרן בשנת 2012 היא השקיעה כ- 2 מיליארד דולר בכ- 200 סטארט-אפים, רשמה מעל 85 אקזיטים ו-9 הנפקות ציבוריות.