logo
Robot creating artificial intelligence in a digital brain 3D rendering
צוף בר אור

צוף בר-אור,

AI researcher in the natural sciences & AI consultant

מורה נבוכים למהפכת ה-AI

2023-08-07

6 דקות קריאה

כל הבסיס, בשפה של בני אדם, כדי לא להשאר מאחור.

תוך חודשים ספורים מונחים שהיו נחלתם של מדעני נתונים החלו להופיע בחדשות. אי אפשר להסתובב עם התואר ״יזם״ בלי להכיר את עולם ה-AI, והכניסה לעולם התוכן הזה, שהוא ברובו מתמטי ומסובך, לא תמיד פשוטה. בואו ננסה לעשות בהכל סדר, ונבין את המונחים לשיחת מסדרון רצינית על AI. בלי מספרים או נוסחאות ובשפה קלה לעיכול.

למונח AI אין משמעות אמיתית. הוא שם שיווקי לאוסף של שיטות שבסופן ישנה מערכת שיודעת לבצע פעולה שעשויה להזכיר אינטיליגנציה, וגם זו הגדרה שהמצאתי עכשיו. אם נרצה להכנס לעולם המקצועי ולא השיווקי, עלינו להכיר את המילים מערכות מומחה, לימוד מכונה ולמידה עמוקה.

מערכות מומחה הן ה-AI של פעם. האם טייס אוטומטי הוא AI? תלוי את מי שואלים. הוא מסוגל לבצע פעולות מורכבות שגורמות למטוס להשאר באוויר, אך אף אחד לא חשב ב1912, כשהומצא הטייס האוטומטי הראשון, לקרוא לו AI. מדובר במערכת שיודעת להגיב בעזרת סט סגור של חוקים. כשהסט הזה קטן, אנחנו נוטים לקרוא לזה ״מכונה״. גם כשסט החוקים ענק וסבוך, כמו בכל האלגוריתמים שאחראיים לפיקסלים שאנחנו רואים על המסך, אנחנו לא קוראים לזה AI.

למה? כי אנחנו יודעים שמישהו כתב את החוקים הללו. מערכות מומחה, מוסבכות ככל שיהיו, הן הקוסם שמסביר איך הוא עשה את הטריק. היתרון במערכות האלה היא המוסברות שלהן. כמובן שיכולות להתרחש תקלות, אך ניתן לחקור אותן, לאתר את הכלל במערכת שגרם להן ולתקן אותן. יש לנו שליטה מלאה על דרכי הפעולה שלהן, והן פותרות את רוב הבעיות בעולם.

ההגדרה העממית של AI מתייחסת בעיקר ללימוד מכונה. גם בלימוד מכונה מתקבלת בסופו של דבר מערכת חוקים שמסוגלת לבצע מטלה. ההבדל הוא בשאלה כיצד החוקים הללו נבנים. במערכות המומחה ישב צוות ועמל על כתיבה ומימוש כל הכללים שעל פיהם המערכת עובדת. במערכות מבוססות לימוד מכונה נאסף מידע רב על הבעיה, כל בעיה וכל הפתרונות המוצעים לה. המודל, שזה השם שאנחנו נותנים לאלגוריתם לומד, הסתכל על המידע ועל הפתרונות ובנה לעצמו מערכת חוקים שמאפשרת לפתור אותה. תהליך בנית החוקים נקרא אימון.

נשמע נפלא בתאוריה, הרבה יותר קשה בפרקטיקה. הבעיה העיקרית היא שהחוקים הללו נכתבים בשפה שלרוב אנחנו לא יודעים להבין. הם מתחבאים בהררי מספרים ובמקרים רבים לא ניתן להבין מדוע המודל טועה. אם זה לא מספיק, עלינו לאסוף מספיק מידע שייצג כראוי את עולם הבעיה. אם אנחנו רוצים ללמד מודל להבדיל בין חתולים לכלבים, נצטרך אוסף עם כמות אדירה של וריאציות של בעלי החיים האלה. שיטת לימוד המכונה הזו, שבה אנחנו מראים למודל דוגמאות רבות של מאפיינים (הפיקסלים בתמונה) שעל בסיסם המודל צריך ללמוד תיוגים (התשובה: זה כלב) מכונה למידה מונחית (Supervised Learning). 

בלמידה המונחית אנחנו, באופן לא מפתיע, נותנים למחשב הנחיות ברורות - זה א׳, זה ב׳. הוא בדרך כלל מתחיל מניחושים אקראיים, ואז לומד מהשגיאות שלו ומשתפר. גם את העולם הזה ניתן לחלק לשניים: בעיות רגרסיה, ובעיות סיווג - משימות הלמידה. בעיות רגרסיה הן בעיות בהן הדבר שאנחנו רוצים ללמוד הוא ערך מספרי רציף. מודל שצריך להסתכל על הסביבה וללמוד את המהירות הנכונה לרכב הוא מודל רגרסיה. בעיות סיווג הן בעיות בהן צריך להחליט לאיזה קטגוריה משתייך הדבר אותו אנחנו רוצים לסווג, ״כלב״ או ״חתול״, ״וירוס״ או ״לא וירוס״, אין באמצע.

סוג נוסף של שיטת לימוד מכונה נקרא באופן לא מפתיע למידה לא מונחית (Unsupervised), והוא תחום מעניין לא פחות, ביחוד יזמים. בלמידה לא מונחית אין לנו משימת למידה מוגדרת. אחד השימושים המוכרים של למידה לא מונחית היא אשכול (Clustering).

אשכול הוא הפעולה של חלוקת מידע לקבוצות בעזרת כלים מתמטיים. המשמעות היא שניתן, לדוגמא, לקחת נתוני מכירות ולשאול אותם את השאלה ״האם יש פה סוגי לקוחות שונים?״. מודל האשכול יכול לנסות לחלק את הלקוחות שלכם לקבוצות בעזרת מתמטיקה טהורה. החלוקה הזו היא בסיס להעמקה במאפייני כל קבוצה, ואולי בניית מודל עסקי מתאים.

 

 

סביב שנת 2015 פרצה לעולמינו הלמידה העמוקה. הלמידה העמוקה היא דרך ללמוד, ולא משימת למידה בפני עצמה. מדובר בשיטה שיכולה לייצר ולזקק בעצמה מאפיינים שעליהם המודל צריך להסתכל כדי להצליח במשימת הלימוד, כל זה בשיטה של לימוד מונחה. בעולם הראיה הממוחשבת ניתן להזין כקלט את כל הפיקסלים של התמונה, ומודל הלמידה העמוקה לומד בעצמו כיצד לזקק ממנה את האינפורמציה הרלוונטית.

רשתות הנוירונים, שהן האלגוריתם שנמצא בלב הלמידה העמוקה, הן כמו פלסטלינה שניתן לעצב בדיוק סביב הבעיה אותה רוצים לפתור. הן יכולות, אם נעבור עולם תוכן מתמונות לטקסט, ללמוד בעצמן קשרים בין מילים בתוך משפט ופסקה וכך להבין טקסט מבלי שהוזנו בהן חוקי דקדוק. הן יכולות, בהינתן טקסט, לחזות מה צריך להיות הטקסט התגובה - והרי לכם ChatGPT. המנוע שעומד מאחורי הצ׳אט הוא רשת נוירונים שמשימת הלימוד שלה הייתה פשוטה יחסית - השלמת משפטים.

השלמת המשפטים מחייבת הרשת ״להבין״ היטב את השפה, מה בא אחרי מה ולמה. ההבנה היא לא המשימה, היא תופעת לוואי. המודל שעומד מאחורי ChatGPT קצת יותר מורכב מזה, אבל הרעיון הבסיסי זהה. זאת תופעה די מדהימה. האלגוריתם מצליח, מבלי שהוגדר לו מראש, ללמוד מבנים מורכבים בתוך משפט, להבין תמונות, אודיו, טקסט ואפילו מולקולות בעזרת משימות למידה פשוטות למדי ומבלי שהיינו צריכים ״להנדס״ לו משהו נוח לראות.

המודלים העמוקים מייצרים בתוך עצמם עולם פנימי עשיר שניתן לנצל. שיכון (Embedding), הוא היכולת לייצג קונספט לא מספרי כמו טקסט, תמונה, וידאו או קטע קול כישות מספרית (וקטור). כשמשהו מיוצג מספרית, אפשר למדוד אותו. מה שמדהים בעולם השיכון הוא שתמונות דומות רעיונית יהיו קרובות (פיזית, על ציר המספרים) אחת לשניה, ותמונות שונות רחוקות. רעיון דומה קיים גם למילים ומשפטים. נוכל לקבל מדד כמותי לקרבה בין שני אובייקטים מופשטים, כל זה על בסיס הלמידה של מודל הלמידה העמוקה שאומן לכל משימה שהצריכה ממנו ״להבין״ כדי להצליח.

תעשייה שלמה של בסיסי נתונים וקטוריים (וכאן שווה להזכיר את Pinecone הישראלית שמובילה בתחום) נוצרה סביב הרעיון הזה. שולפים את הייצוג הפנימי מתוך הקישקע של מודלי הלמידה העמוקה ומשתמשים בו ישירות למציאת דימיון בין אובייקטים. אם העסק שלכם עוסק בטקסט סביר להניח שתוכלו למצוא לקונספט הזה שימוש. מזמין אתכם לקרוא עליו יותר.

 

 

הנה, הגענו למילה שחיכיתם לה, GenAI, בינה מלאכותית גנרטיבית. גם כאן מדובר על שם מסחרי שכולל בתוכו כל מיני שיטות שהמשותף להן הוא התחושה שהבינה המלאכותית יוצרת משהו חדש. הרעיון בכל השיטות האלה דומה: המודל לומד התפלגות סטטיסטית כלשהי, התפלגות של הדבר אותו אנחנו רוצים לייצר, כשהיא מותנית (מלשון תנאי) במשהו. הרעיון הכי מוכר - טקסט לתמונה. מודלים כמו Dalle2 וMidjourney למדו ממיליוני צירופים של תמונות והתיאור שלהן.

ברמה הקונספטואלית, אפשר לחשוב שהמילה ״כלב״ ותמונה של ״כלב״ נתפשות באותו האופן בתוך הרשתות העמוקות, שהן בסיס הטכנולוגיה הזו. לא מדובר בכלב ספציפי, אלא בסוג של ״כלב סטטיסטי״ שהוא הממוצע של כל הכלבים שהרשת ראתה. אם נרחיב את ההתניה מ״כלב״, ל-״כלב שחור״, הרעיון המופשט יצטמצם גם הוא ל״כלב השחור הסטטיסטי״. בסופו של דבר, בהינתן כל הטקסט שכתבנו, הרשת דוגמת תוצאה מאותה הסתברות מסובכת, בדיוק כמו שהטלת מטבע דוגמת תוצאה מתוך הסתברות 50-50.

מכיוון שמדובר בתהליך של דגימה סטטיסטית, אם נכתוב לבינה המלאכותית ״כלב שחור״ נוכל לקבל מאות ואלפי דוגמאות שונות של כלבים שחורים. קצת קשה לעכל את הרעיון שכל האובייקטים המופשטים מומרים להתפלגות סטטיסטית שמבוטאת במספרים, אבל ככה זה עובד, ואת התוצאות כבר ראיתם בכל מקום. גם ChatGPT עובד באופן דומה. הוא לוקח את כל הטקסט שכתבתם, ומייצר התפלגות סטטיסטית לכל ההמשכים האפשריים למשפט. מההתפלגות הזו נדגם ההמשך, והנה התשובה.

יכול להיות שבסביבה המקצועית שלכם תשמעו את המונחים רשתות קונבולוציה וטרנספומרים. אז רק כדי להבין על מה מדובר, כדאי לדעת שמדובר על שיטות יחודיות לסידור רשתות נוירונים (או: ארכיטקטורות) שמאפשרות לכל התהליך הזה להתרחש.

המונח החשוב האחרון הוא AGI - Artificial General Intelligence, הגביע הקדוש. AGI הוא הפנטזיה על AI יודע כל, כזה שיכול למצוא תרופה לסרטן, לנהוג ברכב שלנו ולהכין לנו ארוחת בוקר. הAGI הוא קונספט שאין לו הגדרה ברורה, אבל כולנו יודעים לדמיין איך הוא בערך נראה. האם AGI יגיע בעתיד הקרוב? קשה להגיד.

בסופו של דבר, כל הרעיונות שמוצגים כאן הם ענף בעץ הסטטיסטיקה. המחמירים יגידו ש-AI הוא סטטיסטיקה שעברה Rebranding. איך שלא נראה את זה, המהפכה עדיין לא באמת התחילה. התחום מתקדם כל כך מהר שבקהילה המדעית עצמה יש תסכול מכך שעוד לא הספקנו לעכל את התגלית של אתמול, כבר מדברים על התגלית של היום.

בעולם היזמות אין תחליף ללהבין, באמת להבין, איך הדברים עובדים. לא צריך להיות מתמטיקאי כדי ללמוד את החוזקות והחולשות של המערכות האלה ואם תשאלו את דעתי - הלמידה תשתלם, כי הן הולכות ללוות אותנו עוד הרבה שנים קדימה.

הכותב הוא חוקר יישומי בינה מלאכותית במדעים המדוייקים ויועץ בתחום ה-AI, עוד תובנות – בחשבון ה-X שלו.

שתפו את הבלוג:

הירשמו לאיזור האישי

צרו פרופיל אישי באתר ותוכלו להתחבר לאחרים ואחרות, לקבל תכנים מותאמים אישית, ולשמור את התכנים שהכי מעניינים אתכם.