העיירה השלווה דאבוס, באלפים של מזרח שווייץ מונה כ-11,000 תושבים. בעיקרון אין שם שום דבר מעניין, פרט לארבעה ימים בשנה בהם מתכנס הפורום הכלכלי העולמי. כל ההנהגה העסקית והפוליטית מגיעה לשם - מוולדימיר זלנסקי עד סם אלטמן (מנכ״ל OpenAI) וסאטיה נאדלה (מנכ״ל מייקרוסופט). ללא ספק אוסף מקבלי ההחלטות המשמעותי בעולם. (דרך אגב, הרבה מהפגישות שם הם off the record. מעניין 🤫)
הכנס השנה נפתח בדו״ח של קרן המטבע הבינלאומי שטען ש-60% מהמשרות היום בסכנה בעקבות AI. זו הייתה התחלה לאינספור דיונים נמרצים על הסכנות וההזדמנויות של AI.
(מי בכלל זוכר ששנה שעברה כל מה שדיברו עליו היה ההתחממות הגלובלית..)
לא סתם בכירי העולם חוששים:
גוגל לאחרונה הצהירה כי היא מתכננת לפטר כ-30,000 עובדים לאור התפתחויות בתחום ה-AI ורצון להחליף את אותם עובדים במערכות מבוססות AI. שימו לב, שכרגע זה ב"תכנון” ופורסם סמוך לדוחות הרבעוניים של גוגל ויכול להיות סתם איתות למשקיעים שהם מתייעלים. אבל עדיין..
לאחרונה ChatGPT הצליח לקבל רישיון לעסוק ברפואה בארה"ב. אז האם גם עתיד הרופאים בסכנה?
החברה ElevenLabs, אשר גייסה מעל 100 מיליון דולר, מסוגלת להפיק קול על בסיס דוגמא של קול אחר. אני יכול, בקלות מדאיגה, ליצור נאום שלם (ב-ChatGPT, לדוגמא) בה אני מכחיש את קיומה של של השואה. לאחר מכן להעלות דוגמית קול של מישהו ידוע, נניח ג׳ו ביידן, והמערכת תחזיר לי את הנאום בקולו של ביידן. זה פרויקט של חצי שעה, במקסימום. תחשבו כמה הרס ניתן לזרוע באמצעות סרטון מיסאינפורמציה כזה.
אז, אמאלה?
נראה כי החשש ש-AI הולך להחליף אותנו במקרה הטוב, או להביא לקץ האנושות במקרה הרע, מבוסס על עובדות אמיתיות. האם עתידנו בסכנה? מה אנחנו יכולים לעשות כדי לשמור על הביטחון התעסוקתי שלנו, או סתם על הביטחון שלנו?
כדי להתייחס לסוגיה הזאת, צריך להבין לעומק מול מה כרגע אנחנו עומדים.
ספוילר - השבועות הקרובים יעסקו, ניחשתם נכון, ב-AI:
בפוסט זה נתמקד בלהסביר (בקצרה) מה זה AI ואיך הגענו לימינו אנו.
קיצור תולדות ה-AI
תאמינו או לא, יש לנו היסטוריה ארוכה עם AI. המונח בינה מלאכותית (Artificial intelligence) נטבע ב-1956, וכבר אז נבנו המודלים התיאורטיים שעל בסיסם פותחו כל מוצרי ה-AI. הסיבה שלקח כל כך הרבה זמן ליישם אותם (קראו לתקופה הזו AI winter) היא מגבלה ביכולות החישוב של המחשבים.
בסוף המאה ה-20, AI חזר להיות בעניינים משתי סיבות עיקריות: התפתחות יכולות המחשוב והעובדה שהתחלנו לאסוף המון נתונים (Big data).
איך איסוף נתונים עוזר לנו?
נניח שאנו רוצים לפתח תוכנה שבהינתן גודל דירה במ״ר ושכונה בתל אביב, עליה להחזיר את ערכה המשוער של הדירה.
דרך אחת היא לכתוב המון תנאים - אם גדולה מ-100 מ״ר ובשכונת תל ברוך אז 5,000 ש״ח; אם קטנה מ-50 מ״ר ובשכונת בבלי, אז 2,000 ש״ח. הבעיה שיש המון תנאים.
דרך נוספת, במקום לחשוב על אותם תנאים, אנו מזינים את המערכת בהרבה דוגמאות של גודל/שכונה/מחיר והמכונה ״לומדת״ בעצמה מה המחיר הרצוי. ככל שנזין למערכת יותר דוגמאות עבר (נתונים), כך היא תהיה יותר אפקטיבית.
אופי הפעולה הזה זהה שאיך שאנחנו, בני האדם, לומדים דברים חדשים. רק שפה זה בינה מלאכותית. aha! 💡
ֿקל לראות איך יש כאן יתרון מובהק לגודל - חברות ענק כמו גוגל ואמאזון מכילות כמויות עצומות של מידע על המשתמשים שלה, ולכן מודלי הבינה המלאכותית שלהן יהיו הרבה יותר חזקים משל סטארטאפ מתחיל.
מ-AI ל-Generative AI
הדור הבא של מודלי ה-AI הוא מודלים יצרניים (Generative). החידוש כאן הוא שהם אשכרה מייצרים משהו חדש - טקסט, תמונה, וידאו וכו׳.
למרות שמתחת למנוע יש מודלים סופר מורכבים, הבעיה שהם פותרים היא די פשוטה.
מכירים את המשלים האוטומטי בטלפון? נניח ואנו כותבים ״היי, מה״, המשלים האוטומטי, יציע לנו את המילים ״נשמע״, ״המצב״ או ״קורה״. איך הוא יודע שזה מה שאני רוצה לרשום?
הטכנולוגיה של מודלי שפה גדולים (LLMs) כמו ChatGPT מבוססת על עיקרון דומה לזה של המשלים האוטומטי בטלפון. המשלים האוטומטי למד לחזות את המילה הבאה במשפט על בסיס ניתוח של מיליוני שיחות. כך גם LLM כמו ChatGPT למד לחזות משפטים ופסקאות שלמות בהתבסס על ניתוח של טקסטים רבים באינטרנט. המודל מקבל "הנחיה" ראשונית (prompt) ואז מנסה לחזות את ההמשך הסביר ביותר בהתבסס על ההתנסות שלו. יכולת החיזוי המתקדמת הזו מאפשרת יצירת טקסט קוהרנטי ומשכנע.
זה אותו דבר גם בעולמות של ייצור תמונה - רק כאן צריך לחזות את הפיקסל הבא.
אין ספק שמדובר בטכנולוגיה פורצת דרך שיש לה אינסוף יישומים. מצד שני, אם המודלים הללו חוזים את המילה הבאה, מה קורה כשהם חוזים משהו שקרי או מומצא לחלוטין (מה שנקרא, בעיית ההזיה)?
בפוסט הבא ננסה להבין מה אפשר לעשות עם הטכנולוגיה הזאת ואיך מתמודדים עם המגבלות שלה.