מארטי קגן הוא יועץ וגורו לניהול מוצר. בספרו Inspired הוא מציג מתודולוגיה אשר מתמקדת בארבעה תחומים אשר נדרש לתת להם מענה לפני שמשיקים מוצר:
ערך (value) - האם משתמשים יקבלו מספיק ערך כך שישלמו על המוצר.
ישימות (feasibility) - מידת ההתאמה של המוצר למציאות ובמגבלות הקיימות. לדוגמא, לא ישים לפתוח עסק לנסיעות לחו״ל בעזרת סוס.
בר קיימא (viability) - האם המוצר מותאם לצרכי העסק, מייצר הכנסות העולות על ההוצאות, אינו כרוך בבעיות רגולטוריות או אתיות, וניתן למכירה על ידי צוות המכירות הנוכחי.
שימושיות (usability) - האם משתמשים ידעו איך להפיק ערך מהמוצר?
המועמדים לאוסקר בקטגוריית AI ל-2024 הם:Gemini
בינואר 2024, פרסמה גוגל סרטון (שווה צפייה) אשר מדגים את יכולותיו של מודל השפה שלהם - Gemini. הדמו משאיר את הצופים פעורי פה:
המודל מסוגל להגיב לפקודות (prompts) מבוססי טקסט ותמונה - מה שנקרא, מולטי-מודאלי.
יכולות הבנת הקונטקסט של השיחה והתאמת התשובות אליה פנומנלית. מרגיש ממש כמו שיחה עם אדם אמיתי.
המודל מפגין ידע במגוון רחב של תחומים והתגלה כיצירתי (ואפילו הומוריסטי) מאוד בתשובות שלו.
רק שהתגלה שגוגל עשתה כמה שינויים לדמו לפני שפורסם, שעיקרם:
התשובות שנתן Gemini היו אחרי שקיבל עוד פרומפטים שנחתכו בעלילה כדי לדייק את התוצאות.
הזמן שלקח למודל לענות נחתך בעריכה כדי להראות שהוא מהיר יותר משהוא בפועל.
גוגל עמדה בפני ביקורת קשה, כולל בקרב עובדיה, אשר האשימו את החברה בהונאת הציבור והצגת Gemini באופן לא ריאליסטי ומוגזם.
Sora
פברואר 2024, OpenAI השיקו מספר סרטונים אשר הופקו על ידי מודל הטקסט-לוידאו החדש שלהם שנקרא Sora. רמת האמינות ואיכות הסרטונים מדהימה. אי אפשר היה להתחמק מהסרטונים שלהם - כל ״משפיען AI״ פמפם אותם ברשתות החברתיות.
התגובות, כמובן, לא איחרו לבוא - מפיק הסרטים טיילר פרי הודיע כי החליט לעצור תכנית התרחבות של 800 מיליון דולר(!) באולפנים שלו בעקבות התפתחויות טכנולוגיות מסוג זה. מצד שני, גורמים בתעשייה טוענים שאין סכנה לעתיד הקולנוע, היות והסרטונים הללו כוללים הרבה טעויות (נניח אנשים עם שש אצבעות) ותהליך הפקת סדרה או סרט מורכב מדי להמיר במודל AI.
Devin
מרץ 2024, חברת Cognition Labs שחררה הדגמה של סוכן AI (כתבתי על סוכני AI כאן) בשם Devin - מהנדס תוכנה אוטונומי מבוסס AI, כמובן. הוא מסוגל לבנות לבד תוכנות שלמות מאפס, ממש כמו מהנדס תוכנה אמיתי. בדמו, הוא נראה פותר את הבאגים, מחפש תשובות לטעויות באינטרנט ואפילו תורם שינויים לפרויקטי קוד פתוח. גם Devin נהנה מחגיגת שיתופים, הייפ והסברים למה ״AI הולך לקחת לי את העבודה״. ל-Cognition גב יחצ"ני משמעותי - המשקיע העיקרי הוא פיטר ת׳יל, אחד היזמים של פייפל וממשקיעי ההון סיכון הבולטים בסיליקון ואלי.
And the Oscar goes to 🏆
אף אחד 🙃
אז מה משותף לשלושת פריצות הדרך הללו?
אי אפשר להשתמש במוצרים הללו בפועל. יש להם רק סרטוני הדגמה.
הם זוכים לקידום חסר תקדים, יש הטוענים חסר הצדקה, מצד משפיעני טכנולוגיה וקרנות הון סיכון.
חברינו Devin, Sora ו-Gemini סובלים ממספר קשיים אשר מעכבים אותם במעבר מדמו למוצר.
Gemini, סובל בעיקר מבעיות feasibility (ישימות) - נראה שעליהם לגרום למודל שלהם להיות הרבה יותר מהיר ומדויק לפני ששמים אותו בידם של משתמשים.
Sora המסכן סובל מאתגר מורכב יותר, בעיית ה-viability (בר-קיימא) - מודלי שפה ותמונה יקרים מאוד ועדיין לא נראה שהצליחו לייצר מודל כלכלי בר קיימא. בעולמות הוידאו זה אפילו עוד יותר יקר. לא ברור כמה זה יעלה לנו להשתמש ב-Sora, אבל זה לא הולך להיות זול בכלל.
אספקט viability נוסף הוא שכל המודלים הללו מייצרים תכנים עם בעיות אתיות קשות. דמיינו פרומפט ל-Sora בסגנון “נאום של ג'ון ביידן מכחיש את שואת היהודים” להצית את הדמיון.
ו-Devin החרוץ אולי מסוגל לעבוד לבד, אבל יהיה קשה לראות אותו מקבל החלטות מורכבות בהנדסת תוכנה כמו ארכיטקטורה, צבירה או תשלום חוב טכני (tech debt), מהו ה-design pattern הנכון ועוד. אלו פשוט החלטות, ובכן, אנושיות מדי.
אז האם יש לנו פה באמת מוצר אמיתי או שמדובר בבועה מלאה בדמואים חלולים?
בניגוד לטכנולוגיות בועתיות ואמורפיות כמו ה-Metaverse, ה-AI היא טכנולוגיה אמיתית שתפתור בעיות אמיתיות למשתמשים שיהיו מוכנים לשלם על כך. מצד שני, יש פה ללא ספק בועה, שמנופחת על ידי משקיעים ומובילי דעה בסיליקון ואלי מתוך מטרה להגדיל את ההשקעות שלהם ולייצר תחושת ביקוש (שקרית ברובה). אני לא מכיר אף חברה מבוססת מודל שפה (LLM) שהצליחה לייצר מוצר אשר עונה על ארבעת הסיכונים של קגן באופן שמאפשר לנהל חברה לטווח הארוך ולא להתבסס על סבבי גיוס.
AI אכן יפרוץ למיינסטרים, אבל זה ייקח זמן. האם חברות יספיקו להגיע ליעד הנכסף או שייגמר להן הכסף בדרך?
ניקח את האינטרנט - הטכנולוגיה פותחה בשנות ה-60׳ של המאה הקודמת, הפכה להיות ה-world wide web ב-1989, צברה פופולריות ראשונית עם הדפדפנים של שנות ה-90’, נכנסה למיינסטרים בתחילת שנות ה-2000 עם כניסת האינטרנט בפס רחב ורשתות חברתיות, והפכה למה שהיא היום בעשור של 2010 עם כניסת הסמארטפונים. לקח זמן…
Well written