גוגל DeepDream: צייר לי כבשה מהגיהנום
אם נתקלתם ברשת לאחרונה בתמונות משונות שמלאות בעיניים ובראשי בעלי חיים, גוגל אשמה. חוקרים בחברה ביקשו ממערכת זיהוי התמונות שלה לצייר עצמים. התוצאה: פרויקט דיפ דרים, עליו הסתערו המפתחים והגולשים כדי להפיק שלל יצירות אמנות מטרידות
- מלכודת ה-AI: הכתבה שהרובוטים לא רוצים שתקראו
- השקעה של אלון מאסק תממן פיתוח מוסר אצל מחשבים ורובוטים
- גוגל פיתחה מחשב שיודע לצייר בהתבסס על דימיון מלאכותי
מי שאחראית לתופעת הרשת המשונה הזאת, מלבד הגולשים שמתעקשים לשתף את התמונות, היא לא אחרת מאשר גוגל. בתחילת החודש החליטה החברה להעלות לרשת פרויקט מחקר פנימי בשם "דיפ דרים" (DeepDream) בגרסת קוד פתוח המאפשרת למפתחים לערוך בו שינויים.
המתנה הזאת נפלה היישר לידיהם של אלפי מפתחים ומשתמשים, שהחלו לשחק עם הקוד וליצור תמונות מוזרות בעצמם. ואולם, הסיפור שמאחורי דיפ דרים מעניין אפילו יותר מהתמונות עצמן.
זאת בננה זאת?
מגיפת דיפ דרים החלה באמצע החודש שעבר בפוסט תמים שפרסמו בבלוג חטיבת המחקר של גוגל שלושה מהנדסי תוכנה - כריסטופר אולה, אלכסנדר מורדוינצב ומייק טיקה. המהנדסים רצו להבין מה בעצם מתרחש בקרבי האלגוריתם שגוגל פיתחה כדי ליצור כיתובי תמונה אוטומטיים ותיוגים אוטומטיים לתמונות.
האלגוריתם המדובר הוא אחד הניסויים המעניינים כיום בענף הבינה המלאכותית המכונה למידת מכונה, שבו מפתחים יוצרים מערכות מחשב המחקות את תהליכי החשיבה של המוח האנושי. החוקרים מאמנים את המערכת באמצעות הזנת מיליוני תמונות שאותן היא מנסה לזהות, ונותנים לה פידבק על רמת הדיוק של התוצאות, שגורם לה להשתפר ככל שמזינים לתוכה יותר דוגמאות. כך יכולה המערכת לנתח תמונה שלא נתקלה בה מעולם, שבה מופיעים לדוגמה קבוצת חברים המשחקים בפריזבי, ולחבר אליה כיתוב המתאר את הסיטואציה.
מוזר ככל שהדבר יישמע, אפילו המהנדסים שבנו את המערכת לא מבינים עד הסוף כיצד היא פועלת. אנו יודעים שתהליך הלמידה עצמו מבוסס על רשת של נוירונים וירטואליים, המחקים את פעילות יחידת העיבוד הבסיסית במוח, ויוצרים שכבות עיבוד שמפענחות תמונות ברמות שונות. ואולם, הסיבות להצלחת מודלים חישוביים מסוימים יותר מאחרים, הן עדיין בגדר קופסה שחורה עבור חוקרי התחום.
בניסיון להבין טוב יותר את המערכת החליטו החוקרים להפוך את רשת הנוירונים על ראשה, ולבחון מה קורה כשמשתמשים בה כדי לבצע תהליך הפוך מזה שהיא תורגלה בו. הם הזינו לתוכה מילים וצירופי מילים ("בננה", למשל), וביקשו ממנה ליצור תמונה שממחישה אותם, על הסמך הידע הדיגיטלי שהיא צברה בנוגע לדרך שבה אמורים להיראות החפצים המתוארים. התוצאה היא איננה תצלום של בננה, אלא תמונה צבעונית שנראית כציור אבסטרקטי, בדרך כלל עם שלל ראשים משונים ועיניים, אך היא תכיל בבירור צורה של בננה צהובה.
בנוסף הזינו החוקרים למערכת תמונות רגילות וביקשו ממנה לשנות אותן, באמצעות העצמת התבניות והאספקטים שאחת משכבות העיבוד שלה מזהה בתמונה. כיוון שעדיין לא ברור לחלוטין כיצד המערכת מחלקת את תפקידי השכבות, התוצאות יכולות להיות מפתיעות: ענן שקצת מזכיר ציפור או שולחן, לדוגמה, עשוי לכלול אלמנטים "ציפוריים" בגרסה אחת של האלגוריתם ואלמנטים "שולחניים" בגרסה אחרת, מבלי שהמפתחים יחזו זאת מראש. המערכת "אומנה" בעיקר בזיהוי תמונות של חיות, כך שריבוי התמונות מתוצרתה הכוללות בעלי חיים אינו מקרי.
יותר פחד ותיעוב
הרעיון המקורי מאחורי הכלי החדש היה לשפר את ביצועי אלגוריתם זיהוי התמונות, ולגזור ממנו תובנות שונות שיסייעו בכך: בזכות הפרויקט התברר, למשל, שהמערכת של גוגל אינה יודעת לצייר משקולות אימון ללא זרוע של מתעמל המחוברת אליהן. ואולם, חשיפת התמונות עוכרות השלווה עוררה עניין רב מצד גולשים, מפתחים ואמנים, שתהו אם מחשבים בעלי בינה מלאכותית יכולים להפיק יצירות אמנות של ממש.
בתחילת החודש הגיבה גוגל למתעניינים בכך שהעלתה את קוד המקור של דיפ דרים לאתר Github, כך שכל אחד יוכל לעבד באמצעותו תמונות נוספות, או לשנות את פעולת המערכת כדי לבחון את הנושא מזוויות אחרות. "יהיה מעניין לראות אילו תמונות אנשים יצליחו ליצור", כתבו בחברה, וביקשו מהגולשים להעלות את התמונות לרשתות החברתיות תחת התגית deepdream.
ההיענות היתה מיידית ורחבה: המיזם הפך לאחד הפופולריים ביותר בגיטהאב, כשהמפתחים יצרו עד היום יותר מ־1,300 גרסאות שונות של הקוד המקורי. אחד היישומים הפופולריים שלו הוא דף שיצר סטודיו יפני לעיצוב בשם Psychic VR Lab, שמציע למשתמשים ללא ידע טכני מחולל אוטומטי שאליו ניתן להעלות כל תמונה ולקבל את גרסת הדיפ דרים שלה.
עד כה ביקשו קרוב ל-200 אלף איש להשתמש בשירות, ו"יצרו" תמונות בעלות מראה שכבר הפך לאופייני (צ'אק נוריס אחרי השתלת עיניים, לווייתן שמעופף בין חלקי בעלי חיים אחרים, ויער שלא הייתם רוצים להיקלע אליו בשום נסיבות שהן). לצד המחולל של Psyshic VR ואחרים נפתחה באתר רדיט קהילה ייעודית לפרסום התמונות, שצמחה במהירות וכוללת כיום יותר מ-15 אלף חברים.
גוגל, סביר להניח, תיעזר בשמחה בתובנות ובקודים שהמפתחים יספקו לה כדי לחדד את אלגוריתמי הבינה המלאכותית שלה ולצבור יתרון על מתחרותיה (שיכולות, מצדן, לבחון בעצמן את אותם קודים). ואולם בניגוד לחוקריה של ענקית הרשת, שהתעניינו בעיקר בתובנות טכניות ומדעיות והזינו תמונות בהתאם, לרבים מחובבי המיזם היו רעיונות פרועים הרבה יותר.
אחת מקטגוריות ה-deepdream המטרידות ביותר, לדוגמה, הן תמונות עירום ופורנו שהוזנו לתוכה, ולא חסרות כאלה. בגרסאות שונות של האלגוריתם ניתן להשתמש גם כדי לעבד קטעי וידאו, דבר שהוביל ליצירת סרטון שזכה ליותר ממיליון צפיות ביוטיוב תוך כשבוע: סצנה באורך שתי דקות מהסרט "פחד ותיעוב בלאס וגאס", שהפך בזכות האלגוריתם לפסיכודלי אפילו יותר מכפי שהיה במקור. סרטון אחר מציג חלקים מתוך הסרט הקלאסי "2001: אודיסיאה בחלל", ובמקרה נוסף הוזנו למערכת צילומי מסך מתוך משחק הפעולה הקלאסי Quake.
"התמונות האלה נראות כאילו המנגנון הממוחשב הוא מוח שעובד תחת השפעת סמים. צפיתי ברובן בימים האחרונים והייתי מרותק למה שראיתי", אמר ל"כלכליסט" דורון ויידה, מעריץ נלהב של דיפ דרים, שבחן את הקוד וכמה מהמחוללים בימים האחרונים. "הכי מטריד היה מקרה שבו האלגוריתם איחד את הראש והיד של בת הזוג שלי, והפך אותה לסוס".
השאלה החשובה יותר, אחרי שמסיימים להתפעל או להיגעל, היא אם דיפ דרים הוא בסך הכל עוד שעשוע לא מזיק של גיקים, או שיש כאן יותר מזה, דבר מה בעל ערך אמנותי אמיתי או כזה שיכול לספק לנו הבנה טובה יותר של התודעה האנושית. המגזין "פסיפיק סטנדרד" כבר הקביל את התוצרים לזרם הקיטש באמנות הפלסטית, וקבע כי מדובר בז'אנר אמנותי חדש. גולשים אחרים, כמו כותב שורות אלה, בעיקר רוצים לחזור לישון בשקט, מבלי לראות בעיני רוחם גרסה עצומת ממדים, צבעונית מדי ובעלת אלף עיניים של החתול שלהם.