פורצי הדרך
המכונה של מיקרוסופט יודעת מה צילמתם
החוקרים של מיקרוסופט יצרו מערכת בינה מלאכותית שיודעת לבחון תמונות ולענות על שאלות מורכבות לגבי התוכן שלהן
- אינטליגנציה מלאכותית חושפת: כך תצלמו את הסלפי המושלם
- אפל מסתערת על תחום הבינה המלאכותית: רוכשת שתי חברות הייטק בתחום
- "לכל אדם ימשיכו להיות חברים. רק שחלקם יהיו בינה מלאכותית"
כאשר המערכת נשאלה, למשל, "מהו הדבר שמושך אדם על עגלה על עפר" היא ענתה "סוסים", וכשנשאלה "מהו צבע הקופסה". בתמונה שהראתה צמחים בתוך עציץ היא ענתה את התשובה המדויקת "אדום". על צילום של מטפסי הרים נשאלה "כמה אנשים מטפסים במעלה ההר עם מקלות טיפוס" והגיבה "ארבעה".
לבני אדם המטלה הזו אולי נשמעת טריוויאלית, אבל עבור מחשב מדובר במשימה מורכבת שכוללת כמה שלבים: המערכת צריכה קודם כל לאתר את כל העצמים שכלולים בשאלה, להבין קונספטים כגון "ישיבה" או "טיפוס", לנפות את העצמים הלא רלבנטיים שמופיעים בתמונה, ולבסוף לבודד את החלקים הנכונים ולזהות אותם במדויק.
פריצת הדרך התאפשרה באמצעות ההתקדמות הרבה שחלה בשנים האחרונות בתחומי ראיית המכונה וניתוח השפה הטבעית. חוקרי מיקרוסופט בחרו בגישה שעושה שימוש במספר שכבות מקושרות של רשתות נוירונים, מאותו סוג המשמש ליצירה אוטומטית של כיתובי תמונה ותרגום טקסטים אוטומטי שאנו מכירים מגוגל ומבינג.
לטכנולוגיה החדשה, אומרים במיקרוסופט, יכולים להיות יישומים שדורשים מתן המלצות בזמן אמת וזיהוי מוקדם של צרכים אנושיים, כגון מערכת התרעה לרוכבי אופניים שתורכב על הקסדה ותתריע מפני סכנות. באמצעות הפתרון של החברה היא תוכל לשאול את עצמה תוך כדי רכיבה שאלות רלבנטיות כמו "מהו הדבר מצד שמאל בהמשך הדרך" או "האם יש רוכבי אופניים אחרים שעומדים לעקוף" ולהשמיע באוזני הרוכב אזהרות כאשר היא תזהה מצבי סכנה פוטנציאלית.