המנוע שמאחורי סירי: ניואנס עובדת על פיתוח מוצרים בעברית
פיטר מהוני, סמנכ"ל השיווק של החברה שמפתחת תוכנות זיהוי קולי, מגיע לכנס בארץ ומבטיח התאמה של מוצרי החברה לקהל הישראלי
לקראת כנס זיהוי דיבור של ארגון AVIOS ישראל וארגון המרכז לעיבוד שפה במכללת אפקה להנדסה שייערך בשבוע הבא במכללת אפקה להנדסה שבתל אביב, שוחחנו עם סמנכ"ל השיווק העולמי של ניואנס, פיטר מהוני, שיגיע לכנס כאחד מאורחי הכבוד.
כיצד היית מגדיר את המוצרים של ניואנס?
"ניואנס מאפשרת תקשורת מילולית בין אנשים למחשבים. זיהוי קול טבעי, ללא צורך מצד המשתמש להתאים את עצמו לתוכנה. התפקיד שלנו הוא בעצם לספק את המנוע שמפעיל את זיהוי הקול במחשבים ומוצרי אלקטרוניקה צרכניים".
מהי התפלגות הפעילות של ניואנס?
"המוצרים העיקריים שלנו הם בתחומי הסלולר והמחשבים, ובנוסף בתחום מוצרי אלקטרוניקה צרכנית כגון טלוויזיות חכמות. תחום הטלוויזיה מתפתח בעיקר בסמסונג ו-LG. הטכנולוגיה שלנו מניעה את השלט החכם של LG למשל. תוכנת 'דרגון' היא מוצר מוביל לתחום המחשבים".
כחברה המפתחת טכנולוגיית זיהוי דיבור, האם ישנם תחומים בהם אתם פעילים מעבר לשליטה במחשבים וטלוויזיות או בתחום תוכנות המזכירות הווירטואלית?
"תחום שבו אנחנו מהמובילים בעולם, הוא שירות הלקוחות האוטומטי, למשל בתחום מוקדי שירות לקוחות שמאפשרים ללקוחות לדבר באופן טבעי עם מוקד ממוחשב. חלק גדול מהמוקדים עובדים עם תוכנות ומנועי זיהוי דיבור של ניואנס", מהוני מוסיף: "תחום נוסף בו אנו פעילים מאוד הוא שירותי הבריאות - 40% מההכנסות שלנו מגיעות משם. בעיקר בתחום התיעוד הרפואי. התוכנה שלנו משמשת בעיקר כשיטה לתיעוד בעל פה של פרוצדורות רפואיות מה שמשאיר את ידי הרופא פנויות".
מתי נזכה לראות מוצרי זיהוי קולי של ניואנס בעברית? האם סירי ישראלית מחכה לנו מעבר לפינה?
"לצערי אנו לא יכולים לספק מידע אודות מוצרים של אפל מכיוון שאנו חתומים עימם על הסכמים שמונעים זאת. ניואנס תציע מוצרים בעברית - בהתחלה ברמה של זיהוי דיבור בסיסי, כגון מערכות קול לטקסט. או מערכות שירות לקוחות, בהתחלה דרך מוצר של חברת צד שלישי, ובהמשך אנו מתכוונים לשחרר אפליקציות דרגון בעברית לסמארטפונים".
כיצד אתם מייצרים אפליקציה בעברית?
"אנחנו מייצרים מודל סטטיסטי של השפה שמבוסס על כמות גדולה של נתונים כתובים. אם על ידי איסוף מהאינטרנט, או מספרים. אנחנו מתאימים את המודל גם למשל לתחום שאליו הוא מיועד, למשל רפואה. אנחנו גם אוספים מידע אקוסטי זאת אומרת צלילים, אנחנו מקליטים כמה שיותר דוגמאות גם ברחוב וגם מהרדיו, הטלוויזיה ויצירות מוזיקליות. הרעיון הוא לאסוף כמה שיותר דוגמאות של טביעות קול שונות. כמובן שאנחנו לוקחים בחשבון גם את התקדמות השפה, המבטאים השונים ואופן הדיבור. שכן אדם בן 70 וילד בן 5 מדברים באופן שונה ועם אוצר מילים שונה".
איך אתה רואה את העתיד של הזיהוי הקולי?
"נוצר שינוי רציני בתחום בעקבות סירי לטובת זיהוי דיבור טבעי. נציג אפשרויות עתידיות לגבי הכיוונים הבאים בכנס. תחום חשוב נוסף הוא שימוש בטכנולוגיה לטובת הנכים: פעם נדרשו תוכנות מיוחדות, היום התוכנות הרגילות טובות מספיק לשימושם של נכים".