סגור
באנר דסקטופ כלכליסט טק
מייסד ו מנכ"ל OpenAI סם אלטמן ב ועידת ניו יורק טיימס 4.12.24
מייסד ומנכ"ל OpenAI סם אלטמן (צילום: Michael M. Santiago/Getty Images/AFP)

סם אלטמן מודה: "היינו בצד הלא נכון של ההיסטוריה - OpenAI שוקלת לפתוח את הקוד"

בעקבות המודל המוצלח של דיפסיק הסינית, חברת הבינה המלאכותית האמריקאית מתכננת לחשוף את תהליכי החשיבה של המודלים שלה ובוחנת שחרור גרסאות ישנות בקוד פתוח

אחרי ההפתעה של דיפסיק (DeepSeek), מייסד ומנכ"ל OpenAI, סם אלטמן מודה: הם צימצמו את ההובלה שלנו, "היינו בצד הלא נכון של ההיסטוריה".
בחודש שעבר הפתיעה דיפסיק הסינית את שוק הבינה המלאכותית (AI), כשהשיקה מודל בינה מלאכותית גנרטיבית (GenAI) בקוד פתוח שמשתווה ביכולותיו למודלים מתקדמים דוגמת אלו של OpenAI, ושלדבריה פותח בשבריר מעלות הפיתוח של מודלים אלו. בהמשך, עלו ספקות לגבי טענות דיפסיק, כאשר בין השאר התברר שייתכן שדיפסיק נעזרה בפיתוח המודל שלה ב-ChatGPT, השתמשה בשבבים של אנבידיה שרכשה בשוק השחור, ושעלויות הפיתוח של המודל היו גבוהות משמעותית מטענותיה ועברו למעשה את חצי מיליארד הדולר.
חרף גילויים אלו, אלטמן סבור שהמודל של דיפסיק מייצג שינוי משמעותי בתעשייה, ומשפיע גם על עמדתה של OpenAI. "ניצור מודלים טובים יותר בעתיד, אבל נתחזק הובלה פחותה מכפי שהיתה לנו בשנים קודמות", הוא אמר במענה לשאלות גולשים ברדיט.
אלטמן גם התייחס להחלטה של דיפסיק להשיק את המודל שלה בקוד פתוח, בניגוד ל-OpenAI שמנגישה את המודלים שלה רק בקוד סגור ושומרת על שליטה מלאה לגבי אופן השימוש בהם, והודה שמשהו בתפיסה של החברה בנושא זה צריך להשתנות. "אני חושב שהיינו בצד הלא נכון של ההיסטוריה ושאנחנו צריכים לחשוב על אסטרטגיית קוד פתוח חדשה", אמר. "לא כולם ב-OpenAI חושבים ככה, וזו גם לא העדיפות הגבוהה ביותר שלנו".
סמנכ"ל המוצר של החברה, קווין וייל, הוסיף ש-OpenAI שוקלת להנגיש בקוד פתוח מודלים ישנים יותר: "בהחלט נחשוב על זה יותר".
השפעה אפשרית נוספת של דיפסיק, לפי אלטמן, היא יצירת שקיפות גדולה יותר לגבי אופן החשיבה של מודלים. כיום, המודלים של OpenAI מסתירים את הליך החשיבה והסקת המסקנות שלהם, בין השאר כדי למנוע ממתחרים להשתמש בתובנות אלו בפיתוח המודלים שלהם. זאת, בניגוד למודל R1 של דיפסיק שמציג את שרשרת המחשבות המלאה שלו. "אנחנו עובדים על להציג יותר דברים מכפי שאנחנו מציגים כיום. בקרוב מאוד מאוד נציג את הליך החשיבה של המודל. עדיין לא הוחלט כמה להציג – הצגת כל שרשרת החשיבה מאפשרת למתחרים לנצל זאת, אבל אנחנו גם יודעים שאנשים רוצים את זה. אז נמצא דרך לעשות את זה באופן מאוזן", אמר.