הרגע המכונן של DeepSeek-R1: איך מודל AI בקוד פתוח מסין משנה את מפת הטכנולוגיה הגלובלית?

יניב גולן

11:04, 26.01.25

תגיות:

קוד פתוח

DeepSeek-R1

כאשר התפרסמה מלפני מספר ימים הידיעה על DeepSeek-R1, מודל AI בקוד פתוח שפותח על ידי סטארט-אפ סיני, זה נשמע בתחילה כמו עוד השקה שגרתית. כיום נראה שכל שבוע יוצא מודל חדש המבטיח להיות "קפיצת הדרך". אבל אז, DeepSeek-R1 עשה משהו שונה: הוא משך תשומת לב רבה בקהילת הטכנולוגיה בזכות יכולותיו להשוות ולעיתים להתחרות עם מודלים מתקדמים יותר של OpenAI במשימות כמו מתמטיקה ותכנות, וכל זה בתקציב ובמשאבים נמוכים בהרבה.
מנקודת המבט שלי, כשותף בקרן הון סיכון בשלבים מוקדמים שנמצא שנים בזירה של חברות טכנולוגיה עמוקות, השינוי הזה שבו צוותים קטנים וממוקדים מצליחים לערער תאגידים ענקיים הוא דפוס מוכר. ראיתי סטארט-אפים שהתמודדו עם האתגרים הקשים ביותר בעיצוב חומרה, עם מעבדים שמצליחים לשפר את יחס הביצועים לאנרגיה פי שלושה, ותוכנות שמפחיתות צווארי בקבוק בעומסי GPU. כמעט בכל המקרים, הקפיצות הגדולות לא נבעו ממשאבים בלתי נגמרים, אלא מחשיבה רעננה ופתרונות לא שגרתיים.
DeepSeek-R1 מגלם את אותו סיפור של אנדרדוג. הוא דחה את הגישה ה"מסורתית" שמבוססת על כוח עיבוד עצום לטובת גישה חכמה וחסכונית יותר. במקום להסתמך על מערך שבבים יקר, הוא מצליח להצטיין במשימות מורכבות באמצעות אדריכלות חדשנית מסוג Mixture-of-Experts) MoE), אשר מפעילה רק 37 מיליארד פרמטרים מתוך 671 מיליארד אפשריים בכל שלב עיבוד. זה לא רק הישג טכני—זה רמז משמעותי על איך העתיד של עולם ה-AI עשוי להיראות.
תפנית סינית ותחרות עם ארצות הברית
במשך שנים ארצות הברית הובילה את תחום ה-AI, במידה רבה בזכות תשתיות ענן מתקדמות ושבבי GPU חזקים. אבל DeepSeek-R1 מערער את ההנחה המקובלת שצריך משאבים עצומים כדי להתחרות בצמרת. הצלחת המודל מבוססת על גישה אלגוריתמית מתקדמת שצמצמה את התלות בשבבים המתקדמים ביותר, ובמקומם השתמשה DeepSeek בשבבים נחותים יותר להם היתה לה גישה,  כמו ה-A100 ומאוחר יותר H800 של Nvidia, ובכך הוכיחו שאפשר לעקוף סנקציות אמריקאיות על ידי מיצוי יעיל של חומרה קיימת.
המודל משנה את כללי המשחק במרוץ החימוש בתחום ה-AI. במקום לחשוב שרק כסף וכוח עיבוד ינצחו, DeepSeek-R1 מוכיח שחדשנות אלגוריתמית ושיתופי פעולה בקוד פתוח יכולים לשנות את המפה. עבור מדינות קטנות עם תעשיות טכנולוגיה תוססות, כמו ישראל, זהו שיעור חשוב: היתרון המשמעותי הוא לא תמיד בכסף' אלא בגמישות ובתעוזה.
כוחו של קוד פתוח
אחת המחלוקות החמות ביותר בתחום ה-AI היא השאלה האם לשחרר קוד מקור או לשמור עליו סגור. מצדדי הקוד הפתוח טוענים שהוא מקדם חדשנות ומאפשר תחרות הוגנת—כל אחד יכול לתרום שיפורים, לזהות פגמים או ליצור פתרונות חדשים. מתנגדי הקוד הפתוח מזהירים מפני שימוש לרעה, סוגיות קניין רוחני ואתגרי מוניטיזציה. DeepSeek-R1 הציב את עצמו בבירור במחנה הקוד הפתוח, מהלך שהדהד בכל התעשייה. בתקופה שבה חלק מהמעבדות הגדולות מגבילות את השקיפות, הופעתו של מתחרה פתוח שמציג ביצועים כמעט שווי ערך שולחת גלים של השפעה.
בישראל, עם היצירתיות והחדשנות הטכנולוגית שלה, יש פוטנציאל עצום להוביל מגמות כאלה. המפתח הוא להבין איך למנף את הלקחים מ-DeepSeek-R1 כדי לקדם צוותים קטנים להגיע לתוצאות ענק.
כשהפוליטיקה והטכנולוגיה נפגשות
עם זאת, DeepSeek-R1 אינו חף מבעיות. הסתבר שלמודל יש שכבת צנזורה שמגבילה תגובות בנושאים פוליטיים רגישים. משתמשים שניסו לשאול על אירועים היסטוריים מסוימים נתקלו בתגובות מרוסנות או חסומות. הדבר עורר דיון חשוב על הקונפליקט בין "קוד פתוח" לבין "מגבלות פוליטיות". אם מודל מוגבל לציית למדיניות תוכן של מדינה מסוימת, עד כמה הוא באמת "פתוח"?
1 צפייה בגלריה 
יניב גולן 
(צילום: סטודיו שבע)
חשוב לזכור שצנזורה או מגבלות תוכן קיימות גם במודלים מערביים, לרוב מסיבות של הגנה על מותג או עמידה בדרישות רגולטוריות. עם זאת, במקרה של DeepSeek-R1, השאלות הגיאופוליטיות בולטות במיוחד. אם AI מתקדם נשלט על ידי כוח מרכזי, מה תהיה ההשפעה על השיח הבינלאומי?
מחלוקות סביב קניין רוחני ואתיקה
הדיון סביב DeepSeek-R1 אינו שלם ללא התייחסות למחלוקות על השימוש בנתונים ובתוצרי מודלים אחרים לצורכי אימון. נטען כי המודל הסתמך על נתונים שנוצרו על ידי מודלים גדולים אחרים, scr שמעלה שאלות על זכויות יוצרים ואחריות אתית. ככל שמודלים פתוחים ימשיכו להתפתח, ניתן לצפות לוויכוחים חריפים יותר סביב השאלה "למי שייכות היכולות של מודל ה-AI?"
מבט קדימה: הזדמנות לישראל
מעבר לסיפור הגלובלי, DeepSeek-R1 טומן בחובו מסר חשוב לישראל ולמדינות קטנות אחרות: לא חייבים תקציב עתק כדי לחדש ולהתחרות. צוותים מוכשרים שימקדו מאמצים בגישות כמו אופטימיזציה של חומרה ותוכנה יכולים להשיג תוצאות משמעותיות. ישראל, או לפחות החלק שלה שעדיין רוצה להיות הסטארטאפ ניישן, יכולה ללמוד מ-DeepSeek-R1 כיצד לשלב חדשנות עם מגבלות משאבים. הטכנולוגיה בקוד פתוח מציעה הזדמנות מיוחדת ליזמים מקומיים לפרוץ גבולות ולהתחרות בשוק הגלובלי — לא בזכות היקף אלא בזכות חוכמה ואומץ.
לחלופין, תמיד אפשר להמשיך ולדון במקום בפרגולה של השופט עמית, ושיהיה לנו בהצלחה! 
יניב גולן הוא שותף בקרן הון סיכון Lool Ventures המשקיעה בסטרטאפים בשלבים מוקדמים