דיפסיק ממשיכה להדהים: מודל התמונות שכולם מדברים עליו

וואלה האתר המוביל בישראל - עדכונים מסביב לשעון

DeepSeek/GettyImages

חברת דיפסיק (DeepSeek), שהחלה את דרכה כחברת סטארטאפ סינית צנועה, ממשיכה להדהים את תעשיית הטכנולוגיה העולמית. לאחר שהצליחה לערער את שליטתן של ענקיות טכנולוגיה כמו אנבידיה (Nvidia), OpenAI ומיקרוסופט בזירת הבינה המלאכותית, היא מציבה לעצמה מטרה חדשה ושאפתנית: כיבוש תחום יצירת התמונות באמצעות בינה מלאכותית.

במסמך טכני שפרסמה החברה השבוע, נחשף כי מודל הדגל החדש שלה, Janus-Pro-7B, הצליח לעקוף את המודלים המובילים של OpenAI (DALL-E 3) ושל Stability AI (Stable Diffusion) במבחני ביצועים ליצירת תמונות באמצעות הנחיות טקסט. המודל החדש נחשב לשדרוג משמעותי של מודל Janus שהושק בסוף השנה שעברה.

החברה דיווחה כי המודל החדש עושה שימוש ב-72 מיליון תמונות סינתטיות באיכות גבוהה, יחד עם נתונים מהעולם האמיתי, על מנת לייצר תמונות יציבות, עשירות בפרטים ומותאמות להנחיות הטקסטואליות. כמו כן, דיפסיק שיפרה את תהליכי האימון, איכות הנתונים וגודל המודל, שהגיע ל-7 מיליארד פרמטרים.

המודל Janus-Pro-7B הוכרז לאחר ההצלחה של צ'אטבוט ה-AI של דיפסיק, המבוסס על DeepSeek-V3, שהפך לאפליקציה החינמית המדורגת במקום הראשון בחנות האפליקציות של אפל בארה"ב.

מה ההבדל בין DeepSeek למתחרות? בניגוד למודלים מתקדמים אחרים, שדורשים "ליטוש" (Fine-Tuning) בפיקוח אנושי, R1-Zero אומן בשיטה שנקראת למידת חיזוק (Reinforcement Learning). המשמעות היא שהמודל למד לבד לשפר את הביצועים שלו, ללא מעורבות אנושית בתהליך. זה כמו ללמד רובוט לשחק שחמט - ואז לתת לו להתאמן מול עצמו עד שהוא הופך לאלוף, בלי שאף אדם ידריך אותו.

הגישה החדשנית הזו מספקת לא רק פתרון טכנולוגי מתקדם, אלא גם יעילות כלכלית שמייתרת את הצורך בהשקעות עצומות בתהליכים מסובכים. DeepSeek לא רק חוסכת משאבים, אלא גם מציעה דרך פשוטה יותר להפיק תוצאות מדהימות - מה שמסמן שינוי פוטנציאלי במירוץ הבינה המלאכותית.

טרם התפרסמו תגובות