זו לא סלין דיון:
?Paper Alert ?
— naveen manwani (@NaveenManwani17) February 4, 2025
➡️Paper Title: OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models
?Few pointers from the paper
?End-to-end human animation, such as audio-driven talking human generation, has undergone notable advancements in the recent… pic.twitter.com/BPpJOU8mQW
דמיינו עולם שבו כל סרטון שתראו עלול להיות מזויף לחלוטין, אך נראה אמיתי להחריד. זה לא עתיד רחוק, אלא מציאות שכבר מתקרבת אלינו בצעדי ענק. בעוד שחברות הטכנולוגיה השקיעו בשנים האחרונות משאבים עצומים כדי לפתח יכולות AI פורצות דרך, הן נזהרו עד כה מלעסוק בדבר אחד מסוכן במיוחד: דיפ-פייקים שמזייפים אנשים מפורסמים בצורה משכנעת. אולם, עם OmniHuman-1, כלי חדש ופורץ דרך מבית ByteDance (החברה שמאחורי טיקטוק), נדמה כי הגבולות נפרצו - לטוב ולרע.
OmniHuman-1 מציג יכולות דיפ-פייק מתקדמות ומעוררות השתאות. הכלי מסוגל ליצור סרטוני וידאו מזויפים באיכות גבוהה במיוחד, שמאתגרים את היכולת שלנו לזהות אם מה שראינו אכן קרה במציאות. בין הדוגמאות שהוצגו ניתן למצוא את מנכ"ל אנבידיה (NVIDIA), ג'נסן הואנג, שר בסינית; טיילור סוויפט שרה ביפנית; אלברט איינשטיין מדבר על רגשות; ואפילו דמויות משתתפות בהרצאות TED שמעולם לא התקיימו.
הרצאת TED שמעולם לא התקיימה:
More Halfbody Cases with Gestures: See how OmniHuman generates lifelike gestures from just one image and audio. Check out this little snippet from a TED talk inspired image. pic.twitter.com/1BFwBpRBOP
— ToriMukami (@ToriMukami) February 5, 2025
דיפ-פייק של טיילור סוויפט שרה ביפנית
Finally I'll be able to properly sing lol.
— Rodri Mora aka Bullerwins (@rodrimora) February 4, 2025
OmniHuman-1 paper just came out pic.twitter.com/WqhamHOsXW
לפי החוקרים של ByteDance, OmniHuman-1 נבנה בעזרת 19,000 שעות של תכני וידאו שנאספו ממקורות לא מזוהים. הכלי זקוק רק לתמונה אחת ולמקור שמע, כמו דיבור או שירה, כדי ליצור סרטון באורך בלתי מוגבל. יתרה מכך, הוא מאפשר התאמות מדויקות כמו שינוי יחס הממדים של הסרטון והתאמת הפרופורציות של הגוף. OmniHuman-1 יכול גם לערוך סרטונים קיימים, כולל שינוי התנועות של איברי הגוף, וכל זה עם תוצאה שנראית כמעט מושלמת.
אולם, OmniHuman-1 אינו חף מבעיות. תמונות באיכות נמוכה פוגעות בתוצאה הסופית, והמערכת מתקשה לעיתים במצבים מסוימים, כמו תנועות ידיים מורכבות. למרות זאת, מדובר בטכנולוגיה שמתקדמת בהרבה על פני שיטות הדיפ-פייק הקודמות. השימוש בדיפ-פייק כבר הוביל לאירועים מדאיגים ברחבי העולם. במהלך יום הבחירות בטייוואן בשנה שעברה, הופצה הקלטת דיפ-פייק שבה פוליטיקאי מביע תמיכה במועמד פרו-סיני. במולדובה, סרטון דיפ-פייק הציג את הנשיאה, מאיה סנדו, מתפטרת מתפקידה. ובדרום אפריקה, דיפ-פייק של הראפר אמינם הוביל לתמיכה במפלגת אופוזיציה.
בנוסף לפוליטיקה, דיפ-פייק משמש גם לביצוע פשעים כלכליים. צרכנים נופלים קורבן להונאות שבהן מוצגים סרטונים מזויפים של ידוענים המציעים הזדמנויות השקעה פיקטיביות, וחברות מאבדות מיליונים בגלל מתחזים שמנצלים דיפ-פייק.
דיפ-פייק: אלברט איינשטיין מדבר על רגשות
זה לא מנכ"ל אנבידיה:
NVIDIAのCEOが熱弁している内容とは?
— ジェイ | AIラッパー (@Jay_AIrapper) February 5, 2025
と思いきや、この動画は写真一枚から生成されたアバター動画なのです。
ByteDanceがOmniHumanという革命的なツールを発表。
写真一枚を、話す・歌う・ラップをしている動画に変えられます。
Bytedanceの追い上げが来てますね。pic.twitter.com/Oh8Klt4E5I
החשש הגובר מדיפ-פייק הוביל לקריאות לפעולה. בפברואר האחרון חתמו מאות אנשי קהילת הבינה המלאכותית על מכתב פתוח הקורא לרגולציה מחמירה בתחום. בארצות הברית, למרות היעדר חקיקה פדרלית, מעל ל-10 מדינות חוקקו חוקים נגד התחזות באמצעות AI. קליפורניה, למשל, שוקלת חוק שיאפשר לשופטים להורות על הסרת דיפ-פייקים ולחייב קנסות כספיים.
למרות המאמצים, זיהוי דיפ-פייק נותר משימה קשה. הרשתות החברתיות ומנועי החיפוש אמנם פועלים לצמצום התפוצה של תוכן מזויף, אך היקף החומרים המופצים גדל במהירות מדאיגה. בסקר שנערך במאי 2024 על ידי חברת Jumio, 60% מהנשאלים ציינו כי נתקלו בדיפ-פייק בשנה האחרונה, ו-72% מהם הביעו חשש מפני אפשרות להיות מרומים באופן יומיומי.
OmniHuman-1 והקשר לטיקטוק: סכנה נוספת מבית ByteDance
OmniHuman-1 הוא לא רק כלי טכנולוגי חדשני ומעורר חשש, אלא גם תזכורת לבעיות הרחבות יותר שמביא עימו תאגיד הענק הסיני ByteDance, המוכר בעיקר בזכות טיקטוק. הפלטפורמה הפופולרית, שהפכה לרשת חברתית עולמית עם מיליארדי משתמשים, מתמודדת בעצמה עם איומים על קיומה בארצות הברית בשל חששות בטחוניים וחשד להעברת נתונים לממשלת סין.
רק בחודש שעבר, ByteDance הפסידה בקרב בבית המשפט העליון בארה"ב, אך בעקבות לחץ ציבורי ומהלכים משפטיים נוספים, הנשיא לשעבר דונלד טראמפ, מיד עם כניסתו לתפקיד, חתם על צו נשיאותי שהעניק לטיקטוק ארכה של 75 יום. במהלכה, ByteDance נדרשת למצוא קונה אמריקני שירכוש את פעילותה בארה"ב, מהלך שמטרתו לנטרל את החששות של הממשל בנוגע לביטחון המידע ולשליטה הסינית בפלטפורמה.
בזמן שטיקטוק מתמודדת עם החששות המוכרים לגבי פרטיות ומשפיעה בעיקר על דפוסי השימוש של צעירים, OmniHuman-1 מציג איום חמור בהרבה. אם הפלטפורמה הקודמת שימשה בעיקר לשיתוף סרטונים והפכה לאמצעי בידור עולמי, הטכנולוגיה החדשה של ByteDance היא כלי שיכול לשמש להטעיה מאסיבית, לפגיעה באמון הציבורי וליצירת כאוס תקשורתי ברמות שטרם נראו.
התקווה היא שהפעם מדינות ורגולטורים יפעלו מהר יותר כדי לחסום את OmniHuman-1 או לפחות להטיל עליו רגולציה כבדה, בניגוד לטיקטוק שהפכה, על אף הסכנות הקטנות יחסית, לאחת הרשתות החברתיות הפופולריות בעולם. הסכנה הפוטנציאלית מהכלי החדש גדולה בהרבה, וכפי שההיסטוריה מלמדת אותנו - תגובה איטית מדי עלולה להוביל למציאות שבה קשה הרבה יותר להתמודד עם ההשלכות.
ByteDance, שעומדת מאחורי שני הכלים הללו, ממחישה שוב את כוחה והשפעתה בעולם הטכנולוגי. עם זאת, השאלות המטרידות לגבי המניעים שלה והשלכות השימוש בטכנולוגיות אלו ממשיכות להדהד, ומדגישות את הצורך בפיקוח בינלאומי ובמעקב מתמיד.