לפני מספר ימים נחשפו בטעות אלפי מסמכים פנימיים של גוגל, שחשפו את המנגנונים הסודיים שמאחורי מנוע החיפוש של ענקית התוכנה. הדליפה, שככל הנראה נגרמה על ידי בוט של גוגל ששחרר בטעות API (ממשק תכנות יישומים) פנימי ב-GitHub (שירות ניהול גרסאות ושירות אחסון), חשפה 2,500 עמודים של מידע רגיש, כולל פרטים על הנתונים שהחברה אוספת וכיצד הם עשויים לשמש באלגוריתם דירוג החיפוש השמור שלה. היום (חמישי) גוגל אישרה את האותנטיות של המסמכים הללו, והעולם כולו עוצר את נשימתו בציפייה לגלות את ההשלכות של חשיפה זו.
המסמכים המדוברים מפרטים נתונים שגוגל עוקבת אחריהם, שחלקם עשויים לשמש באלגוריתם דירוג החיפוש השמור שלה. המסמכים מציעים מבט חסר תקדים, אם כי עדיין מעורפל, אל מאחורי הקלעים של אחת המערכות המשמעותיות ביותר שמעצבות את הרשת. "אנו מבקשים להיזהר מלעשות הנחות לא מדויקות לגבי החיפוש על סמך מידע לא מבוסס, מיושן או חלקי", אמר דובר גוגל, דייויס תומפסון, ל-The Verge בהודעת דוא"ל.
קיומם של החומרים שהודלפו פורסם לראשונה על ידי מומחי קידום אתרים (SEO) רנד פישקין ומייק קינג, שכל אחד מהם פרסם ניתוחים ראשוניים של המסמכים ותוכנם מוקדם יותר השבוע. החומרים שהודלפו מצביעים על כך שגוגל אוספת ומבחינה פוטנציאלית משתמשת בנתונים שנציגי החברה אמרו שאינם תורמים לדירוג דפי אינטרנט בחיפוש גוגל, כמו קליקים, נתוני משתמשי כרום ועוד.
כמו כן, אלפי עמודי המסמכים משמשים כמאגר מידע לעובדי גוגל, אך לא ברור אם פיסות מידע המפורטות אכן משמשות לדירוג תוכן חיפוש - המידע יכול להיות מיושן, לשמש אך ורק למטרות הדרכה או נאסף אך לא בשימוש לחיפוש באופן ספציפי. המסמכים גם לא חושפים כיצד משוקללים אלמנטים שונים בחיפוש, אם בכלל.
עם זאת, המידע שהתפרסם צפוי לגרום לגלים בתעשיות קידום אתרים (SEO), שיווק והוצאה לאור. גוגל בדרך כלל מסתירה מאוד את אופן הפעולה של אלגוריתם החיפוש שלה, אך מסמכים אלו - יחד עם עדויות אחרונות בתיק ההגבלים העסקיים של משרד המשפטים האמריקאי - סיפקו יותר בהירות לגבי אילו אותות גוגל חושבת עליהם כשמדובר בדירוג אתרים.