Долго думал, что не буду про это писать. Но, почитав и исследовав вопрос, решил, что вам будет интересно.
На прошлой неделе начался большой бум среди всех, кто как-то завязан на поиск Гугла (а это почти весь современный интернет, все его разработчики). Некто "Erfan Azimi", владец SEO-фирмы внезапно начал показывать слитые ему документы о том, как устроено ранжирование в поиске Гугла. На самом деле всё чуть сложнее, не сам поиск, а различные API вокруг него, но, как вы понимаете, даже по этим API уже можно понять многое. Утечка произошла по ошибке, один из разработчиков в гугле написал программу для превращения API в вызовы на любимом им языке программирования, но вместо публичных вызовов выложил все (если вам интересно, я приложил ссылку на коммит, в котором содержатся все эти описания [1]).
Многочисленные проверки через разных бывших и действующих гуглеров говорят, что это не подделка, не шутка, а вполне реальная утечка, исследованием которой теперь очень озабочены все SEO-ресерчеры. Дам вам ссылку на самый глубокий из них [2], но если кратко, то вот что уже сейчас понятно:
– В поиске гугла есть белые списки сайтов, которые принудительно оптимизированы. Как минимум, это известно о некоторых тематиках, таких как выборы штатах в 2020 или ковид.
– Название домена, а так же субдоменов является значимой информацией (гугл всегда говорил что это не так).
– Есть отдельная песочница для новых сайтов. Гугл всегда это отрицал.
– В поиске напрямую используются данные из EWOK (это система, в которой живые люди сидят и за деньги оценивают, какой вариант выдачи в поиске лучше). Да, судя по всему, есть пользователи, которые своими глазами и мнением определяют, какой из нескольких сайтов лучше по некоторому запросу.
– Гугл активно использует информацию по поведению пользователей на сайте для ранжирования.
– Данные по тому, куда пользователь нажимает на странице, берутся не только из гугл-аналитики, но и напрямую из браузера Chrome.
– По количеству кликов на странице сайты делятся на три категории, для каждой из которых строится свой "ранг качества", более популярные по кликам сайты приносят бОльший вклад в пейджранк, т.е. более ценны.
– Гугл внутри учитывает размер бренда сайта, не только по самому сайту, но и в целом по упоминанию этого сайта в интернете (даже без ссылок).
– Контент и ссылки вообще вторичны, сейчас гораздо значимее именно клики и навигация по сайту (то что называют "поведенческий фактор").
– Как следствие, для большинства мелких компаний и сайтов SEO почти не значим, пока вы не создадите бренд, пользователей на сайте и репутацию для аудитории.
Безусловно, это самая значимая утечка про поиск гугла за последние 10-15 лет. По ней очень вероятно, что гугл часто врет, когда публично рассказывает о поиске [3]. Скорее всего, надо переставать верить, что "content is king", кликбейты + фермы ботов — вот нынешний путь к успеху в SEO. Разумеется, гугл от комментариев отказался [4]. Если вам хочется почитать на эту тему еще что-то — вот неплохая статья в iPullRank [5].
А если вам хочется как-то перестать сливать все свои данные в гугл — поставьте себе что-то не из хрома, например, Firefox.
[1] github.com/googleapis/elixir-goo
[3] www.seroundtable.com/google-chro
[4] www.theverge.com/2024/5/28/24166
[5] ipullrank.com/google-algo-leak
An Anonymous Source Shared Thousands of Leaked Google Search API Documents with Me; Everyone in SEO Should See Them - SparkToro
Update: We are diving deep into the Google API leak and what it means for marketers in our next episode of SparkToro Office Hours on June 27. Join Michael