May 29, 20:03

Долго думал, что не буду про это писать. Но, почитав и исследовав вопрос, решил, что вам будет интересно.

На прошлой неделе начался большой бум среди всех, кто как-то завязан на поиск Гугла (а это почти весь современный интернет, все его разработчики). Некто "Erfan Azimi", владец SEO-фирмы внезапно начал показывать слитые ему документы о том, как устроено ранжирование в поиске Гугла. На самом деле всё чуть сложнее, не сам поиск, а различные API вокруг него, но, как вы понимаете, даже по этим API уже можно понять многое. Утечка произошла по ошибке, один из разработчиков в гугле написал программу для превращения API в вызовы на любимом им языке программирования, но вместо публичных вызовов выложил все (если вам интересно, я приложил ссылку на коммит, в котором содержатся все эти описания [1]).

Многочисленные проверки через разных бывших и действующих гуглеров говорят, что это не подделка, не шутка, а вполне реальная утечка, исследованием которой теперь очень озабочены все SEO-ресерчеры. Дам вам ссылку на самый глубокий из них [2], но если кратко, то вот что уже сейчас понятно:

– В поиске гугла есть белые списки сайтов, которые принудительно оптимизированы. Как минимум, это известно о некоторых тематиках, таких как выборы штатах в 2020 или ковид.

– Название домена, а так же субдоменов является значимой информацией (гугл всегда говорил что это не так).

– Есть отдельная песочница для новых сайтов. Гугл всегда это отрицал.

– В поиске напрямую используются данные из EWOK (это система, в которой живые люди сидят и за деньги оценивают, какой вариант выдачи в поиске лучше). Да, судя по всему, есть пользователи, которые своими глазами и мнением определяют, какой из нескольких сайтов лучше по некоторому запросу.

– Гугл активно использует информацию по поведению пользователей на сайте для ранжирования.

– Данные по тому, куда пользователь нажимает на странице, берутся не только из гугл-аналитики, но и напрямую из браузера Chrome.

– По количеству кликов на странице сайты делятся на три категории, для каждой из которых строится свой "ранг качества", более популярные по кликам сайты приносят бОльший вклад в пейджранк, т.е. более ценны.

– Гугл внутри учитывает размер бренда сайта, не только по самому сайту, но и в целом по упоминанию этого сайта в интернете (даже без ссылок).

– Контент и ссылки вообще вторичны, сейчас гораздо значимее именно клики и навигация по сайту (то что называют "поведенческий фактор").

– Как следствие, для большинства мелких компаний и сайтов SEO почти не значим, пока вы не создадите бренд, пользователей на сайте и репутацию для аудитории.

Безусловно, это самая значимая утечка про поиск гугла за последние 10-15 лет. По ней очень вероятно, что гугл часто врет, когда публично рассказывает о поиске [3]. Скорее всего, надо переставать верить, что "content is king", кликбейты + фермы ботов — вот нынешний путь к успеху в SEO. Разумеется, гугл от комментариев отказался [4]. Если вам хочется почитать на эту тему еще что-то — вот неплохая статья в iPullRank [5].

А если вам хочется как-то перестать сливать все свои данные в гугл — поставьте себе что-то не из хрома, например, Firefox.

[1] github.com/googleapis/elixir-google-api/commit/078b497fceb1011ee26e094029ce67e6b6778220

[2] sparktoro.com/blog/an-anonymous-source-shared-thousands-of-leaked-google-search-api-documents-with-me-everyone-in-seo-should-see-them/

[3] www.seroundtable.com/google-chrome-search-usage-15618.html

[4] www.theverge.com/2024/5/28/24166177/google-search-ranking-algorithm-leak-documents-link-seo

[5] ipullrank.com/google-algo-leak

An Anonymous Source Shared Thousands of Leaked Google Search API Documents with Me; Everyone in SEO Should See Them - SparkToro

Update: We are diving deep into the Google API leak and what it means for marketers in our next episode of SparkToro Office Hours on June 27. Join Michael