Масштабний витік коду Яндекса розкриває фактори рейтингу російської пошукової системи

Масштабний витік коду Яндекса розкриває фактори рейтингу російської пошукової системи

Майже 45 ГБ файлів із вихідним кодом, імовірно вкрадених колишнім співробітником, розкрили основи багатьох програм і сервісів російського технічного гіганта Яндекс. Він також виявив ключові фактори ранжування пошукової системи Яндекс, які майже ніколи не розголошуються публічно.

« Джерела Yandex git » були опубліковані як торрент-файл 25 січня і показують файли, нібито зроблені в липні 2022 року і датовані лютим 2022 року. Інженер-програміст Арсеній Шестаков стверджує , що він перевіряв у нинішніх і колишніх співробітників Яндекса, що деякі з архівів «ймовірно містять актуальний вихідний код для послуг компанії». Яндекс повідомив блогу безпеки BleepingComputer , що «Яндекс не був зламаний» і що витік стався від колишнього співробітника. Яндекс заявив, що «не бачить загрози для даних користувачів або продуктивності платформи».

Зокрема, файли датуються лютим 2022 року, коли Росія почала повномасштабне вторгнення в Україну. Колишній керівник Яндекса сказав BleepingComputer, що витік був «політичним», і зазначив, що колишній співробітник не намагався продати код конкурентам Яндекса. Також не було витоку коду захисту від спаму.

Хоча незрозуміло, чи розкриття вихідного коду Яндекса має наслідки для безпеки чи структури, витік 1922 факторів ранжирування в пошуковому алгоритмі Яндекса, безумовно, викликав багато шуму. SEO-консультант Мартін Макдональд описав злом Twitter як «ймовірно, найцікавіше, що сталося в SEO за останні роки» ( як зазначає Search Engine Land ). У ланцюжку, в якому детально описуються деякі з найбільш помітних факторів, дослідник Алекс Буракс припускає , що «також є багато корисної інформації для Google SEO».

Яндекс, четверта за величиною пошукова система, нібито наймає кількох колишніх співробітників Google. Яндекс відстежує багато факторів ранжирування Google, визначених у його коді, і агресивно конкурує з Google. Російський підрозділ Google нещодавно оголосив про банкрутство після втрати банківських рахунків і платіжних сервісів. Буракс зазначає, що першим фактором у списку факторів ранжування Яндекса є «PAGE_RANK», який, схоже, пов’язаний з базовим алгоритмом, створеним співзасновниками Google .

Як детально розповів Burax (у двох темах ), движок Яндекса віддає перевагу сторінкам, які:

  • не надто старий
  • Мати багато органічного трафіку (унікальні відвідувачі) і менше пошукового трафіку.
  • Їх URL-адреса має містити менше цифр і косих риск.
  • Майте оптимізований код, а не «жорстку песимізацію» з «PR = 0».
  • Розміщено на безпечних серверах
  • Бути сторінками Вікіпедії або посиланнями з Вікіпедії
  • Розміщені або пов’язані зі сторінками вищого рівня в домені
  • Додайте ключові слова в URL (до трьох)

Ви можете здійснювати пошук і клацати всі фактори в скомпільованому інструменті пошуку Роба Осбі . Можливо, ви помітили, що майже 1000 факторів ранжирування мають тег «TG_DEPRECATED», а більше 200 вказано як «TG_UNUSED». Оскільки код датований лютим 2022 року та отриманий у липні 2022 року, пошук Яндекса з того часу безперечно змінився. Але витік дає рідкісне уявлення про те, як складаються пошукові рейтинги на сайті, який обслуговує одну з найбільших країн світу.

Раніше код пошукової системи Yandex зник у 2015 році, коли колишній співробітник намагався продати його на чорному ринку за 28 тисяч доларів для фінансування власного стартапу. Напрочуд низька цифра основного коду продукту Яндекса вказувала на те, що він не знав про його справжню цінність. Цього співробітника було засуджено до двох років позбавлення волі умовно, а кодекс так і не був оприлюднений.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *