Masivní únik kódu Yandex odhaluje faktory hodnocení ruského vyhledávače

Masivní únik kódu Yandex odhaluje faktory hodnocení ruského vyhledávače

Téměř 45 GB souborů zdrojového kódu údajně ukradených bývalým zaměstnancem odhalilo základy mnoha aplikací a služeb ruského technologického gigantu Yandex. Odhalila také klíčové faktory hodnocení pro vyhledávač Yandex, které se téměř nikdy nezveřejňují.

Yandex git sources “ byl publikován jako torrent soubor 25. ledna a ukazuje soubory údajně pořízené v červenci 2022 a pocházející z února 2022. Softwarový inženýr Arsenij Shestakov tvrdí, že si u současných a bývalých zaměstnanců Yandexu ověřil, že některé archivy “pravděpodobně obsahovat aktuální zdrojový kód služeb společnosti.“ Yandex řekl bezpečnostnímu blogu BleepingComputer , že „Yandex nebyl hacknut“ a že únik pochází od bývalého zaměstnance. Yandex uvedl, že „nevidí hrozbu pro uživatelská data nebo výkon platformy“.

Konkrétně jde o soubory z února 2022, kdy Rusko zahájilo totální invazi na Ukrajinu. Bývalý výkonný ředitel Yandexu řekl BleepingComputer, že únik byl „politický“ a poznamenal, že bývalý zaměstnanec se nesnažil prodat kód konkurentům Yandexu. Neunikl ani antispamový kód.

I když není jasné, zda má zveřejnění zdrojového kódu Yandex bezpečnostní nebo strukturální důsledky, únik 1 922 hodnotících faktorů ve vyhledávacím algoritmu Yandex jistě způsobil spoustu hluku. SEO konzultant Martin McDonald popsal hack na Twitteru jako „pravděpodobně nejzajímavější věc, která se v SEO za poslední roky stala“ ( jak poznamenal Search Engine Land ). Ve vláknu, které podrobně popisuje některé z nejvýznamnějších faktorů, výzkumník Alex Buraks naznačuje , že „existuje také mnoho užitečných informací pro Google SEO“.

Yandex, čtvrtý největší vyhledávač, údajně najímá několik bývalých zaměstnanců Googlu. Yandex sleduje mnoho hodnotících faktorů Google identifikovaných ve svém kódu a agresivně konkuruje Googlu. Ruská divize Googlu nedávno vyhlásila bankrot poté, co přišla o své bankovní účty a platební služby. Burax poznamenává, že prvním faktorem na seznamu hodnotících faktorů Yandexu je „PAGE_RANK“, který zřejmě souvisí se základním algoritmem vytvořeným spoluzakladateli společnosti Google .

Jak podrobně řekl Burax (ve dvou tématech ), motor Yandex preferuje stránky, které:

  • ne příliš starý
  • Mít velkou organickou návštěvnost (unikátní návštěvníci) a menší návštěvnost z vyhledávání.
  • Jejich adresa URL by měla obsahovat méně čísel a lomítek.
  • Mít optimalizovaný kód, nikoli „tvrdou pesimizaci“ s „PR = 0“.
  • Hostováno na zabezpečených serverech
  • Buď stránkami Wikipedie nebo odkazy z Wikipedie
  • Hostované nebo odkazované na stránky vyšší úrovně v doméně
  • Uveďte klíčová slova ve své adrese URL (až tři)

V kompilovaném vyhledávacím nástroji Roba Osbyho můžete vyhledávat a klikat na všechny faktory . Možná jste si všimli, že téměř 1000 hodnotících faktorů má značku „TG_DEPRECATED“ a více než 200 je uvedeno jako „TG_UNUSED“. Vzhledem k tomu, že kód pochází z února 2022 a byl přijat v červenci 2022, vyhledávání Yandex se od té doby určitě změnilo. Únik však poskytuje vzácný pohled na to, jak se sestavují hodnocení ve vyhledávání na webu, který slouží jedné z největších zemí světa.

Dříve kód vyhledávače Yandex zmizel v roce 2015, když se jej bývalý zaměstnanec pokusil prodat na černém trhu za 28 000 dolarů, aby mohl financovat svůj vlastní startup. Překvapivě nízké číslo pro hlavní kód produktu Yandex naznačovalo, že si nebyl vědom jeho skutečné hodnoty. Tento zaměstnanec dostal dvouletý podmíněný trest odnětí svobody a kodex nebyl nikdy zveřejněn.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *