Ogromny wyciek kodu Yandex ujawnia czynniki rankingowe rosyjskiej wyszukiwarki
Prawie 45 GB plików z kodem źródłowym rzekomo skradzionych przez byłego pracownika ujawniło podstawy wielu aplikacji i usług rosyjskiego giganta technologicznego Yandex. Ujawniono również kluczowe czynniki rankingowe dla wyszukiwarki Yandex, które prawie nigdy nie są ujawniane publicznie.
„ Źródła Yandex git ” zostały opublikowane jako plik torrent 25 stycznia i pokazują pliki rzekomo pobrane w lipcu 2022 r. i datowane na luty 2022 r. Inżynier oprogramowania Arsenij Szestakow twierdzi , że sprawdził z obecnymi i byłymi pracownikami Yandex, że niektóre archiwa „prawdopodobnie zawierają aktualny kod źródłowy usług firmy.” Yandex powiedział blogowi poświęconemu bezpieczeństwu BleepingComputer, że „Yandex nie został zhakowany” i że wyciek pochodzi od byłego pracownika. Yandex stwierdził, że „nie widzi zagrożenia dla danych użytkowników ani wydajności platformy”.
W szczególności akta pochodzą z lutego 2022 r., kiedy Rosja rozpoczęła inwazję na Ukrainę na pełną skalę. Były dyrektor Yandex powiedział BleepingComputer, że wyciek był „polityczny” i zauważył, że były pracownik nie próbował sprzedać kodu konkurentom Yandex. Nie wyciekł również kod antyspamowy.
Chociaż nie jest jasne, czy ujawnienie kodu źródłowego Yandex ma implikacje dla bezpieczeństwa lub struktury, wyciek 1922 czynników rankingowych w algorytmie wyszukiwania Yandex z pewnością narobił wiele hałasu. Konsultant SEO, Martin McDonald, opisał włamanie na Twittera jako „prawdopodobnie najciekawszą rzecz, jaka wydarzyła się w SEO od lat” ( jak zauważył Search Engine Land ). W wątku opisującym niektóre z najbardziej znaczących czynników, badacz Alex Buraks sugeruje , że „istnieje również wiele przydatnych informacji dla Google SEO”.
Yandex, czwarta co do wielkości wyszukiwarka, rzekomo zatrudnia kilku byłych pracowników Google. Yandex śledzi wiele czynników rankingowych Google zidentyfikowanych w swoim kodzie i agresywnie konkuruje z Google. Rosyjski oddział Google niedawno ogłosił upadłość po utracie kont bankowych i usług płatniczych. Burax zauważa, że pierwszym czynnikiem na liście czynników rankingowych Yandex jest „PAGE_RANK”, który wydaje się być powiązany z podstawowym algorytmem stworzonym przez współzałożycieli Google .
Jak szczegółowo opowiedział Burax (w dwóch tematach ), silnik Yandex preferuje strony, które:
- nie za stary
- Mieć dużo ruchu organicznego (unikalni odwiedzający) i mniejszy ruch związany z wyszukiwaniem.
- Adres URL powinien zawierać mniej cyfr i ukośników.
- Zoptymalizuj kod, a nie „twardą pesymizację” z „PR = 0”.
- Hostowane na bezpiecznych serwerach
- Być stronami Wikipedii lub linkami z Wikipedii
- Hostowane lub połączone ze stronami wyższego poziomu w domenie
- Umieść słowa kluczowe w swoim adresie URL (do trzech)
Możesz wyszukiwać i klikać wszystkie czynniki w skompilowanym narzędziu wyszukiwania Roba Osby’ego . Być może zauważyłeś, że prawie 1000 czynników rankingowych ma tag „TG_DEPRECATED”, a ponad 200 jest wymienionych jako „TG_UNUSED”. Ponieważ kod jest datowany na luty 2022 r. i otrzymany w lipcu 2022 r., wyszukiwanie Yandex z pewnością zmieniło się od tego czasu. Ale przeciek daje rzadki wgląd w to, jak tworzone są rankingi wyszukiwania w witrynie obsługującej jeden z największych krajów świata.
Wcześniej kod wyszukiwarki Yandex zniknął w 2015 roku, kiedy były pracownik próbował go sprzedać na czarnym rynku za 28 000 dolarów, aby sfinansować własny start-up. Zaskakująco niska wartość kodu rdzenia głównego produktu Yandex wskazywała, że nie był on świadomy jego prawdziwej wartości. Pracownik ten został skazany na dwa lata więzienia w zawieszeniu, a kodeks nigdy nie został upubliczniony.
Dodaj komentarz