La massiccia perdita di codice Yandex rivela i fattori di posizionamento nei motori di ricerca russi

Quasi 45 GB di file di codice sorgente presumibilmente rubati da un ex dipendente hanno messo in luce le basi di molte delle app e dei servizi del colosso tecnologico russo Yandex. Ha anche rivelato fattori chiave di ranking per il motore di ricerca Yandex che non vengono quasi mai divulgati pubblicamente.
” Yandex git sources “è stato pubblicato come file torrent il 25 gennaio e mostra file presumibilmente presi nel luglio 2022 e risalenti al febbraio 2022. L’ ingegnere del software Arseniy Shestakov afferma di aver verificato con gli attuali ed ex dipendenti di Yandex che alcuni degli archivi “probabilmente contenere il codice sorgente aggiornato per i servizi dell’azienda. Yandex ha dichiarato al blog sulla sicurezza BleepingComputer che “Yandex non è stato violato” e che la perdita proveniva da un ex dipendente. Yandex ha dichiarato di “non vedere una minaccia per i dati degli utenti o le prestazioni della piattaforma”.
In particolare, i file risalgono al febbraio 2022, quando la Russia ha lanciato un’invasione su vasta scala dell’Ucraina. L’ex dirigente di Yandex ha detto a BleepingComputer che la fuga di notizie era “politica” e ha osservato che l’ex dipendente non stava cercando di vendere il codice ai concorrenti di Yandex. Anche il codice anti-spam non è trapelato.
Sebbene non sia chiaro se la divulgazione del codice sorgente di Yandex abbia implicazioni strutturali o di sicurezza, la fuga di 1.922 fattori di classificazione nell’algoritmo di ricerca di Yandex ha sicuramente fatto molto rumore. Il consulente SEO Martin McDonald ha descritto l’hacking di Twitter come “probabilmente la cosa più interessante accaduta nel SEO da anni” ( come notato da Search Engine Land ). In un thread che descrive in dettaglio alcuni dei fattori più importanti, il ricercatore Alex Buraks suggerisce che “ci sono molte informazioni utili anche per Google SEO”.
Yandex, il quarto motore di ricerca più grande, assumerebbe diversi ex dipendenti di Google. Yandex tiene traccia di molti dei fattori di ranking di Google identificati nel suo codice e compete in modo aggressivo con Google. La divisione russa di Google ha recentemente presentato istanza di fallimento dopo aver perso conti bancari e servizi di pagamento. Burax osserva che il primo fattore nell’elenco dei fattori di ranking di Yandex è “PAGE_RANK”, che sembra essere correlato all’algoritmo sottostante creato dai co-fondatori di Google .
Come Burax ha raccontato in dettaglio (in due argomenti ), il motore Yandex predilige le pagine che:
- non troppo vecchio
- Avere molto traffico organico (visitatori unici) e meno traffico di ricerca.
- Il loro URL dovrebbe contenere meno numeri e barre.
- Avere codice ottimizzato, non “pessimizzazione dura” con “PR = 0”.
- Ospitato su server sicuri
- Essere pagine di Wikipedia o collegamenti da Wikipedia
- Ospitato o collegato a pagine di livello superiore nel dominio
- Avere parole chiave nel tuo URL (fino a tre)
Puoi cercare e fare clic su tutti i fattori nello strumento di ricerca compilato di Rob Osby . Potresti aver notato che quasi 1000 fattori di ranking hanno il tag “TG_DEPRECATED” e più di 200 sono elencati come “TG_UNUSED”. Poiché il codice è datato febbraio 2022 e ricevuto a luglio 2022, la ricerca Yandex è sicuramente cambiata da allora. Ma la fuga di notizie fornisce uno sguardo raro su come vengono compilate le classifiche di ricerca su un sito che serve uno dei paesi più grandi del mondo.
In precedenza, il codice del motore di ricerca Yandex era scomparso nel 2015 quando un ex dipendente aveva tentato di venderlo sul mercato nero per 28.000 dollari per finanziare la propria startup. La cifra sorprendentemente bassa per il codice principale del prodotto principale di Yandex indicava che non era a conoscenza del suo valore reale. Questo dipendente è stato condannato a due anni di carcere con sospensione della pena e il codice non è mai stato reso pubblico.
Lascia un commento