Massiv Yandex-kodelækage afslører russiske søgemaskinerangeringsfaktorer
Næsten 45 GB kildekodefiler, der angiveligt er stjålet af en tidligere ansat, har afsløret grundlaget for mange af den russiske teknologigigant Yandex apps og tjenester. Det afslørede også vigtige rangeringsfaktorer for Yandex-søgemaskinen, som næsten aldrig offentliggøres.
” Yandex git sources “blev offentliggjort som en torrent-fil den 25. januar og viser filer, der angiveligt er taget i juli 2022 og går tilbage til februar 2022. Softwareingeniør Arseniy Shestakov hævder, at han tjekkede med nuværende og tidligere Yandex-medarbejdere, at nogle af arkiverne “sandsynligvis indeholde opdateret kildekode til virksomhedens tjenester.” Yandex fortalte sikkerhedsbloggen BleepingComputer , at “Yandex ikke blev hacket”, og at lækagen kom fra en tidligere ansat. Yandex udtalte, at det “ikke ser en trussel mod brugerdata eller platformens ydeevne.”
Konkret går filerne tilbage til februar 2022, hvor Rusland lancerede en fuldskala invasion af Ukraine. Den tidligere Yandex-direktør fortalte BleepingComputer, at lækagen var “politisk” og bemærkede, at den tidligere medarbejder ikke forsøgte at sælge koden til Yandex’ konkurrenter. Anti-spam-koden er heller ikke blevet lækket.
Selvom det er uklart, om afsløringen af Yandex’s kildekode har sikkerhedsmæssige eller strukturelle implikationer, lavede lækagen af 1.922 rangeringsfaktorer i Yandex’ søgealgoritme bestemt meget støj. SEO-konsulent Martin McDonald beskrev Twitter-hacket som “sandsynligvis den mest interessante ting, der er sket inden for SEO i årevis” ( som bemærket af Search Engine Land ). I en tråd, der beskriver nogle af de mest bemærkelsesværdige faktorer, foreslår forsker Alex Buraks , at “der er også en masse nyttig information til Google SEO.”
Yandex, den fjerdestørste søgemaskine, ansætter angiveligt flere tidligere Google-medarbejdere. Yandex sporer mange af Googles rangeringsfaktorer identificeret i sin kode og konkurrerer aggressivt med Google. Den russiske afdeling af Google indgav for nylig konkursbegæring efter at have mistet sine bankkonti og betalingstjenester. Burax bemærker, at den første faktor på Yandex’ liste over rangeringsfaktorer er “PAGE_RANK”, som ser ud til at være relateret til den underliggende algoritme skabt af medstifterne af Google .
Som Burax fortalte i detaljer (i to emner ), foretrækker Yandex-motoren sider, der:
- ikke for gammel
- Har meget organisk trafik (unikke besøgende) og mindre søgetrafik.
- Deres URL skal indeholde færre tal og skråstreger.
- Har optimeret kode, ikke “hård pessimisering” med “PR = 0”.
- Hostet på sikre servere
- Vær Wikipedia-sider eller links fra Wikipedia
- Hostet eller linket til sider på højere niveau i domænet
- Hav søgeord i din URL (op til tre)
Du kan søge og klikke på alle faktorer i Rob Osbys kompilerede søgeværktøj . Du har måske bemærket, at næsten 1000 rangeringsfaktorer har “TG_DEPRECATED”-tagget, og mere end 200 er angivet som “TG_UNUSED”. Siden koden er dateret februar 2022 og modtaget i juli 2022, har Yandex-søgning helt sikkert ændret sig siden da. Men lækagen giver et sjældent indblik i, hvordan søgerangeringer er samlet på et websted, der betjener et af verdens største lande.
Tidligere forsvandt Yandex-søgemaskinekoden i 2015, da en tidligere medarbejder forsøgte at sælge den på det sorte marked for 28.000 dollars for at finansiere sin egen opstart. Det overraskende lave tal for Yandex’ hovedprodukts kernekode indikerede, at han ikke var klar over dens reelle værdi. Denne medarbejder blev idømt to års betinget fængsel, og koden blev aldrig offentliggjort.
Skriv et svar