Massiivne Yandexi koodileke paljastab Venemaa otsingumootorite järjestuse tegurid

Massiivne Yandexi koodileke paljastab Venemaa otsingumootorite järjestuse tegurid

Peaaegu 45 GB lähtekoodifaile, mille väidetavalt varastas endine töötaja, on paljastanud paljude Venemaa tehnoloogiahiiu Yandexi rakenduste ja teenuste alused. See paljastas ka Yandexi otsingumootori peamised järjestuse tegurid, mida peaaegu kunagi avalikult ei avaldata.

Yandexi git-allikad ” avaldati torrent-failina 25. jaanuaril ja see näitab väidetavalt 2022. aasta juulis tehtud faile, mis pärinevad 2022. aasta veebruarist. Tarkvarainsener Arseni Šestakov väidab , et kontrollis Yandexi praeguste ja endiste töötajatega, et osa arhiividest “tõenäoliselt sisaldama ettevõtte teenuste ajakohast lähtekoodi. Yandex ütles turvablogile BleepingComputer , et “Yandexi ei häkitud” ja leke pärines endisest töötajast. Yandex teatas, et “ei näe ohtu kasutajaandmetele ega platvormi jõudlusele”.

Täpsemalt, toimikud pärinevad 2022. aasta veebruarist, mil Venemaa alustas täiemahulist sissetungi Ukrainasse. Yandexi endine juht ütles BleepingComputerile, et leke oli “poliitiline” ja märkis, et endine töötaja ei üritanud koodi Yandexi konkurentidele müüa. Ka rämpspostivastane kood pole lekkinud.

Kuigi pole selge, kas Yandexi lähtekoodi avaldamisel on turvalisuse või struktuuriga seotud tagajärjed, tekitas Yandexi otsingualgoritmi 1922 järjestusteguri lekkimine kindlasti palju müra. SEO konsultant Martin McDonald kirjeldas Twitteri häkkimist kui “tõenäoliselt kõige huvitavamat asja SEO-s viimaste aastate jooksul” ( nagu märkis Search Engine Land ). Mõnda silmapaistvamaid tegureid kirjeldavas lõimes soovitab teadlane Alex Buraks , et “samuti on Google’i SEO jaoks palju kasulikku teavet.”

Väidetavalt palkab suuruselt neljas otsingumootor Yandex mitu endist Google’i töötajat. Yandex jälgib paljusid selle koodis tuvastatud Google’i järjestuse tegureid ja konkureerib agressiivselt Google’iga. Google’i Venemaa osakond esitas hiljuti pankrotiavalduse pärast oma pangakontode ja makseteenuste kaotamist. Burax märgib, et Yandexi järjestustegurite loendi esimene tegur on „PAGE_RANK”, mis näib olevat seotud Google’i kaasasutajate loodud aluseks oleva algoritmiga .

Nagu Burax üksikasjalikult ( kahes teemas ) rääkis, eelistab Yandexi mootor lehti, mis:

  • mitte liiga vana
  • Teil on palju orgaanilist liiklust (unikaalsed külastajad) ja vähem otsinguliiklust.
  • Nende URL peaks sisaldama vähem numbreid ja kaldkriipse.
  • Kasutage optimeeritud koodi, mitte “rasket pessimeerimist” väärtusega “PR = 0”.
  • Hostitud turvalistes serverites
  • Olge Vikipeedia lehed või lingid Vikipeediast
  • Hostitud või lingitud domeeni kõrgema taseme lehtedele
  • Lisage oma URL-is märksõnu (kuni kolm)

Rob Osby koostatud otsingutööriistas saate otsida ja klõpsata kõiki tegureid . Võib-olla olete märganud, et peaaegu 1000 järjestusteguril on silt „TG_DEPRECATED” ja enam kui 200 on loetletud kui „TG_UNUSED”. Kuna kood pärineb veebruarist 2022 ja saadeti juulis 2022, on Yandexi otsing sellest ajast alates kindlasti muutunud. Kuid leke annab harvaesineva pilgu selle kohta, kuidas maailma üht suurimat riiki teenindaval saidil otsingujärjestust koostatakse.

Varem kadus Yandexi otsingumootori kood 2015. aastal, kui endine töötaja üritas seda mustal turul 28 000 dollari eest maha müüa, et rahastada enda idufirmat. Yandexi põhitoote põhikoodi üllatavalt madal näitaja viitas sellele, et ta polnud teadlik selle tegelikust väärtusest. Sellele töötajale määrati kaheaastane tingimisi vanglakaristus ja koodeksit ei avalikustatud kunagi.

Lisa kommentaar

Sinu e-postiaadressi ei avaldata. Nõutavad väljad on tähistatud *-ga