Masveida Yandex koda noplūde atklāj Krievijas meklētājprogrammu ranga faktorus

Masveida Yandex koda noplūde atklāj Krievijas meklētājprogrammu ranga faktorus

Gandrīz 45 GB avota koda failu, kurus, iespējams, nozadzis kāds bijušais darbinieks, ir atklājuši daudzu Krievijas tehnoloģiju giganta Yandex lietotņu un pakalpojumu pamatus. Tas arī atklāja galvenos Yandex meklētājprogrammas ranžēšanas faktorus, kas gandrīz nekad netiek atklāti.

Yandex git avoti “tika publicēts kā torrent fails 25. janvārī, un tajā redzami faili, kas, iespējams, uzņemti 2022. gada jūlijā un datēti ar 2022. gada februāri. Programmatūras inženieris Arsēnijs Šestakovs apgalvo, ka pārbaudījis ar esošajiem un bijušajiem Yandex darbiniekiem, ka daži no arhīviem, “iespējams, satur jaunāko pirmkodu uzņēmuma pakalpojumiem. Yandex sacīja drošības emuāram BleepingComputer, ka “Yandex netika uzlauzts” un ka noplūde notika no bijušā darbinieka. Yandex paziņoja, ka “neredz draudus lietotāju datiem vai platformas veiktspējai”.

Konkrēti, faili ir datēti ar 2022. gada februāri, kad Krievija uzsāka pilna mēroga iebrukumu Ukrainā. Bijušais Yandex vadītājs teica BleepingComputer, ka noplūde bija “politiska”, un norādīja, ka bijušais darbinieks nemēģināja pārdot kodu Yandex konkurentiem. Arī pretsurogātpasta kods nav nopludināts.

Lai gan nav skaidrs, vai Yandex pirmkoda izpaušanai ir drošības vai strukturālas sekas, 1922 ranžēšanas faktoru noplūde Yandex meklēšanas algoritmā noteikti radīja lielu troksni. SEO konsultants Mārtins Makdonalds Twitter uzlaušanu raksturoja kā “iespējams, interesantāko lietu, kas pēdējos gados noticis SEO jomā” ( kā atzīmēja Search Engine Land ). Pavedienos, kurā sīki aprakstīti daži no ievērojamākajiem faktoriem, pētnieks Alekss Buraks norāda, ka “ir daudz noderīgas informācijas arī par Google SEO.”

Ceturtā lielākā meklētājprogramma Yandex pieņem darbā vairākus bijušos Google darbiniekus. Yandex izseko daudzus Google ranžēšanas faktorus, kas identificēti tā kodā, un agresīvi konkurē ar Google. Google Krievijas nodaļa nesen iesniedza bankrota pieteikumu, zaudējot bankas kontus un maksājumu pakalpojumus. Burax atzīmē, ka pirmais faktors Yandex ranžēšanas faktoru sarakstā ir “PAGE_RANK”, kas, šķiet, ir saistīts ar pamatā esošo algoritmu, ko izveidojuši Google līdzdibinātāji .

Kā Burax detalizēti stāstīja ( divās tēmās ), Yandex dzinējs dod priekšroku lapām, kas:

  • ne pārāk vecs
  • Ir daudz dabiskās datplūsmas (unikāli apmeklētāji) un mazāk meklēšanas datplūsmas.
  • Viņu vietrādī URL ir jāsatur mazāk skaitļu un slīpsvītru.
  • Ir optimizēts kods, nevis “stingra pesimizācija” ar “PR = 0”.
  • Mitināts drošos serveros
  • Esiet Wikipedia lapas vai saites no Wikipedia
  • Mitināts vai saistīta ar augstāka līmeņa lapām domēnā
  • Jūsu URL ir atslēgvārdi (līdz trim)

Roba Osbija apkopotajā meklēšanas rīkā varat meklēt un noklikšķināt uz visiem faktoriem . Iespējams, esat pamanījis, ka gandrīz 1000 ranžēšanas faktoru ir atzīmēti ar atzīmi “TG_DEPRECATED”, un vairāk nekā 200 faktori ir norādīti kā “TG_UNUSED”. Tā kā kods ir datēts ar 2022. gada februāri un saņemts 2022. gada jūlijā, Yandex meklēšana kopš tā laika noteikti ir mainījusies. Taču noplūde sniedz retu ieskatu par to, kā tiek apkopoti meklēšanas rangi vietnē, kas apkalpo vienu no pasaules lielākajām valstīm.

Iepriekš Yandex meklētājprogrammas kods pazuda 2015. gadā, kad kāds bijušais darbinieks mēģināja to pārdot melnajā tirgū par 28 000 USD, lai finansētu savu starta uzņēmumu. Pārsteidzoši zemais Yandex galvenā produkta pamatkoda rādītājs norādīja, ka viņš nezināja par tā patieso vērtību. Šim darbiniekam tika piespriests divu gadu nosacīts cietumsods, un kodekss nekad netika publiskots.

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *