Didelis „Yandex“ kodo nutekėjimas atskleidžia Rusijos paieškos sistemų reitingavimo veiksnius

Didelis „Yandex“ kodo nutekėjimas atskleidžia Rusijos paieškos sistemų reitingavimo veiksnius

Beveik 45 GB šaltinio kodo failų, kuriuos tariamai pavogė buvęs darbuotojas, atskleidė daugelio Rusijos technologijų milžinės „Yandex“ programų ir paslaugų pagrindus. Tai taip pat atskleidė pagrindinius „Yandex“ paieškos sistemos reitingavimo veiksnius, kurie beveik niekada nėra viešai atskleidžiami.

Yandex git sources “ buvo paskelbtas kaip torrent failas sausio 25 d., kuriame rodomi failai, tariamai paimti 2022 m. liepos mėn. ir datuojami 2022 m. vasario mėn. Programinės įrangos inžinierius Arsenijus Šestakovas tvirtina, kad su esamais ir buvusiais „Yandex“ darbuotojais patikrino, kad kai kurie archyvai „tikriausiai yra naujausias įmonės paslaugų šaltinio kodas. „Yandex“ saugumo tinklaraščiui „BleepingComputer“ sakė, kad „Yandex nebuvo įsilaužta“ ir kad nutekėjo buvęs darbuotojas. „Yandex“ pareiškė, kad „nemato grėsmės vartotojo duomenims ar platformos veikimui“.

Tiksliau, bylos datuojamos 2022 m. vasario mėn., kai Rusija pradėjo plataus masto invaziją į Ukrainą. Buvęs „Yandex“ vadovas sakė „BleepingComputer“, kad nutekėjimas buvo „politinis“, ir pažymėjo, kad buvęs darbuotojas nebandė parduoti kodo „Yandex“ konkurentams. Nenutekėjo ir anti-spam kodas.

Nors neaišku, ar „Yandex“ šaltinio kodo atskleidimas turi saugumo ar struktūrinių pasekmių, 1922 reitingavimo faktorių nutekėjimas „ Yandex“ paieškos algoritme tikrai sukėlė daug triukšmo. SEO konsultantas Martinas McDonaldas apibūdino „Twitter“ įsilaužimą kaip „turbūt įdomiausią SEO įvykį per pastaruosius metus“ ( kaip pažymėjo Search Engine Land ). Gijoje, kurioje išsamiai aprašomi kai kurie svarbiausi veiksniai, mokslininkas Alexas Buraksas teigia , kad „taip pat yra daug naudingos informacijos apie Google SEO“.

Ketvirta pagal dydį paieškos sistema „Yandex“ tariamai samdo kelis buvusius „Google“ darbuotojus. „Yandex“ stebi daugelį jos kode nustatytų „Google“ reitingavimo veiksnių ir agresyviai konkuruoja su „Google“. Rusijos „Google“ padalinys neseniai iškėlė bankroto bylą, kai prarado banko sąskaitas ir mokėjimo paslaugas. Burax pažymi, kad pirmasis veiksnys Yandex reitingavimo veiksnių sąraše yra „PAGE_RANK“, kuris, atrodo, yra susijęs su pagrindiniu algoritmu, kurį sukūrė „Google“ įkūrėjai .

Kaip Burax išsamiai papasakojo ( dviem temomis ), „Yandex“ variklis teikia pirmenybę puslapiams, kurie:

  • ne per senas
  • Turėkite daug organinio srauto (unikalių lankytojų) ir mažiau paieškos srauto.
  • Jų URL turi būti mažiau skaičių ir pasvirųjų brūkšnių.
  • Turėkite optimizuotą kodą, o ne „kietą pesimizaciją“ su „PR = 0“.
  • Priglobta saugiuose serveriuose
  • Būkite Vikipedijos puslapiai arba nuorodos iš Vikipedijos
  • Priglobtas arba susietas su aukštesnio lygio puslapiais domene
  • URL turi turėti raktinių žodžių (iki trijų)

Galite ieškoti ir spustelėti visus veiksnius Robo Osby sudarytame paieškos įrankyje . Galbūt pastebėjote, kad beveik 1000 reitingavimo veiksnių turi žymą „TG_DEPRECATED“, o daugiau nei 200 – „TG_UNUSED“. Kadangi kodas yra 2022 m. vasario mėn. ir gautas 2022 m. liepos mėn., „Yandex“ paieška nuo to laiko tikrai pasikeitė. Tačiau nutekėjimas suteikia retą žvilgsnį į tai, kaip paieškos reitingai sudaromi svetainėje, kuri aptarnauja vieną didžiausių pasaulio šalių.

Anksčiau „Yandex“ paieškos sistemos kodas dingdavo 2015 m., kai buvęs darbuotojas bandė jį parduoti juodojoje rinkoje už 28 000 USD, kad finansuotų savo startuolį. Stebėtinai mažas „Yandex“ pagrindinio produkto kodo skaičius parodė, kad jis nežinojo tikrosios jo vertės. Šiam darbuotojui buvo skirta dvejų metų lygtinė laisvės atėmimo bausmė, o kodeksas niekada nebuvo viešinamas.

Parašykite komentarą

El. pašto adresas nebus skelbiamas. Būtini laukeliai pažymėti *