Massiivinen Yandex-koodivuoto paljastaa venäläisiä hakukonesijoitustekijöitä

Lähes 45 Gt lähdekooditiedostoja, joiden väitetään varastaneen entisen työntekijän, on paljastanut monien venäläisen teknologiajätti Yandexin sovellusten ja palveluiden perustan. Se paljasti myös Yandex-hakukoneen tärkeimmät sijoitustekijät, joita ei juuri koskaan julkisteta.
” Yandex git sources ”julkaistiin torrent-tiedostona 25. tammikuuta ja näyttää tiedostoja, jotka on väitetysti otettu heinäkuussa 2022 ja jotka ovat peräisin helmikuusta 2022. Ohjelmistoinsinööri Arseniy Shestakov väittää tarkistaneensa Yandexin nykyisiltä ja entisiltä työntekijöiltä, että jotkin arkistoista ”todennäköisesti” sisältää ajantasaisen lähdekoodin yrityksen palveluille.” Yandex kertoi tietoturvablogille BleepingComputerille , että ”Yandexia ei hakkeroitu” ja että vuoto tuli entiseltä työntekijältä. Yandex totesi, että se ”ei näe uhkaa käyttäjädatalle tai alustan suorituskyvylle”.
Tarkemmin sanottuna tiedostot ovat peräisin helmikuulta 2022, jolloin Venäjä käynnisti täyden mittakaavan hyökkäyksen Ukrainaan. Yandexin entinen johtaja kertoi BleepingComputerille, että vuoto oli ”poliittinen” ja huomautti, että entinen työntekijä ei yrittänyt myydä koodia Yandexin kilpailijoille. Myöskään roskapostin estokoodi ei ole vuotanut.
Vaikka on epäselvää, onko Yandexin lähdekoodin paljastamisella turvallisuutta vai rakenteellisia vaikutuksia, Yandexin hakualgoritmin 1 922 sijoitustekijän vuotaminen aiheutti varmasti paljon melua. SEO-konsultti Martin McDonald kuvaili Twitter-hakkerointia ”luultavasti mielenkiintoisimmaksi asiaksi SEO:ssa vuosiin” ( kuten Search Engine Land totesi ). Tutkija Alex Buraks ehdottaa ketjussa, jossa käsitellään joitakin merkittävimmistä tekijöistä, että ”myös Googlen hakukoneoptimoinnista on paljon hyödyllistä tietoa”.
Yandex, neljänneksi suurin hakukone, väittää palkkaavan useita entisiä Googlen työntekijöitä. Yandex seuraa monia koodissaan tunnistettuja Googlen sijoitustekijöitä ja kilpailee aggressiivisesti Googlen kanssa. Googlen venäläinen osasto haki äskettäin konkurssiin menetettyään pankkitilinsä ja maksupalvelunsa. Burax huomauttaa, että ensimmäinen tekijä Yandexin sijoitustekijöiden luettelossa on ”PAGE_RANK”, joka näyttää liittyvän Googlen perustajien luomaan taustalla olevaan algoritmiin .
Kuten Burax kertoi yksityiskohtaisesti ( kahdessa aiheesta ), Yandex-moottori suosii sivuja, jotka:
- ei liian vanha
- Saat paljon orgaanista liikennettä (yksilölliset vierailijat) ja vähemmän hakuliikennettä.
- Niiden URL-osoitteen tulee sisältää vähemmän numeroita ja kauttaviivaa.
- Käytä optimoitua koodia, ei ”kovaa pessimointia” ”PR = 0”:lla.
- Isännöi suojatuilla palvelimilla
- Ole Wikipedia-sivuja tai linkkejä Wikipediasta
- Isännöity tai linkitetty verkkotunnuksen korkeamman tason sivuille
- URL-osoitteessasi on avainsanoja (enintään kolme)
Voit etsiä ja napsauttaa kaikkia tekijöitä Rob Osbyn laatimassa hakutyökalussa . Olet ehkä huomannut, että lähes 1000 sijoitustekijässä on ”TG_DEPRECATED” -tunniste ja yli 200 on listattu nimellä ”TG_UNUSED”. Koska koodi on päivätty helmikuussa 2022 ja vastaanotettu heinäkuussa 2022, Yandex-haku on varmasti muuttunut sen jälkeen. Vuoto tarjoaa kuitenkin harvinaisen kuvan siitä, kuinka hakusijoituksia kootaan sivustolla, joka palvelee yhtä maailman suurimmista maista.
Aiemmin Yandexin hakukonekoodi katosi vuonna 2015, kun entinen työntekijä yritti myydä sen mustilla markkinoilla 28 000 dollarilla rahoittaakseen omaa startup-yritystään. Yandexin päätuotteen ydinkoodin yllättävän alhainen luku osoitti, että hän ei ollut tietoinen sen todellisesta arvosta. Tämä työntekijä tuomittiin kahden vuoden ehdolliseen vankeusrangaistukseen, eikä koodia koskaan julkistettu.
Vastaa