Yandex 代碼大規模洩露揭示了俄羅斯搜索引擎排名因素

Yandex 代碼大規模洩露揭示了俄羅斯搜索引擎排名因素

據稱,一名前員工竊取了近 45GB 的源代碼文件,暴露了俄羅斯科技巨頭 Yandex 的許多應用程序和服務的基礎。它還揭示了 Yandex 搜索引擎幾乎從未公開披露的關鍵排名因素。

Yandex git 源”於 1 月 25 日以 torrent 文件形式發布,顯示了據稱於 2022 年 7 月拍攝並可追溯到 2022 年 2 月的文件。軟件工程師 Arseniy Shestakov 聲稱,他與現任和前任 Yandex 員工核實,部分檔案“可能包含公司服務的最新源代碼。” Yandex 告訴安全博客 BleepingComputer,“Yandex 沒有遭到黑客攻擊”,並且洩密事件來自一名前員工。Yandex 表示,它“沒有看到對用戶數據或平台性能的威脅”。

具體來說,這些文件可以追溯到2022年2月,當時俄羅斯對烏克蘭發動了全面入侵。這位前 Yandex 高管告訴 BleepingComputer,這次洩露是“政治性的”,並指出這位前員工並沒有試圖將代碼出售給 Yandex 的競爭對手。反垃圾郵件代碼也沒有洩露。

雖然尚不清楚 Yandex 源代碼的洩露是否具有安全性或結構性影響,但Yandex 搜索算法中 1,922 個排名因素的洩露無疑引起了很大的轟動。SEO 顧問Martin McDonald 將 Twitter 黑客事件描述為“可能是多年來 SEO 中發生的最有趣的事情”(正如 Search Engine Land 所指出的那樣)。在詳細介紹一些最值得注意的因素的帖子中,研究員 Alex Buraks 表示“對於 Google SEO 也有很多有用的信息。”

第四大搜索引擎 Yandex 據稱僱傭了幾名前谷歌員工。Yandex 跟踪其代碼中確定的許多 Google 排名因素,並與 Google 積極競爭。谷歌俄羅斯分公司在失去銀行賬戶和支付服務後最近申請破產。Burax 指出,Yandex 排名因素列表中的第一個因素是“PAGE_RANK”,它似乎與Google 聯合創始人創建的底層算法有關。

正如 Burax 詳細介紹的那樣(在兩個 主題中),Yandex 引擎更喜歡以下頁面:

  • 不太老
  • 擁有大量的自然流量(獨立訪客)和較少的搜索流量。
  • 他們的 URL 應包含更少的數字和斜杠。
  • 優化代碼,而不是“PR = 0”的“硬悲觀”。
  • 託管在安全服務器上
  • 是維基百科頁面或來自維基百科的鏈接
  • 託管或鏈接到域中的更高級別頁面
  • 您的網址中包含關鍵字(最多三個)

您可以在 Rob Osby編譯的搜索工具中搜索並點擊所有因素。您可能已經註意到,近 1000 個排名因素帶有“TG_DEPRECATED”標籤,超過 200 個排名因素被列為“TG_UNUSED”。由於代碼日期為 2022 年 2 月並於 2022 年 7 月收到,Yandex 搜索自那時起肯定發生了變化。但此次洩露事件讓人們得以難得一睹為世界上最大的國家之一提供服務的網站上的搜索排名是如何編制的。

此前,Yandex 搜索引擎代碼於 2015 年消失,當時一名前員工試圖在黑市上以 28,000 美元的價格出售該代碼,以資助自己的初創公司。Yandex 主要產品核心代碼的數字低得驚人,表明他並沒有意識到其真正價值。這名員工被判處兩年緩刑,並且該代碼從未公開。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *