대규모 Yandex 코드 유출로 러시아 검색 엔진 순위 요소가 드러남

대규모 Yandex 코드 유출로 러시아 검색 엔진 순위 요소가 드러남

전직 직원이 훔친 것으로 추정되는 약 45GB의 소스 코드 파일이 러시아 기술 대기업 Yandex의 많은 앱과 서비스의 기반을 노출했습니다. 또한 거의 공개되지 않는 Yandex 검색 엔진의 주요 순위 요소도 공개했습니다.

Yandex git sources “는 1월 25일에 토렌트 파일로 게시되었으며 2022년 7월에 촬영되었으며 2022년 2월로 거슬러 올라가는 것으로 추정되는 파일을 보여줍니다. 소프트웨어 엔지니어 Arseniy Shestakov 는 현재 및 이전 Yandex 직원에게 일부 아카이브가 “아마도 회사 서비스에 대한 최신 소스 코드를 포함합니다.” Yandex는 보안 블로그인 Bleeping Computer 에 “Yandex는 해킹되지 않았으며 유출은 이전 직원에게서 나온 것”이라고 말했습니다. Yandex는 “사용자 데이터나 플랫폼 성능에 위협이 되지 않는다”고 밝혔습니다.

특히 이 파일의 날짜는 러시아가 우크라이나에 전면 침공을 시작한 2022년 2월로 거슬러 올라갑니다. 전직 Yandex 임원은 BleepingComputer에 유출이 “정치적”이며 전직 직원이 Yandex의 경쟁사에 코드를 판매하려는 것이 아니라고 언급했습니다. 스팸 방지 코드도 유출되지 않았습니다.

Yandex의 소스 코드 공개가 보안 또는 구조적 의미를 갖는지는 불분명하지만 Yandex의 검색 알고리즘에서 1,922개의 순위 요소가 유출되어 많은 소음을 냈습니다. SEO 컨설턴트인 Martin McDonald는 Twitter 해킹을 “아마 몇 년 동안 SEO에서 일어날 수 있는 가장 흥미로운 일”이라고 설명했습니다( Search Engine Land에서 언급한 대로 ). 가장 주목할만한 몇 가지 요소를 자세히 설명하는 스레드에서 연구원 Alex Buraks는 “Google SEO에도 유용한 정보가 많이 있습니다.”라고 제안합니다.

네 번째로 큰 검색 엔진인 Yandex는 전직 Google 직원 몇 명을 고용한 것으로 알려졌습니다. Yandex는 코드에서 식별된 많은 Google 순위 요소를 추적하고 Google과 공격적으로 경쟁합니다. Google의 러시아 사업부는 최근 은행 계좌와 결제 서비스를 잃은 후 파산 신청을 했습니다. Burax는 Yandex의 순위 요소 목록의 첫 번째 요소가 Google의 공동 창립자가 만든 기본 알고리즘 과 관련된 것으로 보이는 “PAGE_RANK”라고 지적합니다 .

Burax가 자세히 설명했듯이( 두 가지 항목 에서 ) Yandex 엔진은 다음과 같은 페이지를 선호합니다.

  • 너무 늙지 않은
  • 유기적 트래픽(순 방문자수)은 많고 검색 트래픽은 적습니다.
  • URL에는 더 적은 수의 숫자와 슬래시가 포함되어야 합니다.
  • “PR = 0″으로 “하드 비관화”가 아닌 최적화된 코드를 사용하십시오.
  • 보안 서버에서 호스팅
  • Wikipedia 페이지 또는 Wikipedia의 링크여야 합니다.
  • 도메인의 상위 수준 페이지에 호스팅 또는 링크됨
  • URL에 키워드 포함(최대 3개)

Rob Osby의 컴파일된 검색 도구 에서 모든 요소를 ​​검색하고 클릭할 수 있습니다 . 거의 1000개의 순위 요소에 “TG_DEPRECATED” 태그가 있고 200개 이상이 “TG_UNUSED”로 나열되어 있음을 눈치채셨을 것입니다. 코드의 날짜가 2022년 2월이고 2022년 7월에 수신되었기 때문에 Yandex 검색은 그 이후로 확실히 변경되었습니다. 그러나 유출은 세계에서 가장 큰 국가 중 하나에 서비스를 제공하는 사이트에서 검색 순위가 어떻게 집계되는지에 대한 드문 일면을 제공합니다.

이전에 Yandex 검색 엔진 코드는 2015년 전직 직원이 자신의 스타트업 자금을 마련하기 위해 암시장에서 28,000달러에 판매하려고 시도하면서 사라졌습니다. Yandex의 주요 제품 핵심 코드에 대한 놀라울 정도로 낮은 수치는 그가 그 진정한 가치를 인식하지 못했다는 것을 나타냅니다. 이 직원은 집행유예 2년을 선고받았고 코드는 공개되지 않았습니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다