Twitter는 사람들이 보는 트윗과 그 이유를 결정한다고 주장하는 코드를 게시합니다.
Twitter는 금요일 오후 GitHub에 트윗 추천 알고리즘의 코드라고 주장하는 내용을 게시함으로써 CEO Elon Musk의 많은 약속 중 하나를 전달했습니다 .
GNU Affero v3.0 일반 공중 사용 허가서(GNU Affero v3.0 General Public License) 로 게시된 이 코드에는 트윗이 사용자의 타임라인에 나타날 가능성을 높이거나 낮추는 요소에 대한 많은 세부 정보가 포함되어 있습니다.
코드 릴리스와 함께 제공되는 블로그 게시물 에서 Twitter 엔지니어링 팀(특정 캡션 없음)은 “장치의 타임라인에 표시되는 가장 인기 있는 트윗”을 결정하는 시스템이 상호 연결된 많은 서비스와 작업으로 구성되어 있다고 설명합니다.
이러한 트윗의 가장 큰 소스는 “온라인 소스” 또는 누군가가 팔로우하는 사용자입니다. 이 스택의 상위 트윗은 사용자가 해당 트윗 작성자와 상호 작용할 가능성에 따라 순위가 매겨집니다. 그들의 트윗이 For You에 나타날 가능성이 높아집니다. 사용자가 팔로우하지 않는 “오프라인 소스”의 경우 Twitter는 사용자가 팔로우하는 사람들의 관심을 끄는 트윗과 사용자와 유사한 트윗을 좋아하는 사람들이 좋아하는 트윗을 고려한다고 말합니다.
이미 코드를 살펴본 사람들은 더 많은 질문을 제기하는 고려 사항을 알아차렸습니다. 물론 많은 사람들이 트위터 자체에 게시했습니다.
Twitter는 방금 “알고리즘”의 소스 코드를 공개했습니다.
오 이 파일이 뭔가요? 홈 타임라인의 트윗 술어?
오 두번째 사진은 뭔가요? pic.twitter.com/UE3dU8e3Os
노르웨이 소프트웨어 컨설팅 서비스 TurtleSec의 수석 소프트웨어 엔지니어인 Olafur Vaage는 ” HomeTweetTypePredicates.scala ” 내부에서 트윗이 “For You” 섹션의 후보가 될 수 있는 몇 가지 가능한 고려 사항은 다음과 같다고 언급했습니다.
-
author_is_elon
-
author_is_power_user
-
author_is_democrat
-
author_is_republican
코드의 다른 곳에서 Twitter 엔지니어가 남긴 것으로 알려진 코드 주석은 이러한 식별 값이 “측정 항목 수집에만 사용”된다고 설명합니다. 댓글은 다음과 같습니다.
이러한 작성자 ID 목록은 지표 수집에만 사용됩니다. 우리는 이러한 작성자의 트윗을 얼마나 자주 제공하고 그들의 트윗이 사용자에게 얼마나 자주 감동을 주는지 추적합니다. 이를 통해 A/B 실험 플랫폼에서 한 그룹에 부정적인 영향을 미치는 변경 사항을 다른 그룹에 제출하지 않는다는 것을 확인할 수 있습니다.
“DDGStatsDemocratsFeature” 또는 “DDGStatsElonFeature”와 같은 해당 개체의 이름은 이러한 해석을 뒷받침하는 것으로 보이지만 사용 가능한 코드로는 확인이 불가능할 수 있습니다. 그러나 Twitter가 이러한 변수를 확인하고 연관시키는 것은 흥미 롭습니다. Twitter Spaces 오디오 세션에서 Twitter 엔지니어는 지표에 사용된 레이블이 민주당원과 공화당원이라고 언급했습니다. 오늘까지 레이블에 대해 몰랐다고 주장한 머스크는 레이블이 있으면 안 된다고 제안했습니다.
트윗과 관련하여 고려되는 다른 사항으로는 30분 미만인지, 이미지가 있는지 여부, 일부에서는 “오래된” 인증 계정을 의미하는 “파워 유저”인지 여부 등이 있습니다 .
오늘날 대부분의 추천 알고리즘은 오픈 소스가 될 것입니다. 나머지는 따를 것입니다.
확실한 테스트는 독립적인 제3자가 사용자에게 표시될 가능성이 있는 것을 합리적인 정확도로 결정할 수 있어야 한다는 것입니다.
분명 어색한 순간이 많을 텐데… https://t.co/41U4oexIev
머스크는 회사 블로그 게시물과 함께 트위터에 추천 알고리즘이 “독립적인 제3자”가 “사용자에게 표시될 가능성이 있는 것을 합리적인 정확도로 결정할 수 있다면” “산성 테스트”가 있을 것이라고 주장했습니다.
The New York Times에 따르면 Twitter의 알고리즘 코드 공개는 소셜 네트워크의 더 광범위한 소스 코드가 GitHub에서 발견된 지 불과 며칠 만에 이루어졌으며 잠재적으로 몇 달 동안 거기에 앉아 있을 수 있다고 합니다 . 그런 다음 Twitter는 GitHub가 GitHub 포스터에 대한 정보를 공개하도록 강제하는 소환장을 받았습니다.
이번 주 초 Platformer의 보고서에 따르면 Twitter는 Biden 대통령, LeBron James, Ben Shapiro 및 Musk를 포함하여 35명의 상위 Twitter 사용자의 비밀 목록을 사용했다고 합니다. 부분적으로 머스크가 자신의 참여에 불만을 품고 촉발된 것으로 알려진 이 목록의 구현에 대한 증거는 트위터에 게시된 코드베이스에서 아직 발견되지 않았습니다.
특히 이 코드는 Musk가 서비스를 구매하기 전에 진위 또는 악명을 나타내기 위해 파란색 표시를 한 “검증된 레거시” 사용자가 유료 Twitter Blue 가입자를 위해 더 이상 사용되지 않을 예정인 사용자보다 몇 시간 전에 도착합니다. 정부 및 대규모 조직과 관련된 일부 사용자는 다른 색상의 체크 표시를 신청할 수 있지만 월 $8의 Twitter Blue 구독자만 “대화에서 우선 순위”를 받게 됩니다 .
이러한 모든 변경 사항은 4월 1일 또는 만우절에 적용됩니다.
답글 남기기