Twitter публікує код, який, на його думку, визначає, які твіти бачать люди та чому.

Twitter публікує код, який, на його думку, визначає, які твіти бачать люди та чому.

Twitter виконав одну з багатьох обіцянок генерального директора Ілона Маска, опублікувавши в п’ятницю вдень те, що, як він стверджує, є кодом свого алгоритму рекомендацій для твітів на GitHub .

Код, опублікований під ліцензією GNU Affero v3.0 General Public License , містить численні подробиці про те, які фактори роблять твіт з більшою чи меншою вірогідністю появи на часовій шкалі користувача.

У дописі в блозі, що супроводжує випуск коду , команда інженерів Twitter (без конкретного підпису) зазначає, що система для визначення «найпопулярніших твітів, які зрештою з’являються на часовій шкалі вашого пристрою» «включає багато взаємопов’язаних служб і завдань». Кожного разу, коли оновлюється головний екран Twitter, Twitter витягує «1500 найпопулярніших твітів із сотень мільйонів», — йдеться у дописі.

Найбільшим джерелом таких твітів є «онлайн-джерела» або користувачі, за якими хтось стежить. Найпопулярніші твіти з цього стеку ранжуються за ймовірністю взаємодії користувача з автором цього твіту; тим більша ймовірність, що їхні твіти з’являться в For You. Для «офлайн-джерел», за якими користувач не стежить, Twitter вважає, що розглядає твіти, які привертають увагу людей, за якими стежить користувач, і твіти, які подобаються тим, хто любить твіти, схожі на користувача.

Уже ті, хто дивився на код, помітили міркування, які викликають багато запитань. Багато хто опублікував їх, звичайно, в самому Twitter.

Twitter щойно опублікував вихідний код «алгоритму».

О, що це за файл? Предикати для твітів на домашній шкалі?

О, що це за друга картинка? pic.twitter.com/UE3dU8e3Os

31 березня 2023 р

Олафур Вааге, старший інженер програмного забезпечення в норвезькій службі консалтингу з програмного забезпечення TurtleSec, зазначив, що всередині « HomeTweetTypePredicates.scala » деякі з можливих міркувань, через які твіт може бути кандидатом на розділ «Для вас», такі:

  • author_is_elon
  • author_is_power_user
  • author_is_democrat
  • author_is_republican

В іншому місці коду коментар до коду, який нібито залишив інженер Twitter, уточнює, що ці ідентифікаційні значення «використовуються виключно для збору показників». Коментар звучить так:

Ці списки ідентифікаторів авторів використовуються виключно для збору показників. Ми відстежуємо, як часто ми обслуговуємо твіти цих авторів і як часто їхні твіти справляють враження на користувачів. Це допомагає нам підтвердити на нашій експериментальній платформі A/B, що ми не подаємо зміни, які негативно впливають на одну групу над іншими.

Назви відповідних об’єктів, як-от «DDGStatsDemocratsFeature» або «DDGStatsElonFeature», здається, підтримують цю інтерпретацію, але це може бути неможливо підтвердити за допомогою доступного коду. Однак цікаво, що Twitter перевіряє та співвідносить ці змінні. Під час аудіосесії Twitter Spaces інженер Twitter зазначив, що мітки, які використовувалися для показників, були демократами та республіканцями. Маск, який стверджував, що до сьогодні не знав про етикетки, припустив, що їх там не повинно бути.

Інші речі, які враховуються щодо твіту, включають те, чи йому менше 30 хвилин, чи є в ньому зображення та чи є він «досвідченим користувачем», що, на думку деяких, означає «застарілий» підтверджений обліковий запис .

Сьогодні більшість рекомендаційних алгоритмів буде відкрито. Решта піде.

Перевірка кислотності полягає в тому, що незалежні треті сторони повинні мати можливість визначити з достатньою точністю те, що, ймовірно, буде показано користувачам.

Безсумнівно, буде багато незручних моментів… https://t.co/41U4oexIev

31 березня 2023 р

Маск написав у Твіттері разом із дописом у блозі компанії, що алгоритм рекомендацій, стверджуючи, що буде проведено «кислотний тест», якщо «незалежні треті сторони» зможуть «визначати з достатньою точністю те, що, ймовірно, буде показано користувачам».

Згідно з The New York Times, Twitter опублікував код свого алгоритму лише через кілька днів після того, як на GitHub було виявлено ширший вихідний код соціальної мережі, який потенційно пролежав там місяцями . Потім Twitter отримав повістку в суд, яка змусила GitHub розкрити інформацію про плакат GitHub.

Раніше цього тижня у звіті Platformer говорилося, що Twitter використовував секретний список із 35 найпопулярніших користувачів Twitter, включаючи президента Байдена, Леброна Джеймса, Бена Шапіро та Маска. Докази впровадження цього списку, як повідомляється, частково викликані незадоволенням Маска його власною участю, ще не знайдені в кодовій базі, опублікованій у Twitter.

Зокрема, код надходить лише за кілька годин до того, як «підтверджені застарілі» користувачі — ті, хто був позначений синьою галочкою, щоб вказати на автентичність або відомість до того, як Маск купив послугу — мають бути припинені на користь платних передплатників Twitter Blue. У той час як деякі користувачі, пов’язані з урядами та великими організаціями, можуть подати заявку на галочки іншого кольору , передплатники Twitter Blue лише за 8 доларів США на місяць отримають, серед іншого, «рейтинг пріоритету в розмовах».

Усі ці зміни відбуваються 1 квітня, або 1 квітня.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *