Twitter публикует код, который, как он утверждает, определяет, какие твиты видят люди и почему.

Twitter публикует код, который, как он утверждает, определяет, какие твиты видят люди и почему.

Twitter выполнил одно из многочисленных обещаний генерального директора Илона Маска, опубликовав в пятницу днем ​​то, что, как он утверждает, является кодом его алгоритма рекомендации твитов на GitHub.

Код, опубликованный под Стандартной общественной лицензией GNU Affero v3.0, содержит многочисленные сведения о том, какие факторы делают твит более или менее вероятным для отображения в хронологии пользователей.

В сообщении в блоге, сопровождающем выпуск кода, команда инженеров Twitter (без конкретной подписи) отмечает, что система для определения того, какие «самые популярные твиты, которые в конечном итоге отображаются на временной шкале вашего устройства для вас», «состоит из множества взаимосвязанных сервисов и заданий». Каждый раз, когда домашний экран Twitter обновляется, Twitter извлекает «1500 лучших твитов из сотен миллионов», говорится в сообщении.

Крупнейшим источником этих твитов являются «внутрисетевые источники» или пользователи, за которыми кто-то следит. Лучшие твиты из этой стопки ранжируются по вероятности взаимодействия пользователя с автором этого твита; тем больше вероятность того, что их твиты появятся в For You. Что касается «внесетевых источников», за которыми не следит пользователь, Twitter заявляет, что рассматривает твиты, привлекшие внимание людей, на которых подписаны пользователи, и твиты, понравившиеся тем, кому нравятся твиты, похожие на пользователя.

Уже те, кто просматривал код, заметили соображения, которые вызывают еще много вопросов. Многие разместили их, естественно, в самом Твиттере.

Твиттер только что опубликовал исходный код «алгоритма».

О, что это за файл? Предикаты для твитов на домашней временной шкале?

О, что это за вторая картинка? pic.twitter.com/UE3dU8e3Os

31 марта 2023 г.

Олафур Вааге, старший разработчик программного обеспечения в норвежской консультационной службе по программному обеспечению TurtleSec, отметил, что внутри « HomeTweetTypePredicates.scala » некоторые из возможных соображений, по которым твит может быть кандидатом в раздел «Для вас», следующие:

  • author_is_elon
  • author_is_power_user
  • author_is_democrat
  • author_is_republican

В другом месте кода комментарий к коду, предположительно оставленный инженером Twitter, поясняет, что эти идентификационные значения «используются исключительно для сбора метрик». Комментарий звучит следующим образом:

Эти списки идентификаторов авторов используются исключительно для сбора метрик. Мы отслеживаем, как часто мы обслуживаем твиты этих авторов и как часто их твиты производят впечатление на пользователей. Это помогает нам подтвердить на нашей платформе экспериментов A/B, что мы не отправляем изменения, которые негативно влияют на одну группу по сравнению с другими.

Имена рассматриваемых объектов, такие как «DDGStatsDemocratsFeature» или «DDGStatsElonFeature», похоже, поддерживают эту интерпретацию, но это может быть невозможно подтвердить с помощью доступного кода. Однако интересно, что Twitter проверяет и сопоставляет эти переменные. Во время аудиосессии Twitter Spaces инженер Twitter отметил, что для показателей использовались ярлыки демократов и республиканцев. Маск, который утверждал, что не знал о этикетках до сегодняшнего дня, предположил, что их там быть не должно.

Другие вещи, которые рассматриваются в отношении твита, включают в себя, является ли он менее 30-минутной давности, есть ли в нем изображения и является ли он «опытным пользователем», что, по мнению некоторых, означает « устаревшую » проверенную учетную запись.

Сегодня большая часть алгоритма рекомендаций будет сделана с открытым исходным кодом. Остальные последуют.

Кислотный тест заключается в том, что независимые третьи стороны должны быть в состоянии определить с достаточной точностью то, что, вероятно, будет показано пользователям.

Без сомнения, будет много неловких моментов… https://t.co/41U4oexIev

31 марта 2023 г.

Маск написал в Твиттере вместе с сообщением в блоге компании, что алгоритм рекомендаций, утверждая, что «кислотный тест» будет, если «независимые третьи стороны» смогут «с разумной точностью определить, что, вероятно, будет показано пользователям».

Публикация Twitter кода своего алгоритма происходит всего через несколько дней после того, как более широкий исходный код социальной сети был обнаружен на GitHub, который потенциально находился там в течение нескольких месяцев, согласно The New York Times. Затем Twitter получил повестку в суд, вынуждающую GitHub раскрыть информацию о плакате GitHub.

В отчете Platformer ранее на этой неделе говорилось, что Twitter использовал секретный список из 35 основных пользователей Twitter, включая президента Байдена, Леброна Джеймса, Бена Шапиро и Маска. Свидетельств реализации этого списка, как сообщается, отчасти вызванного недовольством Маска его собственным участием, пока не было обнаружено в базе кода, опубликованном в Твиттере.

В частности, код поступает всего за несколько часов до того, как «подтвержденные устаревшие» пользователи — те, кому была поставлена ​​синяя галочка, чтобы указать на подлинность или известность до того, как Маск купил услугу, — должны быть отменены в пользу платных подписчиков Twitter Blue. В то время как некоторые пользователи, связанные с правительствами и крупными организациями, могут подавать заявки на галочки других цветов, только подписчики Twitter Blue за 8 долларов в месяц получат, среди прочего, «приоритетный рейтинг в разговорах».

Все эти изменения происходят 1 апреля, или в День дурака.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *