Twitter publikuje kod, który, jak twierdzi, określa, jakie tweety widzą ludzie i dlaczego.

Twitter publikuje kod, który, jak twierdzi, określa, jakie tweety widzą ludzie i dlaczego.

Twitter spełnił jedną z wielu obietnic prezesa Elona Muska , publikując w piątek po południu kod algorytmu rekomendacji tweetów na GitHub .

Kod opublikowany na licencji GNU Affero v3.0 General Public License zawiera liczne szczegóły dotyczące czynników, które sprawiają, że tweet pojawia się mniej lub bardziej na osi czasu użytkownika.

W poście na blogu towarzyszącym wydaniu kodu zespół inżynierów Twittera (bez konkretnego podpisu) zauważa, że ​​system określania, które „najpopularniejsze tweety pojawiają się na osi czasu Twojego urządzenia” obejmuje wiele połączonych ze sobą usług i zadań.

Największym źródłem tych tweetów są „źródła online” lub użytkownicy, których ktoś obserwuje. Najlepsze tweety z tego stosu są uszeregowane według prawdopodobieństwa interakcji użytkownika z autorem tego tweeta; tym większe prawdopodobieństwo, że ich tweety pojawią się w For You. W przypadku „źródeł offline”, których użytkownik nie śledzi, Twitter mówi, że bierze pod uwagę tweety, które przyciągają uwagę osób, które obserwuje użytkownik, oraz tweety, które podobają się tym, którzy lubią tweety podobne do użytkownika.

Już ci, którzy zajrzeli do kodu, zauważyli rozważania, które rodzą o wiele więcej pytań. Wielu umieściło je oczywiście na samym Twitterze.

Twitter właśnie udostępnił kod źródłowy „algorytmu”.

O, co to za plik? Predykaty dla tweetów na domowej osi czasu?

O, co to za drugie zdjęcie? pic.twitter.com/UE3dU8e3Os

31 marca 2023 r

Olafur Vaage, starszy inżynier oprogramowania w norweskiej firmie konsultingowej TurtleSec, zauważył, że w „ HomeTweetTypePredicates.scala ” niektóre z możliwych rozważań, dla których tweet może być kandydatem do sekcji „Dla Ciebie”, są następujące:

  • author_is_elon
  • author_is_power_user
  • author_is_democrat
  • author_is_republican

W innym miejscu kodu komentarz do kodu rzekomo pozostawiony przez inżyniera Twittera wyjaśnia, że ​​te wartości identyfikacyjne są „używane wyłącznie do zbierania danych”. Komentarz brzmi tak:

Te listy identyfikatorów autorów są używane wyłącznie do zbierania danych. Śledzimy, jak często udostępniamy tweety tych autorów i jak często ich tweety robią wrażenie na użytkownikach. Pomaga nam to potwierdzić na naszej platformie eksperymentów A/B, że nie wprowadzamy zmian, które negatywnie wpływają na jedną grupę w stosunku do innych.

Nazwy obiektów, o których mowa, takie jak „DDGStatsDemocratsFeature” lub „DDGStatsElonFeature” wydają się potwierdzać tę interpretację, ale może to nie być możliwe do potwierdzenia dostępnym kodem. Interesujące jest jednak to, że Twitter sprawdza i koreluje te zmienne. Podczas sesji audio Twitter Spaces inżynier Twittera zauważył, że etykiety użyte do wskaźników to Demokraci i Republikanie. Musk, który twierdził, że do dziś nie wiedział o etykietach, zasugerował, że nie powinno ich tam być.

Inne kwestie, które są brane pod uwagę w związku z tweetem, to to, czy ma mniej niż 30 minut, czy zawiera obrazy i czy jest „zaawansowanym użytkownikiem”, co według niektórych oznacza „nieaktualne” zweryfikowane konto .

Obecnie większość algorytmu rekomendacji będzie miała otwarte oprogramowanie. Reszta pójdzie za nimi.

Test kwasowości polega na tym, że niezależne strony trzecie muszą być w stanie określić z rozsądną dokładnością, co prawdopodobnie zostanie pokazane użytkownikom.

Bez wątpienia będzie wiele niezręcznych chwil… https://t.co/41U4oexIev

31 marca 2023 r

Musk napisał na Twitterze, wraz z firmowym postem na blogu, że algorytm rekomendacji, argumentując, że byłby „test kwasowy”, gdyby „niezależne strony trzecie” mogły „określić z rozsądną dokładnością, co prawdopodobnie zostanie pokazane użytkownikom”.

Publikacja kodu algorytmu przez Twittera następuje zaledwie kilka dni po odkryciu szerszego kodu źródłowego sieci społecznościowej na GitHub, potencjalnie siedzącego tam przez miesiące, według The New York Times . Następnie Twitter otrzymał wezwanie sądowe zmuszające GitHub do ujawnienia informacji o plakacie GitHub.

Raport Platformer na początku tego tygodnia powiedział, że Twitter wykorzystał tajną listę 35 czołowych użytkowników Twittera, w tym prezydenta Bidena, LeBrona Jamesa, Bena Shapiro i Muska. Dowodów na wdrożenie tej listy, podobno częściowo spowodowanych niezadowoleniem Muska z własnego zaangażowania, nie znaleziono jeszcze w bazie kodów opublikowanej na Twitterze.

W szczególności kod pojawia się zaledwie kilka godzin przed tym, jak użytkownicy „zweryfikowanej starszej wersji” – ci, którzy zostali zaznaczeni na niebiesko, aby wskazać autentyczność lub rozgłos, zanim Musk kupił usługę – zostaną wycofani na rzecz płatnych subskrybentów Twitter Blue. Podczas gdy niektórzy użytkownicy powiązani z rządami i dużymi organizacjami mogą ubiegać się o inne kolorowe znaczniki wyboru , tylko subskrybenci Twitter Blue za 8 USD miesięcznie otrzymają między innymi „priorytet w rozmowach”.

Wszystkie te zmiany mają miejsce 1 kwietnia, czyli w Prima Aprilis.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *