Twitter udgiver kode, som den hævder bestemmer, hvilke tweets folk ser og hvorfor.
Twitter indfriede et af CEO Elon Musks mange løfter ved at offentliggøre fredag eftermiddag, hvad det hævder er koden til dens tweet-anbefalingsalgoritme på GitHub .
Koden, der er udgivet under GNU Affero v3.0 General Public License , indeholder adskillige detaljer om, hvilke faktorer der gør et tweet mere eller mindre tilbøjeligt til at blive vist i en brugers tidslinje.
I et blogindlæg, der ledsager frigivelsen af koden , bemærker Twitter-ingeniørteamet (uden en specifik billedtekst), at systemet til at bestemme, hvilke er “de mest populære tweets, der ender med at dukke op på din enheds tidslinje for dig”” omfatter mange sammenkoblede tjenester og job.”
Den største kilde til disse tweets er “onlinekilder” eller brugere, der bliver fulgt af nogen. De bedste tweets fra denne stak er rangeret efter sandsynligheden for, at en bruger interagerer med forfatteren af det tweet; jo mere sandsynligt er det, at deres tweets vises i For You. For “offline kilder”, der ikke følges af brugeren, siger Twitter, at det betragter tweets, der fanger opmærksomheden fra folk, brugeren følger, og tweets, der kan lide af dem, der kan lide tweets, der ligner brugeren.
Allerede de, der har set på koden, har bemærket overvejelser, der rejser mange flere spørgsmål. Mange postede dem selvfølgelig på Twitter selv.
Twitter har netop udgivet kildekoden til “algoritmen”.
Åh, hvad er denne fil? Prædikater for tweets på hjemmetidslinjen?
Åh, hvad er det andet billede? pic.twitter.com/UE3dU8e3Os
Olafur Vaage, senior softwareingeniør hos den norske softwarekonsulenttjeneste TurtleSec, bemærkede, at inde i ” HomeTweetTypePredicates.scala “er nogle af de mulige overvejelser, som et tweet kan være en kandidat til sektionen “For dig” for, som følger:
-
author_is_elon
-
author_is_power_user
-
author_is_democrat
-
author_is_republican
Et andet sted i koden præciserer en kodekommentar, der angiveligt er efterladt af en Twitter-ingeniør, at disse identifikationsværdier “kun bruges til at indsamle metrics”. Kommentaren lyder sådan her:
Disse forfatter-id-lister bruges udelukkende til indsamling af metrics. Vi sporer, hvor ofte vi serverer disse forfatteres tweets, og hvor ofte deres tweets imponerer brugerne. Dette hjælper os med at bekræfte på vores A/B-eksperimenteringsplatform, at vi ikke indsender ændringer, der påvirker én gruppe negativt frem for andre.
Navnene på de pågældende objekter, såsom “DDGStatsDemocratsFeature” eller “DDGStatsElonFeature” ser ud til at understøtte denne fortolkning, men dette er muligvis ikke muligt at bekræfte med tilgængelig kode. Det er dog interessant, at Twitter tjekker og korrelerer disse variable. Under Twitter Spaces-lydsessionen bemærkede en Twitter-ingeniør, at etiketterne, der blev brugt til metrikken, var demokrater og republikanere. Musk, som hævdede, at han ikke kendte til etiketterne før i dag, foreslog, at de ikke skulle være der.
Andre ting, der overvejes i forhold til tweetet, er, om det er mindre end 30 minutter gammelt, om det har billeder, og om det er en “power user”, hvilket nogle siger betyder en “forældet” verificeret konto .
I dag vil det meste af anbefalingsalgoritmen blive gjort til open source. Resten følger.
Syretesten er, at uafhængige tredjeparter med rimelig nøjagtighed skal kunne bestemme, hvad der sandsynligvis vil blive vist til brugerne.
Der vil uden tvivl være mange akavede øjeblikke… https://t.co/41U4oexIev
Musk tweetede sammen med et firmas blogindlæg, at anbefalingsalgoritmen, og argumenterede for, at der ville være en “syretest”, hvis “uafhængige tredjeparter” kunne “afgøre med rimelig nøjagtighed, hvad der sandsynligvis vil blive vist til brugerne.”
Twitters frigivelse af sin algoritmekode kommer få dage efter, at det sociale netværks bredere kildekode blev opdaget på GitHub, der potentielt har siddet der i flere måneder, ifølge The New York Times . Twitter modtog derefter en stævning, der tvang GitHub til at afsløre oplysninger om GitHub-plakaten.
En rapport fra Platformer tidligere på ugen sagde, at Twitter brugte en hemmelig liste over 35 top Twitter-brugere, herunder præsident Biden, LeBron James, Ben Shapiro og Musk. Beviser for implementeringen af denne liste, angiveligt delvist foranlediget af Musks utilfredshed med hans egen involvering, er endnu ikke fundet i en kodebase, der er offentliggjort på Twitter.
Specifikt ankommer koden blot et par timer før “verificeret arv”-brugere – dem, der var blåt krydset for at angive ægthed eller berygtethed, før Musk købte tjenesten – skal forældes til fordel for betalte Twitter Blue-abonnenter. Mens nogle brugere tilknyttet regeringer og store organisationer kan ansøge om andre farvede flueben , vil kun 8 USD/måned Twitter Blue-abonnenter blandt andet modtage “prioritetvurdering i samtaler” .
Alle disse ændringer finder sted den 1. april eller aprilsnar.
Skriv et svar