Twitter publicerar kod som den hävdar avgör vilka tweets folk ser och varför.
Twitter levererade ett av VD Elon Musks många löften genom att på fredagseftermiddagen publicera vad den hävdar är koden för dess tweetrekommendationsalgoritm på GitHub .
Koden, publicerad under GNU Affero v3.0 General Public License , innehåller många detaljer om vilka faktorer som gör en tweet mer eller mindre sannolikt att visas i en användares tidslinje.
I ett blogginlägg som åtföljer släppandet av koden noterar Twitters ingenjörsteam (utan en specifik bildtext) att systemet för att avgöra vilka som är ”de mest populära tweets som till slut dyker upp på din enhets tidslinje för dig”” omfattar många sammanlänkade tjänster och jobb.” Varje gång Twitter-startskärmen uppdateras, hämtar Twitter ”de 50 miljoner tvåts översta av 100 inlägg”.
Den största källan till dessa tweets är ”onlinekällor” eller användare som följs av någon. De bästa tweetarna från denna stack rankas efter sannolikheten för att en användare interagerar med författaren till den tweeten; desto mer sannolikt är det att deras tweets dyker upp i For You. För ”offlinekällor” som inte följs av användaren, säger Twitter att det överväger tweets som får uppmärksamhet från personer som användaren följer och tweets som gillas av de som gillar tweets som liknar användaren.
Redan de som har tittat på koden har lagt märke till överväganden som väcker många fler frågor. Många la upp dem, naturligtvis, på självaste Twitter.
Twitter har precis släppt källkoden för ”algoritmen”.
Åh vad är denna fil? Predikat för tweets på hemmatidslinjen?
Åh vad är den andra bilden? pic.twitter.com/UE3dU8e3Os
Olafur Vaage, senior mjukvaruingenjör vid den norska mjukvarukonsulttjänsten TurtleSec, noterade att inom ” HomeTweetTypePredicates.scala ”är några av de möjliga överväganden som en tweet kan vara en kandidat för avsnittet ”För dig” som följer:
-
author_is_elon
-
author_is_power_user
-
author_is_democrat
-
author_is_republican
På andra ställen i koden klargör en kodkommentar som påstås lämnats av en Twitter-ingenjör att dessa identifieringsvärden ”enbart används för att samla in mätvärden”. Kommentaren lyder så här:
Dessa författar-ID-listor används endast för att samla in mätvärden. Vi spårar hur ofta vi visar dessa författares tweets och hur ofta deras tweets imponerar på användare. Detta hjälper oss att bekräfta på vår A/B-experimentplattform att vi inte skickar in ändringar som påverkar en grupp negativt framför andra.
Namnen på objekten i fråga, såsom ”DDGStatsDemocratsFeature” eller ”DDGStatsElonFeature” verkar stödja denna tolkning, men det är kanske inte möjligt att bekräfta med tillgänglig kod. Det är dock intressant att Twitter kontrollerar och korrelerar dessa variabler. Under Twitter Spaces ljudsession noterade en Twitter-ingenjör att etiketterna som användes för mätvärdena var demokrater och republikaner. Musk, som hävdade att han inte kände till etiketterna förrän idag, föreslog att de inte borde vara där.
Andra saker som beaktas i samband med tweeten inkluderar om den är mindre än 30 minuter gammal, om den har bilder och om den är en ”power user”, vilket vissa säger betyder ett ”föråldrat” verifierat konto .
Idag kommer det mesta av rekommendationsalgoritmen att vara öppen källkod. Resten kommer att följa.
Syratestet är att oberoende tredje parter måste kunna avgöra med rimlig noggrannhet vad som sannolikt kommer att visas för användarna.
Utan tvekan kommer det att finnas många obekväma ögonblick… https://t.co/41U4oexIev
Musk twittrade, tillsammans med ett företagsblogginlägg, att rekommendationsalgoritmen, och hävdade att det skulle finnas ett ”syratest” om ”oberoende tredje parter” kunde ”avgöra med rimlig noggrannhet vad som sannolikt kommer att visas för användare.”
Twitters släppande av sin algoritmkod kommer bara några dagar efter att det sociala nätverkets bredare källkod upptäcktes på GitHub, som potentiellt har suttit där i månader, enligt The New York Times . Twitter fick sedan en stämningsansökan som tvingade GitHub att avslöja information om GitHub-affischen.
En rapport från Platformer tidigare i veckan sa att Twitter använde en hemlig lista över 35 toppanvändare på Twitter, inklusive president Biden, LeBron James, Ben Shapiro och Musk. Bevis på implementeringen av denna lista, som enligt uppgift delvis föranleds av Musks missnöje med sitt eget engagemang, har ännu inte hittats i en kodbas som publicerats på Twitter.
Specifikt kommer koden bara några timmar innan ”verifierade äldre” användare – de som var blåkryssade för att indikera äkthet eller ryktbarhet innan Musk köpte tjänsten – kommer att fasas ut till förmån för betalda Twitter Blue-prenumeranter. Medan vissa användare associerade med regeringar och stora organisationer kan ansöka om andra färgade bockar , kommer endast Twitter Blue-prenumeranter för $8/månad att få ”prioritetsbetyg i konversationer” bland annat.
Alla dessa förändringar äger rum den 1 april, eller första april.
Lämna ett svar