Twitter zveřejňuje kód, o kterém tvrdí, že určuje, jaké tweety lidé vidí a proč.

Twitter zveřejňuje kód, o kterém tvrdí, že určuje, jaké tweety lidé vidí a proč.

Twitter splnil jeden z mnoha slibů generálního ředitele Elona Muska tím, že v pátek odpoledne zveřejnil kód pro svůj algoritmus pro doporučení tweetů na GitHubu .

Kód, publikovaný pod licencí GNU Affero v3.0 General Public License , obsahuje četné podrobnosti o tom, jaké faktory způsobují, že se tweet s větší či menší pravděpodobností objeví na časové ose uživatele.

V blogovém příspěvku doprovázejícím vydání kódu technický tým Twitteru (bez konkrétního titulku) poznamenává, že systém pro určování, které „nejoblíbenější tweety, které se vám nakonec zobrazí na časové ose vašeho zařízení“, zahrnuje mnoho vzájemně propojených služeb a úloh.“ Pokaždé, když se obnoví domovská obrazovka Twitteru, Twitter stáhne „nejlepších 1 500 tweetů,“ uvádí příspěvek ze stovek milionů.

Největším zdrojem těchto tweetů jsou „online zdroje“ neboli uživatelé, kteří jsou někým sledováni. Nejlepší tweety z tohoto zásobníku jsou seřazeny podle pravděpodobnosti interakce uživatele s autorem tohoto tweetu; tím je pravděpodobnější, že se jejich tweety objeví ve For You. U „offline zdrojů“, které uživatel nesleduje, Twitter říká, že bere v úvahu tweety, které přitahují pozornost lidí, které uživatel sleduje, a tweety, které se líbí těm, kteří mají rádi tweety podobné uživateli.

Již ti, kteří se podívali na kód, si všimli úvah, které vyvolávají mnohem více otázek. Mnozí je samozřejmě zveřejnili na samotném Twitteru.

Twitter právě zveřejnil zdrojový kód „algoritmu“.

Oh, co je to za soubor? Predikáty pro tweety na domácí časové ose?

Oh, co je ten druhý obrázek? pic.twitter.com/UE3dU8e3Os

31. března 2023

Olafur Vaage, vedoucí softwarový inženýr v norské softwarové konzultační službě TurtleSec, poznamenal, že v „ HomeTweetTypePredicates.scala “ „některé z možných úvah, pro které by mohl být tweet kandidátem na sekci „Pro vás“, jsou následující:

  • author_is_elon
  • author_is_power_user
  • author_is_democrat
  • author_is_republican

Jinde v kódu komentář ke kódu , který údajně zanechal technik Twitteru, objasňuje, že tyto identifikační hodnoty se „používají výhradně pro shromažďování metrik“. Komentář zní takto:

Tyto seznamy ID autorů se používají výhradně ke shromažďování metrik. Sledujeme, jak často poskytujeme tweety těchto autorů a jak často jejich tweety na uživatele zapůsobí. To nám pomáhá potvrdit na naší platformě A/B experimentování, že neodesíláme změny, které negativně ovlivňují jednu skupinu oproti ostatním.

Zdá se, že názvy předmětných objektů, jako je „DDGStatsDemocratsFeature“ nebo „DDGStatsElonFeature“, podporují tuto interpretaci, ale nemusí to být možné potvrdit dostupným kódem. Je však zajímavé, že Twitter tyto proměnné kontroluje a koreluje. Během zvukové relace Twitter Spaces technik Twitteru poznamenal, že štítky použité pro metriky byly demokraté a republikáni. Musk, který tvrdil, že o štítcích až do dnešního dne nevěděl, navrhl, že by tam neměly být.

Další věci, které se v souvislosti s tweetem zvažují, zahrnují to, zda je méně než 30 minut starý, zda obsahuje obrázky a zda se jedná o „pokročilého uživatele“, což podle některých znamená „zastaralý“ ověřený účet .

Dnes bude většina algoritmu doporučení vytvořena jako open source. Zbytek bude následovat.

Kyselinový test spočívá v tom, že nezávislé třetí strany musí být schopny s přiměřenou přesností určit, co se pravděpodobně zobrazí uživatelům.

Není pochyb o tom, že bude mnoho nepříjemných okamžiků… https://t.co/41U4oexIev

31. března 2023

Musk tweetoval spolu s příspěvkem na firemním blogu, že algoritmus doporučení argumentoval tím, že by došlo k „testu kyselinou“, pokud by „nezávislé třetí strany“ mohly „s přiměřenou přesností určit, co se pravděpodobně zobrazí uživatelům“.

Vydání kódu algoritmu Twitteru přichází jen několik dní poté, co byl na GitHubu objeven širší zdrojový kód sociální sítě a podle The New York Times tam může sedět několik měsíců . Twitter poté obdržel předvolání, které donutilo GitHub prozradit informace o plakátu GitHubu.

Zpráva Platformer z počátku tohoto týdne uvedla, že Twitter použil tajný seznam 35 hlavních uživatelů Twitteru, včetně prezidenta Bidena, LeBrona Jamese, Bena Shapira a Muska. Důkazy o implementaci tohoto seznamu, údajně částečně vyvolané Muskovou nespokojeností s jeho vlastním zapojením, se zatím nepodařilo najít v kódové základně zveřejněné na Twitteru.

Konkrétně kód dorazí jen pár hodin předtím, než „ověření starší“ uživatelé – ti, kteří byli modře zaškrtnuti, aby označovali pravost nebo proslulost předtím, než Musk službu koupil – mají být vyřazeni ve prospěch placených předplatitelů Twitter Blue. Zatímco někteří uživatelé spojení s vládami a velkými organizacemi mohou požádat o jiné barevné zaškrtnutí , pouze odběratelé Twitter Blue za 8 $ měsíčně obdrží mimo jiné „hodnocení priority v konverzacích“.

Všechny tyto změny se dějí 1. dubna, tedy prvního dubna.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *