Twitter 發布了它聲稱決定人們看到哪些推文以及為什麼看到的代碼。
Twitter 兌現了首席執行官埃隆·馬斯克 (Elon Musk) 的眾多承諾之一,於週五下午在 GitHub 上發布了其聲稱的推文推薦算法代碼。
該代碼根據GNU Affero v3.0 通用公共許可證發布,包含有關哪些因素使推文或多或少出現在用戶時間線中的可能性的大量詳細信息。
在發布代碼的博客文章中,Twitter 工程團隊(沒有具體標題)指出,用於確定哪些是“最終出現在您設備時間線上的最受歡迎的推文”的系統“包含許多相互關聯的服務和作業。”該帖子稱,每次刷新 Twitter 主屏幕時,Twitter 都會“從數億條推文中提取前 1,500 條推文”。
這些推文的最大來源是“在線來源”或被某人關注的用戶。該堆棧中排名靠前的推文按照用戶與該推文作者互動的可能性進行排名;他們的推文出現在 For You 中的可能性就越大。對於用戶未關注的“離線來源”,Twitter 表示,它會考慮那些引起用戶關注的人注意的推文,以及那些喜歡與用戶類似的推文的人喜歡的推文。
那些看過代碼的人已經註意到了引發更多問題的考慮因素。當然,許多人將它們發佈在 Twitter 上。
Twitter剛剛發布了該“算法”的源代碼。
哦這個文件是什麼?主時間線上推文的謂詞?
噢,第二張圖是什麼?pic.twitter.com/UE3dU8e3Os
挪威軟件諮詢服務 TurtleSec 的高級軟件工程師 Olafur Vaage 指出,在“ HomeTweetTypePredicates.scala ”內部,推文可能成為“For You”部分的候選者的一些可能考慮因素如下:
-
author_is_elon
-
author_is_power_user
-
author_is_democrat
-
author_is_republican
在代碼的其他地方,據稱由 Twitter 工程師留下的代碼註釋澄清了這些標識值“僅用於收集指標”。評論是這樣的:
這些作者 ID 列表僅用於收集指標。我們跟踪我們提供這些作者推文的頻率以及他們的推文給用戶留下深刻印象的頻率。這有助於我們在 A/B 實驗平台上確認我們提交的更改不會對某一組產生負面影響。
相關對象的名稱,例如“DDGStatsDemocratsFeature”或“DDGStatsElonFeature”似乎支持這種解釋,但這可能無法用可用的代碼來確認。然而,有趣的是 Twitter 檢查並關聯了這些變量。在 Twitter Spaces 音頻會議期間,一位 Twitter 工程師指出,用於指標的標籤是民主黨和共和黨。馬斯克聲稱直到今天他才知道這些標籤,並表示它們不應該在那裡。
與推文相關的其他考慮因素包括推文是否少於 30 分鐘、是否有圖像以及是否是“高級用戶”(有人說這意味著“過時的”驗證帳戶)。
如今,大部分推薦算法都將開源。其餘的將隨之而來。
嚴峻的考驗是獨立第三方必須能夠以合理的準確性確定可能向用戶顯示的內容。
毫無疑問會有很多尷尬的時刻…… https://t.co/41U4oexIev
馬斯克在推特上以及公司博客文章中提到了推薦算法,認為如果“獨立第三方”能夠“以合理的準確性確定可能向用戶展示的內容”,就會進行“嚴峻的測試”。
據《紐約時報》報導, Twitter 發布其算法代碼的幾天前,該社交網絡更廣泛的源代碼在 GitHub 上被發現,可能會在那裡保存數月。Twitter 隨後收到了一張傳票,迫使 GitHub 披露有關 GitHub 海報的信息。
Platformer 本週早些時候的一份報告稱,Twitter 使用了 35 位頂級 Twitter 用戶的秘密名單,其中包括總統拜登、勒布朗·詹姆斯、本·夏皮羅和馬斯克。據報導,該清單的實施證據部分是由於馬斯克對自己的參與感到不滿,但尚未在 Twitter 上發布的代碼庫中找到。
具體來說,該代碼在“經過驗證的遺留”用戶(那些在馬斯克購買該服務之前被打上藍色勾號以表明真實性或惡名的用戶)即將被棄用之前幾個小時到達,轉而支持付費 Twitter Blue 訂閱者。雖然一些與政府和大型組織相關的用戶可能會申請其他彩色複選標記,但只有 8 美元/月的 Twitter Blue 訂閱者將獲得“對話優先級”等。
所有這些變化都發生在 4 月 1 日,即愚人節。
發佈留言