諸神之戰AI:ChatGPT vs Bard 鬥智斗勇

諸神之戰AI:ChatGPT vs Bard 鬥智斗勇

在當今人工智能驅動的生成聊天機器人世界中,我們見證了 OpenAI 的 ChatGPT 的突然出現,該產品於 11 月推出,隨後是 2 月的 Bing Chat 和 3 月的 Google Bard。我們決定通過完成一系列任務來測試這些聊天機器人,以確定哪一個在人工智能聊天機器人領域佔據主導地位。由於 Bing Chat 使用與最新 ChatGPT 模型相同的 GPT-4 技術,因此我們決定重點關注 AI 聊天機器人技術的兩大巨頭:OpenAI 和 Google。

我們在七個關鍵類別中測試了 ChatGPT 和 Bard:爸爸笑話、論證對話、文字數學問題、概括、事實發現、創意寫作和編碼。對於每個測試,我們都將相同的指令(稱為“提示”)輸入到 ChatGPT(使用 GPT-4)和 Google Bard 中。我們使用了第一個結果,沒有挑剔。

值得注意的是,基於早期 GPT-3.5 模型的 ChatGPT 版本也可用,但我們在測試中沒有使用它。由於我們只使用了 GPT-4,因此在本文中我們將 ChatGPT 稱為“ChatGPT-4”以避免混淆。

顯然,這不是一項科學研究,而是旨在對聊天機器人的功能進行有趣的比較。由於隨機因素,不同會話的輸出可能會有所不同,並且使用不同線索的進一步評估將產生不同的結果。此外,隨著 Google 和 OpenAI 的不斷升級,這些模型的功能將隨著時間的推移而迅速變化。但就目前而言,這就是 2023 年 4 月初的情況。

爸爸笑話

為了讓我們的智力競賽更加激烈,我們請 ChatGPT 和 Bard 寫了一些笑話。由於爸爸笑話是喜劇的巔峰,我們想知道兩個聊天機器人是否可以想出一些獨特的笑話。

提示:寫 5 個原創爸爸笑話。

在吟遊詩人的五個爸爸笑話中,我們通過谷歌搜索在互聯網上逐字找到了三個。一個例子(“葡萄”)一半是從米奇·赫德伯格(Mitch Hedberg)的笑話推文借來的,但它被一個我們不想嘗試解釋的不幸的雙關語破壞了。令人驚訝的是,有一個看似原創的笑話(關於蝸牛)我們在其他地方找不到,但卻毫無意義。

與此同時,五個 ChatGPT-4 爸爸笑話 100% 非原創,全部完全來自其他來源,但它們的傳達是準確的。由於父親的笑話可能應該是值得抱怨的而不是聰明的,所以 Bard 似乎在這裡取代了 ChatGPT-4。巴德還嘗試想出原創笑話(根據我們的指示),儘管其中一些以令人尷尬的方式嚴重失敗(這符合爸爸的精神),甚至可以說,無意中把一隻腳放進了他的嘴裡(也像爸爸一樣)。

獲勝者:巴德

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *