Clash of the Titans AI: ChatGPT vs Bard w bitwie sprytu i mądrości
W dzisiejszym świecie generatywnych chatbotów napędzanych sztuczną inteligencją byliśmy świadkami nagłego pojawienia się ChatGPT OpenAI, wprowadzonego w listopadzie, następnie Bing Chat w lutym i Google Bard w marcu. Postanowiliśmy przetestować te chatboty, wykonując serię zadań, aby określić, który z nich dominuje na arenie chatbotów AI. Ponieważ Bing Chat wykorzystuje tę samą technologię GPT-4, co najnowszy model ChatGPT, postanowiliśmy skupić się na dwóch tytanach technologii AI chatbot: OpenAI i Google.
Przetestowaliśmy ChatGPT i Bard w siedmiu krytycznych kategoriach: żarty taty, dialogi argumentacyjne, problemy z matematyką słów, uogólnienia, ustalanie faktów, kreatywne pisanie i kodowanie. Dla każdego testu wprowadzaliśmy tę samą instrukcję (zwaną „wskazówką”) do ChatGPT (z GPT-4) i Google Bard. Użyliśmy pierwszego wyniku, bez szukania dziury w całym.
Warto zauważyć, że dostępna jest również wersja ChatGPT oparta na wcześniejszym modelu GPT-3.5, ale nie używaliśmy jej w teście. Ponieważ używaliśmy tylko GPT-4, w tym artykule będziemy odnosić się do ChatGPT jako „ChatGPT-4”, aby uniknąć nieporozumień.
Oczywiście nie jest to badanie naukowe, ale ma być zabawnym porównaniem możliwości chatbotów. Dane wyjściowe mogą się różnić między sesjami ze względu na losowe elementy, a dalsze oceny z różnymi wskazówkami dadzą różne wyniki. Ponadto możliwości tych modeli będą się szybko zmieniać w miarę upływu czasu, ponieważ Google i OpenAI będą je nadal aktualizować. Ale na razie tak jest na początku kwietnia 2023 r.
Tata żartuje
Aby rozgrzać naszą rywalizację dowcipów, poprosiliśmy ChatGPT i Barda o napisanie żartów. A ponieważ żarty z taty są szczytem komedii, zastanawialiśmy się, czy dwa chatboty mogłyby wymyślić jakieś wyjątkowe żarty.
Wskazówka: napisz 5 oryginalnych dowcipów o tacie.
Spośród pięciu dowcipów o tacie Barda znaleźliśmy trzy dosłownie w Internecie za pomocą wyszukiwarki Google. Jeden przykład („winogrona”) jest w połowie zapożyczony z żartobliwego tweeta Mitcha Hedberga , ale jest uszkodzony przez niefortunną grę słów, której nie chcemy próbować interpretować. I, co zaskakujące, jest jeden pozornie oryginalny żart (o ślimaku), którego nie możemy znaleźć nigdzie indziej, ale który nie ma sensu.
Tymczasem pięć dowcipów o tacie z ChatGPT-4 było w 100 procentach nieoryginalnych, wszystkie wzięte w całości z innych źródeł, ale zostały dostarczone dokładnie. Ponieważ żarty ojca powinny być raczej godne jęku niż sprytne, wydaje się, że Bard zastąpił tutaj ChatGPT-4. Bard próbował też wymyślać oryginalne żarty (według naszych wskazówek), choć niektóre z nich zawodziły strasznie w żenujący sposób (co jest w duchu taty), a nawet, że tak powiem, niechcący wsadził mu stopę do buzi ( też podobny do taty).
Zwycięzca: Bard
Dodaj komentarz