Clash of the Titans AI: ChatGPT vs Bard en una batalla de ingenio y sabiduría
En el mundo actual de chatbots generativos impulsados por IA, fuimos testigos de la aparición repentina de ChatGPT de OpenAI, presentado en noviembre, seguido de Bing Chat en febrero y Bard de Google en marzo. Decidimos poner a prueba estos chatbots completando una serie de tareas para determinar cuál domina el campo de los chatbots de IA. Dado que Bing Chat utiliza la misma tecnología GPT-4 que el último modelo de ChatGPT, decidimos centrarnos en los dos titanes de la tecnología de bots de chat con IA: OpenAI y Google.
Probamos ChatGPT y Bard en siete categorías críticas: chistes de papá, diálogos de argumentos, problemas matemáticos, generalización, búsqueda de hechos, escritura creativa y codificación. Para cada prueba, ingresamos la misma instrucción (llamada «pista») en ChatGPT (con GPT-4) y Google Bard. Usamos el primer resultado, sin quisquillosos.
Vale la pena señalar que también está disponible una versión de ChatGPT basada en el modelo GPT-3.5 anterior, pero no la usamos en la prueba. Dado que solo usamos GPT-4, nos referiremos a ChatGPT como «ChatGPT-4» en este artículo para evitar confusiones.
Obviamente, este no es un estudio científico, pero pretende ser una comparación divertida de las capacidades de los chatbots. El resultado puede variar entre sesiones debido a elementos aleatorios, y evaluaciones posteriores con diferentes señales producirán resultados diferentes. Además, las capacidades de estos modelos cambiarán rápidamente con el tiempo a medida que Google y OpenAI continúen actualizándolos. Pero por ahora, así son las cosas a principios de abril de 2023.
chistes de papá
Para animar nuestra competencia de ingenio, le pedimos a ChatGPT y a Bard que escribieran algunos chistes. Y dado que los chistes de papá son el pináculo de la comedia, nos preguntamos si dos chatbots podrían inventar algunos chistes únicos.
Pista: Escribe 5 chistes originales de papá.
De los cinco chistes sobre papás del Bardo, encontramos tres palabra por palabra en Internet mediante una búsqueda en Google. Un ejemplo (“uvas”) está medio tomado de un tuit de broma de Mitch Hedberg , pero está corrompido por un desafortunado juego de palabras que no queremos tratar de interpretar. Y sorprendentemente, hay un chiste aparentemente original (sobre un caracol) que no encontramos en ningún otro lado, pero que no tiene sentido.
Mientras tanto, los cinco chistes de papá de ChatGPT-4 eran 100 por ciento poco originales, todos tomados completamente de otras fuentes, pero fueron entregados con precisión. Dado que se supone que los chistes de padres son dignos de gemidos en lugar de ingeniosos, parece que Bard ha suplantado a ChatGPT-4 aquí. Bard también trató de inventar chistes originales (según nuestras instrucciones), aunque algunos de ellos fallaron terriblemente de manera bochornosa (que está en el espíritu de papá) e incluso, por así decirlo, sin querer, le puso un pie en la boca ( también como papá).
Ganador: Bardo
Deja una respuesta