Une nouvelle mystérieuse Chatbot IA appelé « gpt2-chatbot » a fait tourner les têtes cette semaine après être devenu disponible sur un important site d'analyse comparative de modèles de langage, LMSYS Org. Personne ne sait d'où il vient, mais beaucoup considèrent qu'il a à peu près les mêmes capacités que le GPT-4 d'OpenAI. Cela place gpt2-chatbot dans une classe rare de modèles d’IA que seule une poignée de développeurs dans le monde ont pu réaliser.

Pourquoi tout le monde poursuit-il les sociétés d’IA ? | Technologie du futur

« Personne ne sait qui l'a fabriqué ni ce que c'est, mais j'ai joué un peu avec et il semble avoir le même niveau de capacité que GPT-4 », Ethan Mollick, professeur de recherche sur l'intelligence artificielle à la Wharton School. de l'Université de Pennsylvanie, a déclaré dans un tweeter le lundi.

Alors que gpt2-chatbot atteignait son apogée, le chatbot a disparu avec peu d'explications mardi après-midi. Un avis sur le site LMSYS page d'accueil lit « gpt2-chatbot est actuellement indisponible. » Les brefs messages vous dirigent vers son page de politiquequi note que les fournisseurs de modèles peuvent retirer des modèles d'IA anonymes à tout moment ou une fois qu'un modèle d'IA a reçu suffisamment de votes.

Les communautés d'IA en ligne se sont déchaînées à propos du chatbot anonyme gpt2. Un utilisateur de X affirme que gpt2-chatbot a presque codé un clone parfait du jeu mobile Flappy Bird. Un autre utilisateur de X dit avoir résolu un problème Problème de l'Olympiade internationale de mathématiques d'un seul coup. Sur de longs fils de discussion Reddit, les utilisateurs spéculent énormément sur les origines du chatbot gpt2 et se disputent pour savoir s'il vient de OpenAI, Googleou Anthropique. Il n'y a aucune preuve de ces affirmations, mais les tweets du PDG d'OpenAI, Sam Altman, et d'autres dirigeants n'ont fait qu'alimenter le feu.

Vous pouviez auparavant essayer vous-même le chatbot gpt2 sur Site Web de l'organisation LMSYS. Il était disponible sur « Direct Chat » ou « Arena (side-by-side) » dans le menu déroulant. LMSYS Org dit dans son blog politique que certains développeurs de modèles d'IA peuvent tester des modèles anonymes inédits avant une version plus large. Cela a amené beaucoup de gens à croire que gpt2-chatbot est un modèle anonyme d'un développeur majeur d'IA.

« Juste pour clarifier, conformément à notre politique, nous nous sommes associés à plusieurs développeurs de modèles pour apporter leurs nouveaux modèles sur notre plate-forme pour des tests préliminaires communautaires », a déclaré LMSYS Org dans un communiqué. tweeter lundi, en réponse à un fil de discussion sur gpt2-chatbot. « Ces modèles sont strictement destinés aux tests et ne seront pas répertoriés dans le classement tant qu'ils ne seront pas rendus publics. »

LMSYS Org et OpenAI n'ont pas immédiatement répondu à la demande de commentaires de Gizmodo.

Lors des tests limités de Gizmodo, nous avons constaté que le chatbot gpt2 possède des capacités similaires aux principaux modèles d'IA d'Anthropic et d'OpenAI. Il présentait un comportement exclusif aux grands modèles de langage avancés, raisonnant bien et décrivant des plans détaillés pour des tâches complexes. Voici quelques-uns de nos exemples comparant gpt2-chatbot (à gauche) et le modèle Claude Opus d'Anthropic (à droite).

Invite d'instructions : gpt2-chatbot (à gauche) contre Claude 3 Opus (à droite)

Invite de raisonnement : gpt2-chatbot (à gauche) vs Claude 3 Opus (à droite)

Un professeur d’ingénierie informatique de l’Université du Wisconsin a découvert que le chatbot gpt2 pouvait effectuer une tâche que d’autres modèles d’IA de premier plan ne pouvaient pas réaliser. Dimitris Papailiopoulos a demandé à gpt2-chatbot de résoudre une énigme mathématique qui implique l'apprentissage de règles inexplicites. L’IA a largement du mal à répondre à des questions comme celle-ci.

En fin de compte, il existe encore très peu d’informations disponibles sur le chatbot gpt2. Cependant, il semble clair qu’un acteur puissant se cache derrière ce modèle d’IA. Dans les semaines à venir, le créateur et les origines du chatbot gpt2 seront probablement rendus publics. Cela pourrait signifier qu’un nouveau modèle d’IA se profile à l’horizon ou peut-être qu’il y a un nouveau développeur d’IA sur la scène.

Vous pouvez lire l’article original (en Angais) sur le {site|blog}gizmodo.com