Les grands modèles de langage (LLM) ont fait des progrès significatifs dans la génération de langage naturel par intelligence artificielle (IA). Des modèles tels que GPT-3, Mégatron-TuringChinchilla, PaLM-2Faucon, et Lama 2 ont révolutionné la façon dont nous interagissons avec la technologie. Cependant, malgré leurs progrès, ces modèles peinent souvent à fournir des réponses nuancées et adaptées aux préférences des utilisateurs. Cette limitation a conduit à l’exploration de nouvelles techniques pour améliorer et personnaliser les LLM.

Traditionnellement, l’amélioration des LLM a été réalisée grâce à un réglage fin supervisé (SFT) et à un apprentissage par renforcement à partir de la rétroaction humaine (RLHF). Bien que ces méthodes se soient révélées efficaces, elles comportent leur propre ensemble de défis. La complexité de la formation et le manque de contrôle de l’utilisateur sur le résultat comptent parmi les limitations les plus importantes.

En réponse à ces défis, l’équipe de recherche NVIDIA a développé une nouvelle technique connue sous le nom de SteerLM. Cette approche innovante simplifie la personnalisation des LLM et permet un pilotage dynamique des sorties du modèle en fonction d’attributs spécifiés. SteerLM fait partie de NVIDIA NeMo et suit une technique en quatre étapes : former un modèle de prédiction d’attributs, annoter divers ensembles de données, effectuer une SFT conditionnée par les attributs et s’appuyer sur l’objectif de modélisation du langage standard.

Personnalisez de grands modèles de langage

L’une des caractéristiques les plus remarquables de SteerLM est sa capacité à ajuster les attributs au moment de l’inférence. Cette fonctionnalité permet aux développeurs de définir des préférences pertinentes pour l’application, permettant ainsi un haut degré de personnalisation. Les utilisateurs peuvent spécifier les attributs souhaités au moment de l’inférence, ce qui rend SteerLM adaptable à un large éventail de cas d’utilisation.

Les applications potentielles de SteerLM sont vastes et variées. Il peut être utilisé dans les domaines des jeux, de l’éducation, des entreprises et de l’accessibilité, entre autres domaines. La possibilité de personnaliser les LLM en fonction de besoins et de préférences spécifiques ouvre un monde de possibilités aussi bien pour les développeurs que pour les utilisateurs finaux.

Par rapport à d’autres techniques de personnalisation avancées, SteerLM simplifie le processus de formation et rend les capacités de personnalisation de pointe plus accessibles aux développeurs. Il utilise des techniques standards comme SFT, nécessitant des modifications minimes de l’infrastructure et du code. De plus, il peut obtenir des résultats raisonnables avec une optimisation limitée des hyperparamètres.

Autres articles qui pourraient vous intéresser sur le sujet des modèles d’IA

Les performances de SteerLM ne sont pas seulement théoriques. Lors d’expériences, le SteerLM 43B a atteint des performances de pointe sur la référence Vicuna, surpassant les modèles RLHF existants comme le LLaMA 30B RLHF. Cette réalisation témoigne de l’efficacité de SteerLM et de son potentiel à révolutionner le domaine des LLM.

Le processus de formation simple de SteerLM peut conduire à des LLM personnalisés avec une précision comparable à celle des techniques RLHF plus complexes. Cela rend les niveaux élevés de précision plus accessibles et permet une démocratisation plus facile de la personnalisation parmi les développeurs.

SteerLM représente une avancée significative dans le domaine des LLM. En simplifiant le processus de personnalisation et en permettant un pilotage dynamique des résultats du modèle, il surmonte bon nombre des limitations des LLM actuels. Ses applications potentielles sont vastes et ses performances sont comparables à celles de techniques plus complexes. En tant que tel, SteerLM est sur le point de jouer un rôle crucial dans l’avenir des LLM, en les rendant plus conviviaux et adaptables à un large éventail d’applications.

Pour en savoir plus sur SteerLM et comment il peut être utilisé pour personnaliser de grands modèles de langage lors de l’inférence, accédez au site officiel NVIDIA. site de développeur.

Source et image : Nvidia

Classé sous : Actualités technologiques, Top News

Dernières offres sur les gadgets geek

Divulgation: Certains de nos articles incluent des liens d’affiliation. Si vous achetez quelque chose via l’un de ces liens, Geeky Gadgets peut gagner une commission d’affiliation. Découvrez notre politique de divulgation.

Vous pouvez lire l’article original (en Angais) sur le blogwww.geeky-gadgets.com