La révolution de l’IA générative s’est principalement concentrée sur l’exécution de modèles d’IA vastes et complexes dans les centres de données de serveurs. Certains modèles d’IA sont cependant suffisamment optimisés pour fonctionner sur des ordinateurs classiques, et Intel fait des progrès dans ce domaine.
Intel a annoncé aujourd'hui qu'il existe désormais plus de 500 modèles d'IA optimisés pour ses nouveaux processeurs Intel Core Ultra, qui ont été révélés en décembre et ont commencé à apparaître dans les nouveaux ordinateurs portables. Cette liste comprend probablement de nombreux modèles expérimentaux et de test qui ne répondent pas à un objectif pratique pour la plupart des applications, mais il y en a quelques-uns importants : Phi-2, le modèle Meta's Lllama, Mistral, Bert, Whisper et Stable Diffusion 1.5.
Intel a déclaré dans un communiqué de presse : « Les modèles constituent l'épine dorsale des fonctionnalités logicielles améliorées par l'IA telles que la suppression d'objets, la super résolution d'images ou le résumé de texte. Il existe un lien direct entre le nombre de modèles activés/optimisés et l’étendue des fonctionnalités d’IA destinées aux utilisateurs qui peuvent être mises sur le marché. Sans modèle, la fonctionnalité ne peut pas être conçue. Sans optimisation du runtime, la fonctionnalité ne peut pas atteindre ses meilleures performances.
La plupart (sinon la totalité) de ces modèles d'IA peuvent fonctionner sur du matériel non Intel, mais l'ajout de la prise en charge des fonctionnalités matérielles les plus récentes spécifiques aux dernières puces Intel les rend plus pratiques pour une utilisation réelle. Par exemple, Intel a déclaré que le processus d'optimisation du modèle OpenVINO AI comprenait « l'équilibrage de charge sur toutes les unités de calcul, la compression des modèles pour fonctionner efficacement dans un PC AI et l'optimisation du temps d'exécution pour tirer parti de la bande passante mémoire et de l'architecture de base d'Intel Core Ultra ». .»
L’apprentissage automatique et les modèles d’IA qui s’exécutent localement sur des ordinateurs n’ont rien de nouveau, mais l’exécution locale de nouveaux modèles d’IA génératifs sur des PC présente quelques cas d’utilisation intéressants. Vous pourriez avoir quelque chose comme ChatGPT et Microsoft Copilot fonctionnant entièrement sur votre propre PC, éliminant potentiellement les problèmes de confidentialité et les exigences de connectivité réseau liés à l'envoi de données rapides à des serveurs externes. Le chatbot local ChatRTX de NVIDIA est un pas dans cette direction, mais il est encore expérimental et nécessite un PC équipé d'une puissante carte graphique RTX 30 ou 40.
Intel espère que les logiciels utilisant ces modèles optimisés pourraient inciter les gens à acheter des ordinateurs plus récents équipés de processeurs Core Ultra. Pour l’instant, cependant, les outils d’IA basés sur le cloud comme ChatGPT et Copilot ne vont nulle part.
Source: Intel
Vous pouvez lire l’article original (en Angais) sur le {site|blog}www.howtogeek.com