ChatGPT est jusqu’à présent connu comme le robot magique qui peut vous aider à obtenir des réponses aux requêtes textuelles. Même si des erreurs peuvent être commises assez souvent, cela peut aussi être utile dans certains cas. Cependant, pour la plupart, vous ne pouvez interagir avec lui que par SMS. Vous avez tapé une requête et elle épelait une réponse. Aujourd’hui, OpenAI annonce différentes manières d’interagir avec lui.

OpenAI ajoute quelques nouvelles fonctionnalités vocales et d’image à ChatGPT, vous offrant des moyens plus intuitifs d’interagir avec l’IA. Ces fonctionnalités vous permettent non seulement de communiquer avec ChatGPT de plusieurs manières, mais elles vous permettent également de l’intégrer à davantage d’éléments de votre vie quotidienne.

D’une part, vous pouvez désormais engager des conversations vocales avec ChatGPT, permettant des échanges sur divers sujets. Les capacités vocales sont disponibles sur iOS et Android via des paramètres opt-in, avec cinq options vocales différentes créées par différents acteurs vocaux. Whisper, le système de reconnaissance vocale open source d’OpenAI, transcrit les mots prononcés en texte pour une communication transparente.

Et les images ? Vous pouvez également discuter d’images avec ChatGPT, ce qui permet de résoudre des problèmes, de planifier des repas ou d’analyser des graphiques de données complexes en affichant une ou plusieurs images. La fonctionnalité de compréhension d’images exploite les modèles multimodaux GPT-3.5 et GPT-4, permettant de raisonner avec un large éventail d’images, notamment des photographies, des captures d’écran et des documents contenant du texte et des images. Fondamentalement, lancez simplement une image sur ChatGPT, et il fera de son mieux pour la comprendre et vous aider avec votre requête – comme les fonctionnalités testées dans Bing Chat. Ce ne sera probablement pas parfait, surtout pas au début, mais cela s’améliorera petit à petit.

L’entreprise indique également clairement qu’elle le déploie de manière responsable pour garantir la sécurité et atténuer les risques potentiels. Le chat vocal, par exemple, a été développé en collaboration avec des acteurs vocaux pour éviter toute utilisation abusive, et OpenAI travaille avec des partenaires comme Spotify pour des applications comme Voice Translation dans le podcasting. Et en ce qui concerne les modèles de détection d’images, OpenAI a testé ses modèles avec des équipes rouges et des testeurs alpha pour garantir une utilisation responsable. L’entreprise travaille également avec des organisations comme Be My Eyes pour comprendre les limites et les avantages des capacités visuelles, en particulier pour les malvoyants.

OpenAI déploie progressivement ces fonctionnalités auprès des utilisateurs Plus et Enterprise avant d’étendre l’accès à d’autres groupes. Les développeurs de logiciels créant leurs propres applications GPT pourront également utiliser ces fonctionnalités à un moment donné.

Source: OpenAI

Vous pouvez lire l’article original (en Angais) sur le blogwww.howtogeek.com