FNH N° 1153-1

42

JEUDI 23 MAI 2024 / FINANCES NEWS HEBDO

HIGH-TECH

GPT-4o OpenAI pousse les limites de l’IA

 ChatGPT a enregistré environ 1,6 milliard de visites mensuelles totales en février 2024.

OpenAI a récemment lancé GPT-4o, une version améliorée de son modèle de langage GPT-4. Elle offre de nouvelles perspectives tant pour les utilisateurs grand public que pour les développeurs et les entreprises.

vidéos en séquences d'images. L'entreprise souligne que des travaux supplémentaires sont nécessaires sur l'infrastructure, le surentraînement et la sécurité avant de rendre cette fonctionna- lité largement disponible. Un essai de ces modalités est prévu en cercle restreint (version alpha) sur ChatGPT Plus et sur l'API, avec un délai de mise à disposition compté en mois. GPT-4o intègre les dernières capacités de la brique Advanced Data Analysis (anciennement Code Interpreter), ce qui permet à ChatGPT d'exécuter des opé- rations complexes telles que la détection et la correction d'ano- malies, l'agrégation et l'intégra- tion de données, ainsi que l'ana- lyse statistique et temporelle. Le modèle peut créer des tableaux et des graphiques interactifs en utilisant des bibliothèques comme pandas et Matplotlib. En termes de traitement vocal, et contraire- ment aux modèles précédents qui utilisaient des réseaux distincts pour la reconnaissance et la syn- thèse vocales, GPT-4o intègre un unique réseau de neurones pour traiter tous les types de contenus. Contexte concurrentiel Le lancement de GPT-4o est sur- venu à un moment stratégique, juste avant la conférence Google I/O, où Google a dévoilé de nou- veaux produits d'IA, notamment

dans le cadre de son projet Gemini. Sam Altman, le PDG d'OpenAI, a décrit GPT-4o comme une étape importante dans l'évolution de la vision de l'entreprise. Initialement axée sur la création d'avantages pour le monde, cette vision a évolué vers une approche plus pragmatique, centrée sur la mise à disposition des modèles d'IA via des API payantes. Lors de la démonstration en direct de GPT-4o, le modèle a impres- sionné par sa capacité à intera- gir de manière naturelle avec les utilisateurs, traitant des données multimodales telles que l'audio, la vidéo et le texte en temps réel. Parmi les fonctionnalités mises en avant, on peut citer la réso- lution de problèmes mathéma- tiques complexes, la reconnais- sance des émotions faciales, la génération de contenu audio et la traduction de conversations en temps réel. Avec des améliorations notables en termes de vitesse, de coût et de capacités de traitement des langues et des données, GPT- 4o est bien positionné pour être adopté par un large éventail d'uti- lisateurs, des particuliers aux grandes entreprises. En fin de compte, l'avenir de ces techno- logies dépendra de leur intégra- tion réussie dans divers secteurs, offrant des possibilités sans pré- cédent pour l'interaction entre les machines et les humains. ◆

Par K. A. C

particulièrement dans le traite- ment des langues autres que l'an- glais, ainsi que dans les domaines de la vision et de l'audio. Il est important de noter que la base de connaissances de GPT- 4o s'arrête à octobre 2023, soit deux mois avant celle de GPT-4 Turbo. Néanmoins, cela n'entrave en rien ses capacités étendues. La fenêtre de contexte reste la même à 128k tokens, avec une sortie maximale de 4k tokens. Une autre amélioration notable réside dans l'efficacité des coûts: l'infé- rence avec GPT-4o coûte deux fois moins cher que celle avec GPT-4 Turbo, avec des tarifs de 5 dollars par million de tokens en entrée et 15 dollars par million de tokens en sortie. Une ère multimodale GPT-4o est décrit comme étant «nativement multimodal», capable de traiter une variété de modes d'entrée, y compris la voix, le texte et les images. OpenAI prévoit de lancer la fonctionnalité de traite- ment de la vidéo en temps réel, bien que cette capacité soit pour l'instant limitée à la division de

ontrairement aux lancements précédents, OpenAI adopte une approche de déploiement très pro- gressive pour GPT-4o. Initialement accessible via ChatGPT Plus, GPT-4o est également disponible pour les utilisateurs de la formule «Team» et le sera bientôt pour l'édition «Enterprise». En outre, ce nouveau modèle est accessible aux utilisateurs de la version gra- tuite de ChatGPT, ce qui ouvre la porte à une large adoption. Sur le plan de l'API, GPT-4o peut être exploité sur les endpoints Chat Completions, Assistants et Batch, avec une disponibilité dans le playground d'OpenAI ainsi que sur l'offre Azure OpenAI Service de Microsoft. Ce qui fait la différence OpenAI affirme que GPT-4o est plus rapide que GPT-4 Turbo pour générer du texte, une affirmation confirmée par plusieurs retours d'expérience utilisateurs. Les per- formances de GPT-4o en termes de traitement du texte, de raison- nement et de code seraient équi- valentes à celles de GPT-4 Turbo. Cependant, GPT-4o se distingue

www.fnh.ma

Made with FlippingBook flipbook maker