H IGH-TECH
34
JEUDI 14 DÉCEMBRE 2023 FINANCES NEWS HEBDO
www.fnh.ma
Intelligence artificielle
◆ Après des mois de spéculations et d'anticipation, Google a finalement levé le voile sur son dernier chef-d'œuvre en matière d'intelligence artificielle : Gemini. Gemini, la réponse de Google à ChatGPT
Cependant, Gemini semble avoir réussi là où ses prédé- cesseurs ont échoué. Gemini dans les coulisses Un blog post du 6 décembre, co-signé par Sundar Pichai et Demis Hassabis, dévoile davantage de détails sur Gemini. Google affirme que Gemini est son modèle d'IA le plus grand et le plus perfor- mant, capable de com- prendre et de combiner différentes formes d'in- formations telles que texte, code, audio, image et vidéo. Ce modèle multimo- dal, loin d'être une simple amélioration de modèles existants, marque une avan- cée significative dans la manière dont les modèles d'IA sont construits. Selon Google, la concep- tion de Gemini est unique. Contrairement à la méthode habituelle de création de modèles multimodaux, qui consiste à assembler des composants distincts pour chaque usage, Gemini a été conçu dès le départ pour être nativement multimo- dal. Il a été pré-entraîné à traiter diverses modalités, puis renforcé par des don- nées multimodales supplé- mentaires. Cette approche confère à Gemini une capa- cité de compréhension et de raisonnement sur tous types d'entrées. Gemini ne se contente pas d'être un modèle unique, mais existe sous trois
variantes : Gemini Pro, Gemini Nano et Gemini Ultra. Gemini Pro est d'ores et déjà intégré à Google Bard. Cette version vise à rendre l'IA générative de Google plus compétente dans divers domaines tels que la com- préhension, la rédaction et la planification. Quant à Gemini Nano, il fera son entrée dans le Pixel 8 Pro, ajoutant des capaci- tés telles que la fonction «résumer» dans l'application Enregistreur et des réponses automatiques dans le clavier Gboard. Enfin, Gemini Ultra, la version la plus étendue, sera initialement testée par des clients, développeurs, partenaires, et experts en cybersécurité avant de nour- rir une version améliorée de Bard, baptisée logiquement Bard Advanced, prévue pour début 2024. L'avènement de Google Gemini marque une étape significative dans le monde de l'intelligence artificielle. Sa capacité multimodale, sa compréhension approfondie des intentions utilisateur et ses performances compa- rables, voire supérieures, à celles de ses concurrents en font un acteur incontournable. La rivalité avec ChatGPT pro- met une compétition continue. Avec Gemini, Google se posi- tionne fermement à l'avant- garde de la course pour four- nir des systèmes d'IA toujours plus performants et adaptés aux besoins de ses utilisa- teurs. ◆
Le marché du traitement du langage naturel était évalué à 15,7 milliards de dollars en 2022 et devrait atteindre 49,4 milliards de dollars d'ici 2027, selon Market and Markets.
vraiment Gemini est sa capacité à comprendre les intentions des utilisateurs de manière plus profonde et contextuelle. Contrairement aux modèles précédents, Gemini analyse le contexte et les nuances des requêtes pour fournir des réponses plus pertinentes et adap- tées. Cette caractéristique le positionne comme un acteur clé dans l'améliora- tion de l'interaction entre les utilisateurs et les systèmes automatisés, notamment les chatbots et les assistants vocaux. L'annonce de Gemini a secoué le paysage de l'in- telligence artificielle, faisant écho aux performances du fameux GPT-4 d'OpenAI. Cette rivalité est particuliè- rement intéressante, notam- ment après les tentatives antérieures de Google avec PaLM 2 pour rivaliser avec ChatGPT basé sur GPT-4.
A nnoncé dans un billet de blog signé par Sundar Pichai, CEO de Google, et Demis Hassabis, directeur de Deepmind, cette nouvelle percée promet de redéfinir les normes de compréhen- sion des requêtes utilisa- teur et d'améliorer considé- rablement la génération de code. L'un des aspects les plus captivants de Google Gemini réside dans sa capa- cité à traiter simultanément une multitude de formats de données, grâce à ses carac- téristiques multimodales. Cette prouesse technolo- gique lui permet de navi- guer avec aisance entre les textes écrits, les images, les vidéos, les sons, et bien d'autres formats encore. Mais au-delà de sa poly- valence, ce qui distingue Par K. A.
Gemini ne se contente pas d'être un modèle unique, mais existe sous trois variantes.
Made with FlippingBook flipbook maker