|

Google I/O 2024 : les annonces en un coup œil

annonces Google IO 2024

La conférence Google I/O s’est déroulée le 14 mai 2024 à 19 heures, heure de Paris, de nombreuses annonces sur l’intelligence artificielle ont été présentées. Comme prévu, l’accent a été mis sur les modèles d’IA Gemini de Google, ainsi que sur leur intégration dans des applications telles que Workspace et Chrome.

Pour ceux qui n’ont pas pu suivre l’événement en direct, voici un récapitulatif des dernières nouveautés de Google.

Gemini répondra à des questions précises sur votre bibliothèque de photos

Lors de la conférence I/O 2024, Google a annoncé le lancement une nouvelle fonctionnalité cet été qui pourrait être très utile pour quasiment toute personne ayant des années de photos à trier ou pour recherche une photo avec une information précise. Analyser et rechercher des photos permet à Gemini d’explorer votre bibliothèque de photos Google en réponse à vos questions, qu’elles soient précises ou concernent simplement un tri.

Cette fonction va au-delà de simplement afficher des images de chiens et de chats. Le PDG Sundar Pichai l’a démontré en demandant à Gemini quel était son numéro de plaque d’immatriculation. La réponse a été le numéro lui-même, suivi d’une photo pour qu’il puisse vérifier que c’était correct. Si on couple cette fonctionnalité avec la reconnaissance des visages de Google Photo, cela peut avoir de nombreuses applications.

Google Search : une refonte autour de l’IA.

Google va déployer cette semaine aux États-Unis les « Aperçus IA » – anciennement appelés « Expérience générative de recherche ». Désormais, un modèle Gemini « spécialisé » concevra et peuplera les pages de résultats avec des réponses résumées provenant du web, similairement à ce que vous pouvez observer dans des outils de recherche IA tels que Perplexity ou Arc Search.

Au delà des annonces de la conférence I/O 2024, les changements à venir de Google Search devraient sans aucun doute bouleverser notre manière de rechercher et consulter les informations sur le Web. Ce qui amène de nombreuses questions sur la manière de concevoir des contenus et également sur les modes de rémunération des créateurs de contenus. Vous trouverez plus d’informations sur notre page dédiée Google repense son moteur de recherche pour intégrer l’IA.

Google Seach IA présentation conférence IO 2024

Google Lens recherchera des informations à partir d’une vidéo enregistrée

Alors que Google Lens permet déjà de rechercher des éléments à partir d’images, Google va encore plus loin en offrant la capacité des informations dans une vidéo. Cela signifie que vous pouvez filmer quelque chose que vous souhaitez rechercher, poser une question pendant l’enregistrement, et l’IA de Google essaiera de fournir des réponses pertinentes à partir du web.

Google Lens recherchera des informations à partir d'une vidéo enregistrée

L’IA Gemini : de meilleures performances avec une nouvelle version plus rapide et plus capable

Google a également fait une annonce sur un nouveau modèle d’IA dans sa gamme lors de l’I/O 2024 : Gemini 1.5 Flash. Ce modèle multimodal est aussi puissant que Gemini 1.5 Pro. Toutefois il est spécialement optimisé pour les « tâches précises, à haute fréquence et à faible latence ».

Cette optimisation le rend plus efficace pour fournir des réponses rapides. Par ailleurs, Google a apporté des améliorations à Gemini 1.5 afin d’optimiser ses capacités de traduction, de raisonnement et de codage. De plus, la taille de la fenêtre de contexte de Gemini 1.5 Pro a été doublée, passant de 1 million à 2 millions de tokens, selon Google. Cela signifie que le contexte mémorisé lors de vos échanges avec Gemini est plus important.

Project Astra : l’avenir de l’IA selon Google

La société développe Project Astra, un assistant IA multimodal présenté lors de la Google l’I/O 2024 avec l’ambition de devenir un assistant virtuel polyvalent capable de visualiser et de comprendre ce qu’il voit à travers la caméra de votre appareil, de mémoriser l’emplacement de vos objets, et d’accomplir des tâches à votre place.

Il est au cœur de nombreuses démonstrations impressionnantes présentées lors de la conférence I/O 2024. L’objectif de Google est de créer un véritable agent IA capable non seulement de communiquer avec vous, mais aussi d’accomplir des actions concrètes en votre nom.

A lire : Project Astra : un assistant plus qu’une nouvelle IA génératrice

Imagen 3, les améliorations du générateur d’image assistée par IA

Lors de la conférence Google I/O 2024, la société a fait également des annonces sur les améliorations de son outils de génération d’image assisté par IA :

  • Photorealisme amélioré: Imagen 3 est capable de générer des images plus photoréalistes, capturant des détails plus fins comme les poils d’un animal ou la lumière du soleil dans une scène.
  • Meilleure compréhension des prompts: Ce modèle comprend mieux les instructions écrites de manière créative et détaillée, ce qui améliore la qualité des images générées.
  • Gestion des détails: Imagen 3 est particulièrement efficace pour intégrer de petits éléments mentionnés dans les prompts, comme les fleurs sauvages ou un oiseau bleu.
  • Amélioration de la rendu de texte: Historiquement un défi pour les modèles de génération d’image, Imagen 3 a fait des progrès significatifs dans la reproduction précise du texte dans les images.

Veo : générer des vidéos à partir de texte ou d’image

La société a développé un nouveau modèle d’IA générateur de vidéo en réponse à Sora d’OpenAI. Il serait capable de produire des vidéos en 1080p à partir de directives basées sur du texte, des images et des vidéos. Quelques vidéos ont été présentées lors la Google I/O 2024 et les possibilités semblent intéressantes, il s’agit d’un domaine qui se développe fortement des derniers mois.

Les vidéos peuvent adopter divers styles, comme des prises de vue aériennes ou des accélérés, et peuvent être ajustées avec d’autres instructions. Bien qu’offerte aux créateurs pour une utilisation dans des vidéos YouTube, la société présente également Veo à Hollywood pour son potentiel dans les films.

Voici les principales annonces de Google sur Veo lors de la conférence I/O 2024 :

  • Vidéos de haute qualité: Veo est capable de créer des vidéos en 1080P à partir de prompts textuels, d’images et de vidéos, offrant une grande précision dans les styles visuels et cinématographiques.
  • Contrôle créatif accru: Ce modèle permet des modifications supplémentaires par des prompts, offrant aux utilisateurs une flexibilité sans précédent pour diriger le contenu vidéo.
  • Génération de scènes plus longues et storyboarding: Veo explore des fonctionnalités telles que la création de storyboards et la génération de scènes plus longues, ouvrant la voie à des productions vidéo plus complexes.

Les « Gems » introduisent la création de chatbots sur mesure pour Gemini

Lors de la conférence lors de l’I/O 2024, la société a également annoncé le déploiement d’un créateur de chatbots personnalisé appelé Gems. Il s’agit de modèles Gemini Personnalisés. À l’instar des GPT d’OpenAI, Gems permet aux utilisateurs de donner des instructions à Gemini pour personnaliser ses réponses et ses domaines de spécialisation.

Cette fonctionnalité d’obtenir une IA personnalisée en fonction des contenus et directives que vous lui fournirez. Pour en profiter, il faudra être abonné à Gemini Advanced.

Les Gems introduisent la création de modèles Gemini personnalisés

Gemini s’intègre à Workspace pour les utilisateurs

Google intègre son dernier modèle linguistique grand public, Gemini 1.5 Pro, dans la barre latérale de Docs, Sheets, Slides, Drive et Gmail. Lorsqu’il sera déployé pour les abonnés payants le mois prochain, il deviendra un assistant polyvalent au sein de Workspace, capable de récupérer des informations à partir de tout le contenu de votre Drive, où que vous soyez.

Gemini s'intègre à Workspace pour les utilisateurs dans la barre latérale de Docs, Sheets, Slides, Drive et Gmail

Il pourra également effectuer des actions pour vous, telles que la rédaction d’e-mails intégrant des informations d’un document en cours de consultation, ou vous rappeler ultérieurement de répondre à un e-mail que vous consultez. Certains testeurs ont déjà accès à ces fonctionnalités, mais Google prévoit de les rendre disponibles pour tous les abonnés payants de Gemini le mois prochain.

Gemini : un compagnon de conversation plus efficace

La nouvelle fonctionnalité Gemini Live vise à rendre les discussions vocales avec Gemini plus fluides. Le chatbot bénéficiera d’une voix actualisée avec une touche de personnalité supplémentaire.

Les utilisateurs pourront l’interrompre en cours de phrase ou lui demander de visualiser en temps réel à travers la caméra de leur smartphone pour fournir des informations sur ce qu’elle voit. Gemini recevra également de nouvelles intégrations lui permettant de mettre à jour ou de récupérer des informations depuis Google Agenda, Google Tasks et Google Keep, en utilisant des fonctionnalités multimodales. Une fonctionnalité qui serait bien utile dans les différents appareils Google Assistant, mais le sujet n’a pas été abordé directement.

Sur Smartphone, « entourer pour chercher » résoudra des problèmes mathématiques

Si vous utilisez un téléphone ou une tablette Android, vous pouvez désormais encercler un problème mathématique à l’écran et obtenir de l’aide pour le résoudre. L’IA de Google ne résout pas le problème à votre place, donc elle ne facilite pas la tricherie des étudiants sur leurs devoirs, mais elle le divise en étapes pour rendre sa résolution plus accessible.

Gamini résolution et aide sur des problèmes mathématiques

La détection par l’IA de tentatives frauduleuses arrive sur Android

Grâce à l’intelligence artificielle Gemini Nano intégrée aux appareils, Google annonce que les téléphones Android pourront désormais vous aider à repérer et à éviter les appels frauduleux. La fonctionnalité détecterait des signaux d’alerte, comme les schémas de conversation typiques des fraudeurs, et afficherait des avertissements en temps réel. La société prévoit de fournir davantage de détails sur cette fonctionnalité plus tard dans l’année.

La détection par l'IA de tentatives frauduleuses arrive sur Android

Une IA plus sophistiquée sur les appareils Android.

Google annonce que Gemini sera bientôt capable de permettre aux utilisateurs de poser des questions sur des vidéos à l’écran. Pour les utilisateurs de Gemini Advanced, il pourra également analyser des fichiers PDF et fournir des informations. Ces mises à jour multimodales et d’autres encore pour Gemini sur Android seront déployées dans les prochains mois.

Un assistant IA arrive sur Google Chrome.

Enfin, la conférence Google I/O 2024 a fait une annonce sur l’intégration de Gemini Nano dans le navigateur Chrome sur ordinateur, la version Nano est un modèle allégé de Gemini. Cet assistant intégré utilisera l’IA embarquée pour vous aider à rédiger du texte pour vos publications sur les réseaux sociaux, vos avis de produits, et bien plus encore, directement depuis Google Chrome.

Source : Google Keynote

Si vous appréciez nos articles, ne manquez les prochains en vous abonnant à Cosmo Games sur Google News, vous pouvez également nous suivre sur X (ex Twitter). N'hésitez pas à partager vos réactions, commentaires ou remarques dans les commentaires, afin d'enrichir le contenu, de mieux vous comprendre et intégrer les différents points de vue.

Publications similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *