Le laboratoire de recherche en intelligence artificielle DeepMind, filiale de Google, franchit une nouvelle étape dans le domaine de la robotique assistée par l’IA. Son dernier modèle, conçu pour optimiser les capacités des machines autonomes, leur confère une dextérité inédite, leur permettant d’exécuter avec précision des tâches d’une grande finesse, telles que le pliage d’origamis ou la fermeture hermétique de sacs plastiques de type Ziploc.
Depuis son introduction à la fin de l’année précédente, la technologie Gemini 2.0 a été intégrée à divers produits développés par Google, notamment un chatbot exploitant des fonctionnalités avancées de l’intelligence artificielle. Aujourd’hui, Google DeepMind ambitionne d’aller encore plus loin en explorant des champs d’application inédits. À cet effet, l’entreprise a dévoilé, ce mercredi, deux nouveaux modèles dérivés de Gemini, qui, selon elle, jetteront les bases d’une nouvelle génération de robots dotés d’une utilité accrue.
Le premier de ces modèles, baptisé Gemini Robotics, a été spécifiquement élaboré pour améliorer le pilotage direct des automates. D’après les chercheurs de DeepMind, l’intelligence artificielle dédiée à la robotique doit répondre à trois impératifs fondamentaux :
- La généralité, c’est-à-dire la capacité d’un robot à s’adapter avec souplesse à des situations inédites, y compris celles qu’il n’a pas spécifiquement apprises lors de son entraînement.
- L’interactivité, qui se traduit par une aptitude à interagir avec son environnement ainsi qu’avec les êtres humains de manière fluide et intuitive.
- La dextérité, qui se réfère à l’aisance avec laquelle un robot peut exécuter des gestes d’une précision extrême, là où l’habileté humaine demeure un modèle difficile à égaler pour les machines.
« Si nos recherches antérieures ont démontré des avancées notables dans ces domaines, Gemini Robotics constitue un progrès significatif en optimisant ces trois dimensions essentielles. Nous nous rapprochons ainsi de robots véritablement polyvalents », souligne DeepMind dans son annonce officielle.
Un exemple concret de cette percée technologique est illustré par ALOHA 2, un automate doté de deux bras articulés et alimenté par Gemini Robotics. Ce dispositif sophistiqué est capable d’interpréter des instructions formulées en langage naturel et d’exécuter des actions complexes, même en présence d’obstacles imprévus. Il est notamment en mesure de plier du papier pour réaliser des origamis ou encore de fermer un sac Ziploc avec minutie.
Dans le cadre de ses efforts pour démocratiser ces avancées, Google collabore avec la société Apptronik en vue de concevoir une nouvelle génération de robots humanoïdes aux capacités élargies. Parallèlement, DeepMind inaugure également un second modèle, Gemini Robotics-ER (pour « embodied reasoning »), conçu pour permettre aux ingénieurs en robotique de développer et d’exécuter leurs propres programmes en exploitant les capacités de raisonnement avancées de Gemini.
Dans une optique de fiabilité et de validation, DeepMind a ouvert l’accès à cette technologie à un cercle restreint de partenaires qualifiés, parmi lesquels figure l’entreprise Boston Dynamics, autrefois affiliée à Google. Grâce à ces avancées, la recherche en robotique intelligente franchit un nouveau palier, laissant entrevoir des applications prometteuses dans de nombreux secteurs d’activité.