Google franchit une nouvelle étape avec Gemini : son IA est capable de générer des extraits musicaux de 30 secondes proches d’une véritable composition, grâce au modèle Lyria 3.
Le géant de Mountain View franchit un nouveau cap dans la course à l’intelligence artificielle créative. Google annonce que son assistant IA Gemini est désormais capable de générer un extrait musical de 30 secondes dont le rendu se rapproche d’une véritable composition. Une avancée notable dans le domaine de la génération de musique par intelligence artificielle, qui confirme l’ambition du groupe d’étendre son empreinte sur tous les terrains de la création numérique.
Gemini et Lyria 3 : une nouvelle ère pour la musique générée par IA
Cette évolution repose sur l’intégration du modèle Lyria 3, spécialement conçu pour la production musicale automatisée. Grâce à cette technologie, les utilisateurs peuvent créer une piste sonore d’environ trente secondes à partir d’un simple prompt textuel. Mieux encore, il devient possible de modifier ou transformer un morceau existant selon ses préférences.
Jusqu’ici, Gemini s’était illustré dans la génération de texte, d’images et de vidéos. Avec Lyria 3, Google élargit encore le champ d’application de son intelligence artificielle générative en investissant le secteur de la création musicale assistée par IA.
Des compositions plus réalistes et plus complexes
Selon Google, Lyria 3 se distingue par sa capacité à produire des morceaux « plus réalistes et musicalement sophistiqués ». L’utilisateur ne se contente plus d’une simple description globale : il peut ajuster des paramètres précis tels que le tempo, la rythmique ou le style instrumental.
Autre fonctionnalité innovante : la possibilité de générer une musique à partir d’une image ou d’une vidéo. Une photographie peut ainsi inspirer une ambiance sonore cohérente, tandis qu’une séquence vidéo peut être accompagnée d’une bande originale créée sur mesure. En complément, une pochette d’album peut être produite via le modèle d’images de Google, renforçant l’aspect immersif de l’expérience.
SynthID : garantir la transparence des contenus générés
Face aux enjeux éthiques liés aux contenus synthétiques, Google intègre systématiquement sa signature numérique SynthID sur chaque création musicale issue de Gemini. Ce marquage vise à distinguer clairement les œuvres générées par intelligence artificielle des compositions humaines.
Si l’instrumentation produite par Lyria 3 impressionne par son réalisme, certains éléments – notamment les paroles lorsqu’elles sont incluses – peuvent encore trahir leur origine algorithmique. Néanmoins, la qualité globale des arrangements témoigne d’une progression rapide des modèles d’IA musicale.
Disponibilité et perspectives d’évolution
La génération musicale via Gemini est accessible dès à présent aux utilisateurs de plus de 18 ans dans plusieurs langues, dont le français, l’anglais, l’espagnol, l’allemand, le portugais, le coréen, le japonais et l’hindi.
Pour l’heure, la durée des extraits reste limitée à 30 secondes par clip. Cette contrainte technique pourrait toutefois être assouplie à l’avenir. On peut également envisager une intégration progressive de ces fonctionnalités sur des plateformes comme YouTube Shorts ou au sein d’applications de messagerie, ouvrant la voie à une démocratisation massive de la musique générée par IA.
Avec Gemini et Lyria 3, Google confirme ainsi son ambition de redéfinir les contours de la création artistique à l’ère de l’intelligence artificielle, en rapprochant toujours davantage les productions algorithmiques des standards de la composition musicale traditionnelle.
s2pmag Multimedia Lifestyle