Après que Suno et Udio aient fait la une des journaux récemment, ElevenLabs a présenté un tout nouveau modèle d'IA pour la conversion de texte en musique.
Si vous ne connaissez pas encore ElevenLabs, c'est l'un des outils d'IA les plus populaires capable de produire de l'audio parlé de haute qualité dans n'importe quelle voix, style et langue. C'est lui qui alimente la fonctionnalité vocale de ChatGPT.
Elevenlabs a fait une démonstration du nouvel outil musical d'IA dans un post sur X.
Les résultats publiés par ElevenLabs sont vraiment impressionnants.
En écoutant la musique pour la première fois, il est facile pour un profane de conclure que cette musique n'a pas été générée par un ordinateur. La production actuelle de la musique générée par l'IA la rend de plus en plus indiscernable de celle générée par l'homme.
Pour l'instant, on ne sait pas exactement quelles sont les fonctionnalités avancées disponibles et la durée maximale des chansons que l'IA peut produire, mais en regardant les exemples présentés, il semble que l'IA puisse générer des chansons d'une durée maximale de trois minutes.
ElevenLabs est susceptible d'ajouter des fonctions d'édition telles que la prolongation des morceaux de musique, la modification des paroles, de l'infrastructure musicale*.
* L'infrastructure musicale, ou "Music inpainting" en anglais, est une sous-tâche de la génération de musique automatisée.
Comparaison avec d'autres outils d'IA
À en juger par les échantillons présentés, les résultats d'ElevenLabs sont plus soignés et plus authentiques que ceux de Suno et d'Udio. Les paroles sont également plus cohérentes et semblent suivre les structures usuelles de la composition d'une chanson.
Cependant, il est important de noter que ces résultats sont basés sur des exemples choisis et non sur des résultats réels. ElevenLabs devrait publier d'autres échantillons dans les jours à venir, alors n'oubliez pas de les suivre sur X pour vous tenir au courant des nouveautés.
Lorsque l'accès public sera disponible, il sera intéressant de voir comment il se situe par rapport à d'autres outils d'IA, à mesure que de plus en plus de personnes commenceront à l'utiliser.
Les artistes ne sont pas contents
Il y a quelques semaines, plus de 200 artistes, dont Billie Eilish, Nicki Minaj, Zay Malik et Katy Perry, ont appelé les géants de la technologie à cesser de dévaluer la musique et d'utiliser l'intelligence artificielle pour porter atteinte à leurs droits.
Nous appelons tous les développeurs d'IA, les entreprises technologiques, les plateformes et les services de musique numérique à s'engager à ne pas développer ou déployer de contenu ou d'outils de génération de musique par l'IA qui sapent ou remplacent le travail artistique humain des compositeurs et des artistes ou qui nous privent d'une juste rémunération pour notre travail.
Je ne peux pas les blâmer. Il est compréhensible que les artistes s'inquiètent de l'impact potentiel des systèmes de génération de musique par IA sur leur gagne-pain et leur art.
Mais tous les grands artistes ne sont pas contre cette technologie. Le chanteur des Black Eyed Peas, will.i.am, a manifesté son enthousiasme en citant un exemple d'extrait audio d'Udio sur X, affirmant qu'il s'agit de la meilleure technologie au monde.
Les opinions divergentes des artistes mettent en évidence la nature polarisante de l'IA dans l'industrie musicale. Certains la considèrent comme une menace, tandis que d'autres y voient un puissant outil de création.
Bien entendu, l'utilisation de musique générée par l'IA et le clonage de la voix soulèvent des questions juridiques et éthiques complexes. Mais la technologie progresse rapidement et il sera fascinant de voir comment les artistes, les musiciens et l'industrie musicale dans son ensemble s'adaptent et réagissent à ces nouveaux outils créatifs.
Les points positifs :
- Rapidité : L'IA peut générer de la musique rapidement (Suno et Udio peuvent créer un morceau de 30 secondes en moins d'une minute). Cela accélère le processus créatif et permet de produire plus de musique en moins de temps.
- Soutien aux artistes : Si les artistes acceptent l'IA comme un assistant, elle peut les aider à surmonter les blocages créatifs et à développer de nouvelles idées.
- Rentabilité : Les générateurs de musique IA sont basés sur des logiciels, ce qui les rend plus abordables que le matériel d'enregistrement traditionnel. Bientôt, vous pourrez même installer votre propre studio de musique sur votre téléphone ou votre PC.
Les points négatifs :
- Manque de profondeur émotionnelle : C'est la critique la plus courante à l'égard de la musique générée par l'IA. Elle peine à capturer la composante émotionnelle de la musique.
- Problèmes de droits d'auteur : Comme je l'ai dit, l'utilisation de l'IA dans la composition musicale soulève des questions sur la propriété des droits d'auteur et sur les potentiels litiges juridiques si l'IA produit de la musique qui ressemble à une œuvre existante.
- Préoccupations éthiques : Les artistes humains n'apprécient pas forcément l'IA car elle peut générer de la musique similaire à des styles existants, ce qui soulève des problèmes éthiques de plagiat et de propriété intellectuelle.
Conclusion
Voici ce qui est vraiment intéressant...
ElevenLabs est capable d'imiter votre propre voix avec une précision remarquable. Si vous utilisez votre voix clonée pour chanter sur une musique générée par l'IA, vous pourriez être la prochaine star d'une comédie musicale.
Et si Sora ou Microsoft Vasa-1 sont commercialisés, vous pourrez produire vos propres clips vidéo !
Cela conduira-t-il à une nouvelle ère d'art innovant, assisté par l'IA, ou cela affaiblira-t-il la valeur de l'expression humaine ?
source :
https://generativeai.pub/elevenlabs-announces-an-ai-model-that-can-generate-music-24aedf8c4fb6