Dans une dizaine d'années, nous nous souviendrons de 2023 comme de l'année où l'IA générative a commencé sa marche inexorable vers la transformation de notre façon de travailler, de chercher et de créer.
De la croissance folle de ChatGPT au lancement de Google Bard, en passant par la généralisation de Midjourney et de DALL-E et l'accélération de la réglementation de l'IA, 2023 a été une année importante pour l'IA générative.
2024 promet d'être tout aussi impactante, voire plus. Si 2023 a été l'année où l'humanité a découvert l'IA générative, 2024 sera la première année où nous commencerons à vraiment ressentir son impact.
Je travaille dans le domaine de l'IA depuis plus de dix ans. Voici mes prédictions concernant l'IA générative pour l'année à venir.
La guerre de l'IA s'intensifie
2023 est l'année de ChatGPT. Ce chatbot ultra-populaire a pris le monde d'assaut, surprenant même ses développeurs par sa popularité. Les principaux concurrents, comme Google, ont essentiellement joué un rôle de rattrapage pendant la majeure partie de l'année.
Bard a entamé l'année 2023 comme un outsider qui pouvait à peine rivaliser avec ChatGPT. À l'heure actuelle, il se trouve pratiquement au même niveau.
En 2024, cela va changer.
Google a déjà annoncé qu'il sortirait Gemini Ultra, son modèle de base plus puissant, l'année prochaine.
Je suis sceptique quant au fait qu'il soit plus puissant que ChatGPT et le système GPT-4 sous-jacent. Mais il égalera certainement les fonctions de ChatGPT et sera plus performant que GPT-4 dans certains domaines, notamment la recherche d'informations en direct et la citation précise des sources.
Bien entendu, OpenAI ne se laissera pas distancer. Je prédis qu'elle publiera GPT-4.5, une version plus puissante et plus rapide que GPT-4, au début de l'année 2024.
Nous pouvons nous attendre à voir GPT-5 plus tard dans l'année, qui intégrera probablement la prise en charge de la vidéo et d'autres contenus multimédias.
La réglementation de l'IA progresse... lentement
Les gouvernements ont été échaudés par leur laxisme en matière de réglementation des crypto-monnaies, comme l'a montré l'implosion très médiatisée de FTX. Que ce soit mérité ou non, ils considèrent désormais l'IA générative avec beaucoup plus de prudence.
Pour être clair, je pense que l'IA générative est une technologie beaucoup plus importante et précieuse que les crypto-monnaies. Mais il est peu probable que les régulateurs voient les choses de cette manière et ils essaient déjà de limiter l'expansion de l'IA générative.
Étant donné que 2024 est une année électorale aux États-Unis, nous verrons beaucoup de déclarations sur l'IA générative, mais peu d'actions. En revanche, l'Union européenne tentera probablement d'aller de l'avant avec ses propres réglementations, comme elle l'a fait avec la protection de la vie privée et le GDPR.
Cependant, les régulateurs ne sont tout simplement pas en mesure d'évoluer à la vitesse de l'IA générative d'aujourd'hui. Il est probable qu'une réglementation significative soit mise en place en 2024, mais il est peu probable qu'elle soit vraiment complète ou respectée avant longtemps.
Aux États-Unis, les litiges civils privés prendront la place d'une réglementation formelle. Le bureau des droits d'auteur précisera quels résultats de l'IA générative peuvent, ou non, bénéficier d'une protection des droits d'auteur, et nous devrions obtenir des éclaircissements, peut-être même de la part de la Cour suprême, sur les règles relatives à la formation.
Les politiques propres aux entreprises dicteront également la direction à prendre dans ce domaine. Je m'attends à ce que Google et d'autres grandes plateformes exigent la divulgation du contenu de l'IA dans les vidéos YouTube, par exemple, en 2024.
Les scientifiques lisent dans les pensées grâce à l'IA
Dès les premiers jours, j'ai perçu le potentiel des systèmes d'IA générative pour lire dans les pensées.
C'est passionnant, car j'ai une mémoire photographique et j'aimerais pouvoir transférer des images provenant de mon cerveau.
Même avec des outils rudimentaires, des scientifiques ont démontré en 2021 qu'il était possible de lire des images dans le cerveau. À l'époque, j'avais prédit que la lecture du cerveau par l'IA à grande échelle se produirait dans les dix ans.
Aujourd'hui, je pense que le calendrier va s'accélérer. Les outils d'IA générative, en particulier les outils de création d'images, ont progressé beaucoup plus vite que prévu.
Je m'attends à ce que des études à plus grande échelle soient réalisées cette année, montrant une démonstration de faisabilité de l'IA capable d'utiliser un EEG ou un IRMf pour lire le cerveau d'une personne et créer des images réalistes basées sur ses pensées.
L'IA s'attaque à la vidéo
Les vidéos générées par l'IA sont aujourd'hui courtes, avec une texture granuleuse, et souvent bizarres. C'est exactement ce à quoi ressemblaient les premières photos générées par l'IA il y a seulement quelques années.
Tout comme des systèmes tels que DALL-E et Midjourney ont pris de l'avance en 2023, la vidéo générée par l'IA s'imposera en 2024.
Les principales sociétés d'IA proposeront des outils pour générer des vidéos. Les vidéos deviendront également plus réalistes et beaucoup plus longues que les courts clips générés par des sociétés comme Runway.
Les entreprises hésiteront probablement à créer des avatars vidéo réalistes. Les vidéos générées porteront plutôt sur des sujets tels que la nourriture, la nature, etc. Les vidéos de chats mignons seront également de la partie !
Les lunettes intelligentes se généralisent
Lorsque Google a lancé son système Google Glass il y a près de dix ans, le projet a fait l'objet de nombreuses moqueries. Qui voudrait porter des lunettes ringardes dotées d'un petit écran et d'une caméra ?
Aujourd'hui, les lunettes intelligentes comme les Ray-Ban de Meta ont l'air tout à fait cool.
Elles constituent également l'interface parfaite pour interagir avec l'IA générative. Leurs caméras intégrées permettent à l'IA de voir le monde autour de l'utilisateur, et leurs haut-parleurs intégrés permettent à l'IA de parler directement à l'oreille de l'utilisateur.
Pour l'instant, les lunettes intelligentes ne représentent qu'un tout petit segment du marché. Mais au fur et à mesure qu'elles se doteront de capacités d'IA, je m'attends à ce qu'elles se développent, à l'instar des smartwatches et des wearables qui ont pris leur essor il y a une dizaine d'années.
Pour commencer, des entreprises comme Facebook intégreront l'IA générative directement dans les lunettes. Imaginez des lunettes capables de traduire un texte devant l'utilisateur, de lui donner des indications lorsqu'il se promène dans une ville, etc.
Les lunettes d'IA ne deviendront pas omniprésentes en 2024, mais elles seront prises beaucoup plus au sérieux et s'étendront au-delà du petit groupe d'adeptes précoces. Ce sont les utilisateurs les plus jeunes, qui ont déjà adopté les lunettes intelligentes plus basiques d'entreprises telles que Snapchat, qui seront à l'origine de cette évolution.
L'IA générative se spécialise
2023 est l'année du modèle d'IA généraliste. Les LLM comme GPT-4 et Gemini sont capables d'exécuter un large éventail de fonctions, de l'écriture de code à l'élaboration de Javascript.
2024, en revanche, sera l'année où l'IA générative deviendra spécialisée. De plus en plus d'entreprises créeront leurs propres modèles d'IA hautement spécialisés, ou affineront les modèles frontières existants pour leurs propres cas d'utilisation très spécifiques.
J'ai récemment aidé un client à créer un modèle de ce type. Il est conçu pour générer des cartes HDRi à l'aide de l'IA. Si vous êtes comme la plupart des gens, vous vous demandez probablement ce qu'est une carte HDRI.
Mais si vous êtes un concepteur 3D qui réalise des rendus de véhicules, votre réponse sera probablement : "Wow, incroyable !".
Auparavant, le coût de la formation d'un modèle de frontière* était si élevé que seules les grandes entreprises - ou les startups à la mode - pouvaient réunir le capital nécessaire pour en créer un. Aujourd'hui, il existe beaucoup plus d'outils et de ressources permettant d'affiner les modèles et de créer des modèles sur mesure à un coût relativement faible.
Cela signifie que beaucoup plus d'entreprises créeront leurs propres modèles spécifiques à leur secteur d'activité. Le succès dans le domaine de la création de modèles dépendra moins de la puissance de calcul et des talents en matière d'IA que des entreprises disposant des meilleures données d'entraînement pour leur secteur ou domaine spécifique.
* classe de modèles utilisés principalement dans l'analyse économique et la recherche opérationnelle pour déterminer la frontière d'efficacité ou de performance maximale parmi un ensemble d'entités (comme des entreprises, des institutions financières, etc.).
La médecine entre dans le monde de l'IA
Dans le même ordre d'idées, nous assisterons à une forte progression de l'adoption de l'IA dans le domaine médical.
Jusqu'à présent, les médecins et autres professionnels de la santé ont considéré l'IA avec un certain scepticisme. Cela s'explique en grande partie par le fait que l'interaction avec les systèmes d'IA actuels nécessite la divulgation d'informations d'identification personnelle, ce qui est souvent contraire à l'éthique ou illégal.
Toutefois, à mesure que les LLM deviennent moins volumineux et peuvent commencer à fonctionner sur des ordinateurs en local, voire sur des téléphones portables, les professionnels de la santé les adopteront de plus en plus.
Des versions locales du Gemini Nano de Google et d'autres modèles similaires permettront de guider les médecins vers de meilleurs diagnostics. La technologie sera également adoptée pour les chatbots qui répondent à des questions médicales simples sur des pathologies non mortelles, ce qui évitera aux patients de consulter un médecin pour des problèmes mineurs.
L'IA pourrait également commencer à être utilisée pour certaines formes de thérapie. Des personnes utilisent déjà ChatGPT à cette fin "hors indication", et les startups en prendront bonne note. Attendez-vous à voir émerger davantage d'outils d'IA médicaux et psychologiques en 2024.
La "création humaine" devient le nouvel label "bio"
Avec la prolifération du contenu généré par l'IA, les entreprises commenceront à se distinguer non pas par leur utilisation de l'IA, mais par le fait que leur contenu est créé par des humains.
En particulier pour les articles d'actualité et autres éléments éditoriaux, nous pouvons nous attendre à ce que de plus en plus de plateformes adoptent un badge ou un identifiant "écrit par des humains" en haut de leurs articles.
Les plateformes telles que Medium et Getty Images, qui ont mis l'accent sur le contenu créé par l'homme, continueront à prospérer. Les plateformes axées sur les créateurs, comme Etsy, seront obligées de distinguer clairement les matériaux générés par l'IA de ceux créés par les artistes.
En fait, l'expression "créé par l'homme" deviendra un nouveau label artisanal, à l'instar des labels "bio" appliqués aux aliments. Les gens rechercheront et seront prêts à payer un supplément pour un contenu dont on aura vérifié qu'il a été créé par un être humain.
Les créateurs et les plateformes y trouveront leur compte.
L'IA échoue à détruire le monde
Avec l'éviction très médiatisée de Sam Altman à la fin de l'année, les questions relatives à la sécurité de l'IA et aux menaces existentielles sont sous les feux de la rampe.
Je suis convaincu que l'IA apportera des changements durables et profonds à notre société et à notre économie. Mais il est naïf de penser que ces systèmes sont capables de détruire le monde ou de devenir des voyous.
Oui, l'IA peut faire du travail de bureau à votre place, écrire un article de blog ou même générer un "deepfake" convaincant. Mais il y a une énorme marge entre ce genre d'activités et celles qui peuvent constituer une menace pour l'humanité.
L'IA peut coder, mais elle est loin de pouvoir pirater des centrales nucléaires et déclencher l'apocalypse. Elle peut créer une image du pape portant une veste Balenciaga, mais elle n'est pas en train de tromper les gens avec de fausses publicités électorales ou des messages malveillants - du moins pas à une échelle mondiale.
La plupart des partisans d'un programme agressif en matière de sécurité de l'IA ont d'autres raisons de le faire. Les grandes entreprises veulent que les législateurs croient que l'IA est une menace existentielle afin qu'ils adoptent davantage de réglementations.
Ces réglementations profitent en fin de compte aux grandes entreprises qui ont les moyens de s'y conformer. C'est une façon de créer des douves qui excluent les petits concurrents du marché, tout cela au nom de la sécurité.
Il est également ironique de constater que les mêmes personnes qui minimisent la puissance de systèmes tels que ChatGPT - en affirmant qu'ils peuvent facilement reconnaître des histoires écrites ou des images générées par l'IA - craignent que l'IA ne détruise le monde.
Les prophéties de malheur sur l'IA ne sont que du battage médiatique déguisé. Si vous pensez que l'IA a le potentiel de causer ce genre de destruction, vous pensez implicitement qu'il s'agit d'une technologie incroyablement novatrice et révolutionnaire.
Il est incohérent de dire que les résultats des LLM sont nuls, tout en affirmant qu'ils constituent une menace pour l'existence humaine. À bien des égards, notamment sur le plan économique et social, l'IA générative va remodeler le monde.
Mais tout comme ChatGPT qui peine à faire de la recherche et Bard qui ne sait pas raconter une blague, ces systèmes ne sont pas près de déclencher l'apocalypse.
Cette année a été une année charnière pour l'IA générative. L'année 2024 sera encore plus passionnante !
source :
https://medium.com/the-generator/my-9-generative-ai-predictions-for-2024-a3a8767b00ad#bypass