Résumé : L'ascension fulgurante de Qwen et des modèles d'IA chinois marque un tournant dans l'industrie, privilégiant l'accessibilité et l'usage concret face aux géants américains. Tandis que les lancements de GPT-5 et Llama 4 en 2025 ont déçu par leur manque d'innovation ou leur opacité, Qwen s'est imposé comme le deuxième modèle ouvert le plus populaire au monde grâce à sa flexibilité "open-weight". Cette approche permet à des entreprises comme Rokid ou BYD, et même des firmes américaines comme Nvidia, de personnaliser l'IA pour des applications allant des lunettes intelligentes aux tableaux de bord automobiles. En combinant une transparence scientifique récompensée à NeurIPS et une efficacité permettant de fonctionner localement sur de petits appareils, les modèles chinois redéfinissent le succès non plus par des scores théoriques, mais par leur intégration massive dans les technologies du quotidien.
Par un après-midi pluvieux et venteux cet été, j'ai visité le siège social de Rokid, une start-up qui développe des lunettes intelligentes à Hangzhou, en Chine. Pendant que je discutais avec les ingénieurs, leurs paroles étaient rapidement traduites du mandarin vers l'anglais, puis transcrites sur un petit écran translucide situé juste au-dessus de mon œil droit à l'aide d'un des nouveaux prototypes de l'entreprise.
Les lunettes high-tech de Rokid utilisent Qwen, un modèle linguistique ouvert à grande échelle développé par le géant chinois du commerce électronique Alibaba.
Qwen, dont le nom complet est 通义千问 ou Tōngyì Qiānwèn en chinois, n'est pas le meilleur modèle d'IA qui existe. Le GPT-5 d'OpenAI, le Gemini 3 de Google et le Claude d'Anthropic obtiennent souvent de meilleurs résultats aux tests de performance conçus pour évaluer différentes dimensions de l'intelligence artificielle. Qwen n'est pas non plus le premier modèle open-weight véritablement à la pointe de la technologie, ce titre revenant au Llama de Meta, lancé par le géant des réseaux sociaux en 2023.
Pourtant, Qwen et d'autres modèles chinois (DeepSeek, Moonshot AI, Z.ai et MiniMax) sont de plus en plus populaires, car ils sont à la fois très performants et très faciles à personnaliser. Selon HuggingFace, une entreprise qui donne accès à des modèles et des codes d'IA, les téléchargements de modèles chinois ouverts sur sa plateforme ont dépassé ceux des modèles américains en juillet dernier. DeepSeek a bouleversé le monde en lançant un modèle linguistique de pointe nécessitant beaucoup moins de puissance de calcul que ses concurrents américains, tandis qu'OpenRouter, une plateforme qui achemine les requêtes vers différents modèles d'IA, affirme que Qwen a rapidement gagné en popularité au cours de l'année pour devenir le deuxième modèle ouvert le plus populaire au monde.
Qwen peut faire la plupart des choses que l'on attend d'un modèle d'IA avancé. Pour les utilisateurs de Rokid, cela peut inclure l'identification de produits photographiés par un appareil photo intégré, l'obtention d'itinéraires à partir d'une carte, la rédaction de messages, la recherche sur le web, etc. Comme Qwen peut être facilement téléchargé et modifié, Rokid héberge une version du modèle, adaptée à ses besoins. Il est également possible d'exécuter une version réduite de Qwen sur des smartphones ou d'autres appareils, au cas où la connexion Internet serait interrompue.
Avant de partir en Chine, j'ai installé une petite version de Qwen sur mon MacBook Air et je m'en suis servi pour apprendre quelques bases de mandarin. À bien des égards, les modèles open source de taille modeste comme Qwen sont tout aussi performants que les mastodontes qui occupent les grands centres de données.
L'essor de Qwen et d'autres modèles chinois open-weight a coïncidé avec les déboires de certains modèles d'IA américains réputés au cours des 12 derniers mois. Lorsque Meta a dévoilé Llama 4 en avril 2025, les performances du modèle ont été décevantes, ne parvenant pas à atteindre les sommets des benchmarks populaires tels que LM Arena. Ce revers a incité de nombreux développeurs à rechercher d'autres modèles open source à exploiter.
Lorsque OpenAI a dévoilé son dernier modèle, GPT-5, en août, celui-ci s'est également révélé décevant. Certains utilisateurs se sont plaints d'un comportement étrangement froid, tandis que d'autres ont relevé des erreurs surprenantes par leur simplicité. OpenAI a lancé le même mois un modèle ouvert moins puissant appelé gpt-oss, mais Qwen et d'autres modèles chinois restent plus populaires, car leur conception et leur mise à jour bénéficient de plus d'efforts et parce que les détails de leur architecture sont souvent largement diffusés.
Des centaines d'articles universitaires présentés à NeurIPS, la principale conférence sur l'IA, ont utilisé Qwen. « De nombreux scientifiques utilisent Qwen car c'est le meilleur modèle open-weight », explique Andy Konwinski, cofondateur du Laude Institute, une organisation à but non lucratif créée pour promouvoir les modèles américains ouverts.
L'ouverture dont font preuve les entreprises chinoises spécialisées dans l'IA, qui publient régulièrement des articles détaillant leurs nouvelles astuces en matière d'ingénierie et de formation, contraste fortement avec la philosophie de plus en plus fermée des grandes entreprises américaines, qui semblent craindre de divulguer leur propriété intellectuelle, explique M. Kowinski. Un article de l'équipe Qwen, détaillant une méthode pour améliorer l'intelligence des modèles pendant la formation, a été désigné comme l'un des meilleurs articles lors de la conférence NeurIPS cette année.
D'autres grandes entreprises chinoises utilisent Qwen pour créer des prototypes et développer des produits. Quelques jours avant ma visite chez Rokid, j'ai pu voir comment BYD, le premier constructeur chinois de véhicules électriques, a intégré le modèle dans un nouvel assistant de tableau de bord. Les entreprises américaines adoptent également Qwen. Airbnb, Perplexity et Nvidia utilisent toutes Qwen. Même Meta, autrefois pionnier des modèles ouverts, utiliserait désormais Qwen pour aider à développer un nouveau modèle.
Selon M. Kowinski, les entreprises américaines spécialisées dans l'IA se concentrent désormais trop sur l'obtention d'un avantage marginal sur des critères restrictifs mesurant des compétences telles que les aptitudes mathématiques ou de codage, au détriment de la garantie d'un impact significatif de leurs modèles. « Lorsque les critères ne sont pas représentatifs de l'utilisation réelle ou des problèmes résolus dans le monde, on se retrouve dans une situation frustrante et inadaptée », explique-t-il.
L'importance croissante de Qwen et d'autres modèles similaires semble indiquer qu'au-delà de son intelligence, un critère clé pour tout modèle d'IA devrait être son degré d'utilisation pour créer d'autres choses. Selon ce critère, Qwen et d'autres modèles chinois open source sont en plein essor.
traduction de :
https://www.wired.com/story/expired-tired-wired-gpt-5/

Enregistrer un commentaire
Les commentaires sont validés manuellement avant publication. Il est normal que ceux-ci n'apparaissent pas immédiatement.