Résumé : Alibaba vient de marquer une nouvelle étape dans la course à l'intelligence artificielle avec le lancement de Qwen2.5-Max, un nouveau modèle d'IA qui se présente comme un sérieux concurrent de DeepSeek-V3 et ChatGPT-4o. Selon les benchmarks publiés par Alibaba, ce modèle propriétaire surpasserait ses rivaux sur plusieurs tests de performance clés, notamment Arena-Hard, LiveBench et GPQA-Diamond. Accessible via Qwen Chat dans un navigateur web, ce nouveau modèle se distingue également par une approche plus nuancée sur certains sujets sensibles, bien qu'il maintienne des restrictions sur des thèmes spécifiques. Cette sortie souligne non seulement la rapidité de l'évolution dans le domaine de l'IA, mais aussi l'émergence croissante des entreprises technologiques chinoises comme acteurs majeurs du secteur.
Les choses évoluent rapidement dans la sphère de l'IA, et à peine étions-nous habitués à DeepSeek qu'un nouveau concurrent entre en scène. Alibaba, l'une des principales entreprises technologiques chinoises, a publié un nouveau modèle d'IA appelé Qwen2.5-Max, affirmant qu'il est supérieur à DeepSeek-V3 et à ChatGPT-4o dans divers tests de référence.
Il est important de noter que Qwen2.5-Max n'est pas un modèle à raisonnement, comme DeepSeek-R1 ou ChatGPT-o1, et qu'il n'est donc pas possible de voir le « raisonnement » qu'il effectue pour parvenir à chaque réponse. Il travaille à un niveau comparable à DeepSeek-V3 ou ChatGPT-4o.
Dans un article publié sur son site web, l'équipe de Qwen déclare : « Nos modèles de base ont démontré des avantages significatifs dans la plupart des tests de référence, et nous sommes convaincus que les progrès réalisés dans les techniques de post-entraînement permettront à la prochaine version de Qwen2.5-Max d'atteindre de nouveaux sommets. »
Les tests de référence publiés par l'équipe de Qwen, tels que Arena-Hard, LiveBench, LiveCodeBench et GPQA-Diamond, démontrent que Qwen2.5-Max surpasse ses rivaux, tout en démontrant des résultats compétitifs dans d'autres évaluations, y compris MMLU-Pro.
Contrairement à DeepSeek, Qwen2.5-Max d'Alibaba n'est pas un projet open-source, ce qui signifie que certains détails de son fonctionnement ne sont pas connus du public.
Essayez-le maintenant
Le moyen le plus simple d'essayer Qwen2.5-Max par vous-même est le chatbot Qwen Chat depuis un navigateur Web. Vous devez vous connecter à l'aide d'une adresse e-mail ou de votre compte Google. Contrairement au chatbot DeepSeek, il ne semble pas y avoir de problèmes de délais d'attente lors de la création d'un compte Qwen pour le moment.
Il ne semble pas y avoir d'application mobile officielle pour Qwen actuellement, bien que certaines applications mobiles tierces permettent d'accéder à ses LLM.
Étant donné les niveaux de censure actuels de DeepSeek, une autre IA basée en Chine, lorsqu'elle est interrogée sur des sujets sensibles pour le gouvernement chinois, nous avons été assez surpris de constater que la réponse de Qwen2.5-Max à la question « Taïwan est-il un pays ? Qwen2.5-Max a toutefois refusé de répondre à la question « Que s'est-il passé sur la place Tiananmen en 1989 ? », en répondant : « En tant que modèle linguistique d'IA, je ne peux pas discuter de sujets liés à la politique, à la religion, au sexe, à la violence, etc. Si vous avez d'autres questions, n'hésitez pas à les poser ».
source :
https://www.techradar.com/computing/artificial-intelligence/new-deepseek-ai-rival-claims-to-be-more-powerful-than-both-v3-and-chatgpt-4o-meet-qwen2-5-max
Enregistrer un commentaire
Les commentaires sont validés manuellement avant publication. Il est normal que ceux-ci n'apparaissent pas immédiatement.