Résumé : OpenAI vient de dévoiler son nouveau modèle d'IA o3, présenté comme le plus puissant à ce jour, mais qui se distingue par son coût d'utilisation extraordinairement élevé - plus de 1 000 dollars par requête en mode haute performance. Utilisant une technique appelée "test-time compute" qui lui permet de "réfléchir" plus longuement, l'o3 atteint des performances remarquables avec un score de 87,5% sur le benchmark ARC-AGI, soit presque trois fois mieux que son prédécesseur. Cependant, même sa version économique coûte environ 20 dollars par tâche, soulevant des questions sur sa viabilité commerciale dans des produits comme ChatGPT Plus qui ne coûte que 25 dollars par mois. Le modèle n'est pas encore accessible au public, avec une version "mini" prévue pour janvier.
Le modèle o3 d'OpenAI, qui vient d'être dévoilé, est censé être l'intelligence artificielle la plus puissante à ce jour, mais elle présente un inconvénient de taille : son fonctionnement coûte des sommes astronomiques, selon TechCrunch.
Annoncé il y a un peu plus d'une semaine, o3 « raisonne “ pour résoudre les problèmes en utilisant une technique connue sous le nom de ” test-time compute “, ce qui signifie que ce modèle prend plus de temps pour « réfléchir » et explorer de multiples possibilités avant de donner une réponse. Les ingénieurs d'OpenAI espèrent ainsi que le modèle d'IA produira de meilleures réponses à des questions complexes au lieu de se contenter d'une conclusion erronée.
Il semble que cela ait fonctionné, du moins dans une certaine mesure. En mode de calcul intensif, o3 a obtenu un score de 87,5 % au test de référence ARC-AGI conçu pour tester les modèles de langage, selon François Chollet, créateur du test. Ce résultat est presque trois fois plus élevé que le meilleur score du modèle précédent, o1, qui n'atteignait que 32 %.
Toute cette réflexion minutieuse s'accompagne toutefois de dépenses exorbitantes. Pour atteindre ce niveau, o3 utilise plus de 1 000 dollars de puissance de calcul par tâche, soit 170 fois plus qu'une version basse consommation de o3, et bien plus que son prédécesseur, qui coûtait moins de 4 dollars par opération.
D'un mur à l'autre
Ces coûts compromettent les affirmations de l'industrie selon lesquelles les performances d'o3 réfutent les craintes selon lesquelles l'amélioration des modèles d'IA par la « mise à l'échelle », ou en leur fournissant davantage de puissance de traitement et de données d'entraînement, a atteint un plafond.
Le fait que o3 ait obtenu un score près de trois fois supérieur à celui de o1, qui a été publié il y a seulement trois mois, prouve amplement que les progrès de l'IA ne ralentissent pas.
Salaire élevé
Dans un billet de blog expliquant les résultats du benchmark, M. Chollet affirme que si o3 s'approche des niveaux de performance humains, cela « a un coût élevé et ne serait pas encore viable sur le plan économique ».
« Vous pourriez payer un humain pour résoudre des tâches ARC-AGI pour environ 5 dollars par tâche (nous le savons, nous l'avons fait) », écrit-il, “tout en consommant seulement quelques centimes d'énergie”.
Il est cependant convaincu que « le rapport coût-performance s'améliorera probablement de façon spectaculaire au cours des prochains mois et des prochaines années ».
Il faudra attendre pour le savoir. Pour l'instant, o3 n'est pas encore accessible au public, mais une version « mini » devrait être lancée en janvier.
Mais le reproche que l'on fait à l'échelonnement est qu'il produit des rendements décroissants. Bien que les gains réalisés ici aient été en grande partie obtenus en modifiant la façon dont le modèle d'IA « raisonne » plutôt qu'en augmentant uniquement sa taille, il est difficile d'ignorer les coûts supplémentaires.
Même la version à faible capacité de calcul d'o3, qui a obtenu un score de 76 % sur le benchmark, ce qui constitue une avancée considérable, a coûté environ 20 dollars par tâche. Cela représente relativement une bonne affaire, mais reste beaucoup plus cher que les versions précédentes - et avec ChatGPT Plus qui coûte seulement 25 $ par mois, il est difficile de savoir jusqu'à quel point ce produit destiné aux utilisateurs pourra devenir plus intelligent sans mettre OpenAI dans une situation déficitaire.
source :
https://futurism.com/the-byte/openai-o3-cost-per-query