Depuis maintenant quelque temps, je me passionne pour les grand modèle de langage (LLM – Large Language Models) et surtout depuis l’arrivée de ChatGPT qui a totalement relancé la course. Il y en a eu du chemin parcouru depuis GPT-1 et GPT-2 ! En attendant un potentiel GPT-5 ou en tout cas la prochaine version qui succédera à GPT-4, les choses bougent beaucoup chez la concurrence. En très peu de temps, nous avons eu successivement beaucoup d’annonces par les acteurs majeurs de l’intelligence artificielle. Que ce soit du côté de Mistral AI, Anthropic avec une nouvelle version de Claude et surtout la sortie de Llama 3 par Meta AI. Ils appartiennent à Meta Platforms qui est depuis quelque temps la maison mère de Facebook. Quand on voit l’écosystème open source qui s’est créée avec Llama 2, ça promet pour les prochains mois avec Llama 3 !
À la base, je voulais un peu faire des benchmarks de mon côté, mais je me suis ravisé tellement, les nouveautés s’enchaînent trop vite par rapport au temps que j’ai. De plus, je pense que cela manquerait d’objectivité. En effet, avec mes tests, cela aurait été ma vision de ce que j’attends d’un LLM et cela ne correspond pas forcément à ce que d’autres gens attendent de cette technologie. Donc je me suis dit, pourquoi ne pas essayer de trouver un classement des meilleurs modèles d’intelligence artificielle. Je voulais aussi un classement des top LLM qui est surtout mis à jour par la communauté pour suivre les évolutions des nouvelles sorties. J’ai trouvé mon bonheur et je vais vous le présenter ici.
Classement des meilleurs LLM : quelle est la meilleure intelligence artificielle du moment ?
J’ai trouvé plusieurs classements des grands modèles de langage du moment, mais il y en a un qui sort clairement du lot. Il s’agit du LMSYS Chatbot Arena Leaderboard qui est collaboratif. Au moment où j’écris ces lignes, il y a 90 modèles d’intelligence artificielle mis en compétition avec tout de même 772 779 votes des utilisateurs.
Voici le classement actuel avec Llama-3-70b-Instruct et Command R+ dans le Top 10 qui ne sont pas propriétaire et fermés. Dans le top 20, il y a aussi Mixtral-8x22b-Instruct-v0.1 et le plus petit Llama-3-8b-Instruct qui fait une très belle performance !
Si vous voulez plus de détails sur la méthode d’évaluation des différents LLM, vous pouvez consulter ce papier beaucoup plus scientifique qui devrait répondre à toutes vos questions. Vous pouvez si vous le souhaitez participer pour augmenter cette grande base de données et donc contribuer à ce grand projet qui je trouve, a un grand intérêt.
Vous pouvez affiner les résultats si vous cherchez un modèle d’intelligence d’artificielle pour une tâche précise avec par exemple de bonnes capacités en code pour la programmation. Dans ces catégories, vous avez aussi déjà le français même s’il y a beaucoup moins de votes d’évaluation. J’espère que ce classement continuera d’être mis à jour par la grande communauté des utilisateurs d’intelligence artificielle.
Si j’ai un peu de temps, je pense que je participerai avec grand plaisir pour apporter ma pierre à l’édifice. J’essaye déjà de le faire au maximum ici sur ce blog avec de nombreux tutoriels, j’en profite pour vous dire que si vous débutez avec l’intelligence artificielle et la programmation, vous avez ce tutoriel pour utiliser l’API ChatGPT de OpenAI avec PHP.