Le monde des IA génératives est en ébullition. Pas un jour ne passe (ou presque) sans qu’un nouveau modèle ne sorte. Entre Claude 3.5 d’Anthropic, Gemini 1.5 Flash de Google, HuggingChat ou encore le Chat de Mistral, la compétition est rude. C’est sans parler des modèles qui produisent des vidéos ou ceux intégrés dans les résultats d’un moteur de recherche comme AI Overviews de Google. Il n’en fallait pas plus pour que la société OpenAI, par qui « tout a commencé », sorte un nouveau modèle. Son nom : Chatgpt-4o mini.
ChatGPT-4o mini mais costaud
Alors que Sora, l’IA générative de vidéo d’OpenAI se fait attendre, la société basée à San Francisco a décidé de sortir le 18 juillet 2024 une version dite mini de son GPT-4o, qui lui-même était une déclinaison de GPT-4.
Au programme de cette nouvelle version, un coût réduit qui le rend plus accessible financièrement pour les entreprises qui passent par l’API de Chatgpt. Pour autant, Chatgpt-4o mini reste performant et surpasse des modèles comme Gemini Flash de Google ou Claude Haiku d’Anthropic.
Une autre caractéristique de Chatgpt-4o mini est sa rapidité d’exécution. Conçu pour être aussi rapide que GPT-3.5 Turbo, Chatgpt-4o mini traite environ 67 tokens par seconde.
Par ailleurs, Chatgpt-4o mini n’est pas limité au traitement de texte. Il est conçu pour être multimodal, ce qui signifie qu’il peut également traiter des images et, à terme, des sorties audio et vidéo. Cette capacité élargie ouvre de nombreuses possibilités d’application, allant de l’analyse de données visuelles à la génération de contenu créatif et interactif. Par exemple, les entreprises peuvent utiliser ce modèle aussi bien pour analyser des graphiques complexes que pour créer des contenus multimédias riches pour le marketing.
Critère | GPT-3.5 Turbo | GPT-4 | GPT-4o | GPT-4o mini |
---|---|---|---|---|
Coût par million de tokens (entrée) | 0,002 USD | 0,03 USD | 5,00 USD | 0,15 USD |
Coût par million de tokens (sortie) | 0,008 USD | 0,12 USD | 15,00 USD | 0,60 USD |
Capacité multimodale | Non | Oui | Oui | Oui |
Vitesse de traitement | 67 tokens/seconde | 45 tokens/seconde | 45 tokens/seconde | 67 tokens/seconde |
Performance sur MMLU | 70.0% | 85.0% | 82.0% | 82.0% |
Disponibilité API | Oui | Oui | Oui | Oui |
Applications typiques | Applications de texte de base, chatbots simples | Applications complexes, multimodales | Applications complexes, multimodales | Applications diverses, rentables |
Utilisation optimale | Startups, projets à petit budget | Grandes entreprises, projets de recherche | Grandes entreprises, projets de recherche | PME, startups, projets à budget limité |
Exigences en ressources | Faibles | Élevées | Élevées | Moyennes |
Accessibilité | Large | Large | Large | Très large |
Last but not least : Chatgpt-4o mini est intégré dans les plans Plus et Teams, remplaçant GPT-3.5 Turbo. Autrement dit, ce nouveau modèle est gratuit. Les abonnés peuvent sélectionner Chatgpt-4o mini directement depuis l’interface de Chatgpt.
Test de Chagpt 4o mini
Pour voir ce que ce Chatgpt 4o mini a dans le ventre, nous avons décidé de faire un test en utilisant le prompt suivant : « tu es expert en rédaction web seo. Rédige un article sur l’utilisation de chatgpt dans la rédaction web en respectant les bonne pratique de la rédaction web ». Gpt-4 a produit le résultat suivant :
Ci-dessous, le texte produit par GPT-4o mini.
La réponse fournie Chatgpt 4o mini nous semble à la fois plus pertinente et mieux structurée. Qu’en pensez-vous ?