EvalAP
Évaluer des modèles et pipeline d’IA pour orienter des choix produits

EvalAP, c’est quoi ?
Une plateforme d’évaluation des modèles d’IA, développée par Etalab.
Elle permet de tester, comparer et analyser des modèles (comme Mistrall Small ou Llama 70b) sur différents jeux de données.
À quoi ça sert concrètement ?
-
Comparer plusieurs modèles d’IA pour voir lequel est le plus performant sur une tâche donnée.
-
Naviguer facilement entre les modèles, les datasets, les expériences et les résultats.
-
Piloter les évaluations via une API ou une interface web.
-
Aider à choisir les bons modèles IA pour les projets de l’administration ou de la recherche.
Côté technique :
-
Interface publique : evalap.etalab.gouv.fr
-
Documentation: evalap.etalab.gouv.fr/doc
-
Compatible avec des notebooks Jupyter
-
Entièrement open source, sous licence MIT
À propos
EvalAP est portée par ALLiaNCE.
Ce service numérique est sponsorisé par Direction interministérielle du numérique
- Sécurité : pas encore audité
En quelques dates
Investigation
Construction
3 septembre 2025
Accélération
Transfert
Pérennisé