EvalAP, c’est quoi ?
Une plateforme d’évaluation des modèles d’IA, développée par Etalab.
Elle permet de tester, comparer et analyser des modèles (comme Mistrall Small ou Llama 70b) sur différents jeux de données.
À quoi ça sert concrètement ?
-
Comparer plusieurs modèles d’IA pour voir lequel est le plus performant sur une tâche donnée.
-
Naviguer facilement entre les modèles, les datasets, les expériences et les résultats.
-
Piloter les évaluations via une API ou une interface web.
-
Aider à choisir les bons modèles IA pour les projets de l’administration ou de la recherche.
Côté technique :
-
[décomissionnée] Interface publique : evalap.etalab.gouv.fr
-
[décomissionnée] Documentation: evalap.etalab.gouv.fr/doc
-
Compatible avec des notebooks Jupyter
-
Entièrement open source, sous licence MIT
À propos
EvalAP a été porté par ALLiaNCE.
Ce service numérique est sponsorisé par Direction interministérielle du numérique
Standards de qualité
L'évaluation des standards de beta.gouv.fr n'a pas encore été réalisée sur ce produit.
En savoir plus sur les standards- Code source
- Technologies utilisées :
- Budget (non disponible)
- Statistiques d'usage (non disponible)
- Matrice d'impact (non disponible)
- Analyse de risque (non disponible)
- Suivi des bonnes pratiques (non disponible)
En quelques dates
En construction
3 septembre 2025
Arrêté
1er janvier 2026
L'équipe
Audrey Clevy
Data Scientist MLOps