EvalAP

Évaluer des modèles et pipeline d’IA pour orienter des choix produits

EvalAP, c’est quoi ?

Une plateforme d’évaluation des modèles d’IA, développée par Etalab.
Elle permet de tester, comparer et analyser des modèles (comme Mistrall Small ou Llama 70b) sur différents jeux de données.

À quoi ça sert concrètement ?

Comparer plusieurs modèles d’IA pour voir lequel est le plus performant sur une tâche donnée.
Naviguer facilement entre les modèles, les datasets, les expériences et les résultats.
Piloter les évaluations via une API ou une interface web.
Aider à choisir les bons modèles IA pour les projets de l’administration ou de la recherche.

Côté technique :

[décomissionnée] Interface publique : evalap.etalab.gouv.fr
[décomissionnée] Documentation: evalap.etalab.gouv.fr/doc
Compatible avec des notebooks Jupyter
Entièrement open source, sous licence MIT

À propos

EvalAP a été porté par ALLiaNCE.

Ce service numérique est sponsorisé par Direction interministérielle du numérique

Contacter l'équipe

Standards de qualité

L'évaluation des standards de beta.gouv.fr n'a pas encore été réalisée sur ce produit.

En savoir plus sur les standards

Transparence

Code source
Technologies utilisées :
Budget (non disponible)
Statistiques d'usage (non disponible)
Matrice d'impact (non disponible)
Analyse de risque (non disponible)
Suivi des bonnes pratiques (non disponible)

En quelques dates

En construction
3 septembre 2025

Arrêté
1er janvier 2026

L'équipe

Audrey Clevy

Data Scientist MLOps

EvalAP