Serveur MCP Hugging Face
Serveur MCP fournissant un accès à l'API Hugging Face Dataset Viewer. Interrogez les ensembles de données, explorez les données, recherchez du contenu et analysez les statistiques de la vaste collection d'ensembles de données d'apprentissage automatique du Hugging Face Hub.
Caractéristiques
- 12 outils MCP couvrant tous les points d'extrémité de l'API
get_dataset_splits
- Informations sur les divisions de l'ensemble de donnéesget_dataset_info
- Métadonnées et caractéristiques de l'ensemble de donnéesget_dataset_first_rows
- Aperçu des 100 premières lignesget_dataset_rows
- Accès paginé aux donnéessearch_dataset
- Recherche en texte intégral dans les ensembles de donnéesget_dataset_size
- Informations sur la taille de l'ensemble de donnéesget_dataset_statistics
- Analyse statistiquefilter_dataset
- Filtrage de données de type SQLcheck_dataset_validity
- Validation des donnéesget_dataset_parquet
- Informations sur les fichiers Parquetget_dataset_opt_in_out_urls
- URL d'opt-in/outget_dataset_presidio_entities
- Détection des entités PII
Démarrage rapide
Intégration à Claude Desktop
Ajoutez à votre Claude Desktop claude_desktop_config.json
:
{ "mcpServers" : { "huggingface-mcp" : { "command" : "docker", "args" : [ "run", "--rm", "-i", "--name", "huggingface-mcp-claude", "huggingface-mcp:latest" ] } } }
Construire l'image Docker
make docker-build
Développement
Conditions préalables
- Python 3.12+
- uv
Configuration
make install # Installer les dépendances make test # Exécuter les tests (38 tests) make example # Tester tous les outils make run # Démarrer le serveur directement
Commandes Docker
make docker-build # Construire l'image make docker-run # Exécuter le conteneur make docker-stop # Arrêter le conteneur
Couverture de l'API
Implémente tous les points de terminaison GET de l'API Hugging Face Dataset Viewer:
Point final | Outil | Description |
---|---|---|
/splits | get_dataset_splits | Informations sur les divisions de l'ensemble de données |
/info | get_dataset_info | Métadonnées et caractéristiques de l'ensemble de données |
/first-rows | get_dataset_first_rows | Prévisualisation des 100 premières lignes |
/rows | get_dataset_rows | Accès aux données paginées |
/search | search_dataset | Recherche en texte intégral dans les ensembles de données |
/size | get_dataset_size | Informations sur la taille du jeu de données |
/statistiques | get_dataset_statistics | Analyse statistique |
/filter | filter_dataset | Filtrage de données de type SQL |
/is-valid | check_dataset_validity | Validation du jeu de données |
/parquet | get_dataset_parquet | Informations sur le fichier Parquet |
/opt-in-out-urls | get_dataset_opt_in_out_urls | URL d'entrée et de sortie |
/presidio-entities | get_dataset_presidio_entities | Détection des entités PII |
Construit avec FastMCP en suivant toutes les meilleures pratiques de développement.
Configuration
Copiez le fichier d'environnement de l'exemple et configurez-le selon vos besoins :
cp .env.example .env # Modifiez .env avec votre configuration
Utilisation
Exécution du serveur
make run
Exécution des tests
make test
Exécution d'exemples
make example
Docker
Construire et exécuter
make docker-build make docker-run
Avec Docker Compose
docker-compose up --build
Développement
TODO : Ajouter des directives de développement
Documentation de l'API
TODO : Ajouter la documentation de l'API
Contribution
TODO : Ajouter des directives de contribution
Licence
TODO : Ajouter des informations sur la licence