Servidor MCP de Hugging Face
Servidor MCP que proporciona acceso a la API del visor de conjuntos de datos de Hugging Face. Consulte conjuntos de datos, explore datos, busque contenido y analice estadísticas de la amplia colección de conjuntos de datos de aprendizaje automático de Hugging Face Hub.
Características
- 12 herramientas MCP que cubren todos los puntos finales de la API
get_dataset_splits
- Información sobre divisiones de conjuntos de datosget_dataset_info
- Metadatos y características del conjunto de datosget_dataset_first_rows
- Vista previa de las 100 primeras filasget_dataset_rows
- Acceso a datos paginadossearch_dataset
- Búsqueda de texto completo en conjuntos de datosget_dataset_size
- Información sobre el tamaño del conjunto de datosget_dataset_statistics
- Análisis estadísticofilter_dataset
- Filtrado de datos tipo SQLcheck_dataset_validity
- Validación de conjuntos de datosget_dataset_parquet
- Información del archivo Parquetget_dataset_opt_in_out_urls
- URLs de entrada/salidaget_dataset_presidio_entities
- Detección de entidades PII
Inicio rápido
Integración con Claude Desktop
Añada a su Claude Desktop claude_desktop_config.json
:
{ "mcpServers": { "huggingface-mcp": { "command": "docker", "args": [ "run", "--rm", "-i", "--name", "huggingface-mcp-claude", "huggingface-mcp:latest" ] } }
Crear imagen Docker
make docker-build
Desarrollo
Requisitos previos
- Python 3.12+
- uv
Configuración
make install # Instalar dependencias make test # Ejecutar pruebas (38 pruebas) make example # Probar todas las herramientas make run # Iniciar servidor directamente
Comandos Docker
make docker-build # Construir imagen make docker-run # Ejecutar contenedor make docker-stop # Detener contenedor
Cobertura de la API
Implementa todos los puntos finales GET de la API Hugging Face Dataset Viewer:
Punto final | Herramienta | Descripción |
---|---|---|
/divisiones | get_dataset_splits | Información sobre divisiones de conjuntos de datos |
/info | obtener_conjunto_de_datos_info | Metadatos y características del conjunto de datos |
/primeras filas | get_dataset_first_rows | Vista previa de las 100 primeras filas |
/filas | get_dataset_rows | Acceso a datos paginados |
/buscar | buscar_conjunto_datos | Búsqueda de texto completo en conjuntos de datos |
/tamaño | obtener_tamaño_conjunto_datos | Información sobre el tamaño del conjunto de datos |
/estadística | get_dataset_statistics | Análisis estadístico |
/filtro | filtrar_conjunto_datos | Filtrado de datos de tipo SQL |
/es-valido | comprobar_validez_conjunto_datos | Validación del conjunto de datos |
/parquet | obtener_conjunto_datos_parquet | Información sobre archivos parquet |
/opt-in-out-urls | get_dataset_opt_in_out_urls | URL de entrada/salida |
/presidio-entidades | get_dataset_presidio_entities | Detección de entidades PII |
Construido con FastMCP siguiendo todas las mejores prácticas de desarrollo.
Configuración
Copie el archivo de entorno de ejemplo y configure según sea necesario:
cp .env.ejemplo .env # Edite .env con su configuración
Uso
Ejecutando el Servidor
make run
Ejecución de pruebas
make test
Ejecutar ejemplos
make ejemplo
Docker
Construir y ejecutar
make docker-build make docker-run
Con Docker Compose
docker-compose up --build
Desarrollo
TODO: Añadir directrices de desarrollo
Documentación API
TODO: Añadir documentación API
Contribuyendo
TODO: Añadir directrices de contribución
Licencia
TODO: Añadir información sobre la licencia