PDF to Markdown IA
Demo GPU pendiente de hostingConversor OCR GPU — PDF/DOCX/PPTX a Markdown con Surya
GPU — GPU Local (CUDA, RTX recomendado) + fallback CPUVer codigo en GitHub
Nota honesta: Los componentes marcados como “Demo GPU pendiente” corren en hardware local (RTX 2060 / RTX 5070 Ti) y requieren VRAM dedicada para funcionar. Hostear inferencia GPU en la nube a costo razonable esta pendiente. El codigo fuente de cada componente esta disponible en GitHub.
Descripcion
ConvertPDFToMarkdownIA usa el modelo de OCR Surya con aceleracion CUDA para extraer y convertir documentos complejos (PDFs con imagenes, presentaciones, Word) a Markdown limpio. La arquitectura en tres capas evita bloqueos de UI: Backend API sin GPU para orquestacion, Worker GPU dedicado para procesamiento, y Frontend estatico. Configurable via variables de entorno para forzar CPU o deshabilitar OCR.
Requisitos de hardware
GPU NVIDIA con CUDA (recomendado) | fallback CPU disponible
Capacidades
- —OCR acelerado por GPU con modelo Surya
- —Conversion de PDF, DOCX y PPTX a Markdown
- —Arquitectura desacoplada Backend/Worker/Frontend
- —Procesamiento batch de multiples documentos
- —Modo CPU forzado (PDF2MD_FORCE_CPU=1)
- —Timeout y limite de tamano configurables
- —CORS configurable para UI separada
- —Health checks por capa independientes
Stack tecnologico
Python 3.10+Surya OCRFastAPICUDA / PyTorchpdfminer / python-docx / python-pptx
Diagrama de arquitectura
Arquitectura en tres capas independientes: API de orquestacion, Worker GPU de procesamiento OCR, y Frontend estatico.
Cargando diagrama...
Codigo fuente
https://github.com/stevenvo780/ConvertPDFToMarkdownIA