PDF to Markdown IA

Demo GPU pendiente de hosting

Conversor OCR GPU — PDF/DOCX/PPTX a Markdown con Surya

GPU — GPU Local (CUDA, RTX recomendado) + fallback CPUVer codigo en GitHub

Nota honesta: Los componentes marcados como “Demo GPU pendiente” corren en hardware local (RTX 2060 / RTX 5070 Ti) y requieren VRAM dedicada para funcionar. Hostear inferencia GPU en la nube a costo razonable esta pendiente. El codigo fuente de cada componente esta disponible en GitHub.

Descripcion

ConvertPDFToMarkdownIA usa el modelo de OCR Surya con aceleracion CUDA para extraer y convertir documentos complejos (PDFs con imagenes, presentaciones, Word) a Markdown limpio. La arquitectura en tres capas evita bloqueos de UI: Backend API sin GPU para orquestacion, Worker GPU dedicado para procesamiento, y Frontend estatico. Configurable via variables de entorno para forzar CPU o deshabilitar OCR.

Requisitos de hardware

GPU NVIDIA con CUDA (recomendado) | fallback CPU disponible

Capacidades

—OCR acelerado por GPU con modelo Surya
—Conversion de PDF, DOCX y PPTX a Markdown
—Arquitectura desacoplada Backend/Worker/Frontend
—Procesamiento batch de multiples documentos
—Modo CPU forzado (PDF2MD_FORCE_CPU=1)
—Timeout y limite de tamano configurables
—CORS configurable para UI separada
—Health checks por capa independientes

Stack tecnologico

Python 3.10+Surya OCRFastAPICUDA / PyTorchpdfminer / python-docx / python-pptx

Diagrama de arquitectura

Arquitectura en tres capas independientes: API de orquestacion, Worker GPU de procesamiento OCR, y Frontend estatico.

Cargando diagrama...

Codigo fuente

https://github.com/stevenvo780/ConvertPDFToMarkdownIA

Ver en GitHub