PDF to Markdown IA

Demo GPU pendiente de hosting

Conversor OCR GPU — PDF/DOCX/PPTX a Markdown con Surya

GPUGPU Local (CUDA, RTX recomendado) + fallback CPUVer codigo en GitHub
Nota honesta: Los componentes marcados como “Demo GPU pendiente” corren en hardware local (RTX 2060 / RTX 5070 Ti) y requieren VRAM dedicada para funcionar. Hostear inferencia GPU en la nube a costo razonable esta pendiente. El codigo fuente de cada componente esta disponible en GitHub.

Descripcion

ConvertPDFToMarkdownIA usa el modelo de OCR Surya con aceleracion CUDA para extraer y convertir documentos complejos (PDFs con imagenes, presentaciones, Word) a Markdown limpio. La arquitectura en tres capas evita bloqueos de UI: Backend API sin GPU para orquestacion, Worker GPU dedicado para procesamiento, y Frontend estatico. Configurable via variables de entorno para forzar CPU o deshabilitar OCR.

Requisitos de hardware

GPU NVIDIA con CUDA (recomendado) | fallback CPU disponible

Capacidades

  • OCR acelerado por GPU con modelo Surya
  • Conversion de PDF, DOCX y PPTX a Markdown
  • Arquitectura desacoplada Backend/Worker/Frontend
  • Procesamiento batch de multiples documentos
  • Modo CPU forzado (PDF2MD_FORCE_CPU=1)
  • Timeout y limite de tamano configurables
  • CORS configurable para UI separada
  • Health checks por capa independientes

Stack tecnologico

Python 3.10+Surya OCRFastAPICUDA / PyTorchpdfminer / python-docx / python-pptx

Diagrama de arquitectura

Arquitectura en tres capas independientes: API de orquestacion, Worker GPU de procesamiento OCR, y Frontend estatico.

Cargando diagrama...

Codigo fuente

https://github.com/stevenvo780/ConvertPDFToMarkdownIA

Ver en GitHub