O uso de CUDA é opcional no Docling — ele não é obrigatório, mas impacta diretamente a velocidade de processamento.
- Sem CUDA (CPU): O pipeline funciona normalmente, mas o processamento será mais lento, especialmente ao usar modelos de visão (VLM) para descrição de imagens.
- Com CUDA (GPU): O processamento é significativamente mais rápido, sendo recomendado para volumes maiores de documentos ou quando a performance é crítica.
Ou seja, tanto o StandardPdfPipeline com do_picture_description=True quanto o VlmPipeline podem rodar em CPU, mas a GPU com CUDA acelera consideravelmente a inferência dos modelos de visão-linguagem utilizados na descrição de imagens.