No Docling, o uso de CUDA é obrigatório para processar PDFs com extração de texto e descrição de imagens, ou é opcional?

Documents Docling

Type

Answer

Status

Published

Created

Apr 29, 2026

Updated

Apr 29, 2026

Created by

Dosu Bot

Updated by

Dosu Bot

O uso de CUDA é opcional no Docling — ele não é obrigatório, mas impacta diretamente a velocidade de processamento.

Sem CUDA (CPU): O pipeline funciona normalmente, mas o processamento será mais lento, especialmente ao usar modelos de visão (VLM) para descrição de imagens.
Com CUDA (GPU): O processamento é significativamente mais rápido, sendo recomendado para volumes maiores de documentos ou quando a performance é crítica.

Ou seja, tanto o StandardPdfPipeline com do_picture_description=True quanto o VlmPipeline podem rodar em CPU, mas a GPU com CUDA acelera consideravelmente a inferência dos modelos de visão-linguagem utilizados na descrição de imagens.