Desenvolvedor(a) Python Sênior — Parser, OCR e Extração de Dados
FATTURE TECNOLOGIA E SISTEMAS LTDACampinas - SP
1 posição
Não informado
Integral
PJ
Remoto
Sênior
Tecnologia
Atuar no desenvolvimento e evolução do motor de parsing e extração de dados de PDFs de faturas de energia elétrica em um ambiente que envolve o processamento de documentos PDF em larga escala, OCR, parsing estruturado, validação de dados, monitoramento de qualidade e melhoria contínua de performance e estabilidade.
- Desenvolver e manter parsers de documentos PDF
- Criar novos modelos de extração de dados
- Evoluir estratégias de OCR e parsing
- Corrigir falhas e inconsistências de extração
- Melhorar performance e estabilidade do processamento
- Trabalhar com documentos de layouts variados e não padronizados
- Monitorar qualidade dos modelos e taxa de erro
- Desenvolver ferramentas internas para apoio operacional e técnico
- Participar da definição de estratégias técnicas de extração
- Investigar casos complexos de parsing e OCR
- Trabalhar com alto volume de processamento de documentos
- Melhorar pipelines existentes e propor novas abordagens técnicas
- Atuar diretamente na evolução da arquitetura de processamento
Requisitos
Escolaridade
- Graduação
Idioma
- Inglês - Básico
Habilidade Técnica
- Ambiente Linux - Avançado
- OCR - Avançado
- Python - Avançado
- Processamento de PDFs - Avançado
- Conhecimento em Docker (criação e manutenção de containers) - Avançado
Benefícios
- Adiantamento de salário
- Auxílio viagem
- 13o salário no regime PJ
- Day off de aniversário
Localização
Avenida Doutor José Bonifácio Coutinho Nogueira, 150, Terreo - Conj. 1, Jardim Madalena, Campinas - SP, Brasil, 13091-611