- Customer Success Stories
- Autoridade Tributária e Aduaneira aposta na qualidade e tratamento dos dados
Autoridade Tributária aposta na qualidade e tratamento dos dados
“Passámos a ter mais informação e isto depois é informação que é tratada ao nível da inspeção, das análises de risco e de todo um processo normal de combate à fraude e invasão fiscal.”
80% Taxa de Sucesso
Qualidade de dados
Capacidade de análise e exploração
Maior produtividade
Solução: SAS® Data Quality
Perante o desafio de conseguir não só tratar dados, de forma eficiente, mas também criar processos e ferramentas que garantam a qualidade da informação, a AT resolveu investir na qualidade e tratamento de dados, através da implementação do SAS Data Quality. O objetivo passava por conseguir identificar os contribuintes registados nos ficheiros da troca de informação, onde existia uma grande diversidade de formatos e nomenclaturas de acordo com os vários países da OCDE e da União Europeia. Objetivo cumprido graças à criação de um algoritmo que, por iterações várias de analogias com os respetivos nomes e moradas, prepara os atributos recebidos de acordo com a realidade nacional.
Na totalidade dos dados processados, as taxas médias de sucesso do processo de identificação rondam os 80% graças a esta solução SAS de fácil integração e escalável, que permite assegurar, de forma rápida, os processos de transformação, validação e enriquecimento de dados.
Sobre a AT
A Autoridade Tributária e Aduaneira, abreviadamente designada por AT, tem como missão administrar os impostos, direitos aduaneiros e demais tributos que lhe sejam atribuídos, bem como exercer o controlo da fronteira externa da União Europeia e do território aduaneiro nacional, para fins fiscais, económicos e de proteção da sociedade, de acordo com as políticas definidas pelo Governo e o Direito da União Europeia.
Pertencendo ao Ministério das Finanças de Portugal, a AT é um organismo que lida diariamente com um avultado volume de informação, informação esta - referente aos contribuintes e não só - que para ser devidamente encaminhada, tem de ser tratada de forma sistematizada e automática.
Perante a identificação de um gap daquilo que era a inexistência de uma solução de Data Quality, o desafio foi então lançado ao SAS: conseguir identificar os contribuintes registados nos ficheiros da troca de informação, onde existia uma grande diversidade de formatos e nomenclaturas, de acordo com os vários países da OCDE e da União Europeia. Ou seja, a necessidade passava por se conseguir fazer o match entre informação residente na AT e informação de fontes terceiras.
“Um desafio complexo e, sem dúvida, moroso do ponto de vista da identificação da forma como as coisas vêm escritas. Há muitas abreviaturas, grafismos distintos, caracteres que nem usamos… e depois há o tema das moradas, porque a forma como se escreve depende do país. E a ideia era deixar de fazer esse trabalho de forma manual, onde a taxa de sucesso era efetivamente baixa (nunca superior a 4% ou 5%), sendo necessário obter um método que preparasse os atributos do nome e da morada, de acordo com a realidade nacional, e desse depois para comparar com o nosso cadastro.” começa por explicar Mário Campos, Subdiretor-geral dos Sistemas de Informação da Autoridade Tributária e Aduaneira.
Com a implementação do SAS Data Quality, foi criado um algoritmo que, por iterações várias de analogias com os nomes e moradas, preparou os atributos recebidos de acordo com a realidade nacional, conseguindo-se aprimorar a capacidade de validar contra os dados de cadastro aquilo que era a informação recebida dos países terceiros.
A AT tem também um compromisso comunitário de tratar esta informação no âmbito daquilo que é o combate à fraude e evasão fiscal, e este processo só é possível quando conseguimos uma identificação nacional desse contribuinte Mário Campos Subdiretor-geral dos Sistemas de Informação Autoridade Tributária e Aduaneira
Em termos de evolução do projeto, em 2017 foi efetuada uma prova de conceito com dados anonimizados de report de 4 países da OCDE do ano de 2013, de forma a demonstrar a capacidade da ferramenta de cumprir os objetivos propostos. Depois, em Agosto de 2017, teve início o projeto com o tratamento de toda a informação proveniente de ficheiros da OCDE e do DAC1 (uma diretiva da UE) para os anos de 2014 e 2015. Já em Abril deste ano, foi disponibilizado um WebService para invocação do processo de identificação dos contribuintes pelo Sistema Integrado de Trocas de Informação (SITI), permitindo o tratamento automático dos novos ficheiros que chegam à AT. E por fim, em Maio entrou em produção o SITI, onde toda a informação recebida no âmbito das trocas é registada, sendo toda ela previamente identificada por este algoritmo de qualidade de informação, para posterior tratamento.
Um aspeto importante a ressalvar é o facto desta solução poder vir servir fins maiores em termos de componentes e arquiteturas informacional e analítica da AT, tal como referiu Mário Campos “Neste momento concluímos a fase inicial, a fase de adoção por via do projeto inicial e, portanto, estamos no ponto de posicionar a solução do SAS como solução estrutural para outros projetos associados ao tema da qualidade dos dados e, sobretudo, desta necessidade permanente de cruzar informação, seja dentro dos nossos próprios sistemas ou dos sistemas com informações externas”.
Quantos às vantagens é de referir a incorporação de inteligência naquilo que é um processo que se não fosse baseado no conceito de aprendizagem de Machine Learning seria bastante mais moroso de afinar, sendo de destacar também do ponto de vista da usabilidade o facto de se tratar de uma solução simples, com fácil adesão das pessoas.
Para além disso, o SAS Data Quality conseguiu munir informação a quem analisa, permitindo com base nessa informação a tomada de melhores decisões dentro da AT. “Passámos a ter mais informação e isto depois é informação que é tratada ao nível da inspeção, das análises de risco e de todo um processo normal de combate à fraude e invasão fiscal.” reforça Mário Campos.
O balanço é por isso positivo, “Neste momento estamos com taxas de satisfação muito positivas, na ordem dos 80%. Esta taxa de sucesso existia antes, mas era baixíssima e com base num tempo e num esforço muito dilatado.” afirma aquele Responsável, concluindo que “Os resultados do processo variam bastante de acordo com a qualidade da informação enviada pelos outros países, sendo tanto melhores quanto mais completos e bem preenchidos forem os dados recebidos. Mas neste momento a taxa média de sucesso é elevada, sendo que para contribuintes individuais os resultados são melhores do que para contribuintes coletivos, porque se junta um outro atributo, a data de nascimento, aumentando a taxa de sucesso.”
Benefícios para o Negócio
Maior capacidade de análise e exploração de dados
Maior Produtividade e mais capacidade de gestão da informação
Redução do tempo execução dos processos