Cientistas de dados
O que fazem e porque são importantes?
O que é um cientista de dados?
Os cientistas de dados são pessoas que utilizam conhecimentos estatísticos, de programação e de domínio especializado de indústrias para transformar dados em informações. Por outras palavras, os cientistas de dados são versáteis em várias disciplinas, como matemática, ciência da computação e aptos a notar tendências. Servem-se das suas capacidades em IT para ajudar empresas a calcular o risco e a obter resultados positivos.
Evolução do papel do cientista de dados
De uma forma simplista, um cientista de dados é uma derivação de um especialista em análise de dados que tem capacidades técnicas para resolver problemas complexos e a curiosidade em explorar o que é que os problemas ainda por identificar podem vir a precisar para também, seguidamente, ser resolvidos.
Os cientistas de dados utilizam a ciência de dados para recolher recomendações personalizadas de dados por explorar, sejam eles estruturados ou não-estruturados. À medida que automatização e machine learning se tornam componentes cada vez mais importantes nas estratégias de IT de organizações de grande escala, cresce também o estatuto da análise de dados. Mas qual o porquê desta situação? A razão está relacionada com o valor que os especialistas podem trazer ao traduzir as montanhas de dados em recomendações personalizadas que ajudam negócios a maximizar o seu potencial.
O futuro da ciência de dados
Cientistas de dados, developers e modeladores precisam de ferramentas com tempos de iniciação mais rápidos, flexibilidade e escolha. Ao discutir o que se segue na ciência de dados, Dan Soceanu, explicou a importância de um ambiente que possa ser ampliado e reduzido, numa qualquer escolhida linguagem de programação de preferência, e com pouco apoio informático. Veja para aprender mais acerca dos requisitos de mercado, riscos, responsabilização e cumprimento dentro da área.
Porque é que os cientistas de dados são importantes?
O papel dos cientistas de dados e a importância da ciência de dados em si começou e cresceu com o surgimento dos big data. À medida que os dados cresciam exponencialmente tornou-se evidente, para várias organizações, que estavam sentadas em cima de uma mina de ouro, mas nem sempre estas tinham o melhor posicionamento para colher os benefícios e retirar valor comercial dos seus próprios dados. Pois se os dados são o ouro da era da informação, os cientistas de dados surgiram como os novos mineiros capazes de identificar as verdadeiras pepitas, ou seja, separam o trigo do joio.
Quando a pandemia COVID-19 varreu o globo, acelerou tendências da transformação digital, levando a uma número de pessoas online mais elevado do que o esperado. Estavam a trabalhar online, fazer compras e em busca de entretenimento. Isto deu ainda maior destaque ao papel do cientista de dados e à sua função, tornando-se mais relevante de forma óbvia.
Um estudo da McKinsey, em outubro de 2020, confirmou que a crise da COVID acelerou a digitalização das interações dos clientes em vários anos. Por isso, faz sentido que em 2021 um Inquérito da SAS tenha obtido respostas em que, 91% dos cientistas de dados acredita que o seu trabalho agora é tão ou mais importante do que antes da pandemia.
Ferramentas como o ChatGPT descolaram agora como geradores de código, e alguns especialistas questionam: Será que a AI generativa irá substituir os cientistas de dados? Não. Em vez disso, as tecnologias de AI generativa podem automatizar tarefas rotineiras de dados e ajudar os cientistas de dados a gastar o seu tempo em conhecimentos de domínio para explorar dados, construir modelos e entregar resultados.
Com o efeito dominó das adaptações em processos, práticas, parâmetros e pressupostos operacionais, o papel dos cientistas de dados parece continuar numa trajetória de crescimento no futuro. A falta de trabalhadores, disrupções na cadeia de abastecimento, o aumento do e-commerce e serviços em cloud, todos apontam para a mesma conclusão.
Os cientistas de dados na atualidade
Fique a saber mais pelos próprios cientistas de dados: sobre o que fazem e o que é preciso para entrar nesta profissão.
Aptidões de cientistas de dados
Vamos examinar de perto a vida dos cientistas de dados – os seus papéis e responsabilidades nas organizações e aptidões necessárias que os ajudam a alcançar a excelência. Os cientistas de dados têm como principal tarefa utilizar o software para organizar e analisar dados. Também devem ser capazes de traduzir as descobertas das suas análises em termos que sejam facilmente compreendidos pelas partes interessadas, entre as quais há um misto de pessoas que percebem de tecnologias e outras que nem por isso.
Se tiver curiosidade quanto às principais linguagens de programação que os cientistas de dados devem conhecer, leia este artigo da ZDNET
Está a perguntar-se como é o dia-a-dia de um cientista de dados? Este gráfico do Inquérito SAS não só nos dá uma visão de como gastam o seu tempo, como também dá uma razoável visão cronológica dos seus processos. Reunir dados é um importante primeiro passo, mas é apenas um de muitos que são cruciais quando se está a transformar dados para que fiquem aptos a ser utilizados em recomendações personalizadas.
Na era da inteligência artificial (AI), os cientistas de dados preparam e exploram dados, desenvolvem, treinam e implementam modelos e contribuem para a inovação e pesquisa. Também são especialistas a apresentar análises complexas de uma forma visualmente simplista.
Nota: Certifique-se de que não confunde o cientista de dados, que tende a trabalhar numa visão a longo termo, com o analista de dados. Os analistas apoiam a tomada de decisões a curto prazo e em tempo real. Ao passo que os cientistas de dados levam uma empresa ou departamento a atingir objetivos e a ver mais além, através da criação de motores de previsão e da otimização de algoritmos para aumentar a eficiência a longo prazo.
E quanto às capacidades? Um cientista de dados de excelência possui um misto de habilidades de diferentes naturezas em programação, análise quantitativa, intuição, comunicação e trabalho de equipa. E o trabalho de equipa tem vindo a ganhar importância.
Um inquérito SAS de 2022 revela uma atual escassez de competências relativamente aos cientistas de dados avançados. Cerca de 63% dos tomadores de decisão não têm funcionários suficientes com aptidões em AI e ML, apesar de 54% já utilizar estas tecnologias e 43%-44% planear fazê-lo nos próximos anos.
Debatendo o trabalho da ciência de dados
O cientista de dados Robert Blanchard diz ser um programador por vocação e que adora codificar. Contudo, vê também os benefícios dos simplificados modelos de 'arrastar e largar'. Aprenda como ele trabalha com os colegas para combinar SAS® e Python de forma a implementar um modelo de visão computacional num drone.
Onde encontrar cientistas de dados?
Já não restam dúvidas quanto ao potencial que as tecnologias de AI têm para transformar indústrias por completo. Como resultado, os cientistas de dados estão a ser constantemente chamados para resolver problemas complexos e ajudar empresas a prestar um melhor atendimento aos seus clientes.
Os cientistas de dados...
No sector bancário ajudam as pessoas a visualizar o desempenho sustentável dos seus portfolios.
Na agricultura estão a ajudar a modelar dados de compensação de carbono, para incentivar à produção sustentável de fertilizantes.
Nas pesquisas académicas estão a modelar os maiores fatores de risco a afetar a saúde dos corais de recifes e a partilhá-los com outros conservacionistas.
Na energia (petróleo e gás) estão a ajudar a prever o tempo para maximizar as fontes de energia renováveis, como a eólica e solar.
Nos cuidados de saúde e ciências biológicas estão a ajudar a simplificar processos, para prestar cuidados mais eficazes e interligar fontes de dados, para melhorar a vida dos pacientes, e a eficácia dos prestadores de serviços e dos governos.
Nas seguradoras estão a ajudar os fornecedores a avaliar o risco, detetar fraudes e a refinar as ofertas de produtos, para conseguirem mais vendas e também prestarem um melhor serviço aos clientes.
Na indústria transformadora estão a aplicar o machine learning para antecipar a necessidade de manutenção de maquinarias ou falhas na produção, e também para manter a linha de produção em funcionamento.
No comércio estão utilizar a AI para ajudar compradores a encontrar o percurso mais rápido na sua compra nas lojas.
No sector público estão a salvar vidas através da coordenação de luzes de trânsito para ajudar nos primeiros dispositivos de resposta (pronto socorro).
Nas telecomunicações e media estão a ajudar a otimizar redes e melhor adequar e ajustar as experiências de clientes.
Venha conhecer 3 cientistas de dados
Um grau superior, um estágio e uma certificação levaram esta cientista de dados a conseguir a carreira dos seus sonhos na Nova Zelândia.
Motivada, apaixonada e curiosa, a cientista de dados, Jessica Rudd, obteve um doutoramento para conseguir ter impacto no futuro da tecnologia.
A história do Bowtell é a prova de que nunca é tarde demais para trocar de carreira quando se tem ambição. Descubra como – e o porquê – deste ter trocado a engenharia pela ciência de dados.
Como se tornar um cientista de dados
Pretende posicionar-se para construir uma carreira na ciência de dados? Há mais pessoas a querer aprender. Esta disciplina continua a ganhar relevância. A boa notícia é que o mercado não está próximo de atingir um nível de saturação (nem de perto nem de longe) para quem quer trabalhar como cientista de dados. Aqui encontrará algumas considerações acerca da educação e treino necessário.
Estudantes que querem tornar-se cientistas de dados
Se está a pensar entrar no mercado assim que terminar os estudos, talvez queira considerar uma licenciatura em ciência de dados ou numa área relacionada como: estatística, ciências informáticas, engenharia informática ou sistemas de informação. Certifique-se de que escolhe uma universidade que oferece cursos em ciência de dados, ou pelo menos, aulas em ciência de dados e análise.
Em Portugal, já há escolas a oferecerem cursos em ciência de dados, por exemplo: Instituto Universitário de Lisboa, Faculdade de Ciências da Universidade de Lisboa, Universidade do Minho, entre outras. Em vários destes casos, as capacidades SAS estão incluídas no currículo da ciência de dados.
Profissionais a meio da carreira que querem tornar-se cientistas de dados
Há muitos profissionais interessados em fazer uma mudança na carreira para entrar no ramo da ciência de dados. Embora a maior parte dos cientistas de dados tenha um background em análise de dados ou estatística, há profissionais que vêm de outros campos que podem não ser tão técnicos, como por exemplo, a área de negócios ou economia.
Independentemente do seu background, pense se tem as capacidades básicas que ajudam os cientistas de dados a atingir a excelência – nomeadamente o dom de resolver problemas, boas capacidades de comunicação e uma curiosidade insaciável sobre o funcionamento das coisas.
Pense especializar-se em sub tópicos como: inteligência artificial, pesquisa, gestão de bases de dados ou machine learning. Prepare-se para desenvolver um conhecimento sólido sobre:
- Estatísticas e machine learning.
- Linguagens de código como SAS, R, SQL, Java ou Python.
- Bases de dados como MySQL e Postgres.
- Visualização de dados e tecnologias de relatórios.
- Hadoop e MapReduce.
Note que, à data, há várias universidades a oferecer mestrados em ciência de dados.
Percursos de carreira para cientistas de dados
O cargo mais alto que um cientista de dados pode alcançar, numa empresa de grande dimensão, é o de diretor de dados (CDO). O CDO supervisiona todas as funções relacionadas com os dados e é responsável por ajudar gestores e executivos a obter valor comercial de todos esses dados. Para profissionais ambiciosos, o percurso de um cientista de dados júnior até chegar a CDO assemelha-se a algo do género:
- Analista de dados.
- Cientista de dados - Nível Intermédio
- Cientista de dados - Sénior
- Gestor de ciência de dados
- Diretor de ciência de dados.
- Diretor chefe de dados.
Pode aprender as aptidões que precisa para se tornar um cientista de dados de forma autodidata, através de um curso online, ou treino intensivo. O networking também ajuda. Pode estabelecer relações significativas com outros cientistas de dados ou encontrar uma comunidade online.
Soluções de ciência de dados
As capacidades SAS® Viya® figuram uma gestão de dados robusta, visualização, análise avançada e gestão de modelos para acelerar a ciência de dados em qualquer organização.
SAS para machine learning e Deep learning ajuda a resolver problemas analíticos complexos através de uma solução colaborativa, única e integrada – com o seu próprio automatizado modelo API.
SAS Visual Analytics oferece-lhe os meios para elaborar relatórios com rapidez de forma interativa, explorar os seus dados através de apresentações visuais e realizar as suas análises numa base de self-service.
Estas soluções e outras são alimentadas pela SAS Viya, uma plataforma SAS líder no mercado de ciência de dados que é executada numa arquitetura moderna, escalável e com ligação à cloud.
Os Data scientists são uma nova geração de peritos em dados analíticos que têm competências técnicas para resolver problemas complexos – e a curiosidade para explorar que problemas precisam de ser resolvidos.
São parte matemáticos, parte informáticos e parte observadores de tendências. E, porque se encontram tanto no mundo dos negócios como no das TI, são muito procurados e bem pagos. Quem não gostaria de ser um?
São também um sinal dos tempos. Os data scientists não estavam em muitos radares há uma década atrás, mas a sua súbita popularidade reflete a forma como as empresas agora pensam sobre big data. Essa enorme quantidade de informação não estruturada já não pode ser ignorada e esquecida. É uma mina de ouro virtual que ajuda a aumentar as receitas - desde que haja alguém que investigue e encontre ideias comerciais que ninguém pensou em procurar anteriormente. Introduza o Data Scientist.
De onde é que eles vieram?
Muitos dos Data Scientists começaram as suas carreiras como profissionais de estatística ou analistas de dados. Mas à medida que o big data (e tecnologias de armazenamento e processamento de dados, como o Hadoop) começaram a crescer e a evoluir, esses papéis evoluíram também. Os dados já não são apenas uma reflexão de segundo plano para ser gerida por Tecnologias de Informação. É informação chave que requer análise, curiosidade criativa e um dom para traduzir ideias de alta tecnologia em novas formas de transformar um lucro.
O papel do Data Scientist também tem origens académicas. Há alguns anos, universidades começaram a reconhecer que os empregadores queriam pessoas que fossem programadores e jogadores de equipa. Os professores ajustaram as suas aulas para acomodar esta situação, tal como o Institute for Advanced Analytics na Universidade da Carolina do Norte, preparando-se para lançar a próxima geração de Data Scientists. Existem atualmente mais de 60 programas semelhantes em universidades de todo o país.
“Os meus dias podem ser muito similares, mas o trabalho de semana para semana pode variar muito. Durante algumas semanas posso estar a trabalhar num projeto de extração de texto, e depois disso, posso estar a criar um modelo preditivo sobre o cliente. A isto, juntam-se reuniões com terceiros sobre analytics e como podem ajudar diferentes partes do negócio.”
Alex Herrington
Data Scientist de um importante distribuidor dos EUA
Ler a história
Kirk Borne, doutorado, Diretor Data Scientist em Booz Allen Hamilton, refere a interpretação errada de que a ciência de dados é uma função de Tecnologias de Informação – e de como os Data Scientists podem ajudar na nova era de maiores e mais complexos dados.
Recursos para começar
- Tornar-se um Data Scientist. Saiba como a Academia SAS para Data Science o pode ajudar a começar.
- Faça o download de SAS University Edition software gratuito SAS que permite a estudantes e estagiários utilizar analytics (dados analíticos, estatísticas).
Mais sobre Data Scientists
- Conheça um Data Scientist: Entrevista com Kristin Carney.
- Faça download de um relatório sobre Obter valor dos seus Data Scientists.
Funções típicas a desempenhar por um Data Scientist
Não há uma descrição definitiva quando se fala no trabalho de um Data Scientist. Mas aqui estão algumas coisas que provavelmente irá fazer:
- Recolher grandes quantidades de dados desordenados e transformá-los num formato mais utilizável.
- Resolver problemas relacionados com o negócio usando técnicas orientadas por dados.
- Trabalhar com uma variedade de linguagens de programação, incluindo SAS, R e Python.
- Ter uma compreensão sólida de estatísticas, incluindo testes estatísticos e distribuições.
- Manter-se a par das técnicas de análises tais como machine learning, aprendizagem profunda e análises (dados analíticos) de texto.
- Comunicar e colaborar tanto com as TI como com as empresas.
- Procura de ordem e padrões nos dados, bem como detectar tendências que possam ajudar ao resultado final de um negócio.
O que está na caixa de ferramentas de um Data Scientist?
Estes termos e tecnologias são normalmente usados por Data Scientists:
- Data visualization: a apresentação de dados em formato pictórico ou gráfico para poderem ser facilmente analisados.
- Machine learning: um ramo da inteligência artificial baseado em algoritmos matemáticos e automação.
- Deep learning: uma área de machine learning que usa dados para modelar abstrações complexas.
- Pattern recognition: tecnologia que reconhece padrões em dados (muitas vezes usada de forma alternada com machine learning).
- Data preparation: o processo de converter dados em bruto para outro formato para que possa ser consumido mais facilmente.
- Text analytics: o processo de análise de dados não estruturados para recolher insights empresariais chave.
"Num dia típico, faço uma sessão de brainstorming e resolvo problemas para responder a questões que vêm do negócio com a minha equipa, revejo análises e recomendações concluídas pelas minhas pessoas, e participo numa variedade de reuniões".
Kristin Carney
Data scientist, World’s Foremost Bank
Ler a história
Como pode tornar-se num Data Scientist?
Posicionar-se para uma carreira em ciência de dados pode ser uma jogada inteligente. Terá imensas oportunidades de emprego, e também a oportunidade de trabalhar no campo da tecnologia com espaço para experimentação e criatividade. Então qual é a sua estratégia?
Se for estudante
A escolha de uma universidade que ofereça um diploma de ciências de dados - ou pelo menos uma que ofereça aulas de data science e analytics - é um primeiro passo importante. Oklahoma State University, University of Alabama, Kennesaw State University, Southern Methodist University, North Carolina State University e Texas A&M são todos exemplos de escolas com programas de data science.
Se for um profissional que quer mudar de carreira
Enquanto a maioria dos cientistas de dados têm antecedentes como analistas de dados ou estatísticos, outros vêm de campos não técnicos, tais como negócios ou economia. Como é que profissionais de áreas tão diversas podem acabar no mesmo campo? É importante olhar para o que têm em comum: um dom para resolver problemas, a capacidade de comunicar bem e uma curiosidade insaciável sobre como as coisas funcionam. Saiba como o SAS Academy for Data Science lhe dá as ferramentas para se tornar um data scientist certificado.
Para além dessas qualidades, também irá precisar de uma compreensão sólida:
- Estatísticas e machine learning
- Bases de dados como MySQL e Postgres.
- Visualização de dados e tecnologias de informação/comunicação (relatórios).
- Hadoop e MapReduce.
Se não quiser aprender estas competências por si próprio, faça um curso online ou inscreva-se numa formação. E depois deve, claro, trabalhar em rede. Conecte-se com outros data scientists na sua empresa, ou encontre uma comunidade online. Eles irão dar-lhe informação privilegiada sobre o que os data scientists fazem – e onde irá encontrar os melhores empregos.
Quando é que uma empresa está pronta para contratar um Data Scientist?
Antes de aceitar uma posição como Data Scientist, há algumas coisas sobre a organização, que deve avaliar:
- Lida com grandes quantidades de dados e tem questões complexas que precisam de ser resolvidas? Organizações que realmente precisam de data scientists têm duas coisas em comum: Gerem enormes quantidades de dados, e enfrentam problemas de peso no dia-a-dia. Estão tipicamente em indústrias como a financeira, governo e farmácia.
- Será que valoriza os dados? A cultura de uma empresa tem impacto sobre se deve contratar um data scientist. Será que tem um ambiente que apoia a análise? Tem uma participação executiva? Se não, investir num data scientist, seria deitar dinheiro fora.
- Está pronto para mudar? Como data scientist, espera ser levado a sério, e parte disso implica ver o seu trabalho a ser levado a cabo. Dedica o seu tempo a encontrar formas de o seu negócio poder funcionar melhor. Em resposta, um negócio precisa de estar pronto - e disposto - a dar seguimento aos resultados das suas descobertas.
Contratar um Data Scientist para orientar decisões empresariais baseadas em dados, pode ser um ato de fé para algumas organizações. Certifique-se que a empresa para a qual possa estar a trabalhar tem a mentalidade certa – e que está preparada para fazer algumas mudanças.
"Trabalho para uma empresa ágil, o que exige que eu seja flexível e que me adapte às circunstâncias. Na semana passada, por exemplo, estava a fazer várias tarefas, incluindo melhorar as pontuações de recomendação; afinar a integração com o sistema de gestão de conteúdos operacionais; criar novas variáveis transformadas baseadas no comportamento do consumidor para serem utilizadas em modelos de afinidade; e fazer algum refactoring de relatórios de desempenho/ painéis de controlo analíticos existentes".
Manuel-David Garcia
Data Scientist para uma empresa de tamanho médio em Heidelberg, Alemanha
Ler a história