Machine Learning
Machine Learning
O que é e porque é importante
Machine learning é um método de análise de dados que automatiza a construção de modelos analíticos. É um ramo da inteligência artificial baseado na ideia de que os sistemas podem aprender através dos dados, identificar padrões e tomar decisões com uma reduzida intervenção humana.
Evolução de machine learning
Com os novos avanços tecnológicos, a área de machine learning não é, nos dias de hoje, como era no passado. Esta área surgiu a partir do reconhecimento de padrões e da teoria de que os computadores podem aprender a desempenhar tarefas concretas, sem terem que ser programados; alguns investigadores interessados em inteligência artificial queriam perceber se os computadores podiam aprender a partir de dados. A interatividade que existe na área de machine learning é importante pois, como os modelos são expostos a novos dados, são capazes de se adaptar de forma independente. Aprendem com cálculos anteriores para poderem produzir decisões e resultados fiáveis e repetíveis. É uma ciência que, apesar de não ser nova, ganhou um impulso renovado.
Apesar de muitos algoritmos de machine learning existirem há já muito tempo, a capacidade de aplicar automaticamente cálculos matemáticos complexos a Big Data – repetitivamente e cada vez mais rápido – é um desenvolvimento recente. Estes são alguns exemplos de aplicação de machine learning com os quais pode já estar familiarizado:
- O muito falado self-driving car da Google? A essência de machine learning.
- Ofertas de recomendação online tais como as da Amazon e Netflix? Aplicações de Machine learning para a vida quotidiana.
- Sabe o que os seus clientes estão a dizer da sua marca no Twitter? Machine learning integrado com criação de regras linguísticas.
- Deteção de fraude? Uma das utilizações mais óbvias e importantes no nosso mundo, nos dias de hoje.
Machine Learning e Inteligência Artificial
Se por um lado a inteligência artificial é a ciência alargada de reproduzir as capacidades humanas, machine learning é um subconjunto específico de IA que treina uma máquina para poder aprender. Veja este vídeo para melhor compreender a relação entre IA e machine learning. Verá como estas duas tecnologias funcionam, com exemplos úteis e alguns detalhes engraçados.
Machine learning and artificial intelligence
While artificial intelligence (AI) is the broad science of mimicking human abilities, machine learning is a specific subset of AI that trains a machine how to learn. Watch this video to better understand the relationship between AI and machine learning. You'll see how these two technologies work, with useful examples and a few funny asides.
Machine learning in today's world
By using algorithms to build models that uncover connections, organizations can make better decisions without human intervention. Learn more about the technologies that are shaping the world we live in.
Real-world applications of machine learning
CNG Holdings uses machine learning to enhance fraud detection and prevention while ensuring a smooth customer experience. By focusing on identity verification from the outset, they transitioned from reactive to proactive fraud prevention. Machine learning models help quickly validate identities, significantly reducing fraud instances and false positives. Real-time data access allows CNG to adjust strategies swiftly during fraud attempts, leading to reduced costs and more efficient investigations.
Porque é importante o machine learning?
O interesse crescente em machine learning deve-se aos mesmos fatores que tornaram o data mining e a análise Bayesiana os mais populares de todos os tempos. Estamos a falar de aspetos como volumes crescentes e variedade de dados disponíveis, processamento informático que é mais barato e mais poderoso, e armazenamento de dados mais económico.
Tudo isto significa que é possível produzir rápida e automaticamente modelos que podem analisar dados maiores e mais complexos e fornecer resultados mais rápidos e precisos - mesmo a uma escala muito grande. E ao construir modelos precisos, uma organização tem mais hipóteses de identificar oportunidades lucrativas - ou evitar riscos desconhecidos.
O que é necessário para criar bons sistemas de machine learning?
- Capacidade de preparação de dados.
- Algoritmos – básicos e avançados.
- Automação e processos interativos.
- Escalabilidade.
- Modelação de conjunto.
Sabia que?
- Em machine learning, a um alvo chamamos rótulo (etiqueta).
- Em estatística, a um alvo dá-se o nome de variável dependente.
- Uma variável, em estatística, é designada por funcionalidade (característica) em machine learning.
- A uma transformação em estatística, dá-se o nome de criação de funcionalidade/função (característica) em machine learning.
Machine Learning no mundo de hoje
Ao usar algoritmos para construir modelos que desvendam conexões, as organizações podem tomar melhores decisões sem intervenção humana. Saiba mais sobre as tecnologias que estão a moldar o mundo em que vivemos atualmente.
Oportunidades e desafios para machine learning nos negócios
Este relatório O’Reilly disponibiliza um guia prático para implementar aplicações de machine learning na sua organização.
Amplie as suas competências
Beneficie de ensino especializado e acesso gratuito ao Software SAS para desenvolver os seus conhecimentos em machine learning. Os cursos incluem: 14 horas de aprendizagem, 90 dias de acesso gratuito ao software na cloud, um formato e-learning flexível e sem necessidade de conhecimentos de programação.
Qual será o impacto de machine learning na sua organização?
TEste relatório do Harvard Business Review Insight Center debruça-se sobre o tema de como o machine learning irá mudar as empresas e a forma como as gerimos.
Fazer download do relatório
Aplicar machine learning à IoT
Machine learning pode ser usada para alcançar níveis mais elevados de eficiência, particularmente quando aplicado à Internet das Coisas. Este artigo aborda este tópico.
Who's using it?
Most industries working with large amounts of data have recognized the value of machine learning technology. By gleaning insights from this data – often in real time – organizations are able to work more efficiently or gain an advantage over competitors.
Financial services
Banks and others in the financial industry can use machine learning to improve accuracy and efficiency, identify important insights in data, detect and prevent fraud, and assist with anti-money laundering. Data mining, a subset of ML, can identify clients with high-risk profiles and incorporate cyber surveillance to pinpoint warning signs of fraud.
Health care
Machine learning is a fast-growing trend in the health care industry, thanks to the advent of wearable devices and sensors that can use data to assess a patient's health in real time. The technology can also help medical experts analyze data to identify trends or red flags that may lead to improved diagnoses and treatment.
Insurance
Machine learning is revolutionizing the insurance industry by enhancing risk assessment, underwriting decisions and fraud detection. It also helps improve customer experience and boost profitability. By analyzing vast amounts of data, ML algorithms can evaluate risks more accurately, so insurers can tailor policies and pricing to customers.
Life sciences
Machine learning and other AI and analytics techniques help accelerate research, improve diagnostics and personalize treatments for the life sciences industry. For example, researchers can analyze complex biological data, identify patterns and predict outcomes to speed drug discovery and development. For treatment, analyzing patient data allows therapies to be tailored to individual genetic profiles and health histories (for personalized medicine).
Public sector
Government agencies responsible for public safety and social services have a particular need for machine learning because they have multiple sources of data that can be mined for insights. Analyzing sensor data, for example, identifies ways to increase efficiency and save money. Machine learning can also help detect fraud and minimize identity theft.
Retail and consumer goods
Websites that recommend items you might like based on previous purchases use machine learning to analyze your buying history. Retailers rely on machine learning to capture data, analyze it and use it to personalize a shopping experience, implement a marketing campaign, optimize prices, plan merchandise and gain customer insights.
Analítica Avançada da SAS
Machine learning não é uma tecnologia específica per se; envolve software como a mineração de dados e análise avançada para explorar grandes quantidades de dados e descobrir insights. As soluções SAS® estão imbuidas com algoritmos inovadores que facilmente atingem o objetivo.
Saiba mais sobre soluções analíticas da SAS
Quem está a usar?
A maioria das indústrias que habitualmente trabalham com grandes quantidades de dados, reconheceram o valor da tecnologia de machine learning. Através da recolha de informações destes dados – frequentemente em tempo real – as organizações estão aptas a trabalhar mais eficientemente ou a ganhar vantagem sobre os seus concorrentes.
Serviços financeiros
Os bancos e outros negócios na indústria financeira usam tecnologia de machine learning com dois objetivos chave: identificar informações importantes em dados e prevenir fraude. As informações podem identificar oportunidades de investimento, ou ajudar os investidores a saber quando negociar. A exploração de dados (data mining) pode também identificar clientes com perfis de alto risco, ou usar ciber-vigilância para detectar sinais de alerta de fraude.
Governo
Organismos governamentais tais como segurança pública e serviços públicos têm uma necessidade particular de machine learning, uma vez que têm múltiplas fontes de dados que podem ser exploradas para obtenção de informações. Analisar por exemplo dados de sensores, permite identificar formas de aumentar a eficiência e poupar dinheiro. O machine learning pode ainda ajudar a detectar fraude e minimizar roubos de identidade.
Cuidados de saúde
O machine learning é uma tendência em grande crescimento na indústria de cuidados de saúde, graças ao advento de dispositivos e sensores que podem usar dados para avaliar a saúde de um paciente em tempo real. A tecnologia pode ainda ajudar os profissionais de saúde a analisar dados para identificar tendências ou situações de alerta que podem levar a uma melhoria de diagnósticos e tratamento.
Retalho
Os sites que recomendam artigos que poderá gostar com base em compras prévias, estão a usar machine learning para analisar o seu historial de compra. Os retalhistas apoiam-se no machine learning para recolher dados, analisá-los e depois usá-los para personalizar a experiência de compra em loja, implementar uma campanha de marketing, otimização de preço, planeamento de abastecimento de merchandise, e para obter informações dos clientes.
Petróleo e gás
Encontrar novas fontes de energia. Analisar minerais na terra. Prever falhas de sensores de refinaria. Otimizar a distribuição de petróleo para o tornar mais eficiente e económico. O número de casos de uso de machine learning nesta indústria é vasto e ainda está em expansão.
Transportes
Analisar dados para identificar padrões e tendências é chave para a indústria dos transportes, que assenta numa lógica de tornar as rotas mais eficientes e prever potenciais problemas para melhor a rentabilidade. A análise de dados e aspetos de modulação de Machine Learning são ferramentas importantes para empresas de entregas, transportes públicos e outras organizações de transporte.
Saber mais sobre indústrias a usar esta tecnologia
- Agricultura
- Banca (Serviços bancários)
- Mercados de capital
- Casinos
- Bens de consumo
- Cuidados de Saúde
- Educação Superior
- Hóteis
- Seguros
- Ciências da Vida
- Fabrico (manufactura)
- Petróleo e Gás
- Educação Pré-Escolar (até aos 12 anos)
- Sector Público
- Comércio
- Pequenas e Médias Empresas
- Análise de Desportos
- Viagens e Transportes
- Telecom, Media e Tecnologia
- Serviços Públicos
Como funciona
Para obter o melhor aproveitamento de Machine Learning, é importante saber como emparelhar os melhores algoritmos com as ferramentas e processos certos. O SAS combina tradição rica e sofisticada em estatística e exploração de dados com novos avanços arquiteturais para assegurar que os seus modelos funcionem o mais rápido possível – mesmo nos contextos/ambientes de grandes empresas.
Algoritmos: Os interfaces gráficos de utilizador do SAS ajudam-no a desenvolver modelos de Machine Learning e a implementar um processo interativo. Não precisa de ser um estatístico avançado. A nossa abrangente seleção de algoritmos de aprendizagem automática pode ajudá-lo a rapidamente tirar proveito dos seus grandes dados e estão incluídos em muitos produtos SAS. Algoritmos de Machine Learning do SAS incluem:
Redes neurais
| |
“Decision trees” - Árvores de decisão
| |
“Random forests” – Florestas aleatórias
| |
Descoberta de sequências e associações
| |
Estímulo/Impulso de gradiente e empacotamento
| |
Máquinas vetoriais de suporte | |
Mapeamento de vizinho mais próximo | |
Aglomeração “k-means” (quantização de vetores) | |
Mapas de auto-organização |
Técnicas de otimização de procura local (por exemplo, algoritmos de genética)
| |
Maximização de expectativa
| |
Estrias de regressão adaptativas multivariadas
| |
Redes Bayesian
| |
Estimativa de densidade Kernel
| |
Análise de componente principal | |
Decomposição de valor singular /h5> | |
Modelos de mistura Gaussian | |
Desenvolvimento de regra de cobertura sequencial |
Ferramentas e processos: Como agora sabemos, não são apenas os algoritmos. No fim de contas, o segredo para tirar o maior proveito dos seus grandes dados, está em emparelhar os melhores algoritmos para a tarefa em mãos com:
Gestão e qualidade global de dados
| |
“GUIs” – interfaces gráficos para utilizadores – para desenvolver modelos e fluxos de processos
| |
Exploração de dados interativa e visualização de resultados dos modelos
| |
Comparações de diferentes modelos de Machine Learning para rapidamente identificar o melhor modelo
|
Avaliação automatizada do modelo de conjunto para identificar os melhores desempenhos
| |
Implementação fácil de modelo para que possa ter resultados reproduzíveis e confiáveis rapidamente
| |
Uma plataforma integrada, de ponta-a-ponta, para a automação do processo de decisão com base nos dados
|
Precisa de informações ou orientações sobre qual o algoritmo de aprendizagem automática (de máquina) a utilizar e com que finalidade? Este blog de Hui Li, uma cientista de dados do SAS, fornece-lhe toda a informação de que precisa.
Quais são os métodos mais populares de aprendizagem automática (de máquina)?
Dois dos mais largamente adotados métodos de Machine Learning são a aprendizagem supervisionada e a aprendizagem não supervisionada – mas há ainda outros métodos de aprendizagem automática. Aqui fica uma noção geral dos mais populares.
Algoritmos de aprendizagem supervisionada são treinados para usar exemplos rotulados, tais como um “input” (uma entrada) onde o “output” (a saída/resultado) é conhecido. Por exemplo, uma peça de equipamento podia ter pontos de dados rotulados (etiquetados) como “F” (falha) ou “R” – “runs”. O algoritmo de aprendizagem recebe um conjunto de “inputs” (entradas) de acordo com os “outputs” (saídas/resultados) correspondentes, e o algoritmo aprende comparando o seu verdadeiro output (resultado) com outputs corretos para encontrar erros. E assim, modifica o modelo em conformidade. Através de métodos como classificação, regressão, predição e estímulo/impulso de gradiente, a aprendizagem supervisionada usa padrões para prever os valores do rótulo/etiqueta em dados adicionais ainda por rotular. A aprendizagem supervisionada é normalmente utilizada em aplicações onde dados históricos prevêem prováveis eventos futuros.. Por exemplo, pode antecipar quando transações de cartão de crédito são provavelmente fraudulentas ou que cliente de seguradora irá provavelmente arquivar uma reivindicação.
A aprendizagem não supervisionada é usada para dados que não têm etiquetas em histórico. O sistema não é informado da "resposta certa". O algoritmo tem de descobrir o que está a ser mostrado. O objetivo é explorar os dados e identificar alguma estrutura. A Aprendizagem não supervisionada funciona bem em dados de transações. Permite, por exemplo, identificar segmentos de clientes com atributos semelhantes que são depois tratados de forma semelhante em campanhas de marketing. Ou pode encontrar os principais atributos que separam segmentos de clientes uns dos outros.As técnicas populares incluem mapas de auto-organização, mapeamento de vizinhança próxima (vizinho mais próximo), aglomeração “k-means” (método de quantização vetorial) e decomposição de valores singulares. Estes algoritmos são também usados para segmentar tópicos de textos, recomendar itens e identificar discrepâncias (valores atípicos) em dados.
A Aprendizagem semi-supervisionada é utilizada para as mesmas áreas que a aprendizagem supervisionada. Mas utiliza quer dados rotulados (etiquetados) como dados não rotulados (não etiquetados) para formação – tipicamente uma pequena quantidade de dados etiquetados com uma grande quantidade de dados não etiquetados (porque estes dados são menos dispendiosos e mais fáceis de adquirir). Este tipo de aprendizagem pode ser usada com métodos como classificação, regressão e predição. A aprendizagem semi-supervisionada é útil quando o custo associado à rotulação é demasiado elevado para permitir um processo de formação totalmente etiquetado. Os primeiros exemplos disto incluem identificar o rosto de uma pessoa numa webcam (câmara de filmar de web/internet).
A aprendizagem de reforço é frequentemente usada para robótica, jogos de vídeo e navegação. Com a aprendizagem de reforço, o algoritmo descobre,por tentativa e erro, que ações geram as melhores recompensas. Este tipo de aprendizagem tem três componentes principais: o agente (o aprendiz ou o decisor), o ambiente/contexto (tudo aquilo com que o agente interage) e as ações (o que o agente pode fazer). O objetivo é permitir que o agente escolha as ações que maximizem as recompensas expectáveis durante um determinado período de tempo. O agente irá alcançar o objetivo muito mais rapidamente seguindo uma boa política /diretiva. Assim, o objetivo da aprendizagem de reforço é o de aprender a melhor política.
Os humanos podem normalmente criar um ou dois bons modelos numa semana;o Machine Learning pode criar milhares de modelos numa semana.
Thomas H. Davenport, líder de pensamento em Análise
(excerto do “The Wall Street Journal”)
Quais são as diferenças entre exploração de dados, aprendizagem automática (de máquina) e aprendizagem profunda?
Apesar de todos estes métodos terem o mesmo objetivo – extrair informações, padrões e relações que podem ser usadas para tomar decisões – têm diferentes abordagens e habilidades.
Exploração de Dados
Exploração de dados pode ser considerado um grande conjunto de diferentes métodos para extrair informações de dados. Poderá envolver métodos de estatística tradicional e Machine Learning. A exploração de dados aplica métodos de diferentes áreas para identificar padrões previamente desconhecidos de dados. Isto pode incluir algoritmos estatísticos, Machine Learning, análise de texto, análise de séries cronológicas e muitas outras áreas de analytics. A exploração de dados também inclui o estudo e a prática de armazenamento de dados e manipulação de dados.
Machine Learning
A grande diferença em relação ao Machine Learning é a de que, tal como nos modelos estatísticos, o objetivo é o de compreender a estrutura dos dados – ajustar distribuições teóricas aos dados que são bem compreendidos. Assim, com os modelos estatísticos há uma teoria matematicamente comprovada por detrás do modelo, que requer que os dados cumpram determinados pressupostos também. Aprendizagem de máquina tem-se desenvolvido baseando-se na capacidade de utilizar computadores para sondar a estrutura dos dados, mesmo que não tenhamos uma teoria de como a estrutura se pareça. O teste para um modelo de Machine Learning é um erro de validação em novos dados, não um teste teórico que prova uma hipótese nula. Precisamente porque o Machine Learning frequentemente utiliza uma abordagem interativa para aprender com os dados, a aprendizagem pode ser facilmente automatizada. As transições são efetuadas através dos dados (pelos dados) até se encontrar um padrão robusto.
Aprendizagem profunda
A aprendizagem profunda combina avanços no poder computacional e tipos especiais de redes de internet neurais para aprender padrões complicados em grandes quantidades de dados. As Técnicas de aprendizagem profunda são atualmente a tecnologia de ponta para identificar objetos em imagens e palavras em sons. Os investigadores procuram agora aplicar estes sucessos no reconhecimento de padrões a tarefas mais complexas, tais como tradução automática de línguas, diagnósticos médicos e outros numerosos problemas sociais e empresariais importantes.
Data management needs AI and machine learning, and just as important, AI/ML needs data management. As of now, the two are connected, with the path to successful AI intrinsically linked to modern data management practices. Dan Soceanu Senior Product Manager for AI and Data Management, SAS
What are the differences between data mining, machine learning and deep learning?
Although all of these methods have the same goal – to extract insights, patterns and relationships that can be used to make decisions – they have different approaches and abilities.