IA generativa

O que é e por que é importante?

A IA Generativa consome dados existentes, aprende com eles e depois gera dados com características semelhantes. Por exemplo, pode gerar texto, imagens, audio, vídeo e códigos de computador.

A evolução da IA Generativa

A IA tradicional e os sistemas de aprendizado de máquina reconhecem padrões nos dados para fazer previsões. Mas a IA Generativa vai além da previsão – ela gera novos dados como resultado primário. Imagine receber o texto completo de um discurso segundos após fornecer algumas palavras para descrever sua ideia a um chatbot, como o ChatGPT. Gerar música, arte ou imagens a partir de descrições de texto. Ou elaborar uma estratégia de negócios através de conversas, onde há trocas de ideias “prompting” com uma ferramenta de IA generativa.

Como tudo começou?

Ao contrário da opinião popular, a IA generativa não é nova – ela é construída a partir de tecnologias que usamos há décadas, incluindo a IA, aprendizado de máquina e métodos estatísticos. As três tecnologias centrais da IA generativa são os gêmeos digitais, modelos de linguagem de grande escala e geração de dados sintéticos.

Embora as origens da IA generativa possam ser rastreadas ainda mais no passado, começaremos em 1966 com um chatbot chamado ELIZA.

Joseph Weizenbaum, criador do ELIZA, projetou-o para imitar psicoterapeutas rogerianos, que repetem o que o paciente fala. O ELIZA utilizava correspondência de padrões para realizar esta façanha. O ELIZA foi um dos primeiros programas a tentar o Teste de Turing – um jogo de imitação que testa a capacidade de uma máquina em exibir comportamento inteligente semelhante ao ser humano.

À medida que os métodos de análise de dados de textos não estruturados evoluíram, as décadas de 1970 até 1990 testemunharam o crescimento de redes semânticas, ontologias, redes neurais recorrentes e muito mais. De 2000 até 2015, a modelagem de linguagem e a incorporação de palavras melhoraram, e o Google Tradutor surgiu.

Em 2014, Ian Goodfellow e seus colegas desenvolveram a rede adversária generativa (GAN), configurando duas redes neurais para competir (ou seja, treinar) uma contra a outra. Uma rede gerava dados, enquanto a outra tentava determinar se os dados eram reais ou falsos. Modelos Transformer foram introduzidos em 2017. Eles incluíram um mecanismo de autoatenção que permitiu ponderar a importância de diferentes partes da entrada ao realizar previsões. Arquiteturas como BERT e ELMo também se tornaram populares.

Modelos de transformer pré-treinados (GPT) surgiram em seguida, com o primeiro modelo GPT aparecendo em 2018. Esse modelo foi treinado com grandes quantidades de dados textuais da internet. Com 117 milhões de parâmetros, ele podia gerar texto similar em estilo e conteúdo aos dados de treino. Em 2023, os modelos GPT de linguagem em grande escala evoluíram ao ponto de terem um desempenho proficiente em exames difíceis, como o exame da Ordem dos Advogados.

A rápida ascensão da tecnologia de IA Generativa

Uma tecnologia disruptiva, o impacto da IA Generativa tem sido comparado a descobertas como eletricidade e a prensa tipográfica. Com o potencial de aumentar drasticamente a produtividade, modelos de IA conversacionais como o ChatGPT dispararam em popularidade entre empresas e usuários comuns – e levantaram preocupações sobre privacidade de dados, viés na IA, ética e precisão. É previsto que o mercado global da IA Generativa cresça em US$110,8 bilhões até 2030.

Os legisladores usam a tecnologia de gêmeo digital para determinar como as novas medidas fiscais podem afetar os cidadãos.

Determinar os "vencedores" e "perdedores" das possíveis mudanças fiscais antes de implementar a regulamentação é crucial para o Serviço Público Federal de Finanças da Bélgica. Quando precisa de respostas rápidas e precisas, o FPS Finance usa o Aurora, um gêmeo digital da calculadora que processa os impostos de renda do país, sendo possível simular futuras reformulações da dívida. Simulações melhores resultam em formuladores de políticas mais bem informados – e melhores resultados.

A IA Generativa no mundo atual

Adotando a Inteligência Artificial de modo confiável.

Os consumidores têm mais confiança em organizações que demonstram o uso responsável e ético da IA. Saiba por que é essencial adotar sistemas de IA confiáveis projetados com foco na centralidade humana, inclusão e responsabilidade.

Riscos e Benefícios da IA Generativa

Ficou curioso sobre como funciona a IA Generativa e o que você precisa considerar antes de usá-la? Obtenha uma introdução à tecnologia, conheça um modelo para adotar ferramentas de IA generativa e considere se e como implementar essa tecnologia.

Explorando o uso da IA na educação

Estudantes têm usado a IA Generativa para criar conteúdo, gráficos, escrever código, desenvolver aplicativos móveis e resolver problemas. Embora a IA generativa possa ser divertida e útil, precisamos de humanos para identificar e corrigir respostas erradas ou "alucinações".

Realidades irreais: O estado da IA Generativa

A explosão de imagens geradas pode criar uma irrealidade que conduz os humanos para o fracasso? Aprenda sobre o verdadeiro significado do termo "deepfake", descubra como deepfakes podem ser utilizados para o bem e veja como técnicas emergentes podem ajudar a detectar e identificar a mídia gerada.

Ferramentas Populares de IA e como elas são usadas

Existem muitas ferramentas de IA populares nas notícias. Mas você sabia que existem mais de 1.500 no mercado, incluindo ferramentas de IA Generativa?

Veja quais são as ferramentas mais predominantes atualmente e como são aplicadas em diferentes setores.

Quem está usando a IA Generativa?

A IA Generativa abrange diversas indústrias e funções de negócios em todo o mundo. À medida que ganha popularidade, a tecnologia tem desencadeado tanto agitação quanto receio entre indivíduos, negócios e entidades governamentais. Vamos observar como algumas indústrias estão utilizando a IA generativa atualmente.

Banca

Bancos e outras organizações de serviço financeiro podem usar a IA generativa para melhorar decisões, mitigar riscos e aumentar a satisfação dos clientes. Quando modelos de IA generativa são treinados para aprender padrões e identificar anomalias, eles podem sinalizar atividades suspeitas em tempo real. Ao criar dados simulados para testes de estresse e análise de cenário, a IA generativa pode ajudar bancos a prever futuros riscos financeiros e prevenir perdas. E assistentes virtuais (como chatbots) podem fornecer atendimento ao cliente semelhante ao humano 24 horas por dia, 7 dias por semana.

Seguros

Seguradoras podem usar dados sintéticos para precificação, reserva e modelagem atuarial. Por exemplo, companhias de seguro podem usar dados sintéticos que reproduzem informações históricas de apólices e sinistros para treinarem e testarem modelos de precificação – ajudando-as a avaliarem o desempenho de diferentes estratégias de preço sem usar informações pessoais e confidenciais dos clientes. Dados sintéticos também podem ajudar na avaliação de eventos de baixa probabilidade, como terremotos ou furacões.

Ciências da Vida

Existem muitas aplicações promissoras para a IA generativa nas ciências biológicas. Na descoberta de medicamentos, ela pode acelerar o processo de identificação de novos candidatos a potenciais medicamentos. Na pesquisa clínica, a IA generativa tem o potencial de extrair informações de dados complexos para criar dados sintéticos e gêmeos digitais, que representam indivíduos (uma maneira de proteger a privacidade). Outras aplicações incluem identificar sinais de segurança ou encontrar novos usos para tratamentos existentes.

Manufatura

Fabricantes podem usar a IA generativa para ajudar a otimizar operações, manutenções, cadeias de suprimentos – até mesmo o uso de energia – por custos menores, maior produtividade e maior sustentabilidade. Um modelo de IA generativa aprenderá com dados existentes de desempenho, manutenção, sensores, previsões, fatores externos e outros, para, em seguida, fornecer estratégias recomendadas para aprimoramento.

Setor público

Processamento de linguagem natural (PLN) e chatbots podem ajudar trabalhadores do setor público a responder mais rapidamente às necessidades dos cidadãos, como melhorar os serviços de emergência para áreas propensas a inundações ou auxiliar bairros carentes. Técnicas de IA Generativa – como modelos preditivos e simulações – podem analisar vastas quantidades de dados históricos, sentimentos públicos e outros indicadores, e então gerar recomendações para reduzir congestionamentos, melhorar o planejamento de infraestrutura e ajustar a alocação de recursos.

Varejo

No varejo, o sucesso requer entender a demanda do comprador, projetar experiências de compra que engajem os clientes e garantam uma execução confiável e estável da cadeia de suprimentos. Alguns varejistas, por exemplo, estão usando a IA generativa com tecnologia de gêmeo digital para dar aos planejadores uma visão de cenários potenciais – como interrupções na cadeia de suprimentos ou limitações de recursos. Isso é possível através de simulações sofisticadas de IA e modelagem de dados.

Os resultados da IA generativa, em sua essência, são um reflexo de nós, seres humanos. ... Os consumidores devem continuar aplicando o pensamento crítico sempre que interagirem com IA conversacionais e evitar o viés de automação (a crença de que um sistema técnico tem mais probabilidade de ser preciso e verdadeiro do que um humano). Reggie Townsend VP of the SAS Data Ethics Practice

Considerações sobre modelos de IA Generativa

Os modelos são caros para serem executados – requerendo uma enorme capacidade computacional e de dados. Você deve avaliar cuidadosamente o ROI antes de implementar um modelo de IA generativa. Existem também considerações éticas. De onde vieram os dados – e quem os possui? É confiável? Você entende precisamente como o modelo foi construído?

Como funciona a IA Generativa

Alguns exemplos populares de tecnologias de IA generativa incluem o DALL-E, um sistema de geração de imagens que cria representações visuais a partir de entradas de texto; o ChatGPT (um sistema de geração de texto); o chatbot Google Bard; e o motor de busca Bing da Microsoft que possui suporte de IA. Outro exemplo é usar a IA generativa para criar uma representação digital de um sistema, processo de negócio ou até mesmo uma pessoa – como uma representação dinâmica do estado de saúde atual e futuro de alguém.

Existem três principais tipos de tecnologias generativas (gêmeos digitais, grandes modelos de linguagem e geração de dados sintéticos).

Gêmeos digitais

Os Gêmeos digitais são modelos virtuais de objetos ou sistemas do mundo real, criados a partir de dados históricos, reais, sintéticos ou provenientes do ciclo de feedback de um sistema. Eles são construídos com software, dados e coleções de modelos generativos e não generativos que espelham e sincronizam com um sistema físico – tal como uma entidade, processo, sistema ou produto. Gêmeos digitais são usados para testar, otimizar, monitorar ou prever. Por exemplo, um gêmeo digital de uma cadeia de suprimentos pode ajudar as empresas a anteciparem a ocorrência de uma escassez.

Modelos de linguagem grande

Um modelo de linguagem grande (LLM) é uma potente ferramenta de aprendizado de máquina capaz de processar e identificar relações complexas em linguagem natural, gerar texto e ter conversas com usuários. Esses modelos dependem de técnicas como aprendizado profundo e redes neurais. Definidos como modelos de IA de processamento de linguagem natural, os LLMs são treinados com enormes volumes de dados textuais. Os modelos resultantes podem ter até bilhões de parâmetros. O ChatGPT da OpenAI é um exemplo popular de um modelo de linguagem grande.

Geração de dados sintéticos

A geração de dados sintéticos refere-se à criação de dados gerados sob demanda, autoatendimento ou automatizada por meio de algoritmos ou regras, ao invés de serem coletados do mundo real. Dados sintéticos são frequentemente gerados para atender a condições ausentes em dados reais. Eles reproduzem as mesmas propriedades estatísticas, probabilidades, padrões e características dos dados do mundo real nos quais são treinados. Muitas organizações utilizam dados sintéticos para preservar a privacidade ou superar outros desafios relacionados à coleta e uso de dados do mundo real. Isso inclui questões como custo, processos intensivos de preparação de dados em termos de tempo ou viés.

Muitas outras tecnologias possibilitam e suportam a IA generativa:

Um algoritmo consiste em uma lista de instruções passo a passo definidas para realizar uma tarefa específica ou resolver um problema. Muitos programas de computador são sequências de algoritmos escritos de forma que o computador possa entender. À medida que os algoritmos começam a complementar ou substituir decisões humanas, devemos explorar sua imparcialidade e exigir transparência sobre como são desenvolvidos.

A inteligência artificial possibilita que as máquinas aprendam a partir da experiência, se ajustem a novas entradas e executem tarefas de maneira semelhante aos seres humanos. A IA geralmente depende muito da aprendizagem profunda e do PLN. Através dessas tecnologias, os computadores podem ser treinados para realizar tarefas específicas, processando grandes quantidades de dados e reconhecendo padrões.

O Aprendizado profundo é subconjunto de machine learning que treina um computador para realizar tarefas semelhantes às humanas, como reconhecer fala, identificar imagens e fazer previsões. Ele melhora a capacidade de classificar, reconhecer, detectar e descrever usando dados. Modelos de aprendizado profundo como GANs e codificadores automáticos variacionais (VAEs) são treinados em conjuntos de dados massivos e podem gerar dados de alta qualidade. Técnicas mais recentes como StyleGANs e modelos transformer podem criar vídeos, imagens, texto e falas realistas.

Machine learning é um método de análise de dados que automatiza a construção de modelos analíticos. É um ramo da inteligência artificial que ensina uma máquina a aprender. O Machine learning é baseado na ideia de que sistemas podem aprender com dados, identificar padrões e tomar decisões com mínima intervenção humana.

O Processamento de linguagem natural é um ramo da inteligência artificial que ajuda os computadores a entender, interpretar e manipular a linguagem humana. O PLN baseia-se em várias disciplinas, como ciência da computação e linguística computacional, para preencher a lacuna entre a comunicação humana e o entendimento computacional.

Redes neurais são sistemas computacionais com nós interconectados que funcionam de forma semelhante aos neurônios no cérebro humano. As Redes neurais usam algoritmos para reconhecer padrões ocultos e correlações em dados brutos, agrupando-os e classificando-os. Elas aprendem continuamente e melhoram com o tempo.

O Aprendizado por reforço é quando um algoritmo descobre, através de tentativa e erro, quais ações resultam em maiores recompensas. Como modelo de machine learning, o aprendizado por reforço depende de um sinal de recompensa para seu mecanismo de feedback, enquanto aprende gradualmente a melhor (ou mais recompensadora) política ou objetivo. É usado com frequência em robótica, jogos e navegação.

5 passos para otimização do ajuste de um modelo

A IA Generativa depende de diversos algoritmos e tecnologias de IA distintas para gerar dados que têm distribuições probabilísticas e características semelhantes aos dados dos quais aprende. Ao invés de construir do zero, você pode seguir estes cinco passos para aperfeiçoar um modelo estrutural pré-treinado de linguagem grande.

1. Defina a tarefa.

Escolha um modelo adequado de linguagem grande pré-treinado e defina claramente a tarefa para qual está sendo ajustado. Isso pode ser classificação de texto (como reconhecimento de entidade), geração de texto, etc.

2. Prepare os dados

Reúna e pré-processe os dados específicos da tarefa – para atividades como rotulação, formatação e tokenização. Crie conjuntos de dados de treino e validação (e possivelmente teste).

3. Ajuste Fino

Treine o modelo modificado com os dados específicos da tarefa, usando o conjunto de dados do treinamento para atualizar o peso do modelo. Monitore o desempenho do modelo no conjunto de validação para prevenir o sobreajuste.

4. Avalie e teste

Após o treino, avalie o modelo ajustado no conjunto de validação, fazendo os ajustes necessários com base nos resultados. Quando estiver satisfeito, realize o teste do modelo no conjunto de teste para obter uma estimativa imparcial do desempenho.

5. Execute

Quando estiver confiante no desempenho do modelo, implante-o para o uso pretendido. Isso pode envolver a integração do modelo em um aplicativo, site ou outra plataforma.

O que são dados sintéticos?

Dados são essenciais para construir modelos, mas dados de alta qualidade podem ser difíceis de achar, serem tendenciosos ou caros. Uma maneira de resolver esses problemas é utilizar dados sintéticos, que são criados artificialmente (muitas vezes com algoritmos). Se usarmos um conjunto de dados para gerar dados sintéticos adicionais – com propriedades adequadas para construir bons modelos de machine learning – podemos treiná-los para praticamente qualquer finalidade, como a pesquisa de uma doença rara.

PRÓXIMOS PASSOS

Veja como as soluções de IA podem melhorar a criatividade e empreendimentos humanos.

Connect with SAS and see what we can do for you.