IA generativa
O que é e por que é importante?
A IA Generativa consome dados existentes, aprende com eles e depois gera dados com características semelhantes. Por exemplo, pode gerar texto, imagens, audio, vídeo e códigos de computador.
A evolução da IA Generativa
A IA tradicional e os sistemas de aprendizado de máquina reconhecem padrões nos dados para fazer previsões. Mas a IA Generativa vai além da previsão – ela gera novos dados como resultado primário. Imagine receber o texto completo de um discurso segundos após fornecer algumas palavras para descrever sua ideia a um chatbot, como o ChatGPT. Gerar música, arte ou imagens a partir de descrições de texto. Ou elaborar uma estratégia de negócios através de conversas, onde há trocas de ideias “prompting” com uma ferramenta de IA generativa.
Como tudo começou?
Ao contrário da opinião popular, a IA generativa não é nova – ela é construída a partir de tecnologias que usamos há décadas, incluindo a IA, aprendizado de máquina e métodos estatísticos. As três tecnologias centrais da IA generativa são os gêmeos digitais, modelos de linguagem de grande escala e geração de dados sintéticos.
Embora as origens da IA generativa possam ser rastreadas ainda mais no passado, começaremos em 1966 com um chatbot chamado ELIZA.
Joseph Weizenbaum, criador do ELIZA, projetou-o para imitar psicoterapeutas rogerianos, que repetem o que o paciente fala. O ELIZA utilizava correspondência de padrões para realizar esta façanha. O ELIZA foi um dos primeiros programas a tentar o Teste de Turing – um jogo de imitação que testa a capacidade de uma máquina em exibir comportamento inteligente semelhante ao ser humano.
À medida que os métodos de análise de dados de textos não estruturados evoluíram, as décadas de 1970 até 1990 testemunharam o crescimento de redes semânticas, ontologias, redes neurais recorrentes e muito mais. De 2000 até 2015, a modelagem de linguagem e a incorporação de palavras melhoraram, e o Google Tradutor surgiu.
Em 2014, Ian Goodfellow e seus colegas desenvolveram a rede adversária generativa (GAN), configurando duas redes neurais para competir (ou seja, treinar) uma contra a outra. Uma rede gerava dados, enquanto a outra tentava determinar se os dados eram reais ou falsos. Modelos Transformer foram introduzidos em 2017. Eles incluíram um mecanismo de autoatenção que permitiu ponderar a importância de diferentes partes da entrada ao realizar previsões. Arquiteturas como BERT e ELMo também se tornaram populares.
Modelos de transformer pré-treinados (GPT) surgiram em seguida, com o primeiro modelo GPT aparecendo em 2018. Esse modelo foi treinado com grandes quantidades de dados textuais da internet. Com 117 milhões de parâmetros, ele podia gerar texto similar em estilo e conteúdo aos dados de treino. Em 2023, os modelos GPT de linguagem em grande escala evoluíram ao ponto de terem um desempenho proficiente em exames difíceis, como o exame da Ordem dos Advogados.
A rápida ascensão da tecnologia de IA Generativa
Uma tecnologia disruptiva, o impacto da IA Generativa tem sido comparado a descobertas como eletricidade e a prensa tipográfica. Com o potencial de aumentar drasticamente a produtividade, modelos de IA conversacionais como o ChatGPT dispararam em popularidade entre empresas e usuários comuns – e levantaram preocupações sobre privacidade de dados, viés na IA, ética e precisão. É previsto que o mercado global da IA Generativa cresça em US$110,8 bilhões até 2030.
Os legisladores usam a tecnologia de gêmeo digital para determinar como as novas medidas fiscais podem afetar os cidadãos.
Determinar os "vencedores" e "perdedores" das possíveis mudanças fiscais antes de implementar a regulamentação é crucial para o Serviço Público Federal de Finanças da Bélgica. Quando precisa de respostas rápidas e precisas, o FPS Finance usa o Aurora, um gêmeo digital da calculadora que processa os impostos de renda do país, sendo possível simular futuras reformulações da dívida. Simulações melhores resultam em formuladores de políticas mais bem informados – e melhores resultados.
Quem está usando a IA Generativa?
A IA Generativa abrange diversas indústrias e funções de negócios em todo o mundo. À medida que ganha popularidade, a tecnologia tem desencadeado tanto agitação quanto receio entre indivíduos, negócios e entidades governamentais. Vamos observar como algumas indústrias estão utilizando a IA generativa atualmente.
Os resultados da IA generativa, em sua essência, são um reflexo de nós, seres humanos. ... Os consumidores devem continuar aplicando o pensamento crítico sempre que interagirem com IA conversacionais e evitar o viés de automação (a crença de que um sistema técnico tem mais probabilidade de ser preciso e verdadeiro do que um humano). Reggie Townsend VP of the SAS Data Ethics Practice
Considerações sobre modelos de IA Generativa
Os modelos são caros para serem executados – requerendo uma enorme capacidade computacional e de dados. Você deve avaliar cuidadosamente o ROI antes de implementar um modelo de IA generativa. Existem também considerações éticas. De onde vieram os dados – e quem os possui? É confiável? Você entende precisamente como o modelo foi construído?
Como funciona a IA Generativa
Alguns exemplos populares de tecnologias de IA generativa incluem o DALL-E, um sistema de geração de imagens que cria representações visuais a partir de entradas de texto; o ChatGPT (um sistema de geração de texto); o chatbot Google Bard; e o motor de busca Bing da Microsoft que possui suporte de IA. Outro exemplo é usar a IA generativa para criar uma representação digital de um sistema, processo de negócio ou até mesmo uma pessoa – como uma representação dinâmica do estado de saúde atual e futuro de alguém.
Existem três principais tipos de tecnologias generativas (gêmeos digitais, grandes modelos de linguagem e geração de dados sintéticos).
Gêmeos digitais
Os Gêmeos digitais são modelos virtuais de objetos ou sistemas do mundo real, criados a partir de dados históricos, reais, sintéticos ou provenientes do ciclo de feedback de um sistema. Eles são construídos com software, dados e coleções de modelos generativos e não generativos que espelham e sincronizam com um sistema físico – tal como uma entidade, processo, sistema ou produto. Gêmeos digitais são usados para testar, otimizar, monitorar ou prever. Por exemplo, um gêmeo digital de uma cadeia de suprimentos pode ajudar as empresas a anteciparem a ocorrência de uma escassez.
Modelos de linguagem grande
Um modelo de linguagem grande (LLM) é uma potente ferramenta de aprendizado de máquina capaz de processar e identificar relações complexas em linguagem natural, gerar texto e ter conversas com usuários. Esses modelos dependem de técnicas como aprendizado profundo e redes neurais. Definidos como modelos de IA de processamento de linguagem natural, os LLMs são treinados com enormes volumes de dados textuais. Os modelos resultantes podem ter até bilhões de parâmetros. O ChatGPT da OpenAI é um exemplo popular de um modelo de linguagem grande.
Geração de dados sintéticos
A geração de dados sintéticos refere-se à criação de dados gerados sob demanda, autoatendimento ou automatizada por meio de algoritmos ou regras, ao invés de serem coletados do mundo real. Dados sintéticos são frequentemente gerados para atender a condições ausentes em dados reais. Eles reproduzem as mesmas propriedades estatísticas, probabilidades, padrões e características dos dados do mundo real nos quais são treinados. Muitas organizações utilizam dados sintéticos para preservar a privacidade ou superar outros desafios relacionados à coleta e uso de dados do mundo real. Isso inclui questões como custo, processos intensivos de preparação de dados em termos de tempo ou viés.
Muitas outras tecnologias possibilitam e suportam a IA generativa:
Um algoritmo consiste em uma lista de instruções passo a passo definidas para realizar uma tarefa específica ou resolver um problema. Muitos programas de computador são sequências de algoritmos escritos de forma que o computador possa entender. À medida que os algoritmos começam a complementar ou substituir decisões humanas, devemos explorar sua imparcialidade e exigir transparência sobre como são desenvolvidos.
A inteligência artificial possibilita que as máquinas aprendam a partir da experiência, se ajustem a novas entradas e executem tarefas de maneira semelhante aos seres humanos. A IA geralmente depende muito da aprendizagem profunda e do PLN. Através dessas tecnologias, os computadores podem ser treinados para realizar tarefas específicas, processando grandes quantidades de dados e reconhecendo padrões.
O Aprendizado profundo é subconjunto de machine learning que treina um computador para realizar tarefas semelhantes às humanas, como reconhecer fala, identificar imagens e fazer previsões. Ele melhora a capacidade de classificar, reconhecer, detectar e descrever usando dados. Modelos de aprendizado profundo como GANs e codificadores automáticos variacionais (VAEs) são treinados em conjuntos de dados massivos e podem gerar dados de alta qualidade. Técnicas mais recentes como StyleGANs e modelos transformer podem criar vídeos, imagens, texto e falas realistas.
Machine learning é um método de análise de dados que automatiza a construção de modelos analíticos. É um ramo da inteligência artificial que ensina uma máquina a aprender. O Machine learning é baseado na ideia de que sistemas podem aprender com dados, identificar padrões e tomar decisões com mínima intervenção humana.
O Processamento de linguagem natural é um ramo da inteligência artificial que ajuda os computadores a entender, interpretar e manipular a linguagem humana. O PLN baseia-se em várias disciplinas, como ciência da computação e linguística computacional, para preencher a lacuna entre a comunicação humana e o entendimento computacional.
Redes neurais são sistemas computacionais com nós interconectados que funcionam de forma semelhante aos neurônios no cérebro humano. As Redes neurais usam algoritmos para reconhecer padrões ocultos e correlações em dados brutos, agrupando-os e classificando-os. Elas aprendem continuamente e melhoram com o tempo.
O Aprendizado por reforço é quando um algoritmo descobre, através de tentativa e erro, quais ações resultam em maiores recompensas. Como modelo de machine learning, o aprendizado por reforço depende de um sinal de recompensa para seu mecanismo de feedback, enquanto aprende gradualmente a melhor (ou mais recompensadora) política ou objetivo. É usado com frequência em robótica, jogos e navegação.
5 passos para otimização do ajuste de um modelo
A IA Generativa depende de diversos algoritmos e tecnologias de IA distintas para gerar dados que têm distribuições probabilísticas e características semelhantes aos dados dos quais aprende. Ao invés de construir do zero, você pode seguir estes cinco passos para aperfeiçoar um modelo estrutural pré-treinado de linguagem grande.
1. Defina a tarefa.
Escolha um modelo adequado de linguagem grande pré-treinado e defina claramente a tarefa para qual está sendo ajustado. Isso pode ser classificação de texto (como reconhecimento de entidade), geração de texto, etc.
2. Prepare os dados
Reúna e pré-processe os dados específicos da tarefa – para atividades como rotulação, formatação e tokenização. Crie conjuntos de dados de treino e validação (e possivelmente teste).
3. Ajuste Fino
Treine o modelo modificado com os dados específicos da tarefa, usando o conjunto de dados do treinamento para atualizar o peso do modelo. Monitore o desempenho do modelo no conjunto de validação para prevenir o sobreajuste.
4. Avalie e teste
Após o treino, avalie o modelo ajustado no conjunto de validação, fazendo os ajustes necessários com base nos resultados. Quando estiver satisfeito, realize o teste do modelo no conjunto de teste para obter uma estimativa imparcial do desempenho.
5. Execute
Quando estiver confiante no desempenho do modelo, implante-o para o uso pretendido. Isso pode envolver a integração do modelo em um aplicativo, site ou outra plataforma.
O que são dados sintéticos?
Dados são essenciais para construir modelos, mas dados de alta qualidade podem ser difíceis de achar, serem tendenciosos ou caros. Uma maneira de resolver esses problemas é utilizar dados sintéticos, que são criados artificialmente (muitas vezes com algoritmos). Se usarmos um conjunto de dados para gerar dados sintéticos adicionais – com propriedades adequadas para construir bons modelos de machine learning – podemos treiná-los para praticamente qualquer finalidade, como a pesquisa de uma doença rara.
PRÓXIMOS PASSOS
Veja como as soluções de IA podem melhorar a criatividade e empreendimentos humanos.
Uma plataforma analítica e de IA
Com o SAS® Viya®, não existe excesso de informações. Conheça a maneira mais rápida de transformar um bilhão de dados em um ponto de vista.
Leitura recomendada
- Artigo Shut the front door on insurance application fraud!Fraudsters love the ease of plying their trade over digital channels. Smart insurance companies are using data from those channels (device fingerprint, IP address, geolocation, etc.) coupled with analytics and machine learning to detect insurance application fraud perpetrated by agents, customers and fraud rings. 31 de Agosto de 2018
- Artigo GDPR and AI: Friends, foes or something in between?The GDPR may not be best buddies with artificial intelligence – but GDPR and AI aren't enemies, either. Kalliopi Spyridaki explains the tricky relationship between the two. 12 de Junho de 2018
- Artigo How to improve your AI marketing skillsMarketing teams can use current AI capabilities to enhance their efforts around campaign automation, dynamic pricing based on forecasting models, and by providing more relevant, real-time customer offers. 19 de Fevereiro de 2018
- Artigo Machine learning, data science and AI meet IoTIn this video, Kirk Borne and Michele Null discuss the intersection of machine learning, AI and data science with IoT data and analytics. 1 de Fevereiro de 2018