IA generativa

O que é e porque é importante

A IA generativa alimenta-se dos dados existentes e aprende através deles, para depois então criar dados com características similares. Por exemplo, consegue criar textos, imagens, áudio, vídeos e códigos informáticos.

A evolução da IA generativa

A IA tradicional e os sistemas de aprendizagem automática reconhecem padrões nos dados para assim poderem fazer previsões. Mas a IA generativa vai além da previsão – e gera novos dados como seu principal resultado. Imagine receber um texto completo para um discurso em meros segundos, basta descrever a sua ideia a um chatbot (como é o caso do ChatGPT) em poucas palavras. Poderá criar música, arte ou até mesmo imagens que têm por base um texto descritivo. Ou ainda desenvolver uma estratégia de negócios por meio de uma conversação, onde há uma troca de ideias "prompting" com uma ferramenta de IA generativa.

Como é que tudo isto começou?

Contrariamente à opinião popular, a IA generativa não é uma novidade – é construída tendo por base tecnologias que utilizamos há décadas, aqui estão incluídas as IA, métodos de aprendizagem automática e estatísticos. As três principais tecnologias de IA generativa são os digital twins, modelos linguísticos de grande dimensão e criação de dados sintéticos.

Embora as origens da IA generativa possam ser rastreadas até datas mais antigas, vamos começar no ano de 1966 com um chatbot chamado ELIZA.

Joseph Weizenbaum, foi quem construiu o ELIZA, desenhou-o para imitar psicoterapeutas rogerianos que repetem o que é dito pelos pacientes. O ELIZA serviu-se de um padrão de correspondência para conseguir esta proeza. ELIZA foi um dos primeiros programas a tentar o Teste de Turing – um jogo de imitação que testa a capacidade que uma máquina tem de exibir um comportamento inteligente, à semelhança dos humanos.

À medida que os métodos de análise de dados de textos não-estruturados foram evoluindo entre os anos 70 e 90, testemunhou-se um crescimento nas redes semânticas, ontologias, redes neurais recorrentes e muito mais. De 2000 a 2015, os modelos linguísticos e os embedders de palavras melhoraram, e assim surgiu o Google Tradutor.

Em 2014, Ian Goodfellow juntamente com os seus colegas desenvolveu a Rede Adversária Generativa (GAN), colocando duas redes neurais em competição (ou seja, a treinar) uma com a outra. Uma rede gerava dados enquanto a outra tentava determinar se os dados eram verdadeiros ou falsos. Os modelos transformadores foram introduzidos em 2017. Estes incluíam um mecanismo de atenção própria que lhes permitia medir a importância de várias partes do input ao fazerem as suas previsões. Arquiteturas como BERT e ELMO também se tornaram populares.

A seguir apareceram os modelos generativos transformadores pré-treinados (GPT) com o primeiro modelo do GPT a ser lançado em 2018. Este modelo foi treinado com grandes quantidades de dados de textos retirados da internet. Com 117 milhões de parâmetros, consegue criar um texto semelhante aos dados de treino tanto em estilo como em conteúdo. Em 2023, os grandes modelos de linguagem GPT, conseguiram evoluir a tal ponto em que até obtiveram um bom desempenho em testes difíceis, tal como é o caso do exame da Ordem dos Advogados.

A rápida ascensão da tecnologia IA generativa

É uma tecnologia disruptiva: o impacto da IA generativa tem sido comparado a invenções como a descoberta da eletricidade e da invenção da máquina de escrever. Com o potencial de aumentar drasticamente a produtividade, modelos de IA conversacional, como o ChatGPT, estão no auge da popularidade no que toca a negócios e utilizadores diários – e levantaram preocupações acerca da privacidade dos dados, preconceitos na IA, e ética e precisão. É expectável que o mercado global para a IA generativa cresça para valores próximos dos 110.8$ milhares de milhões até 2030.

Os responsáveis políticos utilizam os digital twins para determinar como é que novas medidas de impostos podem afetar os cidadãos.

Determinar os "vencedores" e "perdedores" de potenciais mudanças fiscais, antes de implementar regulações, é crucial para o Serviço Público Federal Financeiro Belga. Quando precisa de respostas rápidas e exatas o FPS Financeiro utiliza o Aurora, um digital twin da calculadora que processa os impostos sobre o rendimento do país, sendo assim possível simular futuras reformulações da dívida. Melhores simulações são sinónimo de responsáveis políticos mais bem informados – e de melhores resultados.

A IA generativa nos dias de hoje

Abraçar inteligência artificial de confiança

Os consumidores têm mais confiança nas organizações que demonstram um uso responsável e ético da IA. Aprenda porque é essencial adotar sistemas de IA de confiança desenhados para a centralidade humana, inclusão e responsabilização.

Benefícios e riscos da IA generativa

Tem curiosidade sobre como a IA generativa funciona e o que precisa de saber antes de a utilizar? Obtenha uma introdução à tecnologia, aprenda acerca do enquadramento para a adoção de ferramentas de IA generativa, e a avaliar se deve adotar, e como, a tecnologia.

Explorar o uso da IA na educação

Os estudantes já utilizaram IA generativa para criar conteúdo e gráficos, programar, construir aplicações para telemóveis e resolver problemas. Embora a IA generativa possa ser divertida e útil, precisamos de humanos capazes de notar e corrigir respostas erradas ou "alucinações".

Realidades irreais: O estado da IA generativa

Poderá uma explosão de imagens geradas criar uma irrealidade que coloca os seres humanos rumo ao fracasso? Aprenda o verdadeiro significado de "deepfake", descubra como é que a deepfake pode ser utilizada para o bem, e veja como técnicas emergentes podem ajudar a identificar media gerados.

Ferramentas populares de IA e como são utilizadas

Existem várias ferramentas de IA populares nas notícias. Mas sabia que há mais de 1 500 no mercado? E que nestas estão incluídas ferramentas de IA generativa?

Veja quais são as ferramentas que prevalecem atualmente e como estas são aplicadas em várias indústrias.

Quem está a utilizar a IA generativa?

A IA generativa abrange uma vasta gama de indústrias e funções de negócio em todo o mundo. À medida que cresce em popularidade, a tecnologia, consegue simultaneamente despertar excitação e medo entre as pessoas, negócios e entidades governativas. Vamos olhar para como é que algumas indústrias que estão atualmente a utilizar IA generativa.

Serviços bancários

Bancos e outras organizações de serviços financeiros podem utilizar a IA generativa para melhorar a tomada de decisões, mitigar riscos e aumentar a satisfação do cliente. Quando os modelos de IA generativa são treinados para aprender padrões e encontrar anomalias, podem detetar atividades anómalas em tempo real. Ao criar dados simulados para um teste de esforço e realizar a análise de cenário, a IA generativa pode ajudar os bancos a prever futuros riscos financeiros e evitar perdas. E assistentes virtuais (como os chatbots) podem facultar serviço de apoio ao cliente semelhante ao que é feito por um ser humano 24h por dia e sete dias por semana.

Seguros

As seguradoras podem utilizar dados sintéticos para definir preços, reservas e para a modelagem atuarial. Por exemplo, as companhias de seguros podem utilizar dados sintéticos que se assemelham a informações relacionadas com o histórico das apólices e pedidos de indemnização para treinar e testar modelos de preços – ou seja, pode ajudá-las a verificar como é que estratégias de preço diferentes funcionam, e isto sem utilizar informação pessoal dos clientes. Os dados sintéticos também podem ajudar na avaliação de eventos de baixa probabilidade como terramotos ou furacões.

Ciências biológicas

Existem muitas aplicações promissoras para a IA generativa nas ciências biológicas. Na descoberta de medicamentos: pode acelerar o processo de identificação de novos e potenciais candidatos a medicamentos. Na investigação clínica, a IA generativa tem o potencial de extrair informação de dados complexos para depois criar dados sintéticos e digital twins, os quais são representativos de indivíduos (uma forma de proteger a privacidade). Outras aplicações incluem identificar sinais de segurança e descobrir novas utilizações para tratamentos existentes.

Indústrias

Os fabricantes podem utilizar a IA generativa para ajudar a otimizar operações, manutenção, cadeias de abastecimento – até para usos energéticos – para baixar custos, aumentar a produtividade e alcançar maior sustentabilidade. Um modelo de IA generativa aprenderá com o desempenho existente, dados de manutenção e de sensores, previsões, fatores externos e mais, e então fornecerá estratégias recomendadas para melhorias.

Sector público

O processamento de linguagem natural (NLP) e chatbots podem ajudar os trabalhadores do setor público a responder mais rapidamente às necessidades dos cidadãos, melhorando os serviços de emergência para quem reside em áreas propensas às inundações, ou, a prestar assistência a bairros menos favorecidos. As técnicas de IA generativa – tais como modelos de previsão e simulações – podem analisar vastas quantidades de dados históricos, opinião pública e outros indicadores, para então gerar recomendações de forma a reduzir o congestionamento, melhorar o planeamento das infra-estruturas e aprimorar a alocação de recursos.

Comércio

Para ter sucesso no comércio é necessário compreender o que os compradores procuram, conceber experiências de compra que envolvam os clientes, e assegurar a execução estável e confiável da cadeia de abastecimento. Por exemplo, alguns comerciantes, estão a utilizar IA generativa com digital twins para dar a quem planeia uma ideia dos cenários possíveis – tais como sobre disrupções na cadeia de abastecimento ou limitação de recursos. Isto só é possível por meio da sofisticação da simulação da IA e modelação de dados.

Os resultados da IA generativa, na sua essência, são um reflexo do ser humano. ... Os consumidores devem continuar a ter espírito crítico sempre que interagem com uma IA conversacional e evitar o preconceito da automatização (a crença de que um sistema técnico é mais preciso e verdadeiro do que um ser humano). Reggie Townsend VP of the SAS Data Ethics Practice

Considerações acerca dos modelos de IA generativa

É dispendioso operar estes modelos – requer enormes quantidades de capacidade computacional e dados. Deve avaliar cuidadosamente o seu ROI antes de implementar um modelo de IA generativa. Também há considerações éticas. De onde vieram os dados – e a quem pertencem? É de confiança? Percebe concretamente e exatamente como é que o modelo foi construído?

Como funciona a IA generativa

Alguns exemplos conhecidos de tecnologias de IA generativa incluem o DALL-E, um sistema de geração de imagens que cria imagens tendo por base uma descrição textual, o ChatGPT (sistema de produção de texto), o Google Bard (chatbot) e o motor de busca da Microsoft, o Bing, que é impulsionado pela IA. Outro exemplo, é a utilização de IA generativa para criar uma representação digital de um sistema, um processo de negócio, ou até mesmo uma pessoa – é possível fazer uma representação dinâmica do estado de saúde atual e futuro de uma determinada pessoa.

Existem três principais tecnologias de IA generativa (digital twins, modelos linguísticos de grande dimensão e geração de dados sintéticos).

Digital twins

Os digital twins são modelos virtuais de objetos da vida real ou sistemas construídos através de dados que podem ser históricos, do mundo real, sintéticos ou de sistemas de feedback em repetição/ciclo. São construídos tendo por base softwares, dados e coleções de modelos generativos ou não generativos que espelham e se sincronizam com um sistema físico – tal como, por exemplo, uma entidade, processo ou produto. Os digital twins são utilizados para testar, otimizar e prever. Por exemplo, um digital twin de uma cadeia de fornecimento pode ajudar empresas a prever alturas em que exista uma probabilidade de escassez.

Grandes modelos de linguagem

Um grande modelo de linguagem (LLM) é uma poderosa máquina de aprendizagem automática que consegue processar e identificar relações complexas do idioma natural, gerar textos e conversar com os utilizadores. Estes modelos servem-se de técnicas complexas como é o caso do deep learning e redes neurais. Definidos como modelos de IA de processamento de linguagem natural, os LLMs são treinados com quantidades colossais de dados. Os modelos resultantes chegam a ter até milhares de milhões de parâmetros. OpenAI’s ChatGPT é um exemplo de um grande modelo de linguagem bastante popular.

Geração de dados sintéticos

A geração de dados sintéticos refere-se a dados a pedido, self-service ou dados automatizados gerados por algoritmos ou regras, em vez de se fazer recolha dos mesmos no mundo real. Os dados sintéticos são normalmente gerados com o intuito de suprir as condições em falta nos dados reais. Reproduzem as mesmas propriedades estatísticas, probabilidades, padrões e características dos dados do mundo real através dos quais são treinados. Várias organizações utilizam dados sintéticos com o intuito de preservar a sua privacidade ou de ultrapassar outras adversidades ao recolher e utilizar dados do mundo real, tais como o custo e a preparação de processos de dados demorados ou tendenciosos.

Muitas outras tecnologias permitem e apoiam a utilização de IA generativa:

Um algoritmo é uma lista de instruções passo a passo desenhada para conseguir realizar uma tarefa específica ou resolver um problema. Muitos programas de computador são uma sequência de algoritmos escritos de uma forma que o computador consiga perceber. À medida que os algoritmos começam a complementar e substituir decisões tomadas por humanos, é necessário aprofundar sobre a sua justiça e exigir transparência quanto à forma como são desenvolvidos.

Inteligência Artificial faz com que seja possível às máquinas aprender a partir da experiência, ajustarem-se a novos inputs e desempenhar tarefas de forma semelhante ao que um ser humano faria. A IA costuma, sobretudo, basear-se no deep learning e NPL. Através destas tecnologias os computadores podem ser treinados a desempenhar tarefas específicas, sendo isto feito por meio do processamento de vastas quantidades de dados e reconhecimento de padrões.

O deep learning é um subconjunto de aprendizagem automática que treina um computador a desempenhar tarefas à semelhança de um humano, tais como, reconhecer a voz falada, identificar imagens e fazer previsões. Melhora a capacidade de classificar, reconhecer, detetar e descrever através da utilização dados. Modelos de aprendizagem profunda, tais como os GANs e variational autoencoders (VAEs) são treinados por meio de conjuntos de dados gigantescos e podem gerar dados de alta qualidade. Técnicas mais recentes como StyleGANs e modelos transformadores podem criar vídeos realísticos, imagens, textos e voz falada.

A aprendizagem automática é um método de análise de dados que automatiza a construção de modelos analíticos. É um ramo da inteligência artificial que treina a máquina para que esta possa fazer a sua aprendizagem. A aprendizagem automática tem por base a ideia que os sistemas podem aprender através dos dados, identificar padrões e tomar decisões com a mínima intervenção humana.

Processamento de linguagem natural é um ramo da inteligência artificial que ajuda os computadores a compreender, interpretar e manipular a linguagem humana. Os NPL recorrem a várias disciplinas, incluindo a informática e linguística computacional, para preencher as lacunas entre a comunicação humana e o entendimento dos computadores.

Redes Neurais são sistemas de computação com nós interconectados que funcionam de forma muito semelhante aos neurónios que fazem parte do cérebro humano. As redes Neurais utilizam os algoritmos para reconhecer padrões escondidos e correlações em dados não processados, fazem a colocação em cluster e classificam-nos, desta forma, aprendem continuamente e melhoram ao longo do tempo.

Aprendizagem por reforço ocorre quando um algoritmo deteta através de tentativa e erro quais as ações que produzem melhor retorno. Um modelo de aprendizagem automática, ou, de aprendizagem por reforço assenta na premissa de um sinal de recompensa facultado pelo mecanismo de feedback e assim vai aprendendo de forma gradual a política ou objetivo com melhor (ou maior retorno). É utilizada na robótica, gaming e navegação.

5 passos para afinar um modelo

A IA generativa conta com vários algoritmos de IA diferentes e tecnologias para gerar dados com distribuições probabilísticas semelhantes. Conta também com características dos dados através dos quais faz a aprendizagem. Em vez de construir de raiz, pode seguir estes cinco passos e afinar um grande modelo de linguagem que já tenha sido treinado.

1. Defina a tarefa.

Escolha um grande modelo de linguagem adequado e defina claramente a tarefa para a qual o mesmo está a ser afinado. Isto poderá ser uma classificação de texto (nomeadamente o reconhecimento de uma entidade), geração de texto, etc.

2. Prepare os dados.

Reúna e faça o pré-processo dos dados específicos para a tarefa – quando se trata de tarefas como etiquetagem, formatação e atomização. Crie um treino e validação (e possível testagem) de conjuntos de dados.

3. Afine.

Treine o modelo modificado na sua tarefa específica e de acordo com os dados, utilize o conjunto de dados de treino para atualizar as ponderações do modelo. Monitorize o desempenho do modelo no que toca ao conjunto de validação para prevenir o sobreajuste.

4. Avalie e teste.

Depois de treinar, avalie o seu modelo aprimorado no conjunto de validação, fazendo os ajustes necessários com base nos resultados. Quando satisfizer as suas necessidades, teste o modelo no conjunto de teste para obter uma estimativa imparcial do desempenho.

5. Implemente.

Quando estiver confiante no desempenho do modelo, implemente-o no uso a que o mesmo se destina. Isto pode abranger a integração do modelo numa aplicação, website ou outra plataforma.

O que são dados sintéticos?

Os dados são essenciais para a construção de modelos, mas dados de alta qualidade podem ser bastante difíceis de encontrar, tendenciosos ou dispendiosos. Uma forma de resolver este problema é através da utilização de dados sintéticos, que são criados de forma artificial (na maioria das vezes com recurso a algoritmos). Se utilizarmos um conjunto de dados do mundo real para gerar dados sintéticos adicionais – com a propriedades adequadas para construir bons modelos de aprendizagem automática – podemos treinar os modelos, virtualmente, para qualquer propósito, como por exemplo pesquisar uma doença rara.

Próximos Passos

Veja como as soluções de IA podem ampliar os esforços e a criatividade humana.

Connect with SAS and see what we can do for you.