Os desafios da Proteção de Dados no contexto da IA Generativa
03 de dezembro de 2024

O avanço da inteligência artificial Generativa está impulsionando diversos setores, mas também aponta preocupações importantes sobre a proteção de dados pessoais. O estudo "Radar Tecnológico No 3" da ANPD faz uma análise aprofundada de vários desafios. Aqui queremos explorar algumas reflexões do estudo da ANPD com o objetivo participar do debate e aumentar nossa própria compreensão desses desafios que o uso a IA Generativa traz para a conformidade com a LGPD.
Alguns desafios concretos de compliance
Coleta e Armazenamento de Dados
Sistemas de IA Generativa exigem enormes volumes de dados para seu treinamento. A coleta massiva de dados, muitas vezes através de técnicas como web scraping (raspagem de dados dos sites da internet), levanta preocupações sobre a conformidade dessa prática com a LGPD. O fato dos dados estarem públicos na internet não isenta a necessidade de conformidade com as regulamentações de privacidade com atenção, por exemplo, com base legal, transparência e finalidade.
Processamento e Geração de Conteúdo Sintético
Durante o treinamento, os modelos de IA processam grandes volumes de dados, capturando padrões que podem incluir dados pessoais. Além disso, a geração de conteúdo sintético (dados criados pela IA) pode distorcer ou gerar informações enganosas, impactando negativamente os titulares dos dados pessoais
Compartilhamento de Dados
Outro ponto de atenção trazido no estudo da ANPD, é o compartilhamento de dados pessoais, que pode ocorrer, por exemplo, no momento de solicitação de algo para IA via prompt (incluindo documentos anexados) ou mesmo no compartilhamento de informações geradas pela IA com eventuais dados sintéticos.
Eliminação de dados
Importante destacar a questão da eliminação dos dados pessoais, considerando que é nebuloso determinar quando o tratamento de dados é concluído, especialmente em sistemas que continuam refinando modelos com novas entradas. Isso dificulta o entendimento e aplicação da retenção dos dados pessoais, aspecto exigido pela LGPD.
Necessidade
O uso de grandes bases de dados nem sempre respeita o princípio de necessidade, que preconiza a coleta do mínimo necessário para atingir uma finalidade específica. Em alguns contextos, as estruturas de IA muitas vezes desconsideram esse princípio. Como assegurar esse princípio diante desta corrida insana do mercado LLMs, que precisam de volume imensos de dados para serem treinados?
Transparência
A falta de documentação técnica detalhada impede que os titulares compreendam o uso de seus dados, dificultando a conformidade. A transparência é um princípio fundamental da LGPD que precisa ser reforçado no contexto da IA Generativa. É importante refletir que alguns aspectos do comportamento da IA Generativa, nem mesmo os fabricantes têm total controle.
Finalidade
A reutilização de dados para refinamento e outras finalidades não previstas originalmente gera reflexão quanto aos direitos dos titulares. É importante para conformidade com a LGPD que as finalidades sejam claramente definidas e comunicadas para evitar abusos.
Conclusão
A privacidade no contexto da IA Generativa vai exigir uma abordagem ética, jurídica e técnica. Importantíssimo os avanços conquistados e que virão por meio da IA Generativa, mas também é fundamental assegurarmos a privacidade das pessoas e a adequada proteção de seus dados, especialmente na sociedade absolutamente digital que vivemos. O desafio será encontrar o equilíbrio entre a necessidade de regulamentação e a pressão do mercado por velocidade na inovação e reposicionamento das grandes empresas no novo tabuleiro do mercado! Quais outros desafios você enxerga no uso da IA generativa em conformidade com a LGPD?