Em uma postagem na plataforma X , o gigante dos mecanismos de busca revelou que está abrindo o código-fonte de sua ferramenta de marca d’água SynthID Text, dizendo que ela estará “disponível gratuitamente para empresas e desenvolvedores, pois os ajudará a dent seu conteúdo gerado por IA”.
Pushmeet Kohli , vice- dent de pesquisa do Google DeepMind e coautor de um artigo de pesquisa do Google DeepMind, disse: “O sistema não compromete as funções dos modelos de IA, apenas os torna melhores”.
Imagens e vídeos têm sido centrais nas discussões sobre dent de conteúdo e marcas d'água foram apontadas como a solução necessária para combater deepfakes.
A Coligação para a Proveniência e Autenticidade do Conteúdo (C2PA), uma colaboração entre empresas tecnológicas e grandes meios de comunicação para desenvolver um sistema para anexar metadados encriptados para indicar ficheiros de imagem e vídeo gerados por IA, também tem sido central nestas discussões.
De acordo com o artigo de pesquisa do Google DeepMinds, o SynthID Text interfere durante a geração, pois altera algumas palavras emitidas por um chatbot para ficarem claras para um detector SynthID, mas quase invisíveis para os humanos.
“Modificações como essas trazem uma assinatura estatística para o texto gerado por IA e durante a fase de detecção da marca d’água, a assinatura pode ser medida para ver se o texto era de um modelo de IA pelo LLM com marca d’água”, escreveram os pesquisadores no artigo.
Ao gerar frases palavra por palavra, é assim que funcionam os LLMs que alimentam os chatbots, pois eles escolhem a próxima palavra provável dependendo do contexto do que veio antes. Ao alocar aleatoriamente pontuações numéricas para palavras candidatas, o LLM produz palavras com pontuação mais alta. Marcas d'água serão colocadas em um trecho de texto que teria sido analisado pelo detector e que teria uma pontuação mais alta.
Hoje, estamos abrindo o código-fonte de nossa ferramenta de marca d'água de texto SynthID por meio de um kit de ferramentas de IA generativa responsável atualizado.
Disponível gratuitamente para desenvolvedores e empresas, ele os ajudará a dent o conteúdo gerado por IA. 🔍
Saiba mais → https://t.co/n2aYoeJXqn pic.twitter.com/4uRKYaz57Y
-Google DeepMind (@GoogleDeepMind) 23 de outubro de 2024
Apesar do sistema DeepMind ter um desempenho melhor do que outras ferramentas para colocar marcas d'água em textos, os pesquisadores reconheceram em seu artigo que a ferramenta ainda apresenta falhas. Por exemplo, se você alterar um texto gerado pelo Gemini, o detector será enganado.
“Embora o SynthID não seja uma solução mágica para dent conteúdo gerado por IA, é um importante alicerce para o desenvolvimento de ferramentas de dent de IA mais confiáveis.”
– Kohli.
Se os usuários alterarem os textos significativamente ou usarem outro chatbot para resumir o texto, o detector será desviado ao colocar uma marca d'água no texto gerado pela IA.
O Google afirma que o SynthID Text não compromete a qualidade, a precisão ou a velocidade da geração de texto testada pelo sistema integrado em seus modelos Gemini . A empresa também acrescentou que funciona mesmo em textos cortados, modificados ou parafraseados.
“A detecção é um problema particular quando se começa a levar em consideração a implementação em situações reais, pois há problemas com a revisão do texto em estado selvagem, onde será necessário saber qual modelo de marca d’água foi aplicado para saber e onde localizar o sinal”, explicou Bruce MacCormack, membro do comitê diretor do C2PA.
Além do Google, a OpenAI também trabalha na tecnologia de marca d'água de texto AI há anos, mas atrasou seu lançamento devido à viabilidade técnica e comercial.
Mas os especialistas do setor geralmente elogiaram a iniciativa do Google como um passo na direção certa.
“Ele promete melhorar o uso de dent de conteúdo durável do C2PA para documentos e texto bruto”, disse Andrew Jenks, diretor de proveniência de mídia da Microsoft e presidente executivo do C2PA.
MacCormack também acrescentou que, embora os investigadores do Google ainda tenham muito a fazer para tornar isto um caso prático, continua a ser uma grande iniciativa e “o primeiro passo na maratona que temos pela frente”.