IA pode ficar sem dados de treinamento em 4 anos; entenda

Uma projeção do Epoch AI, um instituto de pesquisa virtual, aponta que as inteligências artificiais (IAs) podem ficar sem bases de dados para treinamento em 2029. Isso ocorreria porque, segundo os cientistas, o tamanho do conjunto de dados necessários para treinar uma IA se igualará ao volume de texto público online — limitando, portanto, o treinamento de novos modelos e de modelos mais complexos.

Outro fator complicador é que os veículos de mídia, como jornais e site de notícias, estão restringindo cada vez mais o uso do conteúdo gerado por eles e impedindo, entre outras coisas, que o material possa ser usado para alimentar e treinar a IA.

Um artigo publicado na revista Nature na quarta-feira (11) debate o tema e aponta que as principais empresar do ramo já estão elencando soluções para o esgotamento eminente. Conforme apurado por Nicola Jones, a tendência é de que a saída seja somar o potenciais dos bancos de dados privados com os textos públicos.

Segundo o artigo, uma saída por ser o uso de mensagens trocadas no WhatsApp e transcrições de vídeos de YouTube, cujo acesso é garantido às empresas donas desses produtos. Outra solução parece ser o uso de conjuntos mais restritos que parecem estar sempre em expansão, como os dados astronômicos. Uma terceira saída seria criar dados artificialmente, o que esbarraria num problema de precisão.

“O problema com dados sintéticos é que loops recursivos podem consolidar falsidades, ampliar conceitos errôneos e, em geral, degradar a qualidade do aprendizado”, afirma Jones, citando um estudo de 2023.

ChatGPT, Gemini e Copilot: veja como usar inteligência artificial no trabalho

Este conteúdo foi originalmente publicado em IA pode ficar sem dados de treinamento em 4 anos; entenda no site CNN Brasil.

Adicionar aos favoritos o Link permanente.