Google diz que removerá qualquer coisa que você postar online para a IA

O Google atualizou sua política de privacidade no fim de semana e disse explicitamente que a empresa se reserva o direito de coletar quase tudo o que você publica online para criar suas ferramentas de IA. Se o Google puder ler suas palavras, assuma que elas pertencem à empresa agora e espere que estejam aninhadas em algum lugar nas entranhas de um chatbot.

Mr. Tweet perde o tweet do Super Bowl

“O Google usa as informações para melhorar nossos serviços e desenvolver novos produtos, recursos e tecnologias que beneficiam nossos usuários e o público”, A nova política do Google diz. “Por exemplo, usamos informações disponíveis publicamente para ajudar a treinar os modelos de IA do Google e criar produtos e recursos como Google Tradutor, Bard e recursos de IA na nuvem”.

Felizmente para os aficionados por história, o Google mantém um histórico de mudanças aos seus termos de serviço. A nova linguagem ajusta uma política existente, explicando novas maneiras pelas quais suas reflexões online podem ser usadas para fazer as ferramentas de IA da gigante da tecnologia funcionarem.

Anteriormente, o Google dizia que os dados seriam usados ”para modelos de linguagem”, em vez de “modelos de IA”, e onde a política anterior mencionava apenas Google Tradutor, Bard e Cloud AI agora aparecem.

Esta é uma cláusula incomum para uma política de privacidade. Geralmente, essas políticas descrevem as maneiras pelas quais uma empresa usa as informações que você publica nos próprios serviços da empresa. Aqui, parece que o Google se reserva o direito de coletar e alavancar dados publicados em qualquer lugar na web pública, como se toda a internet fosse o campo de atuação da IA da empresa. O Google não respondeu imediatamente a um pedido de comentário.

A prática levanta novas e interessantes questões de privacidade. As pessoas geralmente entendem que postagens públicas são públicas. Mas hoje você precisa de um novo modelo mental do que significa escrever algo online. Não é mais uma questão de quem pode ver a informação, mas como ela pode ser usada. Bard e ChatGPT provavelmente ingeriram suas postagens de blog há muito esquecidas ou avaliações de restaurantes de 15 anos atrás. Enquanto você lê isso, os chatbots podem estar regurgitando alguma versão humonculóide de suas palavras de maneiras impossíveis de prever e difíceis de entender.

Uma das complicações menos óbvias do mundo pós-ChatGPT é a questão de onde os chatbots famintos por dados obtêm suas informações. Empresas como Google e OpenAI raspou grandes pedaços da internet para alimentar seus hábitos de robô. Não está claro se isso é legal., e os próximos anos verão os tribunais lidarem com questões de direitos autorais que pareceriam ficção científica alguns anos atrás. Enquanto isso, o fenômeno já está afetando os consumidores de maneiras inesperadas.

Os senhores do Twitter e do Reddit estão particularmente ofendidos com o problema da IA e fizeram mudanças controversas para bloquear suas plataformas. Ambas as empresas desabilitaram o acesso gratuito às suas APIs, permitindo que qualquer um que quisesse baixar um grande número de postagens. Isso visa proteger os sites de redes sociais de outras empresas que se aproveitam de sua propriedade intelectual, mas teve outras consequências.

Twitter e Alterações na API do Reddit quebraram ferramentas de terceiros que muitas pessoas usavam para acessar esses sites. Por um minuto, até parecia que o Twitter ia obrigar entidades públicas como clima, tráfego e serviços de emergência para pagar se quisessem twittar, uma medida que a empresa rejeitou após uma enxurrada de críticas.

Ultimamente, a raspagem da web é o coco favorito de Elon Musk. Musk culpou vários desastres recentes do Twitter na necessidade da empresa de impedir que outros removam dados de seu site, mesmo quando os problemas parecem não relacionados. O fim de semana, Twitter limitou o número de tweets os usuários podiam assistir por dia, tornando o serviço quase inutilizável. Musk disse que era uma resposta necessária à “raspagem de dados” e à “manipulação do sistema”. No entanto, a maioria dos especialistas em TI concorda que a limitação de taxa provavelmente foi uma resposta de crise a problemas técnicos decorrentes de má administração, incompetência ou ambos. O Twitter não respondeu às perguntas do Gizmodo sobre o assunto.

No Reddit, o efeito das mudanças na API foi particularmente forte. O Reddit é essencialmente administrado por moderadores não pagos que mantêm os fóruns saudáveis. Mods em grandes subreddits tendem a contar com ferramentas de terceiros para seu trabalho, ferramentas que dependem de APIs agora inacessíveis. Isso provocou um protesto em massa, onde os moderadores basicamente desligaram o Reddit. Embora a controvérsia ainda esteja em andamento, é provável que ela tenha consequências permanentes enquanto moderadores desprezados penduram seus chapéus.