O governo federal voltou e decidiu, por enquanto, não usar o dados adições de eletrodomésticos telefones celulares medir o índice de isolamento social nas cidades, como vêm fazendo os governos estaduais e municípios. O presidente, de acordo com relatado, teria medo do impacto do monitoramento no direito de privacidade.
O uso dos dados gerados pelos telefones celulares suporta muitos dos programas desenvolvidos em outros países para combater novas coronavírus. Mas esses dados são realmente anônimos? Que lições o Brasil pode aprender com as experiências internacionais? O medo da invasão da privacidade é fundado? Separamos algumas perguntas que ajudam a entender o tópico que está na agenda do dia.
1. Quais dados podem ser monitorados em um telefone celular?
O seu telefone diz muito sobre você. As autoridades não precisam ter acesso ao conteúdo de seu dispositivo para descobrir uma série de informações além do importante simplesmente rastreando os dados de localização geográfica. O celular está em um determinado lugar todas as noites? Grandes chances de ser a residência da pessoa. A mesma rota é feita todos os dias úteis, mas não nos finais de semana? Tudo indica que você descobriu onde essa pessoa trabalha.
Enquanto todo mundo luta pela proteção dos dados de navegação no internet e o conteúdo das mensagens, muito pode e foi explorado a partir de dados de geolocalização, geralmente sem o consentimento ou conhecimento da parte interessada.
2. Como funcionam os programas de monitoramento de telefones celulares e o que eles revelam?
Existem várias maneiras de coletar dados de geolocalização, como GPS dispositivos ou a triangulação entre diferentes antenas de celular às quais os celulares estão conectados em movimento.
Essas conexões permitem às empresas de telefonia produzir mapas de calor que indicam a maior ou menor concentração de dispositivos em uma determinada área. Isso já pode ser indicativo de multidões, algo que se deseja evitar em tempos de combate à covid-19.
Esses dados agregados geralmente não identificam pessoas nessa área, mas apenas a presença de telefones celulares conectados na localidade.
O índice de isolamento social, do qual as autoridades falam tanto, pode ser medido a partir da localização da célula durante a noite e seu deslocamento no dia seguinte. Se você passar o dia dentro de um raio muito próximo àquele local (para garantir também uma certa margem de erro), os dados serão incluídos nas estatísticas do grupo que respeitou a quarentena. Se ultrapassar o limite, o índice de isolamento social já é baixo, pois se considera que a pessoa saiu de casa.
Vale ressaltar que a conexão dos dispositivos com as antenas espalhadas pela cidade não gera uma localização precisa do dispositivo, além de vários fatores que podem influenciar nessa medição. Especialmente nas grandes cidades, nas ruas e avenidas com alta concentração de pessoas (e antenas de telefone celular), é fácil para um pequeno deslocamento fazer com que o dispositivo troque de antena.
6/14 – Na prática, o que acontece é que, em locais com alta densidade populacional, se você mora em uma dessas regiões e simplesmente sai do quarto e vai ao banheiro ou à sala, pode mudar a antena do seu celular Então, dependendo da hora do dia também.
– Thiago Rondon (@thiagorondon) 16 de abril de 2020
De qualquer forma, o uso desses dados serve para indicar locais de concentração e pode fornecer uma visão abrangente dos padrões de deslocamento. É um começo de conversa, mas precisamos ver como esses dados são manipulados e se eles podem passar de uma visualização macro para a granularidade de cada indivíduo conectado.
3. Como os dados são anonimizados?
Primeiro, vale a pena explicar que ainda não sabemos como o governo federal implementaria o programa de monitoramento de telefones celulares. Assim, os modelos conhecidos são aqueles utilizados pelos governos estaduais e municípios, cuja operação foi explicada, e outros projetos desenvolvidos pelas empresas de telefonia e startups.
As empresas sempre afirmam que não usam dados pessoais (individualizados) nesses bancos de dados, mas apenas dados anônimos que permitem a geração de estatísticas, estudos e outras funcionalidades com base em dados agregados. Para saber quantas pessoas visitam um lugar na cidade todos os dias, por exemplo, não preciso saber exatamente quem estava lá, com o nome e o número de telefone da pessoa. Mas é claro que quanto mais informações você tiver sobre essa pessoa, maior será o valor desses dados.
Para proteger a privacidade das pessoas, os bancos de dados anônimos podem usar vários dispositivos, como ocultar certas informações, generalizar outras etc. Então, em vez de saber quem exatamente visitou meu estabelecimento, sei que essa pessoa é do sexo masculino ou feminino e tem entre 40 e 50 anos, apenas para continuar o exemplo. Ao adicionar todas as entradas no banco de dados, eu posso gerar uma visualização da porcentagem do meu público-alvo para cada faixa etária, gênero etc.
Acontece que, quanto mais informações você fornecer nessa base, mais fácil será identificar novamente a pessoa cujos dados foram anonimizados. Em seguida, chegamos a uma encruzilhada: como criar um banco de dados anônimo que possa encontrar um equilíbrio entre utilidade para quem o usa sem revelar a identidade de todos?
4. Como saber se os dados foram realmente anonimizados?
Depende do grau de anonimato, das proteções inseridas nessa base e de quem está tentando reverter esses dados. Vale a pena prestar atenção à nomenclatura. Estamos falando de dados “anônimos” e não de dados “anônimos” para dar apenas a idéia de um processo, que esses dados eram dados pessoais, mas que eles passaram por um procedimento para que os links com seus proprietários fossem apagados, tornando-os anônimos.
A própria Lei Geral de Proteção de Dados (LGPD, Lei nº 13.709 / 18), que entrará em vigor em breve, talvez em agosto deste ano, talvez em janeiro do próximo ano, afirma que dados anonimizados “não serão considerados dados pessoais para os fins desta Lei, exceto quando o processo de anonimato a que foram submetidos for revertido, utilizando exclusivamente seus próprios meios, ou quando, com esforços razoáveis, puder ser revertido. “
Em outras palavras, para que os dados sejam considerados anônimos, preciso analisar dois fatores: um objetivo e um subjetivo. Devido a fatores objetivos no conceito de “esforços razoáveis”, a própria lei menciona “o custo e o tempo necessários para reverter o processo de anonimização, de acordo com as tecnologias disponíveis” (art. 12, §1). Fatores subjetivos, por outro lado, examinam quem fez o processo de anonimato e quem está tentando quebrá-lo. Tudo isso conta quando se trata de medir se os dados foram realmente anonimizados. Ou se a empresa apenas ocultou algumas informações aqui e ali que permitem a qualquer pessoa com um pouco mais de teimosia e tempo na vida acessar os dados e revelar a identidade de seus proprietários.
5. Você tem um exemplo simples de reidentificação para explicar como funciona?
Veja isto A Comissão de Táxi e Limusine de Nova York tem um banco de dados anual de corridas que acontecem na cidade. A base de 2013 teve 173 milhões de corridas registradas, indicando o ponto inicial e final, data e hora, mais o valor da corrida e se uma dica foi dada. A comissão teve o cuidado de ocultar os dados de identificação dos motoristas, como o número da placa ou a licença para dirigir táxis.
Não demorou muito para que essa proteção fosse quebrada depois que um analista de dados teve acesso ao documento por meio da lei de acesso à informação e publicou seu conteúdo na Internet. Ainda assim, você pode pensar que a planilha começou a revelar apenas os dados do motorista, mas não os dados do passageiro, já que essas informações nem estavam lá.
Pessoas teimosas e com tempo de vida entram em cena. Sabendo que em Nova York é muito comum as celebridades pegarem um táxi na rua e que esses momentos podem ser fotografados por paparazzi, um jornalista Fui procurar fotos na internet usando nomes de celebridades e menciona “Nova York” e “táxi” na pesquisa. De posse dessas imagens, ele selecionou apenas aquelas que tinham uma indicação da localização e data do incidente. Como naquela quinta-feira, 10 de março de 2011, quando Caetano estacionou um carro no Leblon.
O jornalista também procurou fotos que mostrassem a matrícula ou o número do carro (que em Nova York geralmente é pintado na lateral da porta). Com isso, foi possível vincular os nomes das celebridades aos dados de várias raças que estavam na base da Comissão de Táxi e Limusina. Bradley Cooper, Jessica Alba, uma das Kardashians e outras celebridades foram reveladas sobre suas viagens de táxi, mesmo que essas informações não estivessem presentes na planilha original. E tudo começou com o anonimato mal feito.Recentemente Tatiana Dias, no Interceptar, mostrou como foi possível revelar a identidade das pessoas que anonimizaram seus dados em um banco de dados que a Vivo disponibilizou a terceiros. O processo também utilizou muitas informações presentes no redes sociais para obter a identidade das pessoas que apareceram nos bancos de dados apenas com informações genéricas.
6. Portanto, não há dados anônimos?
Veja, eles até existem, mas esse pássaro exótico só pode realmente se identificar com um olho no estado da arte e o outro nos esforços e recursos daqueles que tentam anonimaizar e dos que tentam se identificar novamente. Não basta esconder o nome, endereço e número de telefone celular e pensar que os dados foram anonimizados. Além disso, o estado de anonimato é sempre temporário, à medida que a tecnologia avança e algo que hoje exige muito esforço para quebrar o amanhã pode ser simplificado.
7. Como outros países usaram o monitoramento por telefone celular para combater o covid-19?
Há tudo aqui. Alguns países usaram exatamente o modelo usado pelos governos estaduais e municípios, trabalhando com dados agregados para mostrar mapas de calor na concentração de dispositivos. Não há nada de errado com essa medida se os dados forem processados de forma agregada e sem a identificação, direta ou indireta, dos usuários. Mais tarde, explicamos o porquê, à luz da Lei Geral de Telecomunicações.
O mesmo ocorre com o índice de isolamento social realizado pelo movimento dos aparelhos. Vale lembrar que em ambas as medidas, inicialmente ninguém é identificado, mas apenas a localização e o movimento dos dispositivos para a formação de dados agregados são registrados.
Um terceiro modelo, que vai além do mapa de calor e do mapa de deslocamento, é o chamado “rastreamento de contatos”, que busca analisar os contatos que o proprietário de um dispositivo teve em um determinado período de tempo e, portanto, , acionar alertas para as pessoas com quem você entrou em contato quando for positivo para a covid-19.
Este foi o sistema usado na Coréia do Sul e Cingapura, por exemplo. O rastreamento de contatos já levanta várias questões importantes sobre o uso de dados pessoais (e não apenas dados anônimos), pois a partir de alertas, não importa o quanto a identidade da pessoa esteja oculta, essas informações podem ser reconstruídas . Além disso, esse sistema depende fortemente de testes populacionais para a covid-19, o que não é uma opção viável em vários países onde o acesso aos testes é um obstáculo.
Maçã y Google venha para anunciar que estão trabalhando em um modelo de rastreamento de contatos que armazena informações em telefones celulares individuais, impedindo que a identidade da pessoa infectada seja facilmente revelada. A União Europeia também está trabalhando em uma iniciativa transfronteiriça que permite esse mapeamento, respeitando a privacidade das pessoas.
Vale lembrar que as iniciativas de monitoramento de contatos se mostraram importantes em alguns países asiáticos para identificar possíveis formas de infecção por vírus e medidas mais específicas para isolar as pessoas e áreas mais afetadas. No entanto, como observado, essa medida exige que o teste de massa seja eficaz.
Outro problema que pode enfraquecer o regime de rastreamento de contatos é o modelo no qual alertas são acionados quando a própria pessoa relata que está infectada. Esses modelos acabam confiando fortemente na boa fé das pessoas para não reportar diagnósticos falsos a manipular As estatísticas.
8. O monitoramento de celulares é legal para combater a covid-19 no Brasil?
Se os dados puderem ser classificados como anônimos, há pouca dúvida. A Lei Geral de Telecomunicações (LGT), por exemplo, permite expressamente às empresas de telecomunicações o uso de dados sobre seus serviços de forma agregada e anônima, disponibilizando essas informações a terceiros. Esta é a redação da LGT:
“Art. 72 § 2 ° O provedor poderá divulgar a terceiros informações agregadas sobre o uso de seus serviços, desde que não permitam a identificação, direta ou indireta, do usuário ou a violação de sua privacidade.”
Ou seja, quando as empresas vão revelar os dados, eles não podem ser dados pessoais que identificam ou levam à identificação de indivíduos. Esta noção de dados pessoais está alinhada com o que diz a Lei Geral de Proteção de Dados (LGPD), que no Artigo 5, I, define dados pessoais como “informações relacionadas à pessoa singular identificada ou identificável”.
Mas os dados pessoais (que identificam ou podem identificar a pessoa) não podem ser usados para combater uma pandemia? Pode, mas é o mesmo LGPD que traz uma série de condições para que isso aconteça.
A maneira mais conhecida de permitir o uso de dados por terceiros é o consentimento da parte interessada para esse fim. Mas a lei ainda apresenta situações que permitem o uso de dados sem consentimento, desde que requisitos muito específicos sejam atendidos, como “a proteção da vida ou da segurança física do proprietário ou de terceiros” (art. 7, VII e art. 11, II, e) ou “proteção da saúde, exclusivamente, em procedimento realizado por profissionais de saúde, serviços de saúde ou autoridades de saúde” (art. 7, VII e art. 11, II, f).
A administração pública também pode fazer uso do “tratamento compartilhado e uso de dados necessários para a implementação de políticas públicas previstas em leis e regulamentos ou lastreados em contratos”, além de acordos e outros instrumentos (art. 7, III).
O combate ao covid-19 parece se encaixar nas premissas acima. No entanto, vale lembrar que o selo concedido pelo LGPD para o uso de dados não é restrito. Os dados processados para a geração de políticas públicas para enfrentar a pandemia devem ser utilizados apenas para esse fim. Se eles forem usados para outros fins, como vender publicidade ou enviar mensagens eleitorais, esse uso é ilegal e pode criar responsabilidades para os envolvidos.
– Mesmo nesses casos, a lei não dá “carta branca”. Os dados devem ser usados apenas com a finalidade de combater a emergência, mantidos em segurança, não podem ser vendidos ou compartilhados com terceiros e devem ser excluídos após a superação da emergência, entre outras proteções.
– Ronaldo Lemos (林纳德) (@lemos_ronaldo) 14 de abril de 2020
Também vale esclarecer que a noção de “política pública” para o uso de dados não pode ser reproduzida na mesa e, consequentemente, é necessário divulgar os dados. É dever do governo informar quais políticas públicas ele pretende cumprir e como os dados serão usados para esse fim. O Brasil está passando por um momento em que governos de todos os níveis da federação buscam dados para gerenciar melhor os assuntos públicos. Mas quando esses dados estão na posse de empresas, não é incomum ver solicitações além das genéricas em nome de “políticas públicas”.
Seja para combater o CCovid-19 ou para qualquer outro propósito, quando o Estado exige dados de indivíduos, é necessário fazê-lo de uma maneira muito específica para evitar a concentração desnecessária (e tentadora) de dados pessoais.
Para resumir: o uso de dados de células de forma agregada e anônima é legal no Brasil. E mesmo o uso de dados pessoais também pode ser admitido no âmbito da Lei Geral de Proteção de Dados. Ok Isso não significa que você ainda tem um problema.
9. Como é a luta contra o covid-19 sem a Lei Geral de Proteção de Dados?
Acontece que o LGPD ainda não está em vigor. Em outras palavras, o uso agregado e anônimo é suportado pela Lei Geral de Telecomunicações, mas os dados pessoais em si devem usar outras fontes para regular sua troca com terceiros.
A Lei 13.979 / 20, denominada “lei de quarentena”, estabelece que “a troca de dados essenciais para a identificação de pessoas infectadas ou suspeitas de infecção por coronavírus é obrigatória entre órgãos e entidades da administração pública federal, estadual e distrital. e municipal, com o único objetivo de impedir sua propagação “. (art. 6) Esta obrigação “se estende às pessoas coletivas de direito privado quando os dados são solicitados por uma autoridade de saúde”. (§ 1)
Essa medida ajuda, mas a lei de quarentena não fornece a estrutura completa sobre o uso de dados pessoais presentes na LGPD, que deve entrar em vigor em 16 de agosto de 2020. Acontece que o Senado Federal decidido Adiou recentemente a entrada em vigor da lei até 1º de janeiro de 2021, uma vez que muitas empresas ainda não se adaptaram e que o próprio governo ainda não criou a Autoridade Nacional de Proteção de Dados (ANPD), que supervisionará a aplicação de a lei lei. A crise do coronavírus acabou servindo como uma razão para adiar a eficácia da lei.
10. Então, o que as autoridades podem fazer para proteger a privacidade dos brasileiros?
O LGPD forneceria mais segurança para que empresas e governos possam processar dados pessoais, oferecendo bases mais concretas e trazendo uma série de restrições quanto ao objetivo do tratamento, sua adequação e proteção. A Câmara dos Deputados pode reverter a direção que veio do Senado e manter a lei em vigor agora em agosto. O próprio Ministério Público Federal posicionado nesse sentido. Precisamos de uma lei de proteção de dados para melhorar os controles sobre o uso de dados pessoais durante o combate à pandemia.
O governo federal também pode fazer sua parte. No início, a primeira medida que falta é a constituição efetiva da ANPD, com a indicação de seus diretores e do Conselho. Vale lembrar que essa autoridade já está na lei e sua criação seria muito importante para unificar os esforços de inspeção e orientação aos setores público e privado sobre como os dados pessoais podem ser tratados em tempos de crise como o que estamos enfrentando.
O que teve repercussão na imprensa nos últimos dias é a disputa política sobre programas de monitoramento de telefones celulares, com pessoas nas mídias sociais alegando que os programas são ditatoriais. De fato, sem conhecer o programa que foi testado pelo governo federal, não se pode dizer que viola os direitos dos usuários. Como pode ser visto, a legislação brasileira já possui disposições que permitem o uso de dados agregados e anonimizados e está prestes a aumentar com a entrada em vigor da LGPD.
Esperamos que essas perguntas tenham ajudado a esclarecer alguns pontos sobre os programas de monitoramento de telefones celulares e o uso de dados agregados e anônimos. Também vai acontecer que um dia você encontre um banco de dados que contenha informações sobre o estacionamento de carros no Leblon em 1 de março de 2011 por um homem da Bahia vestindo uma camisa branca? Você nem precisa de “esforços razoáveis” para saber que não são dados anônimos.