Notícias

O que é a Privacidade Diferencial adotada pela Apple no iOS 10

Na WWDC 2016, a Apple anunciou que estava adotando a chamada Privacidade Diferencial, que protege ainda mais as informações dos usuários. Mas o que seria isso?

Antes de tudo, ela não é uma invenção da Apple. Estudos sobre a privacidade diferencial já ocorrem há anos e é resultado do trabalho de vários especialistas em segurança e privacidade. É a tentativa de manter o anonimato, enquanto se consegue coletar dados estatísticos para desenvolver a inteligência artificial.

A.I. vs. Privacidade

A Inteligência Artificial (A.I., em inglês) é um assunto bastante em voga atualmente. Ela é cada vez mais usada em dispositivos móveis, em assistentes virtuais (tipo a Siri ou o Google Now) que tentam entender o que o usuário está fazendo, para propor ajuda ou planejar antecipadamente o que fazer. É o caso dos avisos de quanto tempo se irá chegar no local de trabalho, de acordo com o trânsito. Isso atualmente já é feito de forma automática.

O problema é que, para as máquinas aprenderem nossos hábitos, elas precisam conhecer e coletar nossos dados, o que vai contra o conceito de privacidade pessoal. A prova está que o Google implementou a criptografia ponta a ponta em seu aplicativo de mensagens, mas ela vem desligada por padrão para que os bots (inteligência artificial) possam funcionar. Não tem como o sistema coletar dados se eles estiverem encriptados.

Mesmo com coletas de dados ditas anônimas, muitas vezes é possível fazer o cruzamento de informações para determinar a identidade da pessoa e obter dados privados dela. Um exemplo do estudante de mestrado Anthony Tockar, da  Northwestern University, de Illinois:

Vamos supor que você tenha acesso a um banco de dados que lhe permita computar, de forma anônima, a renda total de todos os residentes de determinada região. Se você soubesse que o Sr. João se mudaria para outro local, ao consultar este banco de dados antes e depois de sua mudança, você teria como deduzir o quanto ele ganha.

Ou seja, se você sabe que no condomínio X a renda total é de R$900.000, e depois da saída do Sr. João a renda cai para R$870.000, é fácil de deduzir que Sr. João tem renda de R$30.000. Este tipo de cruzamento com dados anônimos pode ser usado em diferentes casos, para descobrir diferentes informações pessoais de qualquer pessoa. Um outro estudo conseguiu, por exemplo, identificar a preferência política de usuários conhecidos apenas analisando os registros anônimos do Netflix.

Neste ponto, já dá para entender a sinuca de bico que a Apple se encontra. Ao mesmo tempo que é pressionada para melhorar ainda mais a Siri e sua inteligência artificial, ela tem como uma de suas principais bandeiras a privacidade dos usuários.

Privacidade Diferencial

O conceito de privacidade diferencial ainda não foi adotado em larga escala, e a Apple é a primeira gigante a fazer isso (apesar da Microsoft estudar há um certo tempo o assunto). Consiste em colocar ruídos matemáticos nas informações, para que a origem delas não seja identificada, mas suficiente para coletar os dados necessários para estatísticas.

Um algoritmo não receberia então um fluxo de dados puro, mas um “sujo” com ruído estatístico. O algoritmo ainda poderá aprender com aquilo e desempenhar sua função, mas sem ter conhecimento de dados de maior sensibilidade. Com isso, os dados estatísticos seriam coletados, descartando todo o resto, que seria ruído. É possível assim determinar os gostos e hábitos do grupo, melhorando os serviços.

A Apple diz que isso permitirá melhorar a Siri e até o QuickType, que poderá adivinhar melhor as palavras que, por exemplo, os brasileiros mais usam.

DifferencialPrivacy2

Opinião

Resta agora saber se a Apple irá conseguir colocar em prática a teoria. Ela acredita que isso irá proteger mais os dados dos clientes, mas é um discurso que começa a destoar do anterior, que defendia a privacidade plena dos usuários a qualquer custo. Quem acompanha o seriado House of Cards, da Netflix, sabe o quão perigoso pode ser o conhecimento de preferências de uma população, mesmo com dados anônimos, para moldar o discurso político e assim influenciar os votos dos cidadãos, sem eles nem perceberem. Esta nova maneira de coletar informações continua sendo uma forma de… “coletar informações“, o que foge um pouco do conceito de privacidade, no sentido que vão continuar sabendo o que nós fazemos, dizemos e gostamos.

Isso é bom? Só o tempo dirá.

Conteúdo original © Blog do iPhone

Tags
Mostrar mais

Ale Salvatori

Applemaníaco desde 1995, quando precisou aprender a usar um Mac em uma semana para conseguir um emprego em uma agência de publicidade. Acha que a Apple não é mais a mesma depois da saída do Gil Amelio.

Artigos Relacionados

  • Este parece ser um ótimo meio termo nesta questão de privacidade.

  • Roberson Annunziato

    Explicado então o porque da Siri ainda ser tão limitada: estão quebrando a cabeça com esse paradoxo entre coleta de dados e privacidade. Será que encontraram a solução? Como o texto diz: só o tempo dirá.

    • Alex iPilot

      A Siri tem MUITAS outras limitações que não envolvem privacidade! O controle de recursos do próprio iOS, por exemplo…

      • Roberson Annunziato

        Talvez justamente por causa da privacidade… Mas realmente talvez daria pra melhorar e muito mesmo com privacidade.

        • Alex iPilot

          Um exemplo simples sem relação com a privacidade: ajuste do volume do som…

  • Alex iPilot

    Preciso ler mais sobre isso para entender melhor, ou talvez eu seja mesmo um pouco burro, rsrsrsrs… Questões: a) Se o objetivo é me oferecer recursos inteligentes baseados em meu comportamento individual, como pode ser possível anular essa identificação particular? Se fosse, realmente, anulada seriam oferecidos para outro, não para mim… b) Se o algoritmo consegue identificar e descartar o que foi ruído inserido, qual o propósito da inserção?

    • Thiago Romero

      Creio que ela utilizaria uma espécie de “criptografia” ou uma forma de embaraçar os seus dados com os dados de outro usuário, pode haver várias possibilidades de se fazer isso. O problema é, como fazer de forma eficiente.

    • O sistema de inteligência artificial tem que se beneficiar da massa, não do individual. A Siri tem que aprender muito com o comportamento de todos para ficar mais inteligente, e um pouco sobre você para moldar suas respostas ao que você esperaria. Isso é sobre a pergunta (a).

      Sobre a (b): no exemplo citado pelo iLex, sobre o condomínio, digamos que um ruído seja adicionado à informação de renda de cada pessoa. Nada muito alto: o suficiente para deixar os dados diferentes do que seriam realmente mas mantendo sua relevância. Se um morador X sai do condomínio, agora é impossível saber qual era sua renda, pois o ruído torna essa informação individual absolutamente inexata (atribuindo rendas diferentes aos condôminos e/ou criando outros moradores falsos que também sairão do condomínio, por exemplo). Isso impossibilita um cruzamento de dados que possa identificar um indivíduo, mantendo o propósito da máquina aprender mais sobre os usuários.

      Usando um outro exemplo, imagine que a Apple está recolhendo informações sobre palavras que pessoas de determinada região usa mais, para melhorar seu QuickType (também citado no texto). A cada vez que você digita, o algoritmo recolhe suas informações com alguns textos extras, que não foram você que digitou, além de remover algumas outras palavras. De modo geral ela continua com dados estatísticos relevantes para usar, mas é impossível cruzar dados de forma satisfatória pra saber quais delas você realmente digitava e quais foram adicionadas pelo algoritmo, mantendo assim sua privacidade. 🙂

      • Alex iPilot

        Muito obrigado pelo aula, bastante esclarecedora! Quanto à questão b), o que eu havia entendido pelo texto do Blog é que o algoritmo conseguiria descartar o ruído, de certa forma “recuperando” a informação original, o que recairia novamente na minha privacidade. Valeu!

  • Lucas Pacheco Petrin

    Vai aparecer muitos “BIIIURRR” no QuickType

    • Phillip César

      BIRL

  • Essa sem dúvida é a maior novidade da Apple. Se ela conseguir contornar a sua própria restrição de coleta de dados se tornará mais competitiva nos seguimentos que dependem disso, podendo competir de verdade com o Google, Facebook e ter uma tecnologia de inteligência artificial decente.

  • Fiquei curioso pra assistir agora o “House of Cards”.
    Será que é bom?

    • Muito. Faça isso logo!

    • Kleyson Klesller

      Já tenho esta seria em minha lista, acho que vou iniciar hoje!