Os Dados de Todos e de cada Um


A revolução informática e a vulgarização do smartphone vem promover a universalização dos sistemas e da informação num mundo virtual multimédia, global e complexo


A virtualização de ativos críticos na vida do cidadão teve início durante a massificação dos serviços bancários em finais dos anos 60, cuja base de confiança é progressivamente baseada em contratos digitais e mecanismos de segurança como cartões, palavras passe, pins, ou carteiras digitais. Infelizmente, a gestão distribuída de milhões de contas bancárias na internet aberta cria muitas oportunidades de furto de informação (p. ex.: dados privados de cartões de crédito), causando avultados prejuízos e constantes dores de cabeça às unidades de cibersegurança das organizações.

Há pouco mais de um ano, a OpenAI e a Google lançam gratuitamente ferramentas como o ChatGPT ou o Bard, que demonstram o potencial de uma nova inteligência artificial que promete automatizar o acesso ao conhecimento e à geração de conteúdos em todas as áreas.  O “combustível” desta tecnologia é a captura de quantidades astronómicas de dados na internet como são as enciclopédias, os jornais, literatura universal e outras. Tais dados, imprescindíveis para treinar os grandes modelos de linguagem, têm sido explorados sem atender a condições de propriedade intelectual, direitos de autor ou reconhecimento de fontes. O debate e o litígio ganham intensidade, especialmente diante das recentes ações judiciais movidas pelo New York Times contra a OpenAI e a Microsoft, alegando ampla reprodução de conteúdos. Espantosamente, devido à onda de plágio com ferramentas de IA, a Amazon decidiu não aceitar mais que três livros publicados por autor / dia.

A utilização indevida de dados pessoais em ações de marketing ou para manipulação política – recorde-se o famoso caso da intervenção da Cambridge Analytica nas eleições presidenciais americanas de 2016 – continua a alastrar, sugerindo uma “guerra fria” entre os agentes detentores “de facto” da informação e os possuidores “de jure” da informação. Recentemente, mais de oitenta empresas espanholas processaram a Meta (Facebook), por alegada violação da regulamentação europeia de proteção de dados.

Esta situação não afeta apenas as grandes organizações, que dispõem de meios para se proteger e disciplinar o controle da informação que lhes pertence por direito, mas também, e desde logo, as pessoas individuais. A revolução informática e a vulgarização do smartphone vem promover a universalização dos sistemas e da informação num mundo virtual multimédia, global e complexo, que condiciona o funcionamento de todos os aspetos da nossa sociedade. A informação, de conceito abstrato, passa a ser encarada neste contexto com um recurso tangível, dotado de autor e de valor, o qual pode ser registado, possuído e trocado por outros ativos digitais ou físicos, e com capacidade de operar ações no mundo físico, nomeadamente quando representa informação executável (ou seja, software).

O uso da informação nesta nova realidade deve apoiar-se em regras de convivência sólidas, compatível com os valores civilizacionais que aceitamos no séc. XXI. A informação privada de um cidadão ou organização nunca deveria ser utilizada sem autorização, e a sua troca baseada em manifestas relações de confiança, suscetíveis de certificação por todos os intervenientes. Estão em causa registos de atos médicos, legais, académicos, de composição de medicamentos, de tráfego de veículos e de mercadorias, de conversas pessoais em videoconferências ou apps de mensagens: é impossível descrever que tipo e volume de dados vão ser gerados no mundo, previstos atingir 180 zeta (180 seguido de 21 zeros) bytes em 2025. Não se trata somente de proteger valores financeiros; de modo abrangente, trata-se de salvaguardar princípios universais de direito e ética relativos à privacidade, autoria, e rigor de todo o tipo de conteúdos, promovendo a transparência e segregando a contrainformação.

Os desafios são muitos e complexos. A original lógica de descentralização da internet, baseada em abordagens colaborativas e abertas, foi progressivamente sendo substituída por uma crescente concentração de recursos e controle. Para o bem e para o mal, sistemas como e-mail, comunicações por voz, texto ou vídeo, redes sociais e suporte geral de computação e armazenamento de dados, que são serviços infraestruturais utilizados por todos, estão a ser predominantemente fornecidos por um pequeno grupo de gigantes tecnológicos. Estas empresas detêm um poder unilateral de estabelecer as regras do jogo, talvez como recompensa providencial do seu esforço inovador.

Do ponto de vista social e político, será necessário continuar a aprofundar e a aperfeiçoar a educação e a legislação. Esta tarefa é exigente, e será tanto mais efetiva quanto mais simples e menos burocrática for, evitando criar obstáculos ao progresso, à inovação e à liberdade de expressão. Os valores do humanismo digital, da democracia, da ética, da inclusão, e da prestação de contas, devem prevalecer sobre as contingências tecnológicas.

Do ponto de vista técnico, é preciso privilegiar soluções que criem oportunidade para serviços mais descentralizados, transparentes e colaborativos. Tais modelos tenderão a explorar princípios de desenvolvimento e inovação aberta (open source), e revelam-se uma importante alavanca de aceleração criativa, incluindo, em particular, as tecnologias de registo por consenso distribuído imutável (blockchain). Neste paradigma emergente, produtores e consumidores de informação colaboram, de forma regulada, para manter a segurança, fiabilidade e propriedade da informação de cada um e de todos, permitindo suportar sistemas mais confiáveis e transparentes em todas as áreas – não apenas nas finanças e criptomoedas – promovendo a inovação participativa, o equilíbrio no acesso aos dados, ao conhecimento e ao valor da informação.

 

Professor Catedrático, Instituto
Superior Técnico e INESC-ID

Os Dados de Todos e de cada Um


A revolução informática e a vulgarização do smartphone vem promover a universalização dos sistemas e da informação num mundo virtual multimédia, global e complexo


A virtualização de ativos críticos na vida do cidadão teve início durante a massificação dos serviços bancários em finais dos anos 60, cuja base de confiança é progressivamente baseada em contratos digitais e mecanismos de segurança como cartões, palavras passe, pins, ou carteiras digitais. Infelizmente, a gestão distribuída de milhões de contas bancárias na internet aberta cria muitas oportunidades de furto de informação (p. ex.: dados privados de cartões de crédito), causando avultados prejuízos e constantes dores de cabeça às unidades de cibersegurança das organizações.

Há pouco mais de um ano, a OpenAI e a Google lançam gratuitamente ferramentas como o ChatGPT ou o Bard, que demonstram o potencial de uma nova inteligência artificial que promete automatizar o acesso ao conhecimento e à geração de conteúdos em todas as áreas.  O “combustível” desta tecnologia é a captura de quantidades astronómicas de dados na internet como são as enciclopédias, os jornais, literatura universal e outras. Tais dados, imprescindíveis para treinar os grandes modelos de linguagem, têm sido explorados sem atender a condições de propriedade intelectual, direitos de autor ou reconhecimento de fontes. O debate e o litígio ganham intensidade, especialmente diante das recentes ações judiciais movidas pelo New York Times contra a OpenAI e a Microsoft, alegando ampla reprodução de conteúdos. Espantosamente, devido à onda de plágio com ferramentas de IA, a Amazon decidiu não aceitar mais que três livros publicados por autor / dia.

A utilização indevida de dados pessoais em ações de marketing ou para manipulação política – recorde-se o famoso caso da intervenção da Cambridge Analytica nas eleições presidenciais americanas de 2016 – continua a alastrar, sugerindo uma “guerra fria” entre os agentes detentores “de facto” da informação e os possuidores “de jure” da informação. Recentemente, mais de oitenta empresas espanholas processaram a Meta (Facebook), por alegada violação da regulamentação europeia de proteção de dados.

Esta situação não afeta apenas as grandes organizações, que dispõem de meios para se proteger e disciplinar o controle da informação que lhes pertence por direito, mas também, e desde logo, as pessoas individuais. A revolução informática e a vulgarização do smartphone vem promover a universalização dos sistemas e da informação num mundo virtual multimédia, global e complexo, que condiciona o funcionamento de todos os aspetos da nossa sociedade. A informação, de conceito abstrato, passa a ser encarada neste contexto com um recurso tangível, dotado de autor e de valor, o qual pode ser registado, possuído e trocado por outros ativos digitais ou físicos, e com capacidade de operar ações no mundo físico, nomeadamente quando representa informação executável (ou seja, software).

O uso da informação nesta nova realidade deve apoiar-se em regras de convivência sólidas, compatível com os valores civilizacionais que aceitamos no séc. XXI. A informação privada de um cidadão ou organização nunca deveria ser utilizada sem autorização, e a sua troca baseada em manifestas relações de confiança, suscetíveis de certificação por todos os intervenientes. Estão em causa registos de atos médicos, legais, académicos, de composição de medicamentos, de tráfego de veículos e de mercadorias, de conversas pessoais em videoconferências ou apps de mensagens: é impossível descrever que tipo e volume de dados vão ser gerados no mundo, previstos atingir 180 zeta (180 seguido de 21 zeros) bytes em 2025. Não se trata somente de proteger valores financeiros; de modo abrangente, trata-se de salvaguardar princípios universais de direito e ética relativos à privacidade, autoria, e rigor de todo o tipo de conteúdos, promovendo a transparência e segregando a contrainformação.

Os desafios são muitos e complexos. A original lógica de descentralização da internet, baseada em abordagens colaborativas e abertas, foi progressivamente sendo substituída por uma crescente concentração de recursos e controle. Para o bem e para o mal, sistemas como e-mail, comunicações por voz, texto ou vídeo, redes sociais e suporte geral de computação e armazenamento de dados, que são serviços infraestruturais utilizados por todos, estão a ser predominantemente fornecidos por um pequeno grupo de gigantes tecnológicos. Estas empresas detêm um poder unilateral de estabelecer as regras do jogo, talvez como recompensa providencial do seu esforço inovador.

Do ponto de vista social e político, será necessário continuar a aprofundar e a aperfeiçoar a educação e a legislação. Esta tarefa é exigente, e será tanto mais efetiva quanto mais simples e menos burocrática for, evitando criar obstáculos ao progresso, à inovação e à liberdade de expressão. Os valores do humanismo digital, da democracia, da ética, da inclusão, e da prestação de contas, devem prevalecer sobre as contingências tecnológicas.

Do ponto de vista técnico, é preciso privilegiar soluções que criem oportunidade para serviços mais descentralizados, transparentes e colaborativos. Tais modelos tenderão a explorar princípios de desenvolvimento e inovação aberta (open source), e revelam-se uma importante alavanca de aceleração criativa, incluindo, em particular, as tecnologias de registo por consenso distribuído imutável (blockchain). Neste paradigma emergente, produtores e consumidores de informação colaboram, de forma regulada, para manter a segurança, fiabilidade e propriedade da informação de cada um e de todos, permitindo suportar sistemas mais confiáveis e transparentes em todas as áreas – não apenas nas finanças e criptomoedas – promovendo a inovação participativa, o equilíbrio no acesso aos dados, ao conhecimento e ao valor da informação.

 

Professor Catedrático, Instituto
Superior Técnico e INESC-ID