Robótica Inteligente: a IA no Mundo Físico

A aplicação desta tecnologia ao mundo físico apresenta desafios de uma dimensão incomparavelmente maior que a IA limitada ao mundo digital.

A Inteligência Artificial (IA), conceito que, no seu sentido lato, surgiu no encontro de Dartmouth em 1956, idealizado por McCarthy, Minsky, Shannon e outros, tem passado por ciclos de entusiasmo e desânimo, conhecidos como “verões” e “invernos” da IA. Neste momento estamos a viver um dos mais empolgantes verões da IA, centrado nos desenvolvimentos da sua corrente conexionista, impulsionados por inovações significativas no campo das redes neuronais, especialmente com o advento dos transformadores (transformers) e grandes modelos de linguagem (large language models – LLM), como o GPT, Claude e outros. Hoje, a IA é frequentemente associada à aprendizagem automática (machine learning).

Nos últimos anos, os avanços têm sido notáveis e acelerados, quer no plano académico, quer no plano comercial, com centenas de novos artigos científicos sobre o tema a serem publicados diariamente, e um crescimento da valorização comercial de áreas como a visão por computador ou a compreensão de linguagem natural, com as empresas da área a dominar o mercado de capitais. Este impulso apresenta um impacto indubitável nas nossas vidas e tem atraído a atenção de governos e organizações internacionais, como a União Europeia ou a ONU, que buscam regulamentar e planear o uso futuro destas tecnologias.

Uma questão importante a considerar é se estamos a aproximar-nos do momento em que a IA poderá ultrapassar a inteligência humana, tornando-se uma inteligência geral capaz de resolver uma ampla gama de problemas. Penso que essa aproximação atual, a existir, se manterá limitada ao mundo digital – o mundo dos chatbots, dos diálogos textuais, da descrição e criação de imagens, da interação através de texto, voz e imagem. Não discuto aqui se alguma vez atingiremos a inteligência geral artificial, mas se a atingirmos teremos seguramente de o fazer através da interação de máquinas dotadas de inteligência artificial com o mundo físico, movendo-se nele, atuando sobre ele, apanhando e transportando objetos, conduzindo veículos, e interagindo com humanos.

Este é o domínio da robótica inteligente, que envolve máquinas com um corpo dotadas não só da capacidade de sensoriar o mundo envolvente, como de atuar sobre ele. Embora os robôs industriais e sistemas automatizados já operem há décadas, os robôs inteligentes enfrentam outros desafios maiores, como perceber e compreender o ambiente e tomar decisões autonomamente sobre como atuar sobre ele, nomeadamente numa grande diversidade de situações que impede a listagem prévia de todas as ocorrências possíveis e do que fazer com elas. Esta capacidade de consciência situacional (situational awareness) e de generalizar a tomada de decisão a situações não previamente enfrentadas é muito importante para tornar os robôs mais inteligentes e já está a beneficiar dos avanços da aprendizagem automática. Mas a aplicação desta tecnologia ao mundo físico apresenta desafios de uma dimensão incomparavelmente maior que a IA limitada ao mundo digital.

Os progressos da aprendizagem automática nos últimos anos foram essencialmente alicerçados no aumento de capacidade computacional (em velocidade dos processadores e armazenamento de memória) e da disponibilidade de dados. O ChatGPT, por exemplo, foi treinado para realizar uma função com 175 mil milhões de parâmetros a partir de aproximadamente 600 Gb de texto na Internet. Noutro exemplo, a deteção de objetos em imagens beneficiou da disponibilidade de uma gigantesca quantidade de imagens que podem ser usadas para treinar as respetivas redes neuronais, e da realidade aumentada, que permite criar imagens dos mesmos objetos vistos de diversos pontos de vista, mesmo aqueles eventualmente não disponíveis online.

Aprender desta forma em robótica é lento e perigoso para os robôs. Apesar da possibilidade de aprender através de vídeos acessíveis online, que o robô usa para visualizar determinadas ações e realizá-las por imitação, esses vídeos estão disponíveis em muito menor escala que as imagens e o texto do mundo digital, e a execução das ações leva tempo e está sujeita a incertezas no sensoriamento e no resultado da sua aplicação. Estas incertezas podem inclusivamente colocar em risco a integridade física da máquina: imagine-se um robô com rodas a aprender a evitar escadas que tivesse de cair por estas abaixo várias vezes antes de aprender o seu objetivo.

O futuro está na Robótica Inteligente, onde a interação dos algoritmos de aprendizagem automática com o mundo físico, e o uso de algoritmos que integram modelos matemáticos (que nalguns casos conhecemos bem e não necessitamos aprender) e soluções aprendidas diretamente dos dados, apresentam os grandes desafios da investigação nestas áreas. Esse futuro está próximo, registando-se um crescimento significativo de investigação nesta área não só na academia, mas principalmente em empresas que apostam em desenvolver sistemas com sucesso comercial. Já assistimos ao aparecimento de robôs especializados (aspiradores, automóveis autónomos), mas aos poucos poderemos começar a sonhar com o robô capaz de desempenhar várias tarefas domésticas nas nossas casas.

Professor do Instituto Superior Técnico, U. Lisboa

Opinião