Em um importante passo que nos deixa um pouco mais próximos do inevitável apocalipse robô, pesquisadores do MIT desenvolveram um sistema que ensina robôs como assimilar novas habilidades e então ensinar essas habilidades para diferentes tipos de robôs.
O sistema se chama C-LEARN e foi desenvolvido por pesquisadores do Computer Science and Artificial Intelligence Laboratory (CSAIL), do MIT. Usando o C-LEARN, pessoas que não têm experiência com programação de computadores podem ensinar um robô a executar uma tarefa, como colocar um frasco em um balde, ou puxar um bastão de um contêiner, providenciando algumas regras básicas sobre a tarefa e permitindo ao robô ver uma única demonstração da tarefa sendo completada.
Incrivelmente, um robô pode então transferir esse conhecimento recém-assimilado para outro robô, mesmo que o robô aprendendo seja fisicamente diferente do robô que ensina. Eventualmente, o sistema C-LEARN pode permitir que fábricas utilizem uma porção de robôs diferentes e não se preocupem em programar cada um deles individualmente. Pode também ajudar robôs a aprender rapidamente e ensinar novas tarefas em situações de grande pressão, como quando estiverem ocupados exterminando toda a espécie humana, ou, em um exemplo mais prático, quando estiverem desativando bombas.
O C-LEARN aplica dois princípios básicos do aprendizado de robôs: aprender a partir de uma demonstração e aprender por programação bruta, em que cada parâmetro físico precisa ser codificado à mão por um especialista. Sozinhas, essas estratégias de ensino têm desvantagens. Com demonstrações, os robôs não podem realmente aplicar as lições para outras situações ou ambientes; com os métodos de planejamento motor, o ensino leva muito tempo e trabalho. As pesquisadoras da CSAIL Claudia Pérez-D’Arpino e Julie Shah combinaram esses dois princípios para compensar as deficiências de cada um.
“Ao combinar a intuitividade do aprendizado por demonstração com a precisão dos algoritmos de planejamento motor, essa abordagem pode ajudar robôs a desempenhar novos tipos de tarefas que eles nunca aprenderam antes, como montagem de múltiplos estágios usando ambos os braços”, disse Pérez-D’Arpino no MIT News.
O primeiro passo do processo de ensino é providenciar ao robô a informação de como alcançar ou segurar vários objetos em diferentes restrições (o “C” do C-LEARN quer dizer ‘constraints’ [restrições, em inglês]). Por exemplo, mesmo que diversos objetos possam ser parecidos em formato, como uma direção e um pneu, um conjunto diferente de movimentos é necessário para instalar essas partes a um carro. Para o segundo estágio, um operador humano usa uma interface de usuário 3D para mostrar ao robô como completar a tarefa. Nos testes, depois de observar uma única demonstração, os robôs foram capazes de acessar sua base de conhecimento e fazer o movimento sugerido para o operador aprovar ou modificá-lo conforme necessário. Se não houver operador, o robô pode escolher sozinho (escolhendo sozinhos, os robôs foram bem sucedidos em 87,5% das vezes, ao contrário dos 100% quando humanos ajudaram).
“Essa abordagem na verdade é bem similar a como os humanos aprendem, em termos de ver como algo é feito e conectando isso ao que já sabemos sobre o mundo”, disse Pérez-D’Arpino. “Nós não podemos aprender magicamente de uma única demonstração, então nós pegamos a nova informação e a relacionamos com conhecimento anterior sobre o nosso ambiente.”
Também é importante notar que esse conhecimento pode ser ensinado a outro robô. No laboratório, os pesquisadores da CSAIL ensinaram um conjunto de tarefas a Optimus, um robô de dois braços desenvolvido para tarefas de desarmamento de bombas. Depois, ele transferiu seu conhecimento sem problemas para Atlas, um imponente robô bípede que pesa mais de 180 quilos. Ao final do experimento, ambos os robôs conseguiam abrir portas, transportar objetos e puxar objetos de dentro de contêineres, mesmo que os robôs tivessem diferenças físicas dramáticas e o Atlas nunca tivesse recebido habilidades diretamente de um humano.
O C-LEARN é um avanço importante porque, ao invés de imitar um movimento diretamente, o robô precisa inferir os princípios por trás do movimento, uma abordagem mais próxima dos humanos. Nós não repetimos cada ação física que aprendemos de maneira literal. Em vez disso, integramos o que estamos aprendendo por meio de demonstrações e então aplicamos o nosso conhecimento em contextos similares.
Um artigo descrevendo o C-LEARN foi aceito na IEEE International Conference on Robotics and Automation (ICRA), que vai acontecer de 20 de maio a 3 de junho em Singapura.
Imagem do topo: Black Hole
FONTE: GIZMODO BRASIL
Comentários
Postar um comentário