Algoritmo usado no sistema Pluribus poderá ser aproveitado em aplicações que vão de estratégias de negociação a jogos de guerra

 

A inteligência artificial (IA) já é capaz de derrotar os melhores humanos em jogos de estratégia como xadrez e go, mas nunca havia feito isso em disputas que podem envolver mais de um participante e situações de blefe, como o pôquer. A barreira foi vencida, segundo um estudo publicado na revista “Science” e abordado no jornal “The Guardian”: o programa Pluribus venceu uma maratona de 12 dias na qual competiu com cinco profissionais de elite do pôquer de cada vez.

Segundo os inventores do programa, Tuomas Sandholm e seu aluno de doutorado Noam Brown, da Universidade Carnegie Mellon, nos EUA, o Pluribus representa um marco significativo no desenvolvimento da IA. O sistema ganhou US$ 48 mil em mais de 10 mil mãos (rodadas) jogadas na modalidade mais praticada de pôquer, o Texas hold’em, contra cinco jogadores selecionados diariamente de uma lista de profissionais que se dispuseram a passar pela experiência. Cada um desses jogadores já havia acumulado pelo menos US$ 1 milhão com o pôquer.

 

LEIA TAMBÉM: Algoritmo de aprendizado de máquina faz descobertas científicas

 

Houve um precursor do Pluribus, o Libratus, que há dois anos bateu os melhores profissionais de pôquer da época, mas jogando um contra um. O Pluribus aprendeu o jogo praticando-o milhares de vezes contra cópias suas. “É a primeira vez que a IA atinge um desempenho sobre-humano em um jogo multiplayer”, afirmou Sandholm.

 

Variedade de aplicações

A capacidade de vencer cinco jogadores ao mesmo tempo em um jogo tão complexo abre novas oportunidades para a IA enfrentar problemas do mundo real, diz ele. Para Sandholm, o algoritmo do programa poderá ser futuramente aproveitado em aplicações que variam de investimentos bancários e estratégias de negociação a jogos de guerra e a decisões sobre quanto os candidatos políticos americanos devem gastar em publicidade em diferentes mídias e estados.

Sean Ruane, um dos adversários do Pluribus, considerou o programa um oponente complicado. “Em um jogo que, na maioria das vezes, recompensa-o quando você exibe disciplina mental, foco e consistência, e certamente o castiga quando você não tem nenhum dos três, competindo por horas a fio contra um robô que obviamente não precisa se preocupar com essas deficiências é uma tarefa cansativa”, afirmou.