Os cientistas estão criando IA que pode esmagar a melhor IA do mundo

AIAs pessoas agora aceitam que nunca serão tão boas no xadrez quanto os robôs, mas agora até os robôs precisam aceitar que nunca serão tão boas quanto os outros robôs!

Uma nova plataforma de inteligência artificial, conhecida como AlphaZero, pode aprender a jogar Go, xadrez e shogi sem intervenção humana. Usando redes neurais profundas, o AlphaZero aprendeu rapidamente como jogar cada jogo “para ser o melhor jogador da história”.

O AlphaZero foi revelado pela DeepMind Technologies em um estudo publicado na Science em 6 de novembro. A DeepMind, uma subsidiária britânica da empresa de inteligência artificial Alphabet, empresa controladora do Google, está envolvida com a Go AI há muitos anos. Em 2017, o DeepMind retirou o ex-campeão de IA AlphaGo, mas continuou a lidar com a IA. Com o AlphaZero, a pesquisa do DeepMind atingiu seu auge.

O programa enfrentou a melhor IA do mundo em três jogos de tabuleiro:

  • Bacalhau, campeão mundial de xadrez AI
  • elmo, vencedor do 27º Campeonato Mundial de Shogi de Computador em 2017
  • AlphaGo Zero, o Go AI do DeepMind, o jogador Go mais poderoso da história
  • De qualquer forma, o AlphaZero apenas adquiriu conhecimento sobre as regras básicas do jogo. Antes de enfrentar o resto da IA, ele jogou milhões de jogos contra si mesmo, começando com táticas aleatórias e tentando vencer, mas lentamente aprendeu quais estratégias funcionam melhor por meio de um processo de tentativa e erro chamado aprendizado por reforço.

    O processo de treinamento e aprendizado levou nove horas para o xadrez, 12 horas para o shogi e 13 dias para o Go, usando 5.000 TPUs (unidades de processamento tensor). Um único TPU pode processar mais de 100 milhões de fotos por dia no Google Fotos. Assim que terminou de aprender, o AlphaZero competiu com o resto. E esmague-os!

    O que é único no estudo é que o algoritmo de aprendizado foi combinado com um “método de busca” chamado Monte Carlo Tree Search (MCTS). É assim que os programas do Go AI determinam que ação a seguir. A equipe do DeepMind usou o mesmo sistema para xadrez e shogi, mostrando pela primeira vez que ele poderia ser adaptado a outros jogos complexos.

    Talvez o mais interessante para os jogadores de xadrez seja o fato de o AlphaZero, sem ter mãos humanas, poder e construir seu conhecimento, implementando estratégias e idéias inovadoras que nunca viram antes. Seu estilo agressivo e sua peça extremamente dinâmica surpreenderam o grande mestre de xadrez, Matthew Sadler, que falou sobre isso no blog do DeepMind.

    Essas estratégias e habilidades exclusivas tornam o AlphaZero uma ótima ferramenta de ensino para jogadores de xadrez.

    O domínio da inteligência artificial sobre os seres humanos é bastante comum no mundo dos jogos, com robôs nos conquistando para jogos de tabuleiro, videogames complexos como Dota 2 e, claro, Go.

    Isso significa que a IA está pronta para literalmente nos derrotar em qualquer jogo competitivo já inventado? Felizmente não. Embora os três jogos usados ​​pelo DeepMind sejam extremamente complexos, eles oferecem algumas vantagens para a IA, pois incluem dois jogadores e todas as informações necessárias para a próxima jogada são sempre visíveis.

    Então, embora eles definitivamente tenham assumido o papel de campeão em jogos como xadrez, os robôs provavelmente nunca nos vencerão no Texas Hold ‘Em.