Alpha yuan veio limites de fazer máquina imaginação humana?

Quem teria pensado, vamos continuamente atualizar duas vezes dentro de um ano AlphaGo? Alpha yuan sobre a forma de aprender rapidamente e crescer batida AlphaGo Lee AlphaGo Mestre de notícias não repeti-los aqui, dar duas informações chave para os leitores a pensar em conjunto.

Primeiro, as células humanas alfa deixar de entrada de dados registro, puramente por auto xadrez, contam com a capacidade de aprendizagem reforço agora é feita.

Em segundo lugar, Alpha empregos yuan e eficiência do treinamento foi muito melhorada, em apenas três dias para ser capaz de bater o Alpha Dog original, enquanto no raciocínio, Alpha yuan levou apenas quatro TPU.

Alpha razão yuan sacudiu toda a indústria, porque quando pensamos mestre Deuses, que conta a uso humano de três dias, o mais alto nível do pensamento humano, na frente da máquina não vale a pena mencionar. A experiência humana tornou-se um empecilho para a Alpha Dog, se livrar desses algoritmos pode ser mais rápido e melhor completar a tarefa.

Para muitas pessoas, este é um grande golpe: estamos orgulhosos de dados grandes, não só algoritmo enganosa vai consumir mais recursos de computação, o que dificulta o desenvolvimento da inteligência geral artificial.

A tarefa principal deste artigo é para aplacar o pânico humana. A primeira pergunta para começar a falar, olhar para Alpha yuan no final é como melhorar a eficiência computacional.

Aprender com supervisão para fortalecer a aprendizagem

Antes do xadrez xadrez homem-máquina, um computador utiliza um método de força bruta de estimar as possibilidades quando o confronto entre os dois lados, através da velocidade de operação para ganhar. Pode exaustivas método uma vez foi considerado inadequado para Go, cada passo será a criação de um 19 × 19 possível, a quantidade de computação é muito grande.

Até que as pessoas começaram a ir para resolver o problema com a rede neural convolutional, redução convolução boa dimensão da rede neural para reduzir o espaço de busca, a máquina terá que superar possibilidade humana.

Na versão mestre da Alpha Dog derrotado Jie Ke, a plena aplicação da política da camada de rede rede 40 / valor, o primeiro é usado para determinar a situação atual, prever o próximo movimento, a rede é utilizada para determinar o valor de kibitzer ganhar duas partes . Além disso, se juntar ao subsistema de ir mais rápido para a despesa de um pouco sob a premissa de jogar qualidade xadrez, alta aumentar a velocidade de computação. Finalmente, e em seguida, o algoritmo de busca árvore Monte Carlo para conectar três ou mais.

O yuan Alpha diretamente para redes de políticas e redes de valor combinado e removido rapidamente ir subsistema. Ou seja, o Alpha Dog nos últimos três componentes hoje diretamente em um todo.

Depois de simplificação, a estratégia + valor recurso de entrada da rede foi reduzida de 48 a 17, mais o apagado ir rapidamente subsistema, conhecimento básico sobre xadrez humano foram removidas.

Pode ser visto a partir da figura, não há yuan alfa do conhecimento humano, muitas vezes há algum do jogo de xadrez estranho ilógico nos estágios iniciais de auto-xadrez, você pode, numa fase posterior, mas sempre capaz de ter um jogo surpresa.

Após o treinamento os jogadores divididos em dois ignorante, ele começou a jogar xadrez, o vencedor com os resultados aparecem, em seguida, continuar o ciclo de jogos - para remover o recurso de entrada conhecido conhecimento humano, os meios para a Alpha aprendizagem yuan reforço de aprendizagem supervisionada .

E avançar para o reforço de aprendizagem, não só por causa da remoção da supervisão de xadrez humano, bem como a aplicação residual na rede. rede residual pode ser entendida como uma rede neural convolução para aprofundar, em termos simples, que é o de minimizar os neurónios de cada camada da rede, e a rede de fazer mais profunda. Combinado com Alpha yuan movimento de aprendizado por reforço de aprendizagem supervisionada, reduzindo os recursos de entrada, mas também benéfico para toda a rede neural para fazer mais simples e bruto.

Em suma, o foco recai Alpha yuan, remova os recursos humanos necessários para Go conhecimento de computação, a rede fez mais profunda, de modo que Alpha yuan em redes cada vez mais profundas encontram-se conhecimento.

O Alpha yuan fez.

Livrar-se de dados, inteligência artificial universal para vir?

Então, Alpha yuan foco é melhorar a eficiência, remover a supervisão de dados humanos, será possível para alcançar a otimização da estrutura.

Em seguida, a mesma rotina, ele pode ser aplicado em outras áreas?

A resposta é provavelmente a decepcionar.

Primeiro de tudo, este jogo Go matemática em si é regras transparentes de cálculo, eo anterior Mestre Lee, usando nada mais do que simples expediente quando não estiver em raciocínio. Outras áreas não pode ser usado para acessar regras transparentes, aprendizagem profunda pode não ser tão fácil de usar.

Este ano DeepMind Caso Challenge é um dos "StarCraft" e dividir o jogo em vários cenários de simulação em uma tentativa de resolver o problema de treino de simulação global distribuída. Disponível agora, os resultados não são satisfatórios. Afinal, ambiente de informação incompleta, capacidade de planejamento de longo prazo, o teste de capacidades de colaboração multi-agentes são muito duras a. Máquinas não são necessariamente uma boa imitação da experiência humana, para não mencionar inteiramente no próprio aparelho.

Em reforço de aprendizagem, a situação é mais provável de ocorrer é a máquina simplesmente obter recompensa sob uma única condição, não pode levar em conta todo o processo de ambiente multi-tasking.

Jogo como este, que em outras áreas de reconhecimento de voz, reconhecimento de imagem e assim por diante, o valor dos dados é ainda mais importante. Agora proposta aprendizado por reforço = inteligência artificial universal, muito cedo.

Assim, não é necessário porque jogo falha matemática foi para negar o valor da existência humana. Para usar seus próprios pontos fracos e fortes da máquina em comparação com, ele é o mais coisas sem sentido.

A imaginação humana limita a máquina de fazer?

A menção de fraquezas humanas, teria que dizer informação interessante encontrada nas células alfa e mestre em xadrez. Típica, está sob a influência dos seres humanos, Mestre muitas vezes para optima local. Enquanto alguns estão nas mãos de Go Go vai aprender apenas jogo de toque, Alpha yuan, mas pode ser encontrado em uma fase muito tardia do treinamento.

Nós costumam comentar com a educação escolar palavras, é regras humanas limitar a imaginação da máquina.

Tudo isso nos faz lembrar de duas coisas, em primeiro lugar, devido à limitada capacidade dos seres humanos, que muitas vezes limitado a convergência local, sem se dar conta, e, portanto, vai afetar a capacidade de aprendizagem de máquina; ruído informações do segundo, big data não pode ser ignorado.

Em outras palavras, se você sempre dependem do nível da experiência humana e de dados, contando com a aprendizagem de máquina, inteligência artificial é na melhor das hipóteses um determinado cérebro humano Haoshi.

O sucesso de The Alpha yuan não está nos dizendo para confiar em reforço aprender a ignorar as limitações de dados de grandes dimensões, e até mesmo as limitações da própria humanidade?

Embora reforço aprendizagem em muitas cenas não existe uma regra clara também fraco desempenho, mas se podemos criar um ambiente de simulação, tentam reinterpretar essas perguntas básicas que nós tomamos para concedido com reforço de aprendizagem? Por exemplo, a composição eo movimento das moléculas e até mesmo a base física, isso pode afetar o material, biológico e assim o campo, tem a imaginação ilimitada.

Alpha yuan para promover a inteligência artificial universal, embora limitado, mas revelou-se possível resolver mais problemas com reforço de aprendizagem acessível. No futuro, podemos esperar cena mais comercial, reforço olhar aprender aprendizagem de máquina não é realmente fazer mais uso do espaço.

Como a matemática infância má pessoa, eu sou aceitação muito calmo de seu fracasso - como seres humanos, o nosso poder de computação é realmente perdeu uma grande parte da máquina. Os obtidos por cálculo pela inteligência, não necessariamente claramente mais brilhante do que a máquina.

O significado da nossa existência não não posso contar, mas a sua capacidade de colocar em um sistema mais avançado, a desempenhar um papel mais poderoso. Assim como não havia sido derrotado calculadora, embora no cálculo desta matéria, Alpha yuan excel. Pode pensar em outro ângulo, nós mesmos, como o inventor do algoritmo, para assistir suas criações compensar a falta de sua capacidade, não é uma criação de Deus deve ser exposto como um sorriso isso?

conteúdo mais interessante, a atenção da mídia de titânio micro sinal (ID: taimeiti), titânio ou baixar media App

Devon comunidade a mesma chamada cortina do palco, ver Zuo Yi gesto pode distinguir público geracional: velho Guo ainda poderosa
Anterior
190.228 antecedência sozinho é solitário, com Huang Jin Luhai você não vai estar em uma luta!
Próximo