professor de Oxford Tucao DeepMind mente rede neural, estes multi-agente recomendado Papers aprender

Verão B a partir do fundo do não-Temple recesso

Qubit produzido | número Público QbitAI

DeepMind Recentemente, uma tela de escova de papel:

Em Teoria da máquina of Mind em, DeepMind proposto " Teoria máquina of Mind de rede "ToMnet Vamos AI inteligente compreensão de suas próprias emoções eo corpo físico de inteligência ambiente, intenções, desejos, e assim por diante. Eles afirmaram valor de tal papel no resumo do papel: Um passo importante na promoção do desenvolvimento da AI interpretability.

endereço de papéis: https: //arxiv.org/abs/1802.07740

E um atualizar a cada papel ao longo da história, bandeira ficar muito alto, é claro, vai provocar oposição.

A questão, muitos de nós estão familiarizados com o professor Marcus, mas Universidade de Oxford professor associado de ciência da computação Shimon (Shimon Whiteson).

Shimon na semana passada depois de ler este artigo, provavelmente muito acúmulo coração ponto calha, depois rajadas de 10 Twitter quer cuspir rápido. Ele diz:

Eu realmente gosto da idéia deste trabalho, utilizando a abordagem de ensino-meta para a modelagem para os adversários. No entanto, a profundidade de aprender a papéis de escrita círculo desses problemas, este trabalho é um exemplo deplorável!

Falando de "círculo de aprendizagem profunda esses problemas", você provavelmente pode pensar em um problema comum: Ao longo reivindicação .

Um passo importante?

Shimon visa, é reivindicações DeepMind de "passo importante".

"Um passo importante" tal posição um, mesmo que essas novas idéias, novos conceitos, novos problemas papel seminal On, usando-os também cauteloso, para não mencionar DeepMind este, em qualquer caso, longe de ser inovador.

Shimon criticar o jornal, ele não disse campo teórico, experimental leva um jogo-like simples, sobre a contribuição de algoritmos é insignificante, mas alguma da arquitectura da rede processo de engenharia. Se você pode encontrá-lo "um passo importante", só pode ser feita qualquer grandes idéias novas, certo?

A nova idéia não é nova, olhar para essa parte da "pesquisa". Mas este papel não é ...... secção Work Related ......

amnésia aprendizagem profunda

Isso também envolve o estudo em profundidade dos pontos de vista de pessoas de fora outro grande círculo Azeri: o círculo não vai ler seus papéis de escrita antes da literatura relevante? Os pesquisadores também dedicados a este problema um nome, chamado de "amnésia aprendizagem profunda (Deep Aprendizagem Amnésia)".

papel de volta DeepMind si. Shimon pensar que este papel está preocupado principalmente com o corpo campo multi-agente não é um assunto popular de estudo: Oponente Modeling (Modelagem oponente). No entanto, o texto não menciona o conceito do começo ao fim.

No domínio da aprendizagem multi-agente, há uma longa história de método bem conhecido chamado contramedidas fictícios (jogo fictício), DeepMind menção não são mencionados; multi-agente de modelos ambientes oponente, existe um quadro completo de raciocínio, chamada interativo parte considerável do processo de tomada de decisão (Interactive POMDPs), DeepMind também completamente ignorada.

Shimon bater na lousa o professor: os alunos, casualmente navegar mais de um agente para aprender no artigo de revisão, estes documentos são encaminhados para o ah!

Mas DeepMind este, literatura citada contornado seu campo, que toca um monte de conversa e teoria Bayesiana da mente.

Para a "amnésia" esta questão, uma para papel, DeepMind pesquisador Neil Rabinowitz respondeu no Twitter, eles estão cientes desses documentos, mas não sabe como na introdução de referências para esquecer. Agora, a segunda edição atualizada do papel no arXiv, estes documentos foram adicionados à referência.

"Investigação"

No entanto, a maioria dos jornais têm uma "pesquisa" na seção, ou não escrever.

A este respeito, há um Tucao vem espectadores quando disse: ou nós damos DeepMind um crowdsourcing "pesquisa", certo?

Este não é claramente uma solução viável, mas para os estudantes que querem aprender a amá-lo, não olhe para esta coisa non-paper, a aprendizagem multi-agente nesta área, há uma série de revisão de literatura pode ser lida.

Shimon em duas listas:

Uma pesquisa abrangente de multiagentes Reinforcement Learning

A Framework for Sequential Planejamento em Multi-Agente Configurações

https://www.jair.org/media/1579/live-1579-2391-jair.pdf

A multidão Katja Hofmann também contribuiu um artigo:

Autónoma Agentes Modelando Outros agentes: uma pesquisa abrangente e aberto Problemas

https://arxiv.org/abs/1709.08071

Sobre Shimon

O fogo em DeepMind Shimon é um professor associado de ciência da computação e inteligência artificial, aprendizado de máquina direção da Universidade de Oxford investigação, liderada Giro (Whiteson Research Lab), principalmente relacionado com o campo de estudo de reforço de aprendizagem, aprendizagem profunda, etc., e seu uso em robótica, jogos, recuperação de informação aplicação on.

Ele levou os alunos publicados muitos conhecido poços papéis, como LipNet, como a cooperação e Pieter Abbeel de Aprendizagem com a consciência-Learning adversário e assim por diante.

Giro laboratório de fotografia, quarto da direita para Shimon

Para saber mais sobre o professor Shimon, você pode ir para casa ver seus laboratórios: http: //whirl.cs.ox.ac.uk/

- FIM -

recrutamento sincero

Qubits estão recrutando editor / repórter, com sede em Zhongguancun de Beijing. Esperamos talentosos, estudantes entusiasmados para se juntar a nós! Detalhes, por favor qubit número público da interface de diálogo (QbitAI), responder palavra "recrutamento".

Qubit QbitAI · manchetes sobre a assinatura de

' ' rastrear novas tecnologias e produtos AI dinâmicos

Você deve comprar Cowarts depois de 90?
Anterior
No Iraque, o campeonato ficou surpreso ao ver "javali" Davis
Próximo