O código aberto da Huawei usa apenas redes neurais aditivas: estagiários lideram a criação, o efeito não perde a CNN tradicional

Xiaocha do Templo de Aofei Relatório Qubit | Número público QbitAI

Você se atreve a imaginar uma rede neural sem multiplicação? Seja uma operação de neurônio único ou uma operação de convolução, é inevitável usar a multiplicação.

No entanto, a multiplicação consome muito mais recursos de hardware do que a adição. Se você não usar a multiplicação, todas as adições deverão aumentar a velocidade do cálculo.

No final do ano passado, pesquisadores da Universidade de Pequim, do Ark Lab da Huawei Noah e do Pengcheng Lab colocaram em prática essa idéia e propuseram uma rede neural que utiliza apenas AdderNet (Rede Adder). O primeiro é um estagiário da Huawei Noah's Ark e atualmente estuda em Bosan III na Universidade de Pequim.

Hoje, este artigo foi incluído no CVPR 2020 (Oral) e o código fonte oficial também está aberto no GitHub. Os alunos interessados podem experimentar.

Introdução à rede Adder

O núcleo da rede do somador é: Substitua a distância euclidiana pela distância L1 .

A distância L1 é a soma do valor absoluto da diferença de coordenadas entre dois pontos, portanto todo o processo não envolve multiplicação.

Sob essa nova definição, a operação derivada parcial usada na retropropagação também se tornou um método de subtração. O processo de otimização da descida do gradiente também é chamado Symbol SGD (SignSGD).

Sob a nova definição da rede de somadores, a distribuição espacial dos vetores de características também é muito diferente da CNN.

Então, qual é o efeito real do AdderNet?

Na tarefa de classificação de imagens do CIFAR-10, o AdderNet melhorou bastante o desempenho da rede neural aditiva BNN proposta por Bengio et al., E esteve próxima dos resultados da CNN tradicional.

código fonte aberto

O AdderNet oficial é baseado em Python3 e PyTorch.

Primeiro prepare o conjunto de dados do ImageNet de acordo com a documentação oficial do PyTorch, execute o programa para avaliar seu efeito no conjunto de verificação:

python test.py - caminho_do_dados 'caminho / para / imagenet_root /'

O AdderNet pode atingir a precisão Top 1 de 74,9% e a precisão Top 5 de 91,7% no conjunto de dados ImageNet.

Ou faça o download do conjunto de dados CIFAR-10 para o local e teste seu efeito no CIFAR-10

python test.py - dataet cifar10 - modelos_dir models / ResNet20-AdderNet.pth - data_dir 'path / to / cifar10_root /'

No entanto, a AdderNet ainda precisa treinar sozinha, e o funcionário disse que lançará o modelo pré-treinado em breve.

O autor disse na página inicial do projeto que, como o AdderNet é implementado com um filtro de adição, a velocidade do raciocínio é lenta e precisa ser escrita em CUDA para aumentar a velocidade.

Isso ainda está distante da intenção original do autor de aumentar a velocidade das operações da rede neural.

Mas o autor deste artigo disse que continuará adicionando pesquisas em redes neurais e publicando mais resultados.Vamos aguardar ansiosamente o novo progresso dessa pesquisa.

Estagiários da Huawei Noah Lab lideram a criação

O artigo da AdderNet é chamado Chen Hanting Formado no Departamento de Matemática da Universidade de Tongji, atualmente estuda um Ph.D. na Escola de Ciência da Informação e Tecnologia da Universidade de Pequim e também é estagiário no Laboratório de Arca da Huawei Noah.

Nos primeiros três anos de estudos de mestrado e doutorado, ele publicou 5 trabalhos como um trabalho, um dos quais "Aprendizagem sem dados de redes de estudantes" foi incluído no ICCV 2019, e esteve envolvido em muitos trabalhos e também foi incluído no NeuroIPS, IJCAI , ICML e outro top serão incluídos.

Portal

Código fonte: https://github.com/huawei-noah/AdderNet

Endereço da tese: https://arxiv.org/abs/1912.13200

- Terminar -

Qubit QbitAI · Assinatura de título

Siga-nos e conheça as últimas tendências tecnológicas

Ali Dharma Instituto de Matemática Olimpíada exposição exame! Limite de 48 horas a 4 questão, se agora pode pegar

GPU salvar o mundo: NVIDIA & Stanford pediu doações contar força para promover novas drogas coroar Computing Research

Baidu ilegal engenheiro de controle da empresa servidor "mineração": 4 meses para ganhar 100.000, condenado a 3 anos de prisão

March 15, 2020

Após 47 dias de guerra de primeira linha apoio "batalha", depois dos Estados Unidos e 95 pequenas guarda "Por favor, envie namorado"

March 16, 2020

História Chronicle leitura noite 237 Shu Yong Kang prevenção de doenças libertação precoce "praga"

March 16, 2020

Atlas Special Edition Volkswagen número oficial divulgado esta primavera ou

April 2, 2020

500.000 proprietários de veículos globais irão beneficiar Kia Motors estendida usuários afetados garantia do veículo epidemia mundial

April 2, 2020

Amor Chi-hwan novo impulso produto equidade 24h experimentação livre completo para experimentar a profundidade à vontade

April 2, 2020

Desenvolver novos negócios / tecnologia A Hyundai Motor construirá o "Global Innovation Center"

April 2, 2020

O espaço é maior do que o Lexus ES, o carro nacional mais forte atingiu administrativa, Guangzhou Automobile Chi Chuan GA8 estará disponível em junho

April 2, 2020

Início quarentena muito chato? Este carro Toyota entrega gratuita modelo origami

April 2, 2020

Sobre Silk Road

Categorias

Partilha