Tegra K1 e de Denver, olhada nesses anos, temos sido mal compreendido NVIDIA CPU

Elevador NVIDIA, provavelmente 99% amigos + primeira reação foi "Gráficos" e "GPU". Um dos dois gigantes GPU, absolutamente campo dominante GPU Bem, o povo da Terra sabe, outro dia acaba de lançar uma nova arquitetura de Turing e RTX 2080Ti / 2080/2070 placa gráfica ainda.

Esta é realmente nada de errado, mas ao longo dos últimos anos, enquanto as pessoas entorpecer a poderosa GPU NVIDIA, parece que em algum lugar por cima de algo. GPU da NVIDIA forte ou não? explosão muito forte, forte, seja no PC ou SoC, para que todos possam ver, conhecido ...... emmm, em seguida, le?

Até que uma volta, enquanto a ver um quadro como esse:

Obviamente, este é um resumo breve do mercado mainstream SoC atual, a concisa vívida e fácil de entender. Mas para ver o último, eu imediatamente percebi que as pessoas ignoradas antes: como sobre CPU NVIDIA SoC, realmente como uma pintura no mapa, como ele?

CPU não funciona? Isso realmente satisfeito

Na verdade, design NVIDIA SoC não é estranho, até agora eles lançaram a 7ª geração da família Tegra de SoC. NVIDIA tem vindo a utilizar a sua própria GPU em arquitetura Tegra SoC, a parte CPU, mas as gerações anteriores utilizado é a versão pública do Braço núcleo da CPU. Comparado com o processador Qualcomm, Samsung, MediaTek no mesmo período, além de GPU externa "ancestral" há outro lugar fora de cor. Eu tenho um monte de telefones e tablets que usam processador Tegra, ainda longe de ser satisfatória.

Mas ainda mais do que só isso tempo, parece que não escolher NVIDIA SoC a CPU não há nada de errado. Tenho que dizer, eu não sei se o líder NVIDIA Huang Yong Joe mais perto de fãs hardcore da Apple, que não são as gerações de néon Tegra co-processador, capacidade de flash player pobre integrados. Quanto ao uso da versão pública do Braço núcleo da CPU, enquanto não falsa, mas ao mesmo período de MediaTek Texas Instruments da Samsung Huawei também são usados na versão pública do kernel.

Além do mais, a ambição NVIDIA e força na CPU, longe de estereótipos das pessoas pode ser medido.

Na CES 2011, a NVIDIA anunciou o plano de Denver, anunciou que será desenvolvido com base na arquitetura de auto-estudo Arm v864-bit conjunto de instruções, usou uma variedade de dispositivos de dispositivos móveis a servidores. CES 2014, depois de apenas três anos, a NVIDIA lançou um estudo sobre o uso de auto-Denver arquitetura Tegra K1, e assim se tornou o segundo consumidor depois de a Apple lançou baseado em ARM instrução v8 companhias nível definido SoC.

rollback tempo de quatro meses, em setembro de 2013, a Apple sobre o seu uso do processador A7 inesperadamente arquitetura Cyclone é baseado no braço v8 conjunto de instruções. Depois de mais de um ano o tempo, o mercado baseado em Braço conjunto de instruções v7 da arquitetura Cortex A15 ea versão pública da arquitetura Qualcomm Krait desde o inquérito, mesmo Cortex A57 também é baseado em Braço conjunto de instruções v8 incluindo, arquitetura de CPU, enquanto todos os outros períodos são varrido Cyclone.

Além de Denver.

De acordo com a rede de Lei Feng entende-se que a arquitetura CPU tradicional é dividido em dois tipos: a ordem de execução e de execução de ordens. Como o nome indica, a ordem de execução do sistema de execução microinstruction em estrita conformidade com a ordem de recepção, eo sistema de execução de ordens, a fim de permitir que o resultado da execução de ajuste da instrução, sem alterar a premissa.

Tem sido fora de ordem é considerado como uma evolução da ordem de execução de desenvolvimento para o limite. tarefa complexa executado pelo CPU, RAM e outros componentes periféricos executar a seqüência de instruções será bloqueado em alguns casos, fora do tempo de execução de ordens pode melhorar significativamente a flexibilidade de operação e, efetivamente, melhorar a taxa de transferência.

Antes da rede de Lei Feng introduzido Arm Cortex A76 arquitetura e artigo, execução de ordens Samsung Exynos M3 é mencionado mais de uma vez, visto nestes núcleo de alto desempenho Arm, execução de ordens parece ter se tornado a única opção. No entanto, para execução de ordens com a necessidade de janela de execução de ordens adicionais, efetivamente identificar instrução pode ser reordenada para garantir as instruções de segurança pode ser executada fora de ordem, o que, obviamente, levantou a complexidade da arquitetura, o tamanho do chip e consumo de energia será aumentado significativamente.

Enquanto NVIDIA é outro caminho para melhorar o desempenho da infraestrutura, que o único plano fora de ordem não é a resposta. Não só se atrevem a pensar, Denver realmente dar-se dominante Arm caminho para sair da versão pública fim de uma arquitetura de alto desempenho, a favor da execução da ordem comum do processador de baixo consumo de energia, juntamente com um eficiente e sua tradução binária e programa de otimização de código.

A idéia de NVIDIA é muito simples: problemas básicos enfrentados pelo sistema de execução de ordens é lembrança muito clara, pobre, nada menos do que os problemas de hardware estagnação, bem como filas de comando e outros problemas de software. Estes problemas devem ser difícil mudar o que a arquitetura do sistema, pode ser resolvido em uma "dimensão suave"? E esta é a idéia central de Denver.

A arquitectura invulgar

Denver um lugar incomum é que ele é um formato de instrução interna e ARMv7 ou ARMv8 diferente. Na estrutura interna específica, Denver usado no VLIW (Very Long Instruction Word, Instrução Longo Word) formato de instrução de execução bastante comum (depois da NVIDIA) GPU.

Na arquitectura de extremidade dianteira, Denver de descodificação de instruções largura atingiu 7 emissão sem precedentes (emissão 3) do que Cortex A15, A57 Cortex (4 emissão) e maçã ciclone (6 emissão) para ser mais larga. NVIDIA oficialmente chamado de "7+" arquitetura, onde "+" refere-se a Denver NVIDIA projetada DCO (otimizador de código dinâmico).

tarefa DCO é código de Braço em formato nativo de Denver, e otimizar o código para fazê-lo funcionar melhor em Denver. Em termos de CPU geral, DCO é o aspecto mais crítico, porque o seu desempenho irá determinar diretamente a DCO.

Ao longo dos anos, tem havido rumores de que Denver intenção original do desenho destinadas a x86, o desenho subjacente e binário mecanismo de tradução é projetado para não infringir a patente, sujeitos a qualquer execução de instruções x86 x86-compatível. Se esse rumor não é verdadeiro, o resultado final é NVIDIA tem resultados surpreendentes sobre o nível suave, para criar um conjunto de hardware podem ser projetados e conjunto de instruções arquitetura separação.

No entanto, apesar de tal um DCO Guards, NVIDIA ou para além de que ele é equipado com uma instrução decodificador Arm. Embora o funcionário disse que decodificador Arm não é um "pneu sobressalente", mas o verdadeiro ponto de vista é claramente "integridade boca demasiado corpo", mais instrução veio de Denver tradução binária, isto Arm largura instrução decodificador escassas 2 (nível Cortex A8 ), não só no manejo eficiente de tradução binária vai assumir decodificação de instrução direta Arm.

Ao mesmo tempo, devido à NVIDIA escolheu o caminho para resolver o problema na "dimensão suave", Denver também tem outras arquiteturas não têm a escalabilidade, a DCO se não houver melhoria, em seguida, a NVIDIA pode implantar ainda uma nova versão do DCO.

O desempenho real da final com um Denver sensacionais é suficiente para descrever, em teste SPECint2000, em comparação com Cortex A15 Denver com aumento médio de 35%, mesmo se a aumentar a velocidade de até 67%:

Mais específico, o uso do núcleo desempenho Tegra K1 Denver dominar completamente o mesmo núcleo período Cyclone da Apple A7, em comparação com Intel Haswell núcleo Celeron 2955U está de volta mútuo e para trás.

segundas intenções

Talvez um amigo para ver esta maravilha, já que a CPU do NVIDIA SoC não é apenas fraco, mas também como existe uma forte explosão e GPU, por NVIDIA no campo dos telemóveis e tablet tem sido não a lei, para finalmente apenas sair dela?

Simplesmente porque as pessoas simplesmente não acho que isso ah luta ......

E nós não têm medo de assistir a esses grandes coisas que um usuário normal, própria situação bastante clara da NVIDIA SoC. Como recentemente recrutado novo escritório, na banda base, o fim do pacote, o SDK, em termos de economia de energia e similares são as desvantagens, mercado e esses bits enraizada velho boi é o verdadeiro esforço para combater desaconselhável.

Texas Instruments tenho visto pessoas sair do campo de SoC de telefonia móvel em 2014, Tegra para a quarta geração para uso com milho 3 pode ser considerado do início ao fim, amigos fazem bem ......

Obviamente, NVIDIA SoC visto aplicações melhor --AI tais como plataformas de computação móvel de alto desempenho, isso significa que o piloto automático eo robô.

Nós experimentamos uma transição Tegra K1 eo Tegra X1, Tegra Parker (ie NVIDIA unidade PX) e finalmente com uma versão modificada da arquitetura Denver2 com sucesso embarcou no estágio piloto automático. E acaba de lançar este ano plataforma NVIDIA Jetson Xavier traz ainda mais forte para não amigos de arquitetura auto-estudo Carmel, que atingiu 10 decodificador de instrução largura com medo para o céu, Denver frente com base na frente de novo em um grande etapa.

De acordo com a rede de Lei Feng entender, no campo de chips AI estão agora em busca de operações AI puro design aerodinâmico, NVIDIA é o único a não desistir da CPU de alta performance, mas também a CPU, GPU, AI equilíbrio de três partes para fazer o melhor .

Assim, o ferro velho que não dizer NVIDIA "CPU não funciona com GPI" a, NVIDIA CPU não é muito ruim, mas é muito forte, forte para ter excedido sabemos esta dimensão ......

Este favorito Oscar Como boa aparência? comentário imprensa estrangeira em "Livro Verde": uma década um dos melhores filmes
Anterior
desempenho monstro inimaginável: avaliação detalhada Mi purificador de ar MAX
Próximo