Devemos nos concentrar em habilidades, em vez de ferramentas.
Se você trabalha em ciência de dados que você pode imediatamente pensar duas linguagens de programação: R e Python.Na verdade, R e Python propriamente dito é uma boa ferramenta, mas é geralmente considerado um concorrente. O artigo de hoje será recomendada para comparar os dois, em vez de tratá-los como duas opções.
Se você digitar R vs Python na barra de pesquisa do Google, você terá um monte de artigos sobre as vantagens de partido imediatamente.
Uma das razões para esse resultado é que as pessoas de acordo com sua ciência dados são divididos de acordo com a escolha da linguagem de programação utilizada para o acampamento, um acampamento e um campo de Python R. E que os dois campos não são muitas vezes em harmonia, em que os membros acreditam que sua língua é melhor que o outro. Então, de certa forma, essa diferença não é a ferramenta, mas sim -
Há muito poucos dados científicos de pessoas que utilizam tanto Python e R. Mas, na verdade, existem muitas pessoas que, embora apenas uma linguagem de programação, mas eles também querem usar algumas das características de outros softwares. Por exemplo, usuários de P às vezes querem usar os recursos orientados a objetos Python da máquina, o mesmo, alguns usuários do Python também querem usar a distribuição de R várias estatísticas.
A figura é o resultado da pesquisa realizada em Red Monk 2018 terceiro trimestre. Os dados da pesquisa vem de estouro de pilha e a popularidade da língua no Github, que mostra claramente a popularidade de R e Python são elevados. Portanto, não há razão inerente por que não podemos usar os dois ao mesmo tempo no mesmo projeto. Nosso objetivo final deve ser para melhor analisar e obter uma melhor compreensão, a escolha da linguagem de programação não deve ser um obstáculo para alcançar esse objetivo.
Vamos olhar línguas, bem como as suas vantagens e desvantagens.
píton
Desde o seu lançamento 1991, Python tem sido muito popular e amplamente utilizado no processamento de dados. As vantagens são:
· Linguagem orientada a objetos.
· Vasta gama de utilizações.
· Existem muitas extensões (funcionalidade) e forte apoio da comunidade.
Simples, fácil de entender e aprender.
· Em tais pandas pacotes, numpy e scikit-learn, Python é uma excelente escolha para as atividades de aprendizagem de máquina.
No entanto, a diferente R, Python há pacotes especiais para cálculos estatísticos.
RR A primeira versão foi lançada em 1995, e desde então se tornou uma das ferramentas mais comumente usado da indústria para dados científicos.
· Instalação pacote contém quase todas as aplicações estatísticas concebíveis. CRAN tem atualmente mais de 10k pacote.
* Equipado com um completo? biblioteca de visualização, como ggplot2.
· Ser capaz de realizar uma análise independente.
Bom desempenho da língua R não é a memória mais rápida, e às vezes até demais quando se trabalha com grandes conjuntos de dados.
Ao mesmo tempo, podemos usar a capacidade estatística e capacidades de programação Python de R? Quando nós pode facilmente incorporar código SQL em R ou Python roteiro, por que não misturar R e Python juntos?
Existem basicamente dois métodos podem ser usados simultaneamente em um projecto e R. Python
R usado em Python
· Pyper
(Http://bioinfo.ihb.ac.cn/softwares/PypeR/)
Pyper fornece uma maneira simples de acessar o Python através da linha R. Pyper também incluído no Python Package Index, que oferece uma instalação mais conveniente. Quando nenhuma transmissão de dados interactiva frequente entre o pitão e R, Pyper particularmente útil. Pipeline correndo por R, programa Python nas plataformas de sistema operacional do processo (incluindo Windows, GNU Linux e Mac OS) controle de sub-processos, controle de memória e flexibilidade pode ser alcançada em termos de portabilidade.
· PyRserve
(Https://pypi.org/project/pyRserve/)
pyRserve Rserve utilizado como gateway de conexão RPC. Através dessa conexão, R pode ser fornecido com Python variável, R pode ser uma chamada de função remota. R objetos como instâncias de uma classe implementada em Python descrito, em muitos casos, R como uma função de ligação destes objectos.
· Rpy2
(Https://rpy2.bitbucket.io/)
rpy2 executando um processo Python incorporado em R. Ele cria um quadro, ele pode ser convertido em objeto objetos R Python, passá-los para uma função de R, R e emite o de volta convertido em objeto Python. rpy2 mais comuns e em desenvolvimento ativo.
Uma vantagem de usar R em Python pode ser facilmente usado em pacote de software poderoso Python R, como ggplot2, tidyr, dplyr como. Como exemplo, Vamos olhar mapeamento como ggplot2 em Python.
· Cena Básico
https://rpy2.github.io/doc/latest/html/graphics.html#plot· Geometria
https://rpy2.github.io/doc/latest/html/graphics.html#geometryPitão usado em R
Podemos utilizar um método alternativo em que a execução de scripts em Python R seguinte:
· RJython
(Https://r-forge.r-project.org/projects/rjython/)
Este pacote conseguido através de interface Jython Python. Ele é projetado para que os outros pacotes podem ser incorporados código python juntamente com R.
· RPython
(Https://cran.r-project.org/web/packages/rPython/index.html)
rPython R é permitido para chamar um pacote Python. Ele é executado em R tal que o código Python, uma chamada de função, e recuperar distribuição variáveis possíveis.
· SnakeCharmR
(Https://github.com/asieira/SnakeCharmR)
SnakeCharmR é rPython versão moderna. É 'rPython' de um ramo, ele usa 'jsonlite' tem um monte de progresso e o lugar proporção rPython.
· PythonInR
(Https://bitbucket.org/Floooo/pythoninr/)
PythonInR de dentro, fornecendo funções interactivas com pitão, de forma que o R interna do Python com muita facilidade.
· Reticulate
(Https://github.com/rstudio/reticulate)
pacote Net fornece um conjunto abrangente de ferramentas para a interoperabilidade entre Python e R. Em todas as opções acima, este é o mais utilizado, mas também porque ele está sendo desenvolvido ativamente rstudio. Reticulate embutido no Python R sessão de conversa, sem costura, interoperabilidade de alto desempenho. Este pacote permite que você malha o código Python em R, para criar um novo projeto irá tecer duas línguas.
pacote Net oferece as seguintes instalações:
· Em várias maneiras de chamar Python de R, incluindo R Markdown, obter Python script para importação módulos Python e interativamente usando Python em sessão R.
A conversão entre objectos e Python · R (por exemplo, R e pandas entre os quadros de dados, ou entre R e conjunto de matriz NumPy).
ligamento flexível para diferentes versões do Python, incluindo ambientes virtuais e ambiente Conda.
R e Python são uma linguagem muito poderosa, qualquer língua são suficientes para executar tarefas de análise de dados. No entanto, este é certamente algumas vantagens e desvantagens de ambos, se somos capazes de tirar proveito de ambos, pode fazer melhor. Em qualquer caso, os dois plena compreensão nos permitirá trabalhar em mais ambientes.