Cada imagem vem com BGM? Oxford brother artefato de código aberto, realizar qualquer espectrograma de conversão de imagem

Treze do templo côncavo Relatório Qubit | Conta Pública QbitAI

Dando uma foto, você consegue imaginar o som?

Um chamado SpectroGraphic O artefato pode fazer isso.

Por exemplo, dada uma foto de "Shrek", através desta ferramenta, você pode gerar seu correspondente Espectrograma .

Espectrograma integrado de imagem

A maioria dos sons são combinações complexas de muitas ondas sonoras, e cada onda sonora tem uma frequência e intensidade diferente.

Espectrograma (espectrograma) É um método de expressão do som, seu eixo horizontal é o tempo e seu eixo vertical é o espectro de freqüência.

Exemplo de espectrograma

e SpectroGraphic O que se faz é obter uma imagem e simplesmente interpretá-la como um espectrograma.

Dessa forma, a imagem pode ser embutida no espectrograma por meio do som gerado.

Não é muito legal?

Agora que o projeto é de código aberto, todos podem experimentá-lo!

Instalação do projeto

Primeiro, execute o seguinte código para obter a ferramenta de linha de comando espectrográfica:

pipinstallspectrographic

Você também pode usar diretamente o arquivo espectrográfico.py na pasta autônoma \ como uma ferramenta de linha de comando.

Além disso, você também precisa garantir que todas as dependências mencionadas no arquivo requirements.txt sejam atendidas.

Você pode instalá-lo com o seguinte comando:

pipinstallrequirements.txt

Depois de usar o pip para instalar, basta executar o espectrográfico no console.

Ao usar scripts autônomos, deve ser usado python spectrographic.py.

Você também pode simplesmente importar a classe SpectroGraphic de SpectroGraphic.base.

Uso de ferramentas de linha de comando

uso: espectrográfico-iPATH_TO_IMAGE Turnanyimageintosound. argumentos opcionais: -h, - ajuda a mostrar essa mensagem de ajuda e sair - versões mostrar o número da versão do programa e sair -iPATH_TO_IMAGE, - imagePATH_TO_IMAGE Trajeto da imagem que desejamos incorporar no espectrograma. -dDURATION, - durationDURATION Duração do som gerado. -mMIN_FREQ, - min_freqMIN_FREQ Menor freqüência usada para desenhar a imagem. -MMAX_FREQ, - max_freqMAX_FREQ Maior freqüência usada para desenhar a imagem. -rRESOLUTION, - resolutionRESOLUTION Resolução vertical da imagem no espectrograma. -cCONTRAST, - contrastCONTRAST Contraste da imagem no espectrograma. -p, --playReproduz diretamente o som resultante. -sSAVE_FILE, - saveSAVE_FILE Pathto.wavfileinquevocêsavivar o som.

Se sua imagem de origem estiver em ./source.png, você deseja gerar áudio de 10s com uma faixa de frequência de 10kHz a 20kHz, também deseja salvá-lo como sound.wav e, por fim, reproduzir o áudio.

Em seguida, execute o seguinte código:

espectrográfico--image./source.png--min_freq10000--max_freq20000--duration10--savesound.wav--play

Se você estiver usando um script autônomo:

pythonspectrographic.py--image./source.png--min_freq10000--max_freq20000--duration10--savesound.wav--play

Sobre o autor

Certo: Levi Borodenko

Levi Borodenko, atualmente estudando para um mestrado em matemática e estatística na Universidade de Oxford. A pesquisa acadêmica se concentra em análise estocástica e aprendizado de máquina.

Graduado também estudou na Universidade de Oxford, atuou como conselheiro da PROMYS Oxford em 2017-2018 e atuou como conselheiro-chefe da PROMYS Boston em 2018-2019.

Mais projetos de código aberto podem visitar o seguinte link: https://github.com/LeviBorodenko

Portal

endereço do projeto: https://github.com/LeviBorodenko/spectrographic

Perfil pessoal: https://cv.levib.dev/

- Terminar -

Qubit QbitAI · Toutiao assinado

Preste atenção em nós e obtenha os últimos desenvolvimentos em tecnologia de ponta

2019CCF Prêmios Conferência e presidente da inauguração foi realizada em Pequim
Anterior
A ferramenta mais otimização do compilador comum! MIT edifício, a taxa de precisão é cinco vezes os métodos tradicionais
Próximo