| Academia Chinesa de Ciências: a TDNN de duas fases de uma rede profundidade de pontuação auto ensaio independente orientada a objeto

O! Extraordinária Outra onda atingiu o topo vai secar papel!

9-10 de Junho de 2018, representantes da academia e de cima evento de networking da indústria - por Information Processing Comitê da Juventude do chinês Society e Baidu organizados conjuntamente [ "AIS2018 (ACL, IJCAI, sr) trabalhos serão pré-falar" ] Grand realizada em Pequim. Dentro de dois dias, a partir de "análise de sentimentos" "sistema de recomendação" "máquina de Q & A", "sistema de diálogo" e outros documentos de conferências de nível superior relatórios diferentes temas juntos, o herói Xiang Xi, Huashan Mountain.

É o monarca núcleo é entendido que esta vai falar no popular círculos nível pré-acadêmicas totalmente além da imaginação dos organizadores, o registo é aberto apenas alguns dias em um abrangente plena capacidade, e que os organizadores tiveram condições estabelecidas para triagem de participantes.

Jun mídia atividades como núcleo de ler este pré Palestras seguirá toda a Assembléia Geral, como gravar todo o evento na vanguarda de vista, as conquistas mais valiosas e artigos convidados vão falar sobre pré-relatório lançado conjuntamente pelos leitores e amigos palestras série de texto pré-definido, o top irá mostrar-lhe os resultados do último papel.

leitores núcleo ler jornais grupo de troca de cirurgia, por favor, adicionar pequenas séries Micro sinal: zhizhizhuji . Esperando por você.

ACL 2018

TDNN: a automática ensaio rede profundidade de pontuação em duas etapas independentes de orientação temática

TDNN: Um dois estágios profunda da Rede Neural para Prompt independente Ensaio Scoring Automated

Academia Chinesa de Ciências

Academia Chinesa de Ciências

[Introdução] escrita estudante é geralmente baseada em um determinado tema escreveu com temas diferentes composição correspondentes são geralmente diferente no uso do vocabulário, estrutura de ensaio. Portanto, para um modelo de ensaio de pontuação automatizado, num ensaio sobre o tema da pontuação tem sido conjunto de dados de treinamento, e, em seguida, prever em outro tema dos conjuntos de dados ensaio, é difícil obter uma boa previsão. A maioria dos estudos existentes são classificados no mesmo modelo de treinamento e predição sobre a escrita de conjuntos de dados, eles usam um monte de recursos relacionados ao tema, como a relevância do tema, peso tf-idf palavras corretas, etc. isso levou a uma formação modelo de composição resultante é difícil generalizar para outros conjuntos de dados com diferentes temas. Para resolver este problema, propomos um algoritmo automatizado ensaio de pontuação chamado TDNN duas etapas, primeiro um modelo de ensaio de pontuação automatizada com as características da formação sobre diferentes temas não relacionados ao tema dos dados pontuação ensaio foi definido, e depois usar o modelo para alvo cada tópico ensaio de jogar uma pontuação pseudo-marca; na segunda etapa, selecione a pontuação pseudo-marca do tópico alvo nos dois extremos do ensaio como um amostras positivas e negativas, e, em seguida, com base na formação de uma profundidade de rede neural modelo, o modelo com o tema da meta, como a pontuação final de cada ensaio previsto pontuações. Os resultados experimentais mostram que a automática TDNN algoritmo ensaio de pontuação de dois estágios proposto neste trabalho e ter alguma melhoria em relação à linha de base.

contribuição

1, propõe um quadro de aprendizagem de dois estágios para resolver problemas Ensaio Automatizado Scoring Modelo de ausência do tema alvo dos dados de treinamento de aprendizagem.

2, propôs um novo modelo de pontuação Ensaio redes neurais profundidade automatizado que leva em conta as partes semânticas do discurso e características estrutura gramatical ensaio.

3, uma solução especial para os problemas ensaio de pontuação automática cena de tópicos e experiências com conjuntos de dados padrão demonstra o mais rápido possível a eficácia do método.

2 Métodos

quadro TDNN do algoritmo proposto é mostrado na Figura 1, é dividido em temas e tópicos relacionados ao estágio independente de palco. No âmbito deste trabalho, em primeiro lugar, outros temas foram treinar uma pontuação modelo na coleta de dados classificação, utilizando apenas recurso off-topic e esperança de realizar uma avaliação preliminar da composição sem considerar o tema do ensaio. Especificamente, esse modelo de treinamento em um RankSVM em sete temas diferentes graduada composição conjunto de dados de treinamento, as razões para o uso de vários temas é para evitar o excesso de ajuste de modelo para um determinado tópico. Cada modelo é treinado pontuação ensaio tópico destino RankSVM, dezenas convertido em , respectivamente, e pontuação selecção e composição assunto alvo como o negativo e amostra positiva pseudo pseudo amostra, que servirá como a próxima fase dos dados de treinamento.

Intuitivamente, a qualidade da maior parte da escrita é no meio dos dois extremos, quer fazer uma avaliação precisa da necessidade de uma melhor compreensão deles, considere fazer informações tema-relacionado se torna mais importante. Para atingir este objetivo, usamos uma rede neural para distinguir profundidade nos dois extremos dos temas alvo de ensaio, treinando dados obtidos a partir da etapa anterior, a esperança de que através da formação permite que a rede se lembrar do que uma boa escrita características. A profundidade do modelo de rede neural proposto mostrado na Figura 2, a fusão do modelo a partir de três peças, isto é, componentes semânticos.

Parte da fala fracção de etiquetagem e, componentes semânticos gramaticais e secção de codificação de fala, respectivamente, obtidas por frases duplas LSTM e sequencialmente escrita referidas porções de estrutura de sintaxe obtidos por duplas sucessivamente frases LSTM, frases e escrever FIG. Finalmente, a composição de três partes obtido como a composição final representada por ligar a referida saída traseira pela composição conexão pontuação total mapeamento camada.

3 resultados

aqui usado, o conjunto de dados de pontuação Ensaio PAEA automatizada, o conjunto de dados contém oito tópicos ensaio diferentes, 20% experimento forma de validação cruzada de índice de avaliação, usando o segundo coeficiente de Kappa, Pearson e coeficiente coeficiente de Spearman. Os resultados mostrados na tabela seguinte:

Como mostrado na tabela acima, o método proposto é mais evidente na maioria dos casos, para aumentar o efeito. Porção da segunda fase pode ser visto que a profundidade de três redes neurais, a porção de sintaxe tem um papel importante, é possível obter a parte semântica em combinação com os melhores resultados.

2019 Beijing montante exame vestibular para 500 pontos ou mais pode aplicar para a escola
Anterior
KPL Super host, em seguida, atualizar a percepção, provocando LOL e glória dos jogadores Rei agitando guerra de palavras
Próximo