Slide 1: boa noite, eu me chamo Ricardo, e vou continuar a apresentação passando uma visão geral dos domínios que o processamento de linguagem natural pode atuar. Primeiramente, vou falar do uso de PLN em sistemas de reconhecimento de voz.Trata-se do reconhecimento da voz humana por computadores, sendo uma forma de deixar a interface de comunicação entre o computador e o ser humano mais amigável. Slide 2: dentro da área de reconhecimento de voz, podemos citar os digitadores automáticos, que funcionam como geradores de texto automáticos, a partir do reconhecimento da voz do usuário. Uma outra aplicação seria para o controle de determinados sistemas, que executam ações através de comandos de voz. Por fim, podemos citar também a área de segurança, onde as pessoas seriam reconhecidas através da voz. Slide 3:os sistemas de reconhecimento de voz podem ser divididos em dois grupos: sistemas de reconhecimento de voz discreta e de voz contínua. Os sistemas de voz discreta interpretam poucas palavras por unidade de tempo, ou seja, as palavras, para serem entendidas pelo sistema, devem ser faladas de forma pausada. Esse processo utiliza menor quantidade de processamento, mas tem um tempo de resposta pior, que pode causar a insatisfação, dependendo do tipo de produto que está com esse sistema implantado. São programas muito utilizados no reconhecimento de comandos do usuário, como os bots que filtram os usuários nas áreas de telemarketing. Sistemas de reconhecimento de voz contínua: são aqueles que conseguem ter o entendimento de uma frase inteira, se a necessidade de falar palavras pausadamente.São sistemas que exigem muito mais do processador, devido à complexidade existente no processo de separação de palavras. Agora, explicando um pouco as etapas para o computador conseguir fazer o reconhecimento de voz: Slide 4: primeiramente, temos a conversão analógico-digital. O som inteligível ao ser humano consiste em ondas de frequência que variam de 20 a 20000hz, ou seja, ao falarmos, o que entendemos está sendo emitindo dentro dessa faixa de frequência, que o computador trabalha para fazer a conversão em sinal digital. Slide 5: temos agora o reconhecimento das palavras e sentenças, que consiste na tentativa de encontrar sentenças/palavras a partir do sinal digital recebido. Esta consiste na principal parte do software de reconhecimento de voz, onde os desenvolvedores concentram os seus esforços. Slide 6:análise do sinal e extração dos parâmetros: como a captação da voz gera uma qtde muito grande de bits a serem consumidos no sistema, antes de ser analisada, a informação recebe algum tipo de tratamento, reduzindo o conteúdo da informação, mas sem que ela perca a sua representatividade. Slide 7: essa etapa consiste na verificação do fim da captação do sinal, ou seja, saber distinguir quando uma palavra ou sentença chegou ao fim, para poder iniciar o processo de análise, e não carregar ruídos ou sentenças que não tenham ligações com a sentença a ser analisada. Slide 8: agora, vou falar da etapa que consiste em normalizar a frequência e o tempo da palavra/sentença a ser analisada: como pessoas diferentes tendem a falar em tons diferentes, com tempos diferentes de pronunciação das mesmas palavras, é necessário fazer essa normalização, a fim de evitar que as mesmas palavras sejam tratadas de forma diferente dentro do sistema. Slide 9: após a ocorrência das etapas anteriores (que não necessariamente devem ser executadas na ordem que eu expliquei), ocorre o reconhecimento, que é a verificação do padrão recebido dentro da sua base de conhecimento. Slide 10: agora vou passar os problemas que acontecem em sistemas de reconhecimento de voz: - Temos o problema das entonações de vozes, que podem variar de pessoa p/ pessoa, podendo causar problemas de interpretação de sentenças iguais; - Temos a ambiguidade de sentenças que tenham o mesmo som, por exemplo, "mais feijão é bom" pode ser interpretado pelo sistema como "mas feijão é bom", alterando o sentido da sentença; - Problemas de iterferência de rúidos externos; - Retrabalho excessivo ao passar uma mesma aplicação para outra linguagem, devido às diferentes características de cultura, gramática, ortografia. Não se trata de uma simples tradução do sistema. - Problemas de distinção de letras maiúsculas e minúsculas, principalmente no alemão, onde os substantivos são escritos em letra maiúscula. Slide 11: agora vou passar uma rápida explicação do uso de PLN em sistemas de reconhecimento de escrita, que consistem basicamente no reconhecimento de letras de fôrma através de algoritmos de reconhecimento de padrões. Em geral, esse reconhecimento ocorre através de uma matriz, que vai mapear o caractere. Quanto maior o tamanho da matriz, maior a precisão na identificação do caractere, porém, maior o tempo de processamento. Na imagem, temos uma aplicação de rede neural na identificação do caractere, onde os sinais entram pelos nós, até ser decodificado no caractere. Slide 12: outro uso do PLN se dá na produção de voz a partir de texto, que consiste na geração de áudio a partir de um texto, ferramenta muito utilizada no auxílio d pessoas com problemas de visão. Slide 13: por fim, temos a análise textual, área onde o PLN é mais aplicado, possuindo diversos produtos desse tipo no mercado. Dentre as aplicações desse tipo, temos os sistemas de correção automática de texto, buscas de conteúdo, geradores de resumos e tradutores automáticos. Porém, essas aplicações ainda dependem da intervenção humana, devido a sua imprecisão em alguns casos. O Sérgio vai explicar agora um exemplo para mostrar como funciona a análise do texto no contexto do PLN.