Aprendizado por Reforço para Sistemas de Diálogo Falado (Reinforcement Learning for Spoken Dialogue Systems)
![]() |
Fonte: CommLab. |
O aprendizado por repetição ou aprendizado por reforço (Reinforcement Learning) é um dos métodos de aprendizado de máquina (Machine Learning) aplicado às tecnologias de Inteligência Artificial (IA). Em síntese, o método pode ser explicado como uma ciência estratégica de tomada de decisão ou uma maneira ótima de se tomar decisões.
No aprendizado por reforço não existe supervisor, somente um sinal de recompensa ou um número real que diz ao agente o quão boa ou ruim foi a ação dele. O agente pode gastar algum tempo explorando o ambiente até que ele finalmente atinja o objetivo, ou seja, depois de entender quais foram as ações boas e ruins que ele tomou.
No artigo divulgado neste post os autores fazem uma análise sobre a implementação desse método inovador de tomada de decisão em sistemas automáticos de diálogo. Aqui os autores também destacam o uso de uma ferramenta desenvolvida por eles aplicada a experimentos com humanos sobre sistemas de diálogo falado.
Nas palavras dos próprios autores (abaixo traduzidas), pode-se notar que os resultados foram satisfatórios:
“Nossos experimentos demonstram que o aprendizado por reforço para sistemas de diálogo [...] imediatamente, são promissores como uma ferramenta para navegação e entendimento de correlações em corpora de diálogo complexo e temporalmente dependente. Tais correlações podem levar a melhorias incrementais, mas importantes, nos sistemas já existentes. “
O artigo Reinforcement Learning for Spoken Dialogue Systems completo pode ser acessado na página Repositório do Blog.
Comments
Post a Comment