Artificial Intelligence

   

Deep Reinforcement Learning for Visual Question Answering

Authors: Ayoub Abraich

La conception de bout en bout des systèmes de dialogue est récemment devenue un sujet de recherche populaire grâce à des outils puissants tels que des architectures codeur-décodeur pour l'apprentissage séquence à séquence. Pourtant, la plupart des approches actuelles considèrent la gestion du dialogue homme-machine comme un problème d’apprentissage supervisé, visant à prédire la prochaine déclaration d’un participant, compte tenu de l’historique complet du dialogue. Cette vision est aussi simpliste pour rendre le problème de planification intrinsèque inhérent au dialogue ainsi que sa nature enracinée, rendant le contexte d'un dialogue plus vaste que seulement l'historique. C’est la raison pour laquelle seules les tâches de bavardage et de réponse aux questions ont été traitées jusqu’à présent en utilisant des architectures de bout en bout. Dans ce rapport, nous présentons une méthode d’apprentissage par renforcement profond permettant d’optimiser les dialogues axés sur les tâches, basés sur l’algorithme policy gradient. Cette approche est testée sur un ensemble de données de 120 000 dialogues collectés via Mechanical Turk et fournit des résultats encourageants pour résoudre à la fois le problème de la génération de dialogues naturels et la tâche de découvrir un objet spécifique dans une image complexe.

Comments: 131 Pages.

Download: PDF

Submission history

[v1] 2019-09-03 07:24:43

Unique-IP document downloads: 9 times

Vixra.org is a pre-print repository rather than a journal. Articles hosted may not yet have been verified by peer-review and should be treated as preliminary. In particular, anything that appears to include financial or legal advice or proposed medical treatments should be treated with due caution. Vixra.org will not be responsible for any consequences of actions that result from any form of use of any documents on this website.

Add your own feedback and questions here:
You are equally welcome to be positive or negative about any paper but please be polite. If you are being critical you must mention at least one specific error, otherwise your comment will be deleted as unhelpful.

comments powered by Disqus