面向嘈杂语音的对话建模新挑战

张开发
2026/6/11 19:56:31 15 分钟阅读
面向嘈杂语音的对话建模新挑战
某机构宣布了一项名为“基于语音对话的知识导向任务型对话建模”的新研究挑战旨在提高对话式人工智能在涉及嘈杂语音输入的现实场景中的鲁棒性。该挑战已被接纳为第十届对话系统技术挑战赛DSTC10的一个赛道DSTC10是推动对话系统发展的领先研究挑战的最新一届。该机构的挑战包含两个赛道对话状态追踪和知识导向的任务型对话建模。在这两种情况下目标都是开发在输入为真实语音信号而不仅仅是文本时也能良好工作的模型。对话状态追踪是对话研究领域研究最广泛的问题之一。它涉及在整个对话过程中估计和追踪用户的目标。该机构在去年的DSTC上引入了知识导向的任务型对话建模。其目标是利用在线信息来补充通过特定应用程序接口获得的信息。例如一个基于对话的酒店预订代理可以访问房间价格和可用性等信息。但如果预订房间的用户询问酒店停车费用代理可能必须从酒店网站的常见问题解答中检索该信息。大多数关于这两个问题的研究都使用了仅包含书面对话的公共数据集这使得模型与实际涉及语音输入的应用场景之间存在差距。在新的某机构挑战中参与者将使用任何公共数据其中大部分仍然包含书面对话为其中一项或两项任务开发对话系统。然而最终评估将使用语音数据鼓励参赛团队专注于构建鲁棒的系统。“本次挑战的目标是弥合学术研究与实际应用之间的差距”某机构Alexa AI组织的一位高级应用科学家表示。“我们希望激发算法灵感以在实践中构建更鲁棒的对话系统这是以往挑战和数据集未能解决的问题。”DSTC自2011年起每年举办一次。去年某机构的赛道“具有非结构化知识访问的任务型对话建模”是最成功的赛道共收到24个团队提交的105个竞争系统。今年某机构的提案再次被选为DSTC的四个主要赛道之一。挑战报名将持续到9月21日欢迎来自学术界、工业界以及非营利组织和政府机构的研究团队参与。某机构已为挑战参与者以及该领域的其他研究人员开源了开发数据、评估脚本和基线系统。FINISHED更多精彩内容 请关注我的个人公众号 公众号办公AI智能小助手或者 我的个人博客 https://blog.qife122.com/对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号网络安全技术点滴分享

更多文章