主要分类
-
任务型对话系统

- 目标:帮助用户完成特定任务(如订票、查询天气)。
- 特点:需理解用户意图、维护对话状态、调用外部API。
- 示例:客服助手、智能家居控制。
-
问答系统
- 目标:回答用户事实性问题。
- 类型:
- 基于知识库的问答(KBQA)
- 基于文档的问答(如阅读理解)
- 常见问题解答(FAQ)
- 示例:IBM Watson、搜索引擎问答片段。
-
闲聊系统
- 目标:开放领域对话,提供情感陪伴或娱乐。
- 特点:无需执行任务,侧重语言流畅性和趣味性。
- 示例:微软小冰、Replika。
-
多模态对话系统
- 目标:融合文本、语音、图像等多模态输入/输出。
- 示例:车载助手(结合语音和视觉)。
基本架构(以任务型为例)
-
自然语言理解(NLU)
- 意图识别:判断用户意图(如“订机票”)。
- 槽位填充:提取关键参数(如目的地、日期)。
- 示例:用户说“明天北京天气如何?” → 意图:
查询天气,槽位:时间=明天,地点=北京。
-
对话状态跟踪(DST)
- 维护对话历史,整合多轮信息,形成当前状态(belief state)。
- 方法:基于规则、统计模型或深度学习(如BERT)。
-
对话策略(Policy)
- 根据当前状态决定系统动作(如询问缺失信息、调用API)。
- 方法:规则、强化学习(如DQN)。
-
自然语言生成(NLG)
- 将系统动作转化为自然语言回复。
- 方法:模板填充、序列到序列模型(如GPT)。
关键技术
- NLU模型:传统方法(SVM、CRF) → 深度学习(RNN、Transformer)。
- 状态跟踪:常用框架如BERT-DST、TRADE。
- 策略学习:强化学习与用户模拟器结合训练。
- 端到端系统:基于大模型(如GPT-4)直接生成回复,简化流水线。
评估方法
-
自动评估
- 任务型:成功率、对话长度。
- 生成式:BLEU、ROUGE(与参考回复对比)。
- 局限性:难以衡量连贯性、个性化等。
-
人工评估
- 常用维度:流畅度、相关性、用户满意度。
- 更可靠,但成本高。
主要挑战
- 上下文理解:处理指代、省略(如“它”、“那个”)。
- 个性化与一致性:保持人设、记忆历史偏好。
- 知识整合:动态接入外部知识(如数据库、网页)。
- 低资源场景:小数据下有效学习。
- 安全与伦理:避免偏见、有害内容生成。
未来方向
- 大模型驱动:GPT、ChatGPT等提升对话能力。
- 多模态融合:结合视觉、语音实现更自然交互。
- 情感智能:识别并适应用户情绪。
- 持续学习:在线适应新领域、新用户。
- 人机协作:系统作为助手与人类共同完成任务。
学习资源
- 经典教材:《Speech and Language Processing》(Jurafsky & Martin)。
- 开源工具:Rasa(任务型)、Hugging Face Transformers(生成式)。
- 数据集:MultiWOZ(任务型)、DailyDialog(闲聊)。
希望这份梳理能帮助您快速入门,如需深入某个方向,可进一步探讨!
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。