核心定义
- 意图:用户希望通过语句达到的目标,查询天气”、“订机票”、“投诉”。
- 实体:语句中的关键信息参数(如时间、地点),意图识别常与实体抽取结合,形成完整的语义理解。
典型流程
-
输入预处理

- 文本清洗:去除噪声、纠错、标准化。
- 分词/分字:将文本转换为处理单元(英文常用词,中文需分词)。
- 向量化:将文本转换为数值表示(如词袋模型、词嵌入)。
-
特征提取
- 传统方法:提取词性、关键词、句法结构等特征。
- 深度学习方法:通过神经网络自动学习特征(如CNN、RNN、Transformer)。
-
意图分类
- 将输入映射到预定义的意图类别(如“问候”、“查询”、“操作”)。
- 常用模型:
- 传统模型:SVM、随机森林(依赖手工特征)。
- 深度学习模型:FastText、TextCNN、BERT等(端到端自动学习)。
-
输出与置信度
- 输出最可能的意图标签,并给出置信度分数。
- 低置信度时可触发澄清或兜底回复。
关键技术方法
基于规则的方法
- 使用正则表达式或模板匹配关键词(如“天气” → 查询天气意图)。
- 优点:简单、可解释、无需训练数据。
- 缺点:泛化能力差,难以处理复杂表达。
基于机器学习的方法
- 有监督学习:需要标注数据(语句+意图标签),训练分类模型。
- 少样本/零样本学习:解决数据稀缺问题(如使用Prompt tuning、元学习)。
基于深度学习的方法
- 预训练模型:BERT、RoBERTa等通过微调实现高精度识别。
- 联合模型:同时进行意图识别和实体抽取(多任务学习)。
- 上下文感知:考虑对话历史(如使用LSTM、Transformer编码上下文)。
应用场景
- 智能客服:自动判断用户咨询类型并转接或回复。
- 语音助手:理解“播放音乐”、“设闹钟”等指令。
- 搜索引擎:识别搜索意图(导航型、信息型、交易型)。
- 机器人流程自动化:解析用户指令以触发业务流程。
挑战与趋势
- 挑战:
- 语义歧义(“苹果”指水果还是公司?)。
- 长尾意图覆盖(罕见意图识别困难)。
- 多语言、跨领域适应性。
- 趋势:
- 大语言模型(LLM)的意图理解能力。
- 低资源场景下的意图发现(无监督聚类)。
- 融合常识和知识图谱增强推理。
简单示例
用户输入:“明天北京天气怎么样?”
- 意图类别:
查询天气 - 实体:时间=
明天,地点=北京 - 系统通过分类模型判断意图,并提取实体参数,进而调用天气API。
意图识别的核心是将自然语言映射到结构化意图,依赖特征工程或深度学习模型从数据中学习语义模式,随着预训练模型的发展,意图识别的准确率和泛化能力显著提升,已成为人机交互的基石技术。
版权声明:除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。