目录
7️⃣ 深入理解常用依存关系标签
在依存句法分析中,dep_
字段的值 就是所谓的“依存关系标签”。这些标签帮助我们理解词与词之间的语法关系。
虽然标签数量很多,但常用的掌握 10~15 个即可覆盖大多数场景。
7.1 主要标签讲解
标签 | 说明 | 示例 |
---|---|---|
ROOT |
句子的根(通常是谓语动词) | "我 喜欢 学习。" → "喜欢" 是 ROOT |
nsubj |
名词性主语 | "我 喜欢 学习。" → "我" 是 nsubj |
obj |
直接宾语 | "我喜欢 学习。" → "学习" 是 obj |
iobj |
间接宾语 | "他送给 我 一本书。" → "我" 是 iobj |
obl |
介词宾语/状语(Oblique nominal) | "他在 图书馆 学习。" → "图书馆" 是 obl |
advmod |
副词修饰语 | "他 认真地 学习。" → "认真地" 是 advmod |
amod |
形容词修饰名词 | "漂亮的 女孩" → "漂亮的" 是 amod |
compound |
复合词(前置修饰) | "人工 智能" → "人工" 是 compound |
det |
限定词(如冠词、数量词) | "一 本书" → "一" 是 det |
case |
介词 | "在 图书馆" → "在" 是 case |
mark |
从属连词(引导从句) | "我希望 如果 有时间 ..." → "如果" 是 mark |
conj |
并列关系 | "我喜欢 学习 和 运动。" → "运动" 是 conj |
cc |
并列连词 | "我喜欢学习 和 运动。" → "和" 是 cc |
punct |
标点符号 | "学习。" → "。" 是 punct |
7.2 典型结构示意图
假设句子:
小明在图书馆认真地读书。
依存树如下逻辑:
读书(ROOT)
|
┌─────────┼─────────────┐
小明(nsubj) 图书馆(obl) 认真地(advmod)
↑
在(case)
解释:
"读书" 是句子的核心谓语,
ROOT
"小明" 是主语,
nsubj
"图书馆" 是介词宾语,
obl
,由 "在" (case
) 介词引导"认真地" 是副词修饰语,
advmod
7.3 常用组合模式
主谓宾(SVO)
nsubj → ROOT → obj
主谓(SV)
nsubj → ROOT
状语(状词修饰动词)
advmod → ROOT
介宾短语
case → obl → ROOT
7.4 应用建议
信息抽取:重点关注
nsubj
、obj
、obl
,可提取三元组。生成增强:通过
advmod
、amod
等找到修饰成分,增强生成语言风格。事件抽取:通过
ROOT
、nsubj
、obj
组合确定事件结构。QA 系统:根据依存树裁剪长句、理解疑问句结构。
结语
掌握依存句法分析是 NLP 开发中非常重要的一环。通过 SpaCy 这样高效易用的工具,可以帮助你轻松构建各种基于依存关系的 NLP 应用场景。
👉 建议实践:多分析常见文本,熟悉标签分布 + 自定义规则提取。