图数据库neo4j部分用法浅讲

发布于:2025-06-17 ⋅ 阅读:(17) ⋅ 点赞:(0)

图数据库neo4j部分用法浅讲

一、简单介绍

1、✅ 简要说明

Neo4j 是基于图结构的数据存储系统,与传统的关系型数据库(如 MySQL、PostgreSQL)不同,它使用节点(Node)、关系(Relationship)和属性(Property)来存储和查询数据。

2、📌 核心概念

概念 说明
节点(Node) 表示实体,例如:人、地点、产品等,相当于关系型数据库中的一行记录
关系(Relationship) 表示节点之间的连接和关系,关系是图数据库的核心优势
属性(Property) 存储在节点或关系上的键值对,例如:name, age, time 等
标签(Label) 给节点分类的标识,例如:Person, Company
Cypher 查询语言 Neo4j 使用的类 SQL 的图查询语言,用来创建、查询、更新图数据

3、🧠 为什么使用图数据库?

  • 更适合处理复杂关系(例如:社交网络、推荐系统、交通网络)
  • 查询关系路径(path)效率高,不需要 JOIN 多表
  • 更直观的数据建模

二、neo4j桌面版

在这里插入图片描述

1、🧭 左侧导航栏(Sidebar)

Data services
  • Local instances(本地实例):显示你在本机上运行的所有 Neo4j 实例,如 addressSearch。

  • Remote connections(远程连接):用于连接 Neo4j Aura 或其他远程服务器上的 Neo4j 实例。

  • Import(导入):用于导入 CSV、JSON、GraphML 等数据文件进入数据库。

Tools

  • Query(查询):进入 Cypher 查询编辑器,执行查询语句。
  • Explore(探索):图形化地浏览图数据库中的数据节点和关系。

About

  • Settings(设置):修改 Neo4j Desktop 的全局设置,比如 JDK 路径、插件管理等。

三、Neo4j 的 Cypher语言

1、 查询

MATCH (p:poi)
RETURN keys(p), p
LIMIT 100
1.1 详细解释
MATCH (p:poi)

查找图中所有标签为 poi 的节点,并将它们绑定到变量 p。

  • p:是一个变量名,代表匹配到的节点。
  • :poi:是标签(label),表示我们只关注拥有 poi 标签的节点。
  • MATCH:是 Cypher 查询中用于模式匹配的关键字,相当于 SQL 的 FROM + JOIN,用于从图中查找结构
RETURN keys§, p

返回每个 poi 节点的:

  • keys§:该节点的所有属性名称(即字段名、键名)
  • p:整个节点对象,包括其所有属性值

2、添加新的字段

MATCH (p:poi)
SET p.location = point({longitude: toFloat(p.lng), latitude: toFloat(p.lat)})
2.1 详细解释
🔹 MATCH (p:poi)
  • 匹配所有带有 poi 标签的节点。
  • 把每个匹配的节点赋值给变量 p。
SET p.location = …
  • 对每个匹配到的节点,**设置(或覆盖)**一个名为 location 的新属性。
  • 这个属性将被赋值为一个 point 类型(地理坐标点)。
🔹 point({longitude: …, latitude: …})

Neo4j 中支持 原生地理空间类型,point() 是一个函数,用来创建一个地理坐标点。

  • longitude: 经度,对应东-西方向。
  • latitude: 纬度,对应北-南方向。

这个点会是 WGS-84 坐标系中的一个 2D 点(默认 SRID 为 4326)

3、构建“就近关系”图谱

MATCH (a:POI), (b:POI)
WHERE id(a) < id(b) AND point.distance(a.location, b.location) < 500
MERGE (a)-[:NEARBY]->(b)
3.1 详细解释
🔹 MATCH (a:POI), (b:POI)
  • 匹配所有 POI 标签的节点对 (a, b)。
  • 这会产生 所有可能的两两组合(即笛卡尔积)。
  • ⚠️ 如果有 n 个 POI 节点,组合总数是 n²,因此加上 WHERE 限制很重要
🔹 WHERE id(a) < id(b)
  • 防止重复组合和自连接:

    • 例如 (a, b) 和 (b, a) 是一样的距离关系,只需要创建一条。
    • 同时 a != b,避免自己连自己。
  • id(a) 是 Neo4j 内部自动生成的唯一节点 ID

🔹 point.distance(a.location, b.location) < 500
  • 使用 point.distance 函数计算两个点之间的直线(欧几里得)距离(单位:米,基于 WGS84 坐标)。
  • 这里表示:a 和 b 节点之间的距离小于 500 米。
  • 前提是两个节点的 location 属性都必须是 point 类型(即之前你设置的那种):
SET p.location = point({latitude: ..., longitude: ...})
🔹 MERGE (a)-[:NEARBY]->(b)
  • 如果 a 到 b 之间还没有 NEARBY 关系,就创建一条有向边。
  • MERGE 语义类似 SQL 的 UPSERT,保证不会创建重复的关系

🧠 注意:

  • MERGE 是有向的,这里是 a → b,不是 b → a。
  • 如果你希望两个方向都存在(双向连接),可以写成:
MERGE (a)-[:NEARBY]->(b)
MERGE (b)-[:NEARBY]->(a)

双向连接⚠️ 性能提示

这种写法可能在节点数量多时非常慢,因为:

  • 它是 全图两两比较(复杂度 O(n²))。
  • 建议在实际场景中加 空间索引 + 分批处理
CREATE INDEX poi_location_index FOR (p:POI) ON (p.location)

或者使用 Neo4j 的 空间范围搜索方式更高效(基于 WITH 和 apoc.spatial.*)

3、查询某个关系信息

MATCH p = ()-[:NEARBY]->()
RETURN p
LIMIT 250;
🔹 MATCH p = ()-[:NEARBY]->()

✅ 含义:

  • 匹配图中所有带有 NEARBY 关系的节点对(即边)。
  • () 表示任意节点(不限制标签)。
  • [:NEARBY] 表示只匹配名为 NEARBY 的边(关系类型)。
  • -> 表示关系方向是从左节点指向右节点。

✅ p = … 的作用:

  • 把匹配到的整个路径(起点节点、关系、终点节点)赋值给变量 p。
  • 这样你可以在 RETURN 中一次性返回整个路径对象

网站公告

今日签到

点亮在社区的每一天
去签到