R语言入门:“Hellinger“转化和“normalize“转化(弦转化)的公式表示与R代码实现

发布于:2024-04-20 ⋅ 阅读:(24) ⋅ 点赞:(0)

1、写在前面

vegan包中的decostand()函数为群落生态学研究提供了一些流行的(和有效的)标准化方法。有关decostand()函数标准化的一些标准化方法可以看我的另一篇笔记:R语言入门:vegan包使用decostand()函数标准化方法

由于在网络上没有找到关于这两个转化的公式表示,而官方给出的解释又较为复杂,因此写了这篇笔记,帮助理解,方便日后复习查阅。 

进行样方标准化时,可采用:"Hellinger"转化和"normalize"转化(弦转化)。

2、Hellinger转化

2.1 Hellinger转化过程解释

函数将使用边际总数来对数据进行标准化。对于每个值将被除以该行或列的总和,以使得每个值在标准化后的行或列的总加和为1,在此之后对结果取平方根,即Hellinger转化。也可以理解为:“total”标准化后取平方根,即hellinger转化。

2.2 Hellinger转化的公示表示

Hellinger转化的对象是一系列的列向量或者行向量,总归来说是对几串数字的计算,假设这里处理的是一个m行n列的矩阵(m X n),其中,m为样本/观测/样方/重复,n为物种。需要对其进行样方标准化,即对行进行标准化,这里采用Hellinger转化(标准化)。

若以其中一行举例(x1,x2,x3,x4,…,xn),则对于每一个元素xi标准化过程可以表示为:

\sqrt{\frac{x_i}{x_1+x_2+...+x_n}}

2.3 Hellinger转化的代码实现
x.hel <- decostand(x, "hellinger", MARGIN, range.global, logbase = 2, na.rm=FALSE, ...)

注:若仅仅进行样方标准化,输入下面代码即可:

x.hel <- decostand(x, "hellinger")

参数说明:

  • x: 群落数据,类似矩阵的对象,用于进行标准化处理。
  • method: 标准化方法。
  • MARGIN: 如果默认不可接受,则为边界。这里默认为1,即对行向量进行标准化。
  • range.global: 在 method = "range" 中找到范围的矩阵。这允许在数据的子集之间使用相同的范围。 MARGIN 的维度必须与 x 匹配。
  • logbase: 在 method = "log" 中使用的对数基数。
  • na.rm: 忽略行或列标准化中的缺失值。
  • zap: 使接近零的值成为精确的零,以避免负值和夸张的物种丰富度估计。

3、Normalize转化

3.1 Normalize转化过程解释

每行或每列的值都会被缩放,使得每行的平方和为1。这个转化也称为"弦转化" chord。

3.2 Normalize转化的公示表示

弦转化的对象是一系列的列向量或者行向量,总归来说是对几串数字的计算,假设这里处理的是一个m行n列的矩阵(m X n),其中,m为样本/观测/样方/重复,n为物种。需要对其进行样方标准化,即对行进行标准化,这里采用normalize转化(标准化)。

若以其中一行举例(x1,x2,x3,x4,…,xn),则对于每一个元素xi标准化过程可以表示为:

\frac{x_i}{\sqrt{x_{1}^{2}+x_{2}^{2}+...+x_{n}^{2}}}

 3.3 Normalize转化的代码实现
x.norm <- decostand(x, "normalize", MARGIN, range.global, logbase = 2, na.rm=FALSE, ...)

 注:若仅仅进行样方标准化,输入下面代码即可:

x.norm <- decostand(x, "normalize")

参数说明(跟上面一样):

  • x: 群落数据,类似矩阵的对象,用于进行标准化处理。
  • method: 标准化方法。
  • MARGIN: 如果默认不可接受,则为边界。这里默认为1,即对行向量进行标准化。
  • range.global: 在 method = "range" 中找到范围的矩阵。这允许在数据的子集之间使用相同的范围。 MARGIN 的维度必须与 x 匹配。
  • logbase: 在 method = "log" 中使用的对数基数。
  • na.rm: 忽略行或列标准化中的缺失值。
  • zap: 使接近零的值成为精确的零,以避免负值和夸张的物种丰富度估计。

4、Hellinger转化和弦转化的关系

根据上面公式表示,不难理解,Hellinger转化等同于数据先平方根转化后再进行弦转化。​​​​​​​反过来说,弦转化是多度数据平方后的Hellinger转化。

参考:赖江山.《数量生态学——R语言的应用》. 北京:高等教育出版社

           Package vegan version 2.6-4