摘要——利用窄带传感器阵列寻找多个平面波方向的问题,以及与之相关的在噪声中估计多个叠加指数信号参数的问题,最近引起了广泛的关注。为解决这些问题,已有多种方法被提出,例如 MUSIC 算法和最大似然 (ML) 算法。
本文研究了 MUSIC 和 ML 方法的性能,并分析了它们的统计效率。本文还针对上述估计问题推导了克拉美-罗界 (CRB),并建立了 CRB 协方差矩阵的一些有用性质。此外,本文也探究了 MUSIC 和 ML 估计器之间的关系。最后,本文包含了一项数值研究,该研究探讨了在使用均匀线性阵列寻找两个平面波方向的问题中,MUSIC 估计器的统计效率。
关于本文研究结果的更精确描述可以在结论部分找到。
文章目录
I. INTRODUCTION AND PRELIMINAR
信号处理领域的几个重要问题,其中包括使用窄带传感器阵列进行方向探测、在噪声中估计多个叠加指数信号的参数,以及解析重叠回波(参见 [1], [2], [9], [12] 及其参考文献),都可以归结为对以下模型中的参数进行估计:
y ( t ) = A ( θ ) x ( t ) + e ( t ) t = 1 , 2 , ⋯ , N . (1.1a) y(t) = A(\theta)x(t) + e(t) \quad t = 1, 2, \cdots, N. \tag{1.1a} y(t)=A(θ)x(t)+e(t)t=1,2,⋯,N.(1.1a)
在 (1.1) 中, y ( t ) ∈ C m × 1 y(t) \in \mathbb C^{m \times 1} y(t)∈Cm×1 是带噪声的数据向量, x ( t ) ∈ C n × 1 x(t) \in \mathbb C^{n \times 1} x(t)∈Cn×1 是信号振幅向量, e ( t ) ∈ C m × 1 e(t) \in \mathbb C^{m \times 1} e(t)∈Cm×1 是加性噪声,而矩阵 A ( θ ) ∈ C m × n A(\theta) \in C^{m \times n} A(θ)∈Cm×n 具有以下特殊结构:
A ( θ ) = [ a ( ω 1 ) ⋯ a ( ω n ) ] (1.1b) A(\theta) = [a(\omega_1) \cdots a(\omega_n)] \tag{1.1b} A(θ)=[a(ω1)⋯a(ωn)](1.1b)
其中 { ω i } \{\omega_i\} {ωi} 是实数参数, a ( ω i ) ∈ C m × 1 a(\omega_i) \in C^{m \times 1} a(ωi)∈Cm×1 是所谓的传递向量 [在第 i 个信号和 y ( t ) y(t) y(t) 之间],且 θ = [ ω 1 ⋯ ω n ] T \theta = [\omega_1 \cdots \omega_n]^T θ=[ω1⋯ωn]T。在第二节中,我们将简要讨论模型 (1.1) 如何涵盖上述某些应用中使用的数据模型,并将介绍关于 (1.1) 的基本假设。
II. NOTATION, BASIC ASSUMPTIONS, AND SPECIAL CASES
我们首先列出本文将使用的一些符号约定。
A T A^T AT = 矩阵 A ∈ C k × p A \in \mathbb{C}^{k \times p} A∈Ck×p 的转置
A + A^+ A+ = A A A 的共轭
A ∗ A^* A∗ = A A A 的共轭转置
A ˉ \bar{A} Aˉ = A A A 的实部
A ~ \tilde{A} A~ = A A A 的虚部
tr A \text{tr } A tr A = 矩阵 A ∈ C k × k A \in \mathbb{C}^{k \times k} A∈Ck×k 的迹
A i j A_{ij} Aij = A A A 的第 i , j i,j i,j 个元素
A ⊙ B A \odot B A⊙B = A ∈ C k × p A \in \mathbb{C}^{k \times p} A∈Ck×p 和 B ∈ C k × p B \in \mathbb{C}^{k \times p} B∈Ck×p 的哈达玛积 ( [ A ⊙ B ] i j = A i j B i j [A \odot B]_{ij} = A_{ij}B_{ij} [A⊙B]ij=AijBij)
A ≥ B A \ge B A≥B = 差分矩阵 A − B A - B A−B 是半正定的,其中 A A A 和 B B B 是埃尔米特半正定矩阵
δ k , p \delta_{k,p} δk,p = 狄拉克 δ \delta δ 函数 (如果 k = p k=p k=p 则 = 1 =1 =1,否则 = 0 =0 =0)
ω \omega ω = 向量 θ \theta θ 的通用元素;为避免符号复杂化,符号 ω \omega ω 和 θ \theta θ 用于表示真实参数和未知参数
d ( ω ) = d a ( ω ) / d ω d(\omega) = da(\omega)/d\omega d(ω)=da(ω)/dω
E E E = 期望算子;对于确定性信号, E ( ⋅ ) = lim N → ∞ ( 1 / N ) ∑ i = 1 N ( ⋅ ) E(\cdot) = \lim_{N\to\infty} (1/N) \sum_{i=1}^N (\cdot) E(⋅)=limN→∞(1/N)∑i=1N(⋅)
接下来,我们介绍一些关于模型 (1.1) 的基本假设。MUSIC 和 ML 方法基于不同的假设集。然而,一些假设对两种方法是共通的。共通的假设首先列出。
A1: m > n m > n m>n,且对应于 ( n + 1 ) (n+1) (n+1) 个不同 ω \omega ω 值的向量 a ( ω ) a(\omega) a(ω) 是线性无关的。(这是一个弱假设,它保证了 MUSIC 和 ML 估计器的唯一性。)
A2: E e ( t ) = 0 Ee(t) = 0 Ee(t)=0, E e ( t ) e ∗ ( t ) = σ I Ee(t)e^*(t) = \sigma I Ee(t)e∗(t)=σI 且 E e ( t ) e T ( t ) = 0 Ee(t)e^T(t) = 0 Ee(t)eT(t)=0。(这是一个更严格的假设,对 MUSIC 算法至关重要;对于 ML 方法,原则上可以放宽 A2,但这会导致相当大的复杂性。)
MUSIC 算法需要以下额外假设。
- AMU: 矩阵
P = E x ( t ) x ∗ ( t ) (2.1) P = Ex(t)x^*(t) \tag{2.1} P=Ex(t)x∗(t)(2.1)
是非奇异的(正定的),且 N > m N > m N>m;而 MLE 需要以下假设:
- AML: 对于 t ≠ s t \ne s t=s, E e ( t ) e ∗ ( s ) = E e ( t ) e T ( s ) = 0 Ee(t)e^*(s) = Ee(t)e^T(s) = 0 Ee(t)e∗(s)=Ee(t)eT(s)=0,且 e ( t ) e(t) e(t) 是高斯分布的。
假设 AML 似乎比 AMU 更具限制性(同样,AML 原则上可以放宽,但这会引入显著的复杂性)。上文所做的关于 MUSIC 和 MLE 使用的假设之间的区分,对于认识到这两个估计器中哪一个(如果有的话)在特定情况下可用是非常重要的(见下文)。
接下来我们简要描述通用模型 (1.1) 的一些应用。关于 (1.1) 的其他可能应用,我们参考 [9], [12] 及其中的参考文献。
A. Direction Finding with Uniform Linear Sensor Arrays
确定入射到由 m m m 个传感器组成的线性均匀窄带阵列上的 n n n 个平面波的方向的问题,可以表述为估计模型 (1.1) 的参数 θ \theta θ 的问题,其中 x ( t ) x(t) x(t) 是复波幅值向量, N N N 是“快拍”数,以及
a ( ω ) = [ 1 e i ω ⋯ e i ( m − 1 ) ω ] T . (2.2) a(\omega) = [1 \quad e^{i\omega} \quad \cdots \quad e^{i(m-1)\omega}]^T. \tag{2.2} a(ω)=[1eiω⋯ei(m−1)ω]T.(2.2)
请注意,在这种情况下, A ( θ ) A(\theta) A(θ) 是一个范德蒙矩阵,因此假设 A1 得到满足。假设 A2 和 AML 意味着噪声在空间和时间上是不相关的,而假设 AMU 意味着平面波不是“完全相干”的,并且快拍数大于阵列中的传感器数量。所有这些假设看起来都是合理的,并且可以被满足。因此,MUSIC 和 MLE 都可以在这类应用中使用。
IV. THE CRAMER-RAO BOUND
在本节中,我们假设条件 A1, A2 和 AML 成立。在这些条件下,我们推导了任意关于 θ \theta θ 和 σ \sigma σ 的无偏估计器的协方差矩阵的 CRB。在接下来的章节中,我们将 MUSIC 和 ML 估计器(MLE 在第五节中讨论)的性能与 CRB 对应的最终性能进行比较。当然,下文推导出的 CRB 公式的用处不仅限于本文报告的性能研究。它也可以用来确定文献中提出的其他关于 θ \theta θ 和 σ \sigma σ 的估计器的相对效率(例如,参见 [15]–[17], [20])。
本节的第一个结果包含在以下定理中。
定理 4.1: 在所述假设下, θ \theta θ 和 σ \sigma σ 的 CRB 由下式给出
CRB ( θ ) = σ 2 { ∑ t = 1 N Re [ X ∗ ( t ) D ∗ ⋅ [ I − A ( A ∗ A ) − 1 A ∗ ] ⋅ D X ( t ) ] } − 1 (4.1) \text{CRB}(\theta) = \frac{\sigma}{2} \left\{ \sum_{t=1}^{N} \text{Re} \left[ \mathbf{X}^*(t) \mathbf{D}^* \cdot [\mathbf{I} - \mathbf{A}(\mathbf{A}^*\mathbf{A})^{-1}\mathbf{A}^*] \cdot \mathbf{D}\mathbf{X}(t) \right] \right\}^{-1} \tag{4.1} CRB(θ)=2σ{t=1∑NRe[X∗(t)D∗⋅[I−A(A∗A)−1A∗]⋅DX(t)]}−1(4.1)
和
var CR ( σ ) = σ 2 m N (4.2) \text{var}_{\text{CR}}(\sigma) = \frac{\sigma^2}{mN} \tag{4.2} varCR(σ)=mNσ2(4.2)
其中
X ( t ) = [ x 1 ( t ) 0 ⋱ 0 x n ( t ) ] \mathbf{X}(t) = \begin{bmatrix} x_1(t) & & 0 \\ & \ddots & \\ 0 & & x_n(t) \end{bmatrix} X(t)= x1(t)0⋱0xn(t)
D = [ d ( ω 1 ) ⋯ d ( ω n ) ] \mathbf{D} = [d(\omega_1) \cdots d(\omega_n)] D=[d(ω1)⋯d(ωn)]
(回想一下, d ( ω ) = d a ( ω ) / d ω d(\omega) = da(\omega)/d\omega d(ω)=da(ω)/dω)。
证明:见附录 E。
在下文中,为方便记法,我们省略 CRB 对 θ \theta θ 的依赖性。我们将转而强调 CRB 对 m m m 和 N N N 的依赖性。我们可以预期,当 m m m 或 N N N 增加时,CRB 会“减小”。这个直观上预期的结果确实成立,如下一个定理所示。
定理 4.2: CRB 协方差矩阵 (4.1) 满足以下次序关系:
CRB ( N ) ≥ CRB ( N + 1 ) CRB ( m ) ≥ CRB ( m + 1 ) \begin{align} \text{CRB}(N) &\ge \text{CRB}(N + 1) \tag{4.3a} \\ \text{CRB}(m) &\ge \text{CRB}(m + 1) \tag{4.3b} \end{align} CRB(N)CRB(m)≥CRB(N+1)≥CRB(m+1)(4.3a)(4.3b)
证明:见附录 F。
以上结果对于一个通用的传递向量 a ( ω ) a(\omega) a(ω) 是有效的。在下文中,我们为形如 (2.2) 的传递向量提供一些专门化的结果,这种形式出现在若干信号处理应用中(一些例子见第二节)。
APPENDIX E DERIVATION OF THE CRB
数据的似然函数由下式给出
L ( y ( 1 ) , ⋯ , y ( N ) ) = 1 ( 2 π ) m N ( σ / 2 ) m N exp { − 1 σ ∑ t = 1 N [ y ( t ) − A x ( t ) ] ∗ ⋅ [ y ( t ) − A x ( t ) ] } . L(y(1), \cdots, y(N)) = \frac{1}{(2\pi)^{mN}(\sigma/2)^{mN}} \exp \left\{ -\frac{1}{\sigma} \sum_{t=1}^{N} [y(t) - Ax(t)]^* \cdot [y(t) - Ax(t)] \right\}. L(y(1),⋯,y(N))=(2π)mN(σ/2)mN1exp{−σ1t=1∑N[y(t)−Ax(t)]∗⋅[y(t)−Ax(t)]}.
因此,对数似然函数为
ln L = const − m N ln σ − 1 σ ∑ t = 1 N [ y ∗ ( t ) − x ∗ ( t ) A ∗ ] ⋅ [ y ( t ) − A x ( t ) ] . (E.1) \ln L = \text{const} - mN \ln\sigma - \frac{1}{\sigma} \sum_{t=1}^{N} [y^*(t) - x^*(t)A^*] \cdot [y(t) - Ax(t)]. \tag{E.1} lnL=const−mNlnσ−σ1t=1∑N[y∗(t)−x∗(t)A∗]⋅[y(t)−Ax(t)].(E.1)
首先,我们计算 (E.1) 关于 σ \sigma σ, { x ˉ ( t ) ≜ Re x ( t ) } \{\bar{x}(t) \triangleq \text{Re } x(t)\} {xˉ(t)≜Re x(t)}, { x ~ ( t ) ≜ Im x ( t ) } \{\tilde{x}(t) \triangleq \text{Im } x(t)\} {x~(t)≜Im x(t)} 和 θ \theta θ 的导数。我们有
∂ ln L ∂ σ = − m N σ + 1 σ 2 ∑ t = 1 N e ∗ ( t ) e ( t ) (E.2a) \frac{\partial \ln L}{\partial \sigma} = -\frac{mN}{\sigma} + \frac{1}{\sigma^2} \sum_{t=1}^{N} e^*(t)e(t) \tag{E.2a} ∂σ∂lnL=−σmN+σ21t=1∑Ne∗(t)e(t)(E.2a)
∂ ln L ∂ x ˉ ( k ) = 1 σ [ A ∗ e ( k ) + A T e + ( k ) ] = 2 σ Re [ A ∗ e ( k ) ] , k = 1 , ⋯ , N (E.2b) \frac{\partial \ln L}{\partial \bar{x}(k)} = \frac{1}{\sigma} [A^*e(k) + A^Te^+(k)] = \frac{2}{\sigma} \text{Re}\,[A^*e(k)], \quad k = 1, \cdots, N \tag{E.2b} ∂xˉ(k)∂lnL=σ1[A∗e(k)+ATe+(k)]=σ2Re[A∗e(k)],k=1,⋯,N(E.2b)
∂ ln L ∂ x ~ ( k ) = 1 σ [ − i A ∗ e ( k ) + i A T e + ( k ) ] = 2 σ Im [ A ∗ e ( k ) ] , k = 1 , ⋯ , N (E.2c) \frac{\partial \ln L}{\partial \tilde{x}(k)} = \frac{1}{\sigma} [-iA^*e(k) + iA^Te^+(k)] = \frac{2}{\sigma} \text{Im}\,[A^*e(k)], \quad k = 1, \cdots, N \tag{E.2c} ∂x~(k)∂lnL=σ1[−iA∗e(k)+iATe+(k)]=σ2Im[A∗e(k)],k=1,⋯,N(E.2c)
和
∂ ln L ∂ ω i = 2 σ ∑ t = 1 N Re [ x ∗ ( t ) d A ∗ d ω i e ( t ) ] = 2 σ ∑ t = 1 N Re [ x i ∗ ( t ) d ∗ ( ω i ) e ( t ) ] , i = 1 , ⋯ , n \begin{aligned} \frac{\partial \ln L}{\partial \omega_i} &= \frac{2}{\sigma} \sum_{t=1}^{N} \text{Re}\left[x^*(t)\frac{dA^*}{d\omega_i}e(t)\right] \\ &= \frac{2}{\sigma} \sum_{t=1}^{N} \text{Re}\left[x_i^*(t)d^*(\omega_i)e(t)\right], \quad i=1,\cdots,n \end{aligned} ∂ωi∂lnL=σ2t=1∑NRe[x∗(t)dωidA∗e(t)]=σ2t=1∑NRe[xi∗(t)d∗(ωi)e(t)],i=1,⋯,n
可以更紧凑地写为
∂ ln L ∂ θ = 2 σ ∑ t = 1 N Re [ X ∗ ( t ) D ∗ e ( t ) ] . (E.2d) \frac{\partial \ln L}{\partial \theta} = \frac{2}{\sigma} \sum_{t=1}^{N} \text{Re}\left[ \mathbf{X}^*(t)\mathbf{D}^*e(t) \right]. \tag{E.2d} ∂θ∂lnL=σ2t=1∑NRe[X∗(t)D∗e(t)].(E.2d)
为了继续,我们需要一些结果。这些结果在下文中陈述和证明。
R1:
E e ∗ ( t ) e ( t ) e ∗ ( s ) e ( s ) = { m 2 σ 2 for t ≠ s m ( m + 1 ) σ 2 for t = s (E.3) Ee^*(t)e(t)e^*(s)e(s) = \begin{cases} m^2\sigma^2 & \text{for } t \ne s \\ m(m+1)\sigma^2 & \text{for } t=s \end{cases} \tag{E.3} Ee∗(t)e(t)e∗(s)e(s)={m2σ2m(m+1)σ2for t=sfor t=s(E.3)
证明:对于 t ≠ s t \ne s t=s,
E e ∗ ( t ) e ( t ) e ∗ ( s ) e ( s ) = [ E e ˉ T ( t ) e ˉ ( t ) + E e ~ T ( t ) e ~ ( t ) ] 2 = m 2 σ 2 . Ee^*(t)e(t)e^*(s)e(s) = [E\bar{e}^T(t)\bar{e}(t) + E\tilde{e}^T(t)\tilde{e}(t)]^2 = m^2\sigma^2. Ee∗(t)e(t)e∗(s)e(s)=[EeˉT(t)eˉ(t)+Ee~T(t)e~(t)]2=m2σ2.
对于 t = s t=s t=s,
E e ∗ ( t ) e ( t ) e ∗ ( s ) e ( s ) = E [ e ˉ T ( t ) e ˉ ( t ) + e ~ T ( t ) e ~ ( t ) ] 2 = E [ e ˉ T ( t ) e ˉ ( t ) ] 2 + 2 E [ e ˉ T ( t ) e ˉ ( t ) ] E [ e ~ T ( t ) e ~ ( t ) ] + E [ e ~ T ( t ) e ~ ( t ) ] 2 = 2 E [ e ˉ T ( t ) e ˉ ( t ) ] 2 + 1 2 m 2 σ 2 . \begin{aligned} Ee^*(t)e(t)e^*(s)e(s) &= E[\bar{e}^T(t)\bar{e}(t) + \tilde{e}^T(t)\tilde{e}(t)]^2 \\ &= E[\bar{e}^T(t)\bar{e}(t)]^2 + 2E[\bar{e}^T(t)\bar{e}(t)]E[\tilde{e}^T(t)\tilde{e}(t)] \\ & \quad + E[\tilde{e}^T(t)\tilde{e}(t)]^2 \\ &= 2E[\bar{e}^T(t)\bar{e}(t)]^2 + \frac{1}{2}m^2\sigma^2. \end{aligned} Ee∗(t)e(t)e∗(s)e(s)=E[eˉT(t)eˉ(t)+e~T(t)e~(t)]2=E[eˉT(t)eˉ(t)]2+2E[eˉT(t)eˉ(t)]E[e~T(t)e~(t)]+E[e~T(t)e~(t)]2=2E[eˉT(t)eˉ(t)]2+21m2σ2.
由于
E [ e ˉ T ( t ) e ˉ ( t ) ] 2 = E ∑ i = 1 m ∑ j = 1 m e ˉ i 2 ( t ) e ˉ j 2 ( t ) = ∑ i = 1 m ∑ j = 1 , j ≠ i m E e ˉ i 2 ( t ) E e ˉ j 2 ( t ) + ∑ i = 1 m E e ˉ i 4 ( t ) = ( m − 1 ) m σ 2 4 + 3 m σ 2 4 = m ( m + 2 ) σ 2 4 , \begin{aligned} E[\bar{e}^T(t)\bar{e}(t)]^2 &= E \sum_{i=1}^m \sum_{j=1}^m \bar{e}_i^2(t)\bar{e}_j^2(t) = \sum_{i=1}^m \sum_{j=1, j\ne i}^m E\bar{e}_i^2(t)E\bar{e}_j^2(t) \\ & \quad + \sum_{i=1}^m E\bar{e}_i^4(t) \\ &= (m-1)m\frac{\sigma^2}{4} + 3m\frac{\sigma^2}{4} = m(m+2)\frac{\sigma^2}{4}, \end{aligned} E[eˉT(t)eˉ(t)]2=Ei=1∑mj=1∑meˉi2(t)eˉj2(t)=i=1∑mj=1,j=i∑mEeˉi2(t)Eeˉj2(t)+i=1∑mEeˉi4(t)=(m−1)m4σ2+3m4σ2=m(m+2)4σ2,
2 [ m ( m + 2 ) σ 2 4 ] + 1 2 m 2 σ 2 = m ( m + 2 ) σ 2 2 + m 2 σ 2 2 = ( m 2 + 2 m + m 2 ) σ 2 2 = ( 2 m 2 + 2 m ) σ 2 2 = m ( m + 1 ) σ 2 \begin{aligned} & 2\left[m(m+2) \frac{\sigma^{2}}{4}\right]+\frac{1}{2} m^{2} \sigma^{2}=m(m+2) \frac{\sigma^{2}}{2}+\frac{m^{2} \sigma^{2}}{2} \\ = & \frac{\left(m^{2}+2 m+m^{2}\right) \sigma^{2}}{2}=\frac{\left(2 m^{2}+2 m\right) \sigma^{2}}{2}=m(m+1) \sigma^{2} \end{aligned} =2[m(m+2)4σ2]+21m2σ2=m(m+2)2σ2+2m2σ22(m2+2m+m2)σ2=2(2m2+2m)σ2=m(m+1)σ2
证明完毕。
R2:
E e ∗ ( t ) e ( t ) e T ( s ) = 0 for all t and s . (E.4) Ee^*(t)e(t)e^T(s) = 0 \quad \text{for all } t \text{ and } s. \tag{E.4} Ee∗(t)e(t)eT(s)=0for all t and s.(E.4)
证明:对于 t ≠ s t \ne s t=s,由于 e ( t ) e(t) e(t) 和 e ( s ) e(s) e(s) 是独立的,结果是显而易见的。对于 t = s t=s t=s,该结论可由高斯随机变量的三阶矩等于零这一事实得出。
R3:
Re ( x ) Re ( y T ) = 1 2 [ Re ( x y T ) + Re ( x y ∗ ) ] Im ( x ) Im ( y T ) = − 1 2 [ Re ( x y T ) − Re ( x y ∗ ) ] Re ( x ) Im ( y T ) = 1 2 [ Im ( x y T ) − Im ( x y ∗ ) ] . (E.5) \begin{aligned} \text{Re}\,(x) \text{Re}\,(y^T) &= \frac{1}{2}[\text{Re}\,(xy^T) + \text{Re}\,(xy^*)] \\ \text{Im}\,(x) \text{Im}\,(y^T) &= -\frac{1}{2}[\text{Re}\,(xy^T) - \text{Re}\,(xy^*)] \\ \text{Re}\,(x) \text{Im}\,(y^T) &= \frac{1}{2}[\text{Im}\,(xy^T) - \text{Im}\,(xy^*)]. \end{aligned} \tag{E.5} Re(x)Re(yT)Im(x)Im(yT)Re(x)Im(yT)=21[Re(xyT)+Re(xy∗)]=−21[Re(xyT)−Re(xy∗)]=21[Im(xyT)−Im(xy∗)].(E.5)
证明:该结果可由一些直接的计算得出。
R4: 设 H \mathbf{H} H 是一个非奇异复矩阵,并将其逆记为 G ≜ H − 1 \mathbf{G} \triangleq \mathbf{H}^{-1} G≜H−1。则
[ H ˉ − H ~ H ~ H ˉ ] − 1 = [ G ˉ − G ~ G ~ G ˉ ] . (E.6) \begin{bmatrix} \bar{\mathbf{H}} & -\tilde{\mathbf{H}} \\ \tilde{\mathbf{H}} & \bar{\mathbf{H}} \end{bmatrix}^{-1} = \begin{bmatrix} \bar{\mathbf{G}} & -\tilde{\mathbf{G}} \\ \tilde{\mathbf{G}} & \bar{\mathbf{G}} \end{bmatrix}. \tag{E.6} [HˉH~−H~Hˉ]−1=[GˉG~−G~Gˉ].(E.6)
证明:
[ H ‾ − H ~ H ~ H ‾ ] [ G ‾ − G ~ G ~ G ‾ ] = [ H ‾ G ‾ − H ~ G ~ − ( H ‾ G ~ + H ~ G ‾ ) H ~ G ‾ + H ‾ G ~ H ‾ G ‾ − H ~ G ~ ] \left[\begin{array}{cc} \overline{\mathbf{H}} & -\tilde{\mathbf{H}} \\ \tilde{\mathbf{H}} & \overline{\mathbf{H}} \end{array}\right]\left[\begin{array}{cc} \overline{\mathbf{G}} & -\tilde{\mathbf{G}} \\ \tilde{\mathbf{G}} & \overline{\mathbf{G}} \end{array}\right]=\left[\begin{array}{lc} \overline{\mathbf{H}} \overline{\mathbf{G}}-\tilde{\mathbf{H}} \tilde{\mathbf{G}} & -(\overline{\mathbf{H}} \tilde{\mathbf{G}}+\tilde{\mathbf{H}} \overline{\mathbf{G}}) \\ \tilde{\mathbf{H}} \overline{\mathbf{G}}+\overline{\mathbf{H}} \tilde{\mathbf{G}} & \overline{\mathbf{H}} \overline{\mathbf{G}}-\tilde{\mathbf{H}} \tilde{\mathbf{G}} \end{array}\right] [HH~−H~H][GG~−G~G]=[HG−H~G~H~G+HG~−(HG~+H~G)HG−H~G~]
等式 (E.6) 可以等价地写为
H ˉ G ˉ − H ~ G ~ = I H ˉ G ~ + H ~ G ˉ = 0 \begin{aligned} \bar{\mathbf{H}}\bar{\mathbf{G}} - \tilde{\mathbf{H}}\tilde{\mathbf{G}} &= \mathbf{I} \\ \bar{\mathbf{H}}\tilde{\mathbf{G}} + \tilde{\mathbf{H}}\bar{\mathbf{G}} &= \mathbf{0} \end{aligned} HˉGˉ−H~G~HˉG~+H~Gˉ=I=0
这当然必须成立,因为
I = H G = ( H ˉ + i H ~ ) ( G ˉ + i G ~ ) = ( H ˉ G ˉ − H ~ G ~ ) + i ( H ˉ G ~ + H ~ G ˉ ) . \begin{aligned} \mathbf{I} = \mathbf{H}\mathbf{G} &= (\bar{\mathbf{H}} + i\tilde{\mathbf{H}})(\bar{\mathbf{G}} + i\tilde{\mathbf{G}}) \\ &= (\bar{\mathbf{H}}\bar{\mathbf{G}} - \tilde{\mathbf{H}}\tilde{\mathbf{G}}) + i(\bar{\mathbf{H}}\tilde{\mathbf{G}} + \tilde{\mathbf{H}}\bar{\mathbf{G}}). \end{aligned} I=HG=(Hˉ+iH~)(Gˉ+iG~)=(HˉGˉ−H~G~)+i(HˉG~+H~Gˉ).
现在转向 CRB 协方差矩阵的评估,它由下式给出
Ω = ( E Ψ Ψ T ) − 1 (E.7a) \boldsymbol{\Omega} = (E\boldsymbol{\Psi}\boldsymbol{\Psi}^T)^{-1} \tag{E.7a} Ω=(EΨΨT)−1(E.7a)
其中
Ψ T ≜ ∂ ln L / ∂ [ σ x ˉ T ( 1 ) x ~ T ( 1 ) ⋯ x ˉ T ( N ) x ~ T ( N ) θ T ] . (E.7b) \boldsymbol{\Psi}^T \triangleq \partial\ln L / \partial[\sigma\,\bar{\mathbf{x}}^T(1)\,\tilde{\mathbf{x}}^T(1)\,\cdots\,\bar{\mathbf{x}}^T(N)\,\tilde{\mathbf{x}}^T(N)\,\boldsymbol{\theta}^T]. \tag{E.7b} ΨT≜∂lnL/∂[σxˉT(1)x~T(1)⋯xˉT(N)x~T(N)θT].(E.7b)
使用 R1,我们得到
E ∣ ∂ ln L ∂ σ ∣ 2 = m 2 N 2 σ 2 − 2 m N σ 3 ∑ t = 1 N E e ∗ ( t ) e ( t ) + 1 σ 4 ∑ t = 1 N ∑ s = 1 N E e ∗ ( t ) e ( t ) e ∗ ( s ) e ( s ) = m 2 N 2 σ 2 − 2 m 2 N 2 σ 2 + N m σ 2 [ ( N − 1 ) m + ( m + 1 ) ] = m N σ 2 . (E.8a) \begin{aligned} E\left|\frac{\partial \ln L}{\partial \sigma}\right|^2 &= \frac{m^2N^2}{\sigma^2} - 2\frac{mN}{\sigma^3}\sum_{t=1}^N Ee^*(t)e(t) \\ & \quad + \frac{1}{\sigma^4}\sum_{t=1}^N\sum_{s=1}^N Ee^*(t)e(t)e^*(s)e(s) \\ &= \frac{m^2N^2}{\sigma^2} - 2\frac{m^2N^2}{\sigma^2} \\ & \quad + \frac{Nm}{\sigma^2}[(N-1)m + (m+1)] \\ &= \frac{mN}{\sigma^2}. \end{aligned} \tag{E.8a} E ∂σ∂lnL 2=σ2m2N2−2σ3mNt=1∑NEe∗(t)e(t)+σ41t=1∑Ns=1∑NEe∗(t)e(t)e∗(s)e(s)=σ2m2N2−2σ2m2N2+σ2Nm[(N−1)m+(m+1)]=σ2mN.(E.8a)
使用 R2,我们注意到 ∂ ln L / ∂ σ \partial \ln L / \partial \sigma ∂lnL/∂σ 与 (E.2) 中的任何其他导数都不相关。
接下来,我们使用 R3 以及 E e ( t ) e T ( s ) = 0 Ee(t)e^T(s)=0 Ee(t)eT(s)=0 这一事实
E [ ∂ ln L ∂ x ˉ ( k ) ] [ ∂ ln L ∂ x ˉ ( p ) ] T = 4 σ 2 1 2 Re [ E A ∗ e ( k ) e ∗ ( p ) A ] = 2 σ Re [ A ∗ A ] δ k , p (E.8b) \begin{aligned} E\left[\frac{\partial \ln L}{\partial \bar{\mathbf{x}}(k)}\right]\left[\frac{\partial \ln L}{\partial \bar{\mathbf{x}}(p)}\right]^T &= \frac{4}{\sigma^2}\frac{1}{2}\text{Re}\,[E\mathbf{A}^*e(k)e^*(p)\mathbf{A}] \\ &= \frac{2}{\sigma}\text{Re}\,[\mathbf{A}^*\mathbf{A}]\delta_{k,p} \end{aligned} \tag{E.8b} E[∂xˉ(k)∂lnL][∂xˉ(p)∂lnL]T=σ2421Re[EA∗e(k)e∗(p)A]=σ2Re[A∗A]δk,p(E.8b)
E [ ∂ ln L ∂ x ˉ ( k ) ] [ ∂ ln L ∂ x ~ ( p ) ] T = − 4 σ 2 1 2 Im [ E A ∗ e ( k ) e ∗ ( p ) A ] = − 2 σ Im [ A ∗ A ] δ k , p (E.8c) \begin{aligned} E\left[\frac{\partial \ln L}{\partial \bar{\mathbf{x}}(k)}\right]\left[\frac{\partial \ln L}{\partial \tilde{\mathbf{x}}(p)}\right]^T &= -\frac{4}{\sigma^2}\frac{1}{2}\text{Im}\,[E\mathbf{A}^*e(k)e^*(p)\mathbf{A}] \\ &= -\frac{2}{\sigma}\text{Im}\,[\mathbf{A}^*\mathbf{A}]\delta_{k,p} \end{aligned} \tag{E.8c} E[∂xˉ(k)∂lnL][∂x~(p)∂lnL]T=−σ2421Im[EA∗e(k)e∗(p)A]=−σ2Im[A∗A]δk,p(E.8c)
E [ ∂ ln L ∂ x ˉ ( k ) ] [ ∂ ln L ∂ θ ] T = 4 σ 2 ∑ t = 1 N 1 2 ⋅ Re [ E A ∗ e ( k ) e ∗ ( t ) D X ( t ) ] = 2 σ Re [ A ∗ D X ( k ) ] (E.8d) \begin{aligned} E\left[\frac{\partial \ln L}{\partial \bar{\mathbf{x}}(k)}\right]\left[\frac{\partial \ln L}{\partial \boldsymbol{\theta}}\right]^T &= \frac{4}{\sigma^2}\sum_{t=1}^N\frac{1}{2} \cdot \text{Re}\,[E\mathbf{A}^*e(k)e^*(t)\mathbf{D}\mathbf{X}(t)] \\ &= \frac{2}{\sigma}\text{Re}\,[\mathbf{A}^*\mathbf{D}\mathbf{X}(k)] \end{aligned} \tag{E.8d} E[∂xˉ(k)∂lnL][∂θ∂lnL]T=σ24t=1∑N21⋅Re[EA∗e(k)e∗(t)DX(t)]=σ2Re[A∗DX(k)](E.8d)
E [ ∂ ln L ∂ x ~ ( k ) ] [ ∂ ln L ∂ x ~ ( p ) ] T = 4 σ 2 1 2 Re [ E A ∗ e ( k ) e ∗ ( p ) A ] = 2 σ Re [ A ∗ A ] δ k , p (E.8e) \begin{aligned} E\left[\frac{\partial \ln L}{\partial \tilde{\mathbf{x}}(k)}\right]\left[\frac{\partial \ln L}{\partial \tilde{\mathbf{x}}(p)}\right]^T &= \frac{4}{\sigma^2}\frac{1}{2}\text{Re}\,[E\mathbf{A}^*e(k)e^*(p)\mathbf{A}] \\ &= \frac{2}{\sigma}\text{Re}\,[\mathbf{A}^*\mathbf{A}]\delta_{k,p} \end{aligned} \tag{E.8e} E[∂x~(k)∂lnL][∂x~(p)∂lnL]T=σ2421Re[EA∗e(k)e∗(p)A]=σ2Re[A∗A]δk,p(E.8e)
E [ ∂ ln L ∂ x ~ ( k ) ] [ ∂ ln L ∂ θ ] T = 4 σ 2 ∑ t = 1 N ( − 1 2 ) ⋅ Im [ E X ∗ ( t ) D ∗ e ( t ) e ∗ ( k ) A ] T = − 2 σ Im [ X ∗ ( k ) D ∗ A ] T = 2 σ Im [ A ∗ D X ( k ) ] (E.8f) \begin{aligned} E\left[\frac{\partial \ln L}{\partial \tilde{\mathbf{x}}(k)}\right]\left[\frac{\partial \ln L}{\partial \boldsymbol{\theta}}\right]^T &= \frac{4}{\sigma^2}\sum_{t=1}^N\left(-\frac{1}{2}\right) \cdot \text{Im}\,[E\mathbf{X}^*(t)\mathbf{D}^*e(t)e^*(k)\mathbf{A}]^T \\ &= -\frac{2}{\sigma}\text{Im}\,[\mathbf{X}^*(k)\mathbf{D}^*\mathbf{A}]^T \\ &= \frac{2}{\sigma}\text{Im}\,[\mathbf{A}^*\mathbf{D}\mathbf{X}(k)] \end{aligned} \tag{E.8f} E[∂x~(k)∂lnL][∂θ∂lnL]T=σ24t=1∑N(−21)⋅Im[EX∗(t)D∗e(t)e∗(k)A]T=−σ2Im[X∗(k)D∗A]T=σ2Im[A∗DX(k)](E.8f)
E [ ∂ ln L ∂ θ ] [ ∂ ln L ∂ θ ] T = 4 σ 2 1 2 ∑ t = 1 N ∑ s = 1 N Re [ E X ∗ ( t ) D ∗ e ( t ) e ∗ ( s ) D X ( s ) ] = 2 σ ∑ t = 1 N Re [ X ∗ ( t ) D ∗ D X ( t ) ] ≜ Γ . (E.8g) \begin{aligned} E\left[\frac{\partial \ln L}{\partial \boldsymbol{\theta}}\right]\left[\frac{\partial \ln L}{\partial \boldsymbol{\theta}}\right]^T &= \frac{4}{\sigma^2}\frac{1}{2}\sum_{t=1}^N\sum_{s=1}^N \text{Re}\,[E\mathbf{X}^*(t)\mathbf{D}^*e(t)e^*(s)\mathbf{D}\mathbf{X}(s)] \\ &= \frac{2}{\sigma}\sum_{t=1}^N \text{Re}\,[\mathbf{X}^*(t)\mathbf{D}^*\mathbf{D}\mathbf{X}(t)] \triangleq \mathbf{\Gamma}. \end{aligned} \tag{E.8g} E[∂θ∂lnL][∂θ∂lnL]T=σ2421t=1∑Ns=1∑NRe[EX∗(t)D∗e(t)e∗(s)DX(s)]=σ2t=1∑NRe[X∗(t)D∗DX(t)]≜Γ.(E.8g)
引入以下记法:
var CR ( σ ) = σ 2 / m N \text{var}_{\text{CR}}(\sigma) = \sigma^2/mN varCR(σ)=σ2/mN
H = 2 σ A ∗ A \mathbf{H} = \frac{2}{\sigma}\mathbf{A}^*\mathbf{A} H=σ2A∗A
G = H − 1 \mathbf{G} = \mathbf{H}^{-1} G=H−1
Δ k = 2 σ A ∗ D X ( k ) . \boldsymbol{\Delta}_k = \frac{2}{\sigma}\mathbf{A}^*\mathbf{D}\mathbf{X}(k). Δk=σ2A∗DX(k).
注意到由于矩阵 H \mathbf{H} H 是埃尔米特矩阵,其虚部必须是斜对称的,即 H ~ T = − H ~ \tilde{\mathbf{H}}^T = -\tilde{\mathbf{H}} H~T=−H~。将 (E.8) 代入 (E.7) 并使用上述记法,我们得到
Ω = [ var CR − 1 ( σ ) 0 H ˉ − H ~ H ~ H ˉ 0 Δ ˉ 1 Δ ~ 1 0 0 ⋱ ⋮ H ˉ − H ~ H ~ H ˉ Δ ˉ N Δ ~ N Δ ˉ 1 T Δ ~ 1 T ⋯ Δ ˉ N T Δ ~ N T Γ ] − 1 (E.9) \boldsymbol{\Omega} = \begin{bmatrix} \text{var}_{\text{CR}}^{-1}(\sigma) & 0 & & & \\ & \begin{matrix} \bar{\mathbf{H}} & -\tilde{\mathbf{H}} \\ \tilde{\mathbf{H}} & \bar{\mathbf{H}} \end{matrix} & 0 & & \begin{matrix} \bar{\boldsymbol{\Delta}}_1 \\ \tilde{\boldsymbol{\Delta}}_1 \end{matrix} \\ 0 & 0 & \ddots & & \vdots \\ & & & \begin{matrix} \bar{\mathbf{H}} & -\tilde{\mathbf{H}} \\ \tilde{\mathbf{H}} & \bar{\mathbf{H}} \end{matrix} & \begin{matrix} \bar{\boldsymbol{\Delta}}_N \\ \tilde{\boldsymbol{\Delta}}_N \end{matrix} \\ & \begin{matrix} \bar{\boldsymbol{\Delta}}_1^T & \tilde{\boldsymbol{\Delta}}_1^T \end{matrix} & \cdots & \begin{matrix} \bar{\boldsymbol{\Delta}}_N^T & \tilde{\boldsymbol{\Delta}}_N^T \end{matrix} & \mathbf{\Gamma} \end{bmatrix}^{-1} \tag{E.9} Ω= varCR−1(σ)00HˉH~−H~Hˉ0Δˉ1TΔ~1T0⋱⋯HˉH~−H~HˉΔˉNTΔ~NTΔˉ1Δ~1⋮ΔˉNΔ~NΓ −1(E.9)
因此,关于 var CR ( σ ) \text{var}_{\text{CR}}(\sigma) varCR(σ) 的表达式 (4.2) 得证。为证明关于 CRB ( θ ) \text{CRB}(\theta) CRB(θ) 的表达式 (4.1),我们注意到 (E.9),一个关于分块矩阵求逆的标准结果,以及 R4 给出了
CRB − 1 ( θ ) = Γ − [ Δ ˉ 1 T Δ ~ 1 T ⋯ Δ ˉ N T Δ ~ N T ] [ G ˉ − G ~ G ~ G ˉ 0 ⋱ 0 G ˉ − G ~ G ~ G ˉ ] [ Δ ˉ 1 Δ ~ 1 ⋮ Δ ˉ N Δ ~ N ] (E.10) \text{CRB}^{-1}(\theta) = \mathbf{\Gamma} - \begin{bmatrix} \bar{\boldsymbol{\Delta}}_1^T & \tilde{\boldsymbol{\Delta}}_1^T & \cdots & \bar{\boldsymbol{\Delta}}_N^T & \tilde{\boldsymbol{\Delta}}_N^T \end{bmatrix} \begin{bmatrix} \begin{matrix} \bar{\mathbf{G}} & -\tilde{\mathbf{G}} \\ \tilde{\mathbf{G}} & \bar{\mathbf{G}} \end{matrix} & & \mathbf{0} \\ & \ddots & \\ \mathbf{0} & & \begin{matrix} \bar{\mathbf{G}} & -\tilde{\mathbf{G}} \\ \tilde{\mathbf{G}} & \bar{\mathbf{G}} \end{matrix} \end{bmatrix} \begin{bmatrix} \bar{\boldsymbol{\Delta}}_1 \\ \tilde{\boldsymbol{\Delta}}_1 \\ \vdots \\ \bar{\boldsymbol{\Delta}}_N \\ \tilde{\boldsymbol{\Delta}}_N \end{bmatrix} \tag{E.10} CRB−1(θ)=Γ−[Δˉ1TΔ~1T⋯ΔˉNTΔ~NT] GˉG~−G~Gˉ0⋱0GˉG~−G~Gˉ Δˉ1Δ~1⋮ΔˉNΔ~N (E.10)
接下来,观察到
[ G ˉ − G ~ G ~ G ˉ ] [ Δ ˉ Δ ~ ] = [ G ˉ Δ ˉ − G ~ Δ ~ G ~ Δ ˉ + G ˉ Δ ~ ] = [ G Δ ‾ G Δ ~ ] (E.11a) \begin{bmatrix} \bar{\mathbf{G}} & -\tilde{\mathbf{G}} \\ \tilde{\mathbf{G}} & \bar{\mathbf{G}} \end{bmatrix} \begin{bmatrix} \bar{\boldsymbol{\Delta}} \\ \tilde{\boldsymbol{\Delta}} \end{bmatrix} = \begin{bmatrix} \bar{\mathbf{G}}\bar{\boldsymbol{\Delta}} - \tilde{\mathbf{G}}\tilde{\boldsymbol{\Delta}} \\ \tilde{\mathbf{G}}\bar{\boldsymbol{\Delta}} + \bar{\mathbf{G}}\tilde{\boldsymbol{\Delta}} \end{bmatrix} = \begin{bmatrix} \overline{\mathbf{G}\boldsymbol{\Delta}} \\ \widetilde{\mathbf{G}\boldsymbol{\Delta}} \end{bmatrix} \tag{E.11a} [GˉG~−G~Gˉ][ΔˉΔ~]=[GˉΔˉ−G~Δ~G~Δˉ+GˉΔ~]=[GΔGΔ ](E.11a)
并且
[ Δ ˉ T Δ ~ T ] [ G Δ ‾ G Δ ~ ] = Re [ Δ ∗ G Δ ] . (E.11b) \begin{bmatrix} \bar{\boldsymbol{\Delta}}^T & \tilde{\boldsymbol{\Delta}}^T \end{bmatrix} \begin{bmatrix} \overline{\mathbf{G}\boldsymbol{\Delta}} \\ \widetilde{\mathbf{G}\boldsymbol{\Delta}} \end{bmatrix} = \text{Re}\,[\boldsymbol{\Delta}^*\mathbf{G}\boldsymbol{\Delta}]. \tag{E.11b} [ΔˉTΔ~T][GΔGΔ ]=Re[Δ∗GΔ].(E.11b)
由 (E.10) 和 (E.11) 可得
CRB − 1 ( θ ) = Γ − ∑ t = 1 N Re [ Δ t ∗ G Δ t ] = 2 σ ∑ t = 1 N Re [ X ∗ ( t ) D ∗ D X ( t ) − X ∗ ( t ) D ∗ A ( A ∗ A ) − 1 A ∗ D X ( t ) ] = 2 σ ∑ t = 1 N Re { X ∗ ( t ) D ∗ [ I − A ( A ∗ A ) − 1 A ∗ ] D X ( t ) } \begin{aligned} \text{CRB}^{-1}(\theta) &= \mathbf{\Gamma} - \sum_{t=1}^N \text{Re}\,[\boldsymbol{\Delta}_t^*\mathbf{G}\boldsymbol{\Delta}_t] = \frac{2}{\sigma}\sum_{t=1}^N \text{Re}\,[\mathbf{X}^*(t)\mathbf{D}^*\mathbf{D}\mathbf{X}(t) \\ & \quad - \mathbf{X}^*(t)\mathbf{D}^*\mathbf{A}(\mathbf{A}^*\mathbf{A})^{-1}\mathbf{A}^*\mathbf{D}\mathbf{X}(t)] \\ &= \frac{2}{\sigma}\sum_{t=1}^N \text{Re}\,\left\{\mathbf{X}^*(t)\mathbf{D}^*[\mathbf{I} - \mathbf{A}(\mathbf{A}^*\mathbf{A})^{-1}\mathbf{A}^*]\mathbf{D}\mathbf{X}(t)\right\} \end{aligned} CRB−1(θ)=Γ−t=1∑NRe[Δt∗GΔt]=σ2t=1∑NRe[X∗(t)D∗DX(t)−X∗(t)D∗A(A∗A)−1A∗DX(t)]=σ2t=1∑NRe{X∗(t)D∗[I−A(A∗A)−1A∗]DX(t)}
证明完毕。