宽带线性系统应用广泛却带来了ICI和ISI。设计了一套基于CNN的高准确率低复杂度的信号检测器,用于基带线性系统。这个CNN结构利用了信道矩阵的结构。由三个模块组成:输入预处理模块,CNN模块,输出后期处理模块。此结构可以处理不同大小的系统和维度爆炸问题,还可以很容易扩展到没有严格带宽结构的OFDM、TDMR系统。
大多数的研究聚焦于利用通信系统特殊的结构设计高效的信号检测方法。例如在MIMO系统中利用信道的稀疏性,在利用无线电接入网设计基于消息传递的低复杂度检测算法。本文中聚焦于基带线性系统的信道矩阵和带宽矩阵。宽带系统的结构会收到ICI、ISI的影响。研究信道的带宽结构可以有效地降低信号检测的复杂度。比如著名的Bahl-Cocke-Jelinek-Raviv (BCJR)算法可以应用于宽带系统中实现最优化最大后验概率(MAP)检测。但是由于它固有的严格算法和在宽带系统中指数复杂度使得不适合引用带大规模信号维度中。Rugini提出了一种通过因式分解降低LMMSE复杂度的检测器,然而在线性检测器和MAP检测器之间存在一个相当大的界限。迭代算法包括迭代MMSE和置信传播是一种接近最优方法。这些迭代算法需要大量的迭代以获得高预测准确率。很难并行使用这些迭代算法,大大限制了计算效率,在计算复杂度和检测准确度之间是一个基础的平衡决策。所以同时提高检测准确度和计算复杂度是本文要解决的问题。
设计了一个检测器,只使用了CNN。为什么使用CNN呢?
1)DNN作为全连接层,会带来梯度爆炸的问题。可调参数的数量随着系统规模增长。在CNN中,一层的CNN中神经元共享可调参数,可以有效解决维度爆炸问题。
2)全连接层的DNN在系统规模变化之后需要重新训练,而在CNN中只要在一个系统中训练好了就可以应用在任何不同规模的系统中,而不需要重新训练。
CNN的成功基于假设一套参数可以有效地提取其他维度的特征。比如位移不变性假设,尽管解决了很多计算机视觉的问题,但是不能很好的解决信号检测的问题。为了解决这个问题设计了三个模块的CNN结构:
1)输入预处理模块,重组输入确保位移不变特性,比如信道矩阵和接受信号。
2)CNN模块,从唯一不变输入中提取特征。
3)输出后期处理模块。通过CNN提取的特征获得传输信号的估计。
除了设计了高准确率低复杂度的基于CNN的信号检测器,还提出了基于CNN的近似宽带信道,比如:双重选择性OFDM系统中的1-D近似宽带信道和有着2-D ISI的TDMR系统中的2-D近似宽带信道,还提出了1-D近似宽带信道的循环CNN(CCNN)和2-D近似宽带信道的基于CNN的2-D检测器。提出的结构在不严格的宽带结构中的信道矩阵中也表现的很好。
提出的基于CNN结构的检测器主要有以下四个优点:
1)减轻了为通信系统建立复杂的数学模型的压力,因为提出了自适应任何信道和噪声分布的检测器。
2)基于CNN的检测器和其他有着差不多计算复杂度的检测器相比有着更好的BER性能,还可以使用并行计算。
3)由于参数共享机制,提出的CNN结构对于不匹配的系统大小在训练集和测试集中都有着鲁棒性。
4)基于CNN的检测器很容易就可以拓展到其他没有严格宽带结构的系统中去。
将深度学习引用带通信系统信号检测主要有两个方向。第一个方向是基于深度学习的检测器通过展开现存的迭代算法,将原来的迭代算法展开为DNN网络,将一次迭代展开为一层DNN网络,每一层更新规则不是预定的通信模型,而是由每一层的可学习参数控制,这些可学习通过训练数据中学习。第二个方向是将整个通信过程视为一个黑盒,利用常规的DNNs用于信号检测。除了信号检测,深度学习在通信系统的其他领域也有很多潜在的应用。
第二部分:系统模型,以及扩展到近似宽带系统,利用传统DNNs信号检测的挑战。
第三部分:基于CNN在宽带结构信道矩阵的检测器,并诠释他的鲁棒性。
第四部分:拓展提出的检测器带近似宽带系统。
第五部分:评估不同信道模型中提出的深度学习方法的性能,并和现有的算法进行比较。展示提出的CNN在实际的OFDM系统和TDMR系统中的性能。
第六部分:总结展望。
线性宽带系统,K=5,B=1
y:接受信号
H:信道矩阵
x:发送信号
n:噪声矩阵
B:带宽
h k , m {h_{k,m}} hk,m:信道矩阵H的第(k,m)个元素
y的第k个输入:
矩阵对角线两边元素与响应的x及上下相乘,3*3
xk:x的第k个输入
nk:n的第k个输入
假设接收机准确知道信道矩阵H
上述描述可能相比于实际环境过于理想化,接下来介绍两个从实际中获得信道矩阵的近似带宽系统。
1)1-D近似宽带系统
双重选择性OFDM系统,K=5,B=1
左下和右上是因为不可忽略的ICI。
2)2-D近似宽带系统
TDMR系统,N=4,K=3,B=1。
H和y都作为输入,估计的发送信号为x^。
此结构一旦训练好,就可以用到各种分布的信道。
FC和致密连接层会在大的系统中导致维度爆炸,随着输入数据的增多偏置和权重数量也会线性增长。
缺点:系统大小改变就需要重新训练,导致维度爆炸,训练耗费时间,要求搞得计算复杂度和大量数据。
解决方法:使用CNN,权值共享。为了提高CNN性能,输入必须具有位移不变性,卷积滤波器需要精心设计。
首先介绍基于CNN检测器的设计细节,然后展示这个检测器可以适应不同的系统规模。
基于CNN检测器的结构:
虽然CNN能解决很多领域的问题,但是这基于位移不变性假设,因此并不能很好的解决信道中的信号检测问题。例如,直接移动信道矩阵将显着改变传输模型,从而改变检测结果。因此在基于CCNN的检测器中,输入和可学习的卷积滤波器在送入CNN之前需要适当的组织。
使用输入重塑方法确保输入 h k , m {h_{k,m}} hk,m和y的位移不变性。如下图a所示,重塑信道系数和接收信号到向量 z ( 0 ) z^{(0)} z(0),信道矩阵是一个带状矩阵,其非零项被限制在对角带中。因此,仅仅需要将频段上的非零条目存储到向量 z ( 0 ) z^{(0)} z(0)中,具体而言就是将非零信道系数和与接收位置k相对应的接收信号存储在向量 z k ( 0 ) z_{k}^{(0)} zk(0)中。
M卷积层,K=5,B=1
z ( 0 ) = [ z 1 ( 0 ) T , z 2 ( 0 ) T , ⋯ , z K ( 0 ) T ] T z^{(0)}=[z_{1}^{(0)^{T}},z_{2}^{(0)^{T}},\cdots ,z_{K}^{(0)^{T}}]^{T} z(0)=[z1(0)T,z2(0)T,⋯,zK(0)T]T作为一个输入送入后续的CNN模块。经过上述处理输入向量 z ( 0 ) z^{(0)} z(0)就有了平移不变特性。
CNN模型由多个卷积隐藏层和一个卷积输出层组成,输入是 z ( 0 ) z^{(0)} z(0),输出信号 s k s_{k} sk
ReLU作为隐藏层的激活函数, y = R e L U ( x ) = m a x ( x , 0 ) y=ReLU(x)=max(x,0) y=ReLU(x)=max(x,0)。为了将输出映射到(0,1)区间,使用sigmoid作为输出层的激活函数 y = s i g m o i d ( x ) = 1 / ( 1 + e ( − x ) ) y=sigmoid(x)=1/(1+e^(-x)) y=sigmoid(x)=1/(1+e(−x))。
在第一卷积层,使用步长为4B+4的零填充,设置滤波器大小为 ( 2 B + 1 ) ( 4 B + 4 ) × l 1 (2B+1)(4B+4)\times l_{1} (2B+1)(4B+4)×l1, l 1 l_{1} l1是滤波器的深度。
第k个输出的子向量