基于改进K-均值算法的未知雷达信号分选
摘 要:针对K-均值算法需要事先确定聚类的数目,无法适用于未知雷达信号分选的问题,通过引入脉冲间欧几里德距离和距离阈值TMS2812,完成聚类数目和聚类中心的自动选取,给出一个K-均值的改进算法,改进后的算法既收敛速度快,易于工程化实现,又可自动确定聚类数目和聚类中心。仿真实验表明,该改进算法提高了K-均值算法的适用范围,能够有效适应于未知雷达信号的分选。
关键词:K-均值; 雷达信号分选; 聚类数目; 聚类中心
中图分类号:TN95-34文献标识码:A
文章编号:1004-373X(2010)17-0091-03
Unknown Radar Signals Deinterleaving Based on Improved K-means Algorithm
SUN Xin, HOU Hui-qun, YANG Cheng-zhi
(Aviation University of Air Force, Changchun 130022, China)
Abstract: Since K-means algorithm can not be used for the deinterleaving of the unknown radar signals and needs to make sure the clustering number beforehand, an improved K-means algorithm is proposed based on the introduction of Euclidean distance and the distance threshold value, and the achievement of the automatic selection for the clustering number and clustering center. The algorithm can keep the original advantage and doesn"t need the clustering number. The simulation shows that this algorithm enlarges the application range of K-means algorithm and can successfully deinterleave unknown radar signals.
Keywords: K-means; signal deinterleaving; clustering number; clustering center
0 引 言
雷达信号分选的研究起于20世纪70年代,当时雷达体制较为简单,分选难度不大。随着新体制雷达的大量出现并列入装备使用,现有的电磁环境越来越复杂,使得传统基于直方图的分选算法越来越难以适应分选的要求。近年来一些聚类算法被尝试到信号的分选领域中来,比如空间距离聚类、K-均值聚类、模糊聚类、BFSN聚类等,在这些聚类中K-均值聚类因算法思想简单,易于实现并且收敛速度快等优点,受到科研人员的青睐。但K-均值算法最大的局限性在于聚类的数目需要事先确定,这一要求在实际电子对抗侦察中几乎是不能满足的,这也大大限制了K-均值算法在未知信号分选中的应用。
从目前文献来看,大多数应用K-均值算法的论文中聚类数都是人为设定的。也有少量文献将该算法与其他算法进行结合,使得自动确定聚类数和聚类中心,如将蚁群算法与K-均值算法结合[1],遗传算法与K-均值算法结合[2],以此来确定K-均值聚类的聚类数目,但这些方法存在计算繁琐,运算量较大,难以工程化实现等缺点。因而,如何对K-均值进行相应的改进,使得改进算法在保留算法编程思想简单,易工程化实现等优点的基础上,能够自动确定聚类的数目和聚类中心,便显得意义重大。
本文针对这一问题展开研究,借助文献[3]中的思想对K-均值算法进行改进处理。改进算法自动确定聚类中心和聚类数目,使得算法适应未知信号分选的能力增强。仿真实验验证了其有效性。
1 K-均值算法原理
K-均值算法使用的聚类准则函数是误差平方和准则。该算法的思想是将N个对象进行K个类的划分(K≤N)。其算法步骤如下:
(1) 任选K个初始聚类中心Z(1)2,Z(1)3,…Z(1)K,其中,上角标表示聚类过程中的迭代运算次数。
(2) 假设已进行到第r次迭代,若对某一样本x有:
d(x,z(r)j)=min{d(x,z(r)i),i=1,2,…,K}
(1)
则x∈S(r)j。式中d(x,z(r)j)为样本x~z(r)j间的距离,S(r)j是以z(r)j为聚类中心的样子子集。以此种方法,即最小距离原则,将全部样本分配到K个聚类中。
(3) 计算重新分类后的各聚类中心
z(r+1)j=1n(r)j∑x∈S(r)jX,j=1,2,…,K
(2)
式中:n(r)j为S(r)j中所包含的样本数。
(4) 若z(r+1)j=z(r)j,j=1,2,…,K,则结束;否则转步骤(2)。
2 改进的K-均值算法
改进K-均值算法思想是通过设定距离阈值TMS2812,将脉冲间的欧几里德距离与距离阈值TMS2812进行比较,按照一定准则,完成聚类中心和聚类数目的动态确定。在进行分选前,需完成脉冲的数值处理、特征参量选择以及阈值TMS2812设定等工作。
2.1 数值处理
改进的K-均值算法采用加权欧几里德距离表征脉冲信号参数之间的距离[3]。
r=[(x-u)TW(x-u)]1/2
(3)
式中:x表示脉冲参数的测量值;u表示脉冲聚类中心的参数值;它随聚类运算的进行完成更新;W表示加权矩阵。
设Δ=x-u,当用多脉冲参数进行表征时:
Δ=Δ1Δ2Δn
(4)
脉冲参数加权矩阵为:
W=W10…00W2…000…Wn
(5)
则脉冲参数之间的几何距离为:
r=[Δ1Δ2…Δn]×W10…00W2…000…Wn
×Δ1Δ2Δn1/2
(6)
为便于计算,在参数进行运算之前,先进行归一化处理。归一化的方法可根据实际情况进行设置。此处采用下列归一化公式:
x=x-xminxmax-xmin
(7)
式中:xmin表示该参数集合中的最小值;xmax表示该参数集合中的最大值。如果特征参量选择为DOA,RF和PW时,则xmin,xmax表示DOA,RF和PW的最小值和最大值。
2.2 特征参量选择与阈值TMS2812设定
雷达的脉冲描述字PDW包括RF,DOA,PW,PA,在不考虑脉内信息的情况下,此处选择DOA,RF和PW作为特征参量。
上面提到脉冲信号之间的相似度用欧几里德距离表征,距离越小,相似度越大。此处设定一个参数Sd,作为该欧几里德距离的门限。
2.3 改进K-均值算法步骤
改进K-均值聚类算法的步骤如下:
(1) 在进行聚类之前,设定好距离门限Sd、最大迭代次数iteNum,将迭代次数计数器counter至于0,标志位变量change置于1(用以表征是否完成类的更新),并选取第一个点作为聚类中心。
(2) 读取新的脉冲参数,将其与已有的聚类中心点计算加权距离,得到最小的距离Distance_min,再将Distance_min与Sd进行比较,如果Distance_min
(3) 更新各聚类中心特征值。
(4) 判断counter (5) 将change赋值为0;counter加1。 (6) 重新读取脉冲参数,计算该对象到自身类中心的距离和到其他类中心的距离。如果它到其他类中心的距离更小,则将其归为离它距离小的类,并更新change=1,跳到步骤(3)。否则重复该步,直到所有脉冲都计算一遍或满足类更新条件为止。 2.4 改进算法流程图 改进的K-均值算法流程图如图1所示。 图1 改进算法流程图 3 仿真实验 为验证改进算法的有效性,此处借助Matlab进行仿真测试。本次的仿真中通过DOA,RF,PW参数完成测试。 (1) 仿真1:常规雷达分选测试 选用3部常规体制雷达。3部雷达类型和参数见表1。 表1 雷达类型和参数 辐射源类型DOA /(°)RF /GHzPW /μs脉冲数 1常规体制325.22.0100 2常规体制295.44.6100 3常规体制343.81.2100 经过程序验证,很容易将上述脉冲分为3类,与真实情况相符,成功率达到100%。 (2) 仿真2:复杂体制雷达分选测试 在实际情况下,雷达体制复杂,脉冲流不仅表现在时间轴上的交错,在其他脉冲参数上也表现为出现部分混叠的情况。典型的例子是两部频率捷变雷达在频域上的数值混叠。仿真2在考虑实际情况下对算法进行仿真分析,表2为雷达类型和参数表。 表2 雷达类型和参数 辐射源类型DOA /(°)RF /GHzPW /μs脉冲数 1重频固定 频率捷变 脉宽固定50~554.95~5.052.5100 2重频抖动 频率跳变 脉宽固定48~524.90~5.001.7100 3重频滑变频率捷变 脉宽固定54~575.0~5.22.3100 经过仿真,聚类前到达角-载频分布图如图2所示。 图2 聚类前到达角-载频分布图 经过聚类以后的结果二维显示和三维显示分布图见图3、图4(图中用点表示雷达1,用圈表示雷达2,用下三角表示雷达3)。 图3 聚类结果二维显示图 从仿真图上可以看出,改进算法能够自动将这些对象聚类成3类,与实际情况相符。从图4中可以看到,在聚类的过程中,除有一个属于雷达1的对象被聚类到雷达3中外,其余聚类结果都是正确的,改进后的算法具有较高的准确性。 图4 聚类结果三维显示图 4 结 语 对近年来引入到信号分选领域中的K-均值算法展开研究,主要针对传统K-均值算法需要先验知识,无法有效应用于未知雷达信号的分选的问题。经过对仿真结果分析,结论如下: (1) 改进后的算法只需设定初始距离阈值TMS2812,就能够自动确定聚类数目和聚类中心,并完成相应的聚类,有效地适用于未知信号的分选。 (2) 仿真实验表明,改进算法能够准确完成常规体制雷达的分选,同时对于重频抖动、重频滑变、频率跳变和频率捷变等复杂体制雷达也有很好的分选效果。 (3) 本文给出改进算法流程图,易于工程化实现。 虽然文中提到的改进算法能够自动地完成聚类数目和聚类中心的确定,但仍然需要借助于距离阈值TMS2812的人为设定,现阶段距离阈值TMS2812主要是通过经验和实验得到。关于距离阈值TMS2812的优化或动态设定还需要进一步深入研究。 参考文献 [1]孙秀娟.基于遗传算法的K-means聚类算法分析研究[D].济南:山东师范大学,2009. [2]赵贵喜,骆鲁秦,陈彬.基于改进的蚁群聚类雷达信号分选算法研究[J].电子信息对抗技术,2009(3):27-29. [3]祝正威.雷达信号的聚类分选方法[J].电子对抗,2005(6):6-10. [4]韩俊,何明浩,朱元清.基于多参数的雷达辐射源分选新方法[J].数据采集与处理,2009(1):91-94. [5]李峰.复杂环境下雷达辐射源信号分选算法研究[D].西安:西安电子科技大学,2009. [6]曹俊纺,陈建军,孟晓琳.雷达信号分选技术研究[J].雷达与对抗,2009(1):20-22. [7]张红昌,阮怀林,龚亮亮,等.一种新的未知雷达辐射源聚类分选方法[J].计算机工程与应用,2008,44(27):200-201. [8]陈惠民,盛骥松.一种新的雷达信号分选方法[J].现代电子技术,2009,32(1):20-22. [9]何明浩,朱元清,冒燕,等.一种雷达辐射源信号分选新方法[J].武汉理工大学学报:交通科学与工程版,2007(3):430-433. [10]张兴华,李东海,陈国冲.基于SVC和信息熵的雷达信号分选系统[J].舰船电子对抗,2009(3):38-41.