大型物联网电子设备的海量数据高效挖掘方法研究
摘 要: 当前对大型物联网电子设备数据采用状态模式识别的数据挖掘方式,对具有差异性特征的电子设备数据挖掘无法分类识别,性能不好。在此提出一种基于关联度主特征量提取的大型物联网电子设备的海量数据高效挖掘方法,首先分析了大型物联网中电子设备的数据采集模型,通过对电子设备的原始数据采集,提取电子设备数据信息的关联度主特征量,采用海量数据挖掘最优控制算法实现对大型物联网中的电子设备海量数据的分类挖掘和特征提取。仿真结果表明,采用该算法进行数据挖掘,电子数据的数据差异性特征幅度平稳,数据的关联度区分明显,具有较好的分类识别和数据检测能力且系统运行效率提高。
关键词: 物联网; 电子设备; 数据挖掘; 信息提取
中图分类号: TN915.03⁃34; TP393.04 文献标识码: A 文章编号: 1004⁃373X(2016)04⁃0159⁃04
Abstract: The current data mining mode of state pattern recognition is used for the electronic equipment data of large⁃scale IOT, which can not be classified and identified, and the good performance can not be caught. An efficient data mining method for electronic devices in large⁃scale IOT based on the main feature extraction of association degree is proposed. The data acquirng model of the electronic equipments in large⁃scale internet of things is analyzed, The main features of association degree of the electronic equipments are extracted by collecting the original data of the electronic equipments. The optimal control algorithm of massive data mining is adopted to realize classification mining and feature extraction of electronic equipment massive data in large⁃scale IOT. The simulation results show that this algorithm has excellent ability of classification, identification and feature extraction, and the system operation efficiency is improved.
Keywords: Internet of Things; electronic equipment; data mining; information extraction
0 引 言
物联网是物与物相连的互联网,是新一代信息技术的重要组成部分,在物联网平台下,采用射频识别(RFID),通过红外感应器、GPS定位系统、图像扫描器、数据感应器等信息传感设备,设定协议和通信端口,进行信息交换和通信,以实现智能化识别、定位、跟踪、监控和管理的一种网络。物联网通过电子设备数据传感器,对外界的原始特征数据进行数据采集,再通过网络层进行数据传输通信,发送到应用层实现面向对象的数据应用,达到远程控制和智能化处理的目的。可见,大型物联网由感知层、网络层和应用层三层体系构成。其中感知层实现原始数据采集,网络层实现数据通信,应用层实现功能应用。物联网的三层体系结构中都含有大量的电子设备信息,且各个电子设备的应用功能不同,需要对物联网中电子设备的相关数据进行有效挖掘和特征提取,发掘出有用特征为系统所用;因此研究大型物联网的电子设备海量数据挖掘算法在提高物联网的使用性能方面具有重要意义[1⁃3]。
传统方法中,对大型物联网的电子设备海量数据挖掘算法是建立在处理器集群平台基础上,通过数据传感器把电子设备信息数据在处理器集群平台中进行数据整合,然后用局部网络或互联网等通信技术把传感器、控制器、机器、人员和物等通过新的方式连在一起,实现数字处理集群,达到物联网中的电子设备数据挖掘的目的[4⁃5]。关于大型物联网中电子设备数据挖掘的算法研究,相关文献给出了对应的描述,并取得了一定的研究成果。其中文献[6]提出了一种针对物联网中大数据量高速分组业务电子设备信息挖掘算法,把各类电子设备数据分成多个小的分支进行,从而达到整体效率的提升,系统在大数据量是稳定可靠的,但应对大数据量随机变化时电子设备信息分类的能力欠缺。文献[7]提出了一种面向服务物联网中电子设备大数据信息流调度算法,采用遗传算法进行搜索时所具有并行性和在全局解空间中搜索的特点,系统搜索效率高,但系统网格的划分对系统结果影响大,且没有很好的网格划分标准,物联网中电子设备的差异性特征体现不明显,对物联网中的电子设备的海量信息大数据分类性能不好,且全局收敛性不好,易陷入局部收敛。可见,当前方法对大型物联网电子设备数据采用状态模式识别的数据采集算法,对具有差异性特征的电子设备数据挖掘无法分类识别,性能不好。针对上述问题,本文提出一种基于关联度主特征量提取的大型物联网电子设备的海量数据高效挖掘方法。仿真实验进行了性能验证,展示了本文算法的优越性。
1 问题描述及大型物联网中电子设备的数据采
集模型
1.1 大型物联网中的电子设备海量数据挖掘问题描述
大型物联网的电子设备海量数据挖掘是设计一种有效的大型物联网电子设备数据监测仪为基础,系统的设计重点在数据挖掘算法设计和数据采集系统的改进上。物联网通过电子设备进行数据采集和信号处理,采用信号处理和数据通信方法把各种信息传感设备进行连接,实现对感知层的数据传感器的数据检测和过程控制。典型的物联网网络系统架构一般为三层体系,通常由感知层、网络层和应用层三层体系构成。其中感知层(Sensor Layer)是直接面向数据信息源的底层,采用数据传感器等电子设备实现对特定数据的采集和挖掘;网络层(Network Layer)是大型物联网系统的通信和数据传输层,采用Internet,GPRS,3G,WiFi网络实现数据通信;应用层是系统的顶层,实现整个物联网系统的应用和管理,包括数据应用、过程控制和远程监控等,通过面向对象的应用决策,实现系统最终功能的完成。大型物联网的电子设备信息数据的挖掘和传输以及应用过程示意图如图1所示。由图1可知,在大型物联网系统中,感知层实现原始数据采集;网络层实现数据通信;应用层实现功能应用。各层体系结构都含有大量的如传感器、通信设备和网络设备等电子设备,需要对大型物联网的电子设备进行有效挖掘,提取有用信息,提高物联网电子设备的应用性能。
1.2 当前的物联网中数据挖掘原理与存在的弊端
大型物联网中,应用层用户通常更加关心电子设备数据的信息采集和特征内容,需要对此进行有效挖掘,子设备海量数据存储于数据资源池,通过数据中心网络实现数据的调度和取回,大型物联网中的电子设备海量数据的存储结构描述如图2所示。
式中:[xi∈Rn],代表大型物联网电子设备数据的状态矢量;[Aj(L)]为在约束条件L下的聚类结果。对式(3)目标约束函数进行求解,计算结果必须满足小于电子设备数据采集匹配偏差的约束条件,将符合条件的解与数据流的非线性特征进行匹配,匹配成功的数据即为电子设备的海量数据,实现对电子设备数据挖掘。但是,物联网的环境相对复杂,因此,在聚类过程中,很容易出现数据冗余融合或者干扰的问题,导致式(2)的聚类性能出现较大偏差,给后期的挖掘结果造成影响。本文提出一种改进的算法。
2 海量数据高效挖掘算法改进与实现
2.1 电子设备的关联度主特征量提取算法
2.2 物联网中的数据挖掘与应用
在物联网中,由于大型物联网的数据之间的关联性是自反的和传递的,将上述的方法采用主特征量分割挖掘,设置物联网下电子设备数据挖掘的初始化值为0,利用如下公式能够对大型物联网电子设备数据在存储服务器上读取:
式中:X和Y代表物联网环境下的主特征,两者的差为约束条件;N为约束系数,特征数据并行化地存储到不同的物联网中间件中,实现对电子设备数据的预存和调度,基于上述模型,得到了电子设备海量数据挖掘的完整性边界条件为[fX≤NX,fY≤NY],实现了大型物联网中海量数据挖掘设计。
3 仿真实验与性能分析
为了测试本文算法在实现大型物联网电子设备海量数据挖掘中的性能,进行仿真实验。仿真实验硬件环境表述为:处理器Intel[Ⓡ]CoreTM2 Duo CPU 2.94 GHz,内存为8 GB;操作系统为Windows 7;编程语言为Matlab 7语言。本实验采用Cloudsim平台来模拟大型物联网环境下的电子设备海量数据存储和数据采集系统,首先构建大型物联网的网络结构模型,大型物联网系统中,电子设备作为节点,均匀分布在网络结构中,电子设备数据采集的时间间隔为0.1 s,背景干扰的信噪比分布为:-5 dB,-10 dB,-11 dB和-15 dB。物联网的数据采集感知层电子设备参数设置和应用层及网络层的电子设备参数设置如表1所示。
在实验的过程中,设置控制参数[α=2, β=6]。首先进行大型物联网中的电子设备数据的采集,然后基于关联度主特征量提取,实现了大型物联网电子设备的海量数据高效挖掘。以大型物联网中的4组电子设备数据挖掘为例,得到数据挖掘结果如图3所示。
从图3可见,采用本文算法能有效实现对大型物联网中的海量数据的挖掘和特征提取,幅度平稳,数据的关联度差异明显,具有较好的分类识别和数据检测能力,为了测试性能,在不同数据范围下分析数据挖掘的时间执行开销,得到结果如图4所示,从图4可见,采用本文算法,具有较小的时间执行开销,提高了大型物联网电子设备数据挖掘的时效性。
4 结 语
大型物联网的各层体系结构都含有大量的如传感器、通信设备和网络设备等电子设备,需要对大型物联网的电子设备进行有效挖掘,提取有用信息,提高物联网电子设备的应用性能。本文提出一种基于关联度主特征量提取的大型物联网电子设备的海量数据高效挖掘方法。分析本文的研究结果可见,采用本文算法能有效实现对大型物联网中的海量数据的挖掘和特征提取,幅度平稳,数据的关联度差异明显,具有较好的分类识别和数据检测能力。且系统运行效率提高,运行时间较短,系统能在1 s内处理几百万次查询和数据挖掘,因此该算法具有较强的实用性。
参考文献
[1] 陈志,骆平,岳文静,等.一种能量感知的无线传感网拓扑控制算法[J].传感技术学报,2013,26(3):382⁃387.
[2] 王辛果,张信明,陈国良.时延受限且能量高效的无线传感网络跨层路由[J].软件学报,2011,22(7):1626⁃1640.
[3] 欧世峰,高颖,赵晓晖.自适应组合型盲源分离算法及其优化方案[J].电子与信息学报,2011,33(5):1243⁃1247.
[4] 蔡昕烨,牛耘,黄志球,等.一种用于基因调控网络建模的CGP⁃WPSO混合算法[J].计算机科学,2012,39(9):180⁃182.
[5] 邓异,梁燕,周勇.水声换能器基阵信号采集系统优化设计[J].物联网技术,2015,5(4):36⁃37.
[6] 石鑫,周勇,甘新年,等.机载多源飞行数据资料的非线性检验[J].计算机与数字工程,2013,41(5):729⁃732.
[7] 刘昊晨,梁红.线性调频信号参数估计和仿真研究[J].计算机仿真,2011,28(2):157⁃159.
[8] 罗龙,虞红芳,罗寿西.基于多拓扑路由的无拥塞快速业务迁移算法[J].计算机应用,2015,35(7):1809⁃1814.
[9] 孙超,杨春曦,范莎,等.能量高效的无线传感器网络分布式分簇一致性滤波算法[J].信息与控制,2015,44(3):379⁃384.
[10] 文天柱,许爱强,程恭.基于改进ENN2 聚类算法的多故障诊断方法[J].控制与决策,2015,30(6):1021⁃1026.