当前位置:智城范文网>范文大全 > 征文 > 面向无线传感器网络的自适应数据清洗方法

面向无线传感器网络的自适应数据清洗方法

时间:2022-03-30 08:27:22 来源:网友投稿

摘要:针对无线传感器网络(WSN)数据不精确和不可靠的问题,根据感知数据的空间相关性定义了弹性空间模型,并在此基础上提出一种自适应近邻空间清洗方法(ANSA)。该方法根据感知数据波动动态调整近邻空间大小,并通过计算近邻节点测量数据的加权平均对本地数据清洗。实验结果表明,感知数据清洗后误差控制在0.5以内,与经典的加权移动平均(WMA)方法相比,所提方法的精确度更高,同时能量损耗减少约36%。

关键词:无线传感器网络;空间相关性;数据清洗;孤立点检测;数据可靠性

中图分类号: TP311; TP393.032

文献标志码:A

Abstract: Since the data gathered in Wireless Sensor Network (WSN) are inaccurate and ueliable, a flexible space model based on the spatial correlation of sensor data was defined, and an adaptive neighborspace approach for data cleansing (ANSA) was proposed. The approach adjusted neighborspace dynamically according to sensor data fluctuation and calculated the weighted average of neighbors measurements to clean local raw data. The experimental results show that, the sensor data error after cleansing by the proposed approach is less than 0.5, and compared to the classic Weighted Moving Average (WMA), it is more accurate and the energy consumption is reduced by about 36%.

Key words: Wireless Sensor Network (WSN); spatial correlation; data cleansing; outlier detection; data reliability

0引言

近年来,无线传感器网络(Wireless Sensor Network, WSN)被广泛应用于环境感知、智能监测、行为分析等领域。但由于传感器易受环境等因素的影响,WSN中获得的感知数据往往含有噪声和误差,并经常出现数据丢失、重复和不一致现象。由于感知数据的不精确性和不完整性[1],WSN难以对现实世界中的状态或事件进行精确监测,因此在利用感知数据之前,先对其进行清洗以保证数据的精确性和可靠性是极其重要的。

感知数据的时空相关性[2]是WSN区别于传统数据流的一个重要的特性,也是被研究人员广泛用于数据清洗的特性,这种特性可以概括如下。

1)时间相关性。WSN在环境监测、事件跟踪等应用中,感知节点所在环境发生的现象或事件会持续一段时间,不会立即消失,即这个感知节点的测量值在这段时间内(几个或多个测量周期)应该保持相对稳定,不会发生急剧变化。

2)空间相关性。在WSN应用中,现实世界发生的现象或事件会覆盖WSN的某个区域(称为事件区域(Event Area)),而不是一个位置点,即在现象或事件发生区域内的感知节点,在同一时刻应具有相近的测量值,且在一段时间内(几个或多个测量周期)其测量值具有相似的变化趋势。

在WSN应用领域,基于时空相关性的传感数据清洗技术得到广泛研究,主要分为集中式清洗方法和网内清洗方法。

1)集中式数据清洗方法。如Jeffery等[3]建立的传感器数据清洗模型,利用感知数据的时空相关性来恢复缺失数据和去除孤立点;Sheng等[4]提出使用直方图表示数据的分布式提示信息(hints)并使用hints滤出不必要的数据和识别可能的孤立点。

2)网内数据清洗方法。如Zhuang等[5]提出的加权移动平均(Weighted Moving Average, WMA)方法,通过本地节点测试和邻居节点测试相结合的方法进行感知数据的去噪,从而减少本地节点采样的能量消耗,并加快感知数据的响应速度;郭龙江等[6]在WMA基础上提出基于节点密度的混合式方法(Densitybased Hybrid Approach, DHA),根据节点密度(单跳通信范围内近邻节点个数)来动态调整算法,以达到有效去噪和节省能量的目的;Branch等[7]提出一种网内孤立点检测方法(全局检测和半全局检测),只使用单跳通信获取近邻节点数据,通过计算感知数据的估计值识别孤立点。

集中式清洗方法由于要将大量感知数据传送至Sink节点进行集中处理,因此不能很好地满足WSN应用的实时性要求;同时,由于大量数据的传输引起的能量消耗,也使得集中式清洗方法低效而难以普及。网内数据清洗方法与集中式数据清洗方法相比,感知数据直接在节点内部清洗,具有良好的实时性和节能特性,但这些方法[5-7]没有考虑近邻节点的空间相关度。

综上所述,本文定义了一种数据清洗的弹性空间模型,并在此基础上提出网内的自适应近邻空间清洗方法(Adaptive NeighborSpace Approach, ANSA)。ANSA通过动态调整近邻空间大小控制能耗,并使用空间相关度较高的近邻节点测量数据的加权平均识别孤立点和去噪。最终,通过仿真验证了ANSA方法的可行性和效果。

1面向数据清洗的自适应近邻空间

1.1近邻空间及其对数据清洗的影响

感知节点的近邻空间是指某一节点根据某一度量依据与其他节点共同形成的空间,这些节点互为近邻节点。近邻空间的度量依据可以是地理距离或路由跳数等信息,也可以人为指定。在WSN中,由于感知节点密集分布且可以利用某些定位技术获得其地理位置信息,因此,往往根据地理位置将网络节点划分在不同的空间。

基于近邻空间的数据清洗过程,是以近邻节点的感知数据作为依据,消除本地节点数据不确定性的过程。在WSN中,节点的近邻空间越大,近邻节点数量越多,节点间感知数据的整体空间相关度就越低。空间相关度越低,近邻节点所提供的信息不确定性越高,可能导致数据清洗结果不准确。另外,更多的节点意味着更多的数据通信和更多的能量消耗。当节点近邻空间过小时,由于近邻节点提供的信息不足,也不能很好地完成数据清洗任务。因此,根据本地传感器数值的不确定程度和节点的空间相关性选择合适大小的近邻空间,是有效完成数据清洗任务的前提。

3.3通信能耗评估

在数据清洗中,使用进行数据交换的近邻节点数量来评估ANSA的通信能耗。近邻空间越小,通信的近邻节点数量越少,意味着通信能耗越低。通过对100次实验进行统计,ANSA平均需要和5.1个近邻节点通信,而WMA始终需要和8个近邻节点通信,在采用相同通信协议的情况下,ANSA能相对减少约36%的通信能耗。在不同网络部署环境和不同参数设定下,通信能耗统计结果可能会有差异,但与其他固定近邻节点数的清洗方法相比,在达到同样清洗效果的情况下ANSA更节省能耗。

4结语

本文首先探讨了无线传感器网络中感知数据的不确定性和节点间感知数据的空间相关性,进而提出一种可以提高数据可靠性且节省能耗的自适应清洗方法。本文方法综合考虑感知数据波动、节点间的空间相关度和节点的通信能耗,从而确定数据清洗使用的近邻节点数量。实验结果表明该方法可行、有效,更适合实时性要求较高的WSN应用。下一步研究将考虑结合各节点感知数据的时间相关性对感知数据进行清洗。

参考文献:

[1]MARTINCIC F, SCHWIEBERT L. Distributed event detection in sensor networks [C]// ICSNC06: Proceedings of the 2006 IEEE International Conference on Systems and Networks Communications. Piscataway: IEEE Press, 2006: 43.

[2]AKYILDIZ I F, VURAN M C, AKAN O B. On exploiting spatial and temporal correlation in wireless sensor networks [C]// WiOpt04: Proceedings of the 2004 Modeling and Optimization in Mobile, Ad Hoc and Wireless Networks. Cambridge: University of Cambridge, 2004: 71-80.

[3]JEFFERY S R, ALONSO G, FRANKLIN M J, et al. Declarative support for sensor data cleaning [C]// Proceedings of the 4th International Conference on Pervasive Computing. Berlin: Springer, 2006: 83-100.

[4]SHENG B, LI Q, MAO W, et al. Outlier detection in sensor networks [C]// Proceedings of the 8th ACM International Symposium on Mobile Ad Hoc Networking and Computing. New York: ACM Press, 2007: 219-228.

[5]ZHUANG Y, CHEN L, WANG X S, et al. A weighted moving averagebased approach for cleaning sensor data [C]// ICDCS07: Proceedings of the 27th IEEE International Conference on Distributed Computing Systems. Piscataway: IEEE Press, 2007: 38-38.

[6]GUO L, FU H, ZHANG Z. Adaptive method for cleaning sensory data in wireless sensor networks [J]. Computer Engineering and Applications, 2009, 45(13): 150-155.(郭龙江,付惠娟,张中兆.传感器网络感知数据自适应去噪方法[J].计算机工程与应用,2009,45(13):150-155.)

[7]BRANCH J W, GIANNELLA C, SZYMANSKI B, et al. Innetwork outlier detection in wireless sensor networks [J]. Knowledge and Information Systems, 2013, 34(1): 23-54.

[8]ZHANG Y, MERATNIA N, HAVINGA P. Outlier detection techniques for wireless sensor networks: a survey [J]. IEEE Communications Surveys and Tutorials, 2010, 12(2): 159-170.

[9]FRANKE C, GERTZ M. ORDEN: outlier region detection and exploration in sensor networks [C]// Proceedings of the 2009 ACM SIGMOD International Conference on Management of Data. New York: ACM Press, 2009: 1075-1078.

[10]JEFFERY S R, GAROFALAKIS M, FRANKLIN M J. Adaptive cleaning for RFID data streams [C]// Proceedings of the 32nd International Conference on Very Large Data Bases. New York: ACM Press, 2006: 163-174.

[11]ZHANG Z, YANG D, ZHANG T, et al. A study on the method for cleaning and repairing the probe vehicle data [J]. IEEE Transactions on Intelligent Transportation Systems, 2013, 14(1): 419-427.

[12]FANG L, DOBSON S. Innetwork sensor data modelling methods for fault detection [C]// AmI2013: Proceedings of the Fourth International Joint Conference on Ambient Intelligence. Berlin: Springer, 2013: 176-189.

推荐访问: 传感器 自适应 清洗 面向 方法

版权所有:智城范文网 2010-2025 未经授权禁止复制或建立镜像[智城范文网]所有资源完全免费共享

Powered by 智城范文网 © All Rights Reserved.。粤ICP备20058421号