本发明属于无人机异常检测和系统健康管理领域。
背景技术
无人机异常检测方法主要可分为三大类,基于知识的异常检测方法、基于物理模型的异常检测方法和基于数据驱动的异常检测方法。前两种方法需要充分了解领域知识或系统结构才能达到较好的检测效果,普适性较差,抗干扰能力差,且一般只能检测已知类型的异常检测。无人机遥测数据异常标签少,异常类型复杂,且难以对其各个子系统建立统一的物理模型。
基于数据驱动的异常检测方法属于多元统计分析的范畴,可以细分为基于相似性的方法、基于统计的方法、基于分类的方法、基于预测的方法、基于概率的方法。无人机遥测飞行数据主要的形式为时间序列,基于预测的方法广泛应用于时间序列的异常检测中,具有自适应性,可以进行离线数据或在线数据的异常检测。这类方法以数据的预测结果为基础,因此优秀的检测效果依赖于精准有效的预测模型,如arma、svm、神经网络等。但这些方法都属于浅层学习算法,对于无人机系统工作过程中产生的较为复杂的函数,其逼近能力并不能满足的较高拟合精度需求。近年来,深度学习迅速发展,本课题采用深度学习领域的lstm方法完成预测模型,并基于预测结果完成无人机异常检测。
技术实现要素:
本发明是为了解决在无人机飞行数据异常检测中,无人机系统工作过程中产生的函数较为复杂,其逼近能力并不能满足较高拟合精度需求的问题,现提供一种基于lstm的无人机飞行数据异常检测方法。
一种基于lstm的无人机飞行数据异常检测方法,包括异常点检测方法和异常序列检测方法:
异常点检测方法具体为:
步骤一:重构无人机遥测数据相空间,获得输入向量和输出向量,构建lstm基本预测模型的训练样本集和测试样本集,并基于训练、测试样本集搭建lstm基本预测模型;
步骤二:利用网格搜索法对lstm基本预测模型的参数进行寻优,并将寻优后的参数代入lstm基本预测模型中获得最优lstm模型;
步骤三:将测试样本集中的样本输入到最优lstm模型中,获得lstm预测结果;
步骤四:计算训练样本集中样本的实际值与lstm预测结果的残差,将训练样本集中样本的残差平均值作为正态分布中心μ=mean(etraining),将训练样本集中样本残差的标准差作为正态分布方差σ=std(etraining),etraining表示训练样本集中样本的残差,当置信概率p=99%时,获得置信区间:
[μ-2.6·σ,μ+2.6·σ];
步骤五:判断待检测无人机飞行数据是否属于置信区间,是则该待检测无人机飞行数据为正常点,否则该待检测无人机飞行数据为异常点;
异常序列检测方法具体为:
步骤六:将所有待检测无人机飞行数据按照时间顺序划分为多个时间序列,每个时间序列含有n个数据,6≤n≤15;
步骤七:当置信概率大于99%时,判断每个时间序列中异常点的个数q是否属于[n-4,n],是则该时间序列为异常时间序列,否则该时间序列为正常时间序列。
有益效果:本发明所述的一种基于lstm的无人机飞行数据异常检测方法,对无人机飞行数据进行异常检测时,对片段异常的检测效果较准确。对于图3中异常片段为[303,343]的无人机数据,本发明最终检测到的异常片段为[303,346],可见本方法检测效果较好,逼近能力能够满足较高拟合精度需求。
附图说明
图1为一种基于lstm的无人机飞行数据异常检测方法的流程图;
图2为lstm网络结构示意图;
图3为存在异常的无人机数据曲线图;
图4为测试集残差曲线与决策阈值曲线图;
图5为测试集异常检测结果标记曲线图;
1:lstm节点。
具体实施方式
参照图1具体说明本实施方式,本实施方式所述的一种基于lstm的无人机飞行数据异常检测方法,
步骤一:无人机遥测数据相空间重构。
为适应lstm网络结构的特点,对于单维的无人机遥测数据,首先进行相空间重构,构造输入向量和输出向量作为lstm的训练样本和测试样本,如式1所示。
其中x(t)是从单维时间序列中构造的输入向量,x(t)以时间序列形式存在的单维无人机遥测数据在t时刻的值,其相空间重构窗口长度为d,y(t)为输出向量为x(t)所对应的真实值。lstm模型需要完成的就是对x(t)→y(t)映射关系的学习。
将前
步骤二:利用步骤一获得的训练样本集和测试样本集,采用tensorflow深度学习开源框架搭建lstm基本预测模型。lstm网络结构如图2所示。
具体包含四个要点:
a、确认输入维度。根据每个时刻对lstm网络输入数据点的个数确定输入围度,且网络沿时间展开次数与输入围度的乘积等于相空间重构窗口长度。
b、根据无人机遥测数据的复杂程度和输入维度确定lstm结构网络层数。本实施方式采用三层lstm结构,即只有一层隐藏节点,避免过深的纵向层数导致过拟合。
c、选择激活函数。在隐藏层和输出层之间选择了线性函数作为激活函数。
d、输出层设计。lstm拟合的是[x(t),x(t-1),l,x(t-(d-1))]→x(t+1)的映射关系,每输入一轮数据仅对应一维输出,因此最后一个输入数据到来前所有时刻均不输出结果,即取消网络输出层,网络最后一次沿时间展开时输出层正常输出预测结果。训练和测试样本里的输出向量。
步骤三:利用网格搜索法对lstm基本预测模型的参数进行寻优,并将寻优后的参数代入lstm基本预测模型中获得最优lstm模型。
在lstm模型中,预先设置的诸多参数都可能对最终的预测效果产生明显影响。其中较为关键的三个参数分别为相空间重构窗口长度l、隐藏层节点个数n和学习率η。采用网格搜索方法对上述三种参数进行寻优。网格搜索指的是这三种参数各自取其不同的数值,相互交叉,形成了参数的三维搜索空间。遍历三个参数的设定取值范围,最后给出所有参数组合的测试集预测精度,并按照从高到低的顺序排列,排在首位的参数组合即为最优参数组合。
步骤四:将测试样本集中的样本输入到最优lstm模型中,获得lstm预测结果
步骤五:检测异常点。
预测值与真实值会存在残差,视为不能进一步学习提炼的随机噪声。随机噪声有很多因素共同决定,一般情况下满足均值为0的正态分布。计算训练样本集中样本的实际值与lstm预测结果的残差,将训练样本集中样本的残差平均值作为正态分布中心μ=mean(etraining),将训练样本集中样本残差的标准差作为正态分布方差σ=std(etraining),etraining表示训练样本集中样本的残差,当置信概率p=99%时,获得置信区间:
[μ-2.6·σ,μ+2.6·σ](2)
判断待检测无人机飞行数据是否属于置信区间,是则该待检测无人机飞行数据为正常点,否则该待检测无人机飞行数据为异常点。
步骤六:检测异常序列。
将所有待检测无人机飞行数据按照时间顺序划分为多个时间序列,每个时间序列含有n个数据,6≤n≤15;当置信概率大于99%时,判断每个时间序列中异常点的个数q是否属于[n-4,n],是则该时间序列为异常时间序列,否则该时间序列为正常时间序列。
步骤七:将所有异常时间序列取并集,获得所有待检测无人机飞行数据的异常点集合。
本实施方式选用存在异常片段的无人机数据进行所述方法的效果评估。无人机数据如图3所示,在[303,343]区间内存在片段异常。利用所提出的方法,设定置信度为99%,即置信区间为[μ-2.6·σ,μ+2.6·σ],得到置信区间如图4所示,残差超出置信区间部分为异常值。最后,对所有异常点进行标记。根据所提出的方法,当度为10的时间序列中出现至少6个异常值时,此片段为异常片段,最终得到的异常片段为[303,346],检测效果较好,如图5所示。
聚圣源2018年的宝宝起名韩的起名大全跨境电商的公司起名金属类公司起名五星红旗迎风飘扬演员表调解室起个别致的名字天津塘沽大爆炸篮球游戏魔法总动员电影美女视频黄8频全软件五行中缺水怎么起名用雯字起名大全余干天气东莞通报19岁确诊大学生感染来源降格扫黑风暴全集资源云盘蛋糕店起名有哪些猪婴儿起名宜用的字关于起名字的知识和学问鬼泣3特别版2010年城市gdp排名坏蛋是怎样炼成的txt行走在冬夜的冷风中毛晓彤和陈翔事件取名生辰八字周易起名微商怎样起店名保温材料公司起名联通手机号双胞胎起名男孩 李古冶房屋出租淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男孩疑遭霸凌 家长讨说法被踢出群国产伟哥去年销售近13亿网友建议重庆地铁不准乘客携带菜筐雅江山火三名扑火人员牺牲系谣言代拍被何赛飞拿着魔杖追着打月嫂回应掌掴婴儿是在赶虫子山西高速一大巴发生事故 已致13死高中生被打伤下体休学 邯郸通报李梦为奥运任务婉拒WNBA邀请19岁小伙救下5人后溺亡 多方发声王树国3次鞠躬告别西交大师生单亲妈妈陷入热恋 14岁儿子报警315晚会后胖东来又人满为患了倪萍分享减重40斤方法王楚钦登顶三项第一今日春分两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?周杰伦一审败诉网易房客欠租失踪 房东直发愁男子持台球杆殴打2名女店员被抓男子被猫抓伤后确诊“猫抓病”“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火男孩8年未见母亲被告知被遗忘恒大被罚41.75亿到底怎么缴网友洛杉矶偶遇贾玲杨倩无缘巴黎奥运张立群任西安交通大学校长黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发妈妈回应孩子在校撞护栏坠楼考生莫言也上北大硕士复试名单了韩国首次吊销离岗医生执照奥巴马现身唐宁街 黑色着装引猜测沈阳一轿车冲入人行道致3死2伤阿根廷将发行1万与2万面值的纸币外国人感慨凌晨的中国很安全男子被流浪猫绊倒 投喂者赔24万手机成瘾是影响睡眠质量重要因素春分“立蛋”成功率更高?胖东来员工每周单休无小长假“开封王婆”爆火:促成四五十对专家建议不必谈骨泥色变浙江一高校内汽车冲撞行人 多人受伤许家印被限制高消费