一种基于改进网格搜索算法的SVM参数优化方法与流程

文档序号:20017744发布日期:2020-02-25 10:54阅读:2795来源:国知局
导航: X技术> 最新专利> 计算;推算;计数设备的制造及其应用技术
一种基于改进网格搜索算法的SVM参数优化方法与流程

本发明涉及数据挖掘技术领域,具体涉及支持向量机参数优化的一种基于改进网格搜索算法的svm参数优化方法。



背景技术:

近年来,随着互联网行业的发展,各行各业中积累了大量数字化数据,这些数据中包含着大量的有用信息,从这些海量数据中总结规律,提取出对人类有用的信息已成为数字化时代人们重要的研究内容。

而数据分类作为数据挖掘中的一个重要任务或过程,是利用分类算法对已有的带有类别信息的数据进行学习或训练,探求其中的潜在规律,然后利用这种规律对新的未知数据进行类别分析或预测。

支持向量机(supportvectormachine,svm)作为数据挖掘中应用最为广泛的的分类算法,能够很好地解决非线性、小样本、过学习、维数灾难等问题,它的主要思想是通过寻找不同类别之间的最优分类超平面将数据区分开来,且要满足分类间隔最大。但传统的支持向量机对内部参数的依赖性很强,其中的核参数g与惩罚参数c更是直接决定了支持向量机性能的优劣。所以优化向量机的参数成为了人们研究的重点问题。目前针对参数优化问题,已经提出了多种算法,包括利用网格搜索算法、粒子群算法(particleswarmoptimization,pso)、遗传算法、蚁群算法等。这些方法在一定程度上提升了svm的分类性能,但仍存在一定的缺陷。粒子群算法虽然收敛速度快且搜索能力强,但容易出现局部最优的问题;网格搜索算法虽然进行全局搜索保证得到全局最优参数,但搜索速度慢,性能低。因此,本发明提出了一种改进的网格搜索算法,将粒子群算法与网格搜索算法相结合,可以提升算法整体的搜索性能,以较快的速度在合适的时间消耗内找到满足分类准确性要求的最佳参数,使分类性能与时间消耗达到均衡和最佳状态。

传统的网格搜索算法中,对于搜索区间的选取带有一定的经验性及盲目性。盲目将搜索区间选的过大,在数据量很大的情况下将以大量的时间消耗为代价,无法满足时间性能上的要求;而将区间选的过小,将造成无法寻得最优参数,无法满足分类准确性上的性能要求。而根据合适的区间选取搜索范围带有一定的经验性和针对性,无法满足大多数情况下网格寻优的区间范围选择。并且,大小范围不同的搜索区间对应的搜索步长大小也将影响最优参数的选择以及时间的消耗。

处于对时间性能以及分类性能的双重考虑,本发明改进的网格搜索算法在搜索区间的选择上摆脱了经验性与盲目性的困扰。根据已有的粒子群算法,以其计算得到的局部最优或全局最优参数为搜索区间的中心点,根据一定的规则不断更新网格搜索的范围,从小区间到大区间逐步搜索,既克服了局部最优的缺点,也避免了全局大面积搜索带来的时间消耗,最终找到满足时间性能与分类性能的最佳参数组合。



技术实现要素:

本发明的目的在于提供一种基于改进网格搜索算法的svm参数优化方法。

本发明的目的是这样实现的:

一种基于改进网格搜索算法的svm参数优化方法,包括如下步骤:

步骤1:初始化分类器和粒子群算法的相关参数,选择对分类器性能影响较大的参数作为待优化参数,由粒子群算法获得全局最优参数或局部最优参数;

步骤2:将步骤1中求得的最优参数作为目标点,初始化网格搜索的空间范围参数和网格搜索过程中的搜索步长参数,以及其他变量;

步骤3:在步骤2选定的范围内进行网格搜索,采用k-cv交叉验证,重新获得该范围内的最优参数;

步骤4:将重新获得的最优参数和原来的参数进行比较,若两次获得的参数不相等,将重新获得的最优参数作为目标点,将其搜索范围按照规则进行更新作为新的搜索空间:判断是否满足停止条件,若满足条件则结束寻优过程,输出最优参数组合,

步骤5:若不满足最优条件,则继续将原来的最优参数作为目标点,在原来的搜索范围基础上按照规则重新扩大搜索范围,同时增大搜索步长,返回步骤3继续迭代寻优,直至满足最优条件。

所述步骤1中待优化参数包括:高斯核函数g(g=σ2)和惩罚因子c;所述步骤2中相关的参数包括:参数c的范围区间最小值指数dmin,参数c的范围区间最大值指数dmax,参数g的范围区间最小值指数fmin,参数g的范围区间最大值指数fmax,参数c的搜索步长cstep,参数g的搜索步长gstep,系数变量m、n与常数l,其中参数的搜索范围存在如下关系:

所述步骤4中,区间的变化与搜索步长变化的具体方法为:若新求得的最优参数c′best,g′best分别与上一次迭代过程中的参数cbest,gbest相等,搜索区间的端点值相关参数更新公式及步长更新公式为:

c′step=n×cstep,g′step=m×gstep;

其中dmin、dmax是参数c的范围区间相关的指数参数,fmin与fmax是参数g的范围区间相关指数,常数cstep和gstep是初始化时预设的步长,c′step与g′step是在步骤4中更新的阶段性步长参数,m与n是系统变量且遵循一定的变化规律;

若新求得的最优参数c′best,g′best分别与上一次迭代过程中的参数cbest,gbest不相等,根据新获得的最优参数与上一次迭代过程中的最优参数的大小关系,搜索区间的端点值相关参数更新公式分别是:

当c′best>cbest时:dmax=dmax+l;

当c′best<cbest时:dmin=dmin-l,

同理,

当g′best>gbest时:fmax=fmax+l;

当g′best<gbest时:fmin=fmin-l,

其中,c′best,g′best是本次迭代过程中新求得的最优参数。

本发明的有益效果在于:1.本发明改进了传统的网格搜索算法,克服了在选取搜索区间时存在的盲目性以及经验性问题,改善了在数据量较大的情况下该方法存在的时间消耗大的问题,使时间消耗与分类性能达到一个相对平衡的状态;2.优化之后的分类器可以有效提升分类器的综合性能和泛化能力。

附图说明

图1是基于改进的网格搜索算法的svm参数优化方法总流程图;

图2是基于改进的网格搜索算法的svm参数优化方法详细流程图。

具体实施方式

下面结合附图对本发明做进一步描述。

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施一起用于解释本发明,并不构成对本发明的限制。

本发明涉及数据挖掘技术领域,具体涉及支持向量机参数优化以及一种改进的网格搜索算法。

本发明利用改进的网格搜索算法,并结合粒子群算法相关操作,可以自适应调整网格搜索的区间范围以及搜索步长,提升网格搜索算法的寻优效率。以下结合附图对本发明的具体实施说明如下。

基于改进网格搜索算法的svm参数优化的方法,包括如下几个步骤:

步骤1:该方法首先将惩罚因子c和高斯核函数g作为待优化参数,通过粒子群算法,得到初始优化参数(cpso,gpso)。其中,粒子群算法的标准算法形式如下所示:

vi=w×vi+c1×rand()×(pid(t)-xi)+c2×rand()×(pgd(t)-xi);

xi=xi+vi。

其中,w为惯性因子,c1与c2称为加速常数,一般取c1=c2∈[0,4],rand()表示[0,1]上的随机数。vi是粒子速度,xi表示粒子当前位置,pid(t)代表第i个粒子在t轮迭代时个体最优位置的第d维度值,pgd(t)代表第t轮时的种群最优位置的第d维值,其中,参数c、g作为粒子的相应维度值。

粒子群算法通过以上两个公式,最终计算出局部最优参数组合或全局最优参数组合。因为无法保证参数的全局最优性,所以需要采用改进的网格搜索算法进行进一步计算。

步骤2:对参数进行初始化,具体包括:以(cpso,gpso)作为目标点,初始化常数l,cstep以及gstep,初始化系统变量m=1,n=1,其他参数初始化如下所示:

区间最优参数初始化:(cbest,gbest)=(cpso,gpso);

搜索步长初始化:c′step=cstep,g′step=gstep;

搜索区间端点参数初始化:

其中,搜索范围满足

步骤3:采用k-cv交叉验证,根据步骤2中提供的区间范围进行网格搜索,搜索步长分别为c′step和g′step。最终通过计算获得本次迭代该区间内的最优参数(c′best,g′best)。

步骤4:判断是否满足算法结束条件,若满足则输出最优参数组合,结束寻优;否则,转向步骤5;

步骤5:分别比较c′best与cbest,g′best与gbest的大小关系,根据他们的大小关系更新相关参数:

若c′best>cbest:

系统变量更新:n=0;

范围区间端点参数更新:dmax=dmax+l;

搜索步长更新:c′step=cstep;

最优参数目标值更新:cbest=c′best;

若c′best=cbest:

系统变量更新:n=n+1;

范围区间端点参数更新:

搜索步长更新:c′step=n×cstep;

若c′best<cbest:

系统变量更新:n=0;

范围区间端点参数更新:dmin=dmin-l,

搜索步长更新:c′step=cstep;

最优参数目标值更新:cbest=c′best;

同理,对于参数g:

若g′best>gbest:

系统变量更新:m=0;

范围区间端点参数更新:fmax=fmax+l;

搜索步长更新:g′step=gstep;

最优参数目标值更新:gbest=g′best;

若g′best=gbest:

系统变量更新:m=m+1;

范围区间端点参数更新:

搜索步长更新:g′step=m×gstep;

若g′best<gbest:

系统变量更新:m=0;

范围区间端点参数更新:fmin=fmin-l,

搜索步长更新:g′step=gstep;

最优参数目标值更新:gbest=g′best;

其中,c′best与g′best是当前求得的最优参数,cbest与gbest是上次迭代过程中获得的最优参数。当两次搜索得到的最优参数保持不变时,需要加大搜索空间;当参数发生变化时,以新获得的最优参数作为目标点重新确定搜索范围。需要注意的是,相关参数之间互有联系,更新的顺序需严格按照以上描述进行更新。

步骤6:获得参数c,g的寻优区间的相关参数,回到步骤3进行迭代寻优。

在步骤4中,对于算法终止条件的设置,通常需要根据实际需要选择。可以将实际的分类模型中的准确率作为终止条件,也可以根据实际需要,当获得的最优参数组合多次不再发生变化证明已达到全局最优,可以停止寻优。

本发明提供了一种基于改进的网格搜索算法的svm分类器参数优化方法,目的在于克服现有技术中存在的局部最优与大量的时间消耗问题,可以有效提升分类器的综合性能和泛化能力。

本发明所提供的基于改进的网格搜索算法的svm分类器参数优化方法,该方法包括以下步骤:

(1)初始化分类器和粒子群算法的相关参数,选择对分类器性能影响较大的参数作为待优化参数,由粒子群算法获得全局最优参数或局部最优参数;

(2)将步骤(1)中求得的最优参数作为目标点,初始化网格搜索的空间范围参数和网格搜索过程中的搜索步长参数,以及其他变量。

(3)在步骤(2)选定的范围内进行网格搜索,采用k-cv交叉验证,重新获得该范围内的最优参数;

(4)将重新获得的最优参数和原来的参数进行比较,若两次获得的参数不相等,将重新获得的最优参数作为目标点,将其搜索范围按照规则进行更新作为新的搜索空间,返回步骤(3)继续迭代寻优;否则,判断是否满足停止条件,若满足条件则结束寻优过程,输出最优参数组合,否则继续将原来的最优参数作为目标点,在原来的搜索范围基础上按照规则重新扩大搜索范围,同时增大搜索步长,返回步骤(3)继续迭代寻优。

优选的,所述步骤(1)中待优化参数包括:

高斯核函数g(g=σ2)和惩罚因子c。

优选的,所述步骤(2)中相关的参数包括:

参数c的范围区间最小值指数dmin,参数c的范围区间最大值指数dmax,参数g的范围区间最小值指数fmin,参数g的范围区间最大值指数fmax,参数c的搜索步长cstep,参数g的搜索步长gstep,系数变量m、n与常数l。其中参数的搜索范围存在如下关系:

优选的,所述步骤(4)中,区间的变化与搜索步长变化的具体方法为:

若新求得的最优参数c′best,g′best分别与上一次迭代过程中的参数cbest,gbest相等,搜索区间的端点值相关参数更新公式及步长更新公式为:

c′step=n×cstep,g′step=m×gstep;

其中dmin、dmax是参数c的范围区间相关的指数参数,fmin与fmax是参数g的范围区间相关指数,常数cstep和gstep是初始化时预设的步长,c′step与g′step是在步骤(4)中更新的阶段性步长参数,m与n是系统变量且遵循一定的变化规律。

若新求得的最优参数c′best,g′best分别与上一次迭代过程中的参数cbest,gbest不相等,根据新获得的最优参数与上一次迭代过程中的最优参数的大小关系,搜索区间的端点值相关参数更新公式分别是:

当c′best>cbest时:dmax=dmax+l;

当c′best<cbest时:dmin=dmin-l,

同理,

当g′best>gbest时:fmax=fmax+l;

当g′best<gbest时:fmin=fmin-l,

其中,c′best,g′best是本次迭代过程中新求得的最优参数。

完整全部详细技术资料下载
当前第1页 1  2  3 
相关技术
  • 基于CT图像不相似性特征的胰...
  • 信息分类方法、装置、计算机设...
  • 一种视频质量评估的方法、模型...
  • 一种基于随机森林的KPI劣化...
  • 一种基于注意力机制的图片特征...
  • 一种高精度无人机正射影像制作...
  • 基于深度学习的端到端车架号识...
  • 一种基于卷积神经网络的违章检...
  • 基于最大化置信度的半监督语义...
  • 一种基于边界点检测的场景文本...
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1
网格算法相关技术
  • 正六边形蜂窝网格楼盖结构及其制造方法
  • 大体积混凝土冷却温度场计算方法
  • 三输入三输出的dna算法自组装六边形结构模型的制作方法
  • 一种六边形网格单层网壳的几何建模方法
  • 网格解码器的存储器管理算法的制作方法
  • 孔径为4的六边形格网层次编码、运算与索引方法
  • Led网格阵列,制造所述网格的方法和装置以及用于所述网格阵列的led部件的制作方法
  • 基于网格原理的道路拥堵优化算法
  • 全球六边形离散格网上的矢量数据绘制方法
  • 一种基于最大信息熵的化工数据流实时异常检测方法
网格搜索算法相关技术
  • 基于欠抽样面向不平衡数据集的交通事件自动检测方法
  • 交互式网格系统中基于期权定价模型调度算法的实现的制作方法
  • 一种滑翔飞行器总体性能仿真试验流程自动化管理方法
  • 用于构建地层网格的划分算法的制作方法
  • 一种应用于电信领域地理网格的分析算法的制作方法
  • 基于故障网格的航迹规划算法设计的制作方法
  • 基于空间网格化算法的含逆断层等值线绘图方法
网格简化算法相关技术
  • 基于二维激光传感器的三维环境表面三角网格构建方法与流程
  • 确定并存储描述第一网格多边形集合的信息的方法和系统与流程
  • 多边形网格的MPEG/SC3DMC标准的扩展的制造方法与工艺
  • 一种简化代码的方法和装置与制造工艺
  • 基于逆插值Loop的网格简化方法
  • 点云网格简化系统及方法
  • 一种基于网格匹配的Demons算法的多期CT图像配准方法
  • 一种基于三角网格简化的纹理映射方法
  • 基于偏序简化算法的无线传感网软件模型优化方法
  • 网格译码器中的代码序列检测系统和方法

聚圣源林道平任汕头市委书记陈宇水火名字男孩起名残缺美吕氏春秋辣文小说网摆渡人经典语录办公用品贸易公司起名猴年李姓女宝宝起名店铺免费起名的网站都市言情小说名杨天下取名起名大全网免费起个名字的女孩润字起名字胡 起名知起名字海字取名起名强殖战士新包青天电视剧起个韩国服装店什么名字好归化与异化带恒字公司起名大全公司怎么起英文名男孩子姓王起名大全洋气陈字起名难以置信护肤品取名起名大全大全集氢氧化铜的颜色起名测名软件怯的组词淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男孩疑遭霸凌 家长讨说法被踢出群国产伟哥去年销售近13亿网友建议重庆地铁不准乘客携带菜筐雅江山火三名扑火人员牺牲系谣言代拍被何赛飞拿着魔杖追着打月嫂回应掌掴婴儿是在赶虫子山西高速一大巴发生事故 已致13死高中生被打伤下体休学 邯郸通报李梦为奥运任务婉拒WNBA邀请19岁小伙救下5人后溺亡 多方发声王树国3次鞠躬告别西交大师生单亲妈妈陷入热恋 14岁儿子报警315晚会后胖东来又人满为患了倪萍分享减重40斤方法王楚钦登顶三项第一今日春分两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?周杰伦一审败诉网易房客欠租失踪 房东直发愁男子持台球杆殴打2名女店员被抓男子被猫抓伤后确诊“猫抓病”“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火男孩8年未见母亲被告知被遗忘恒大被罚41.75亿到底怎么缴网友洛杉矶偶遇贾玲杨倩无缘巴黎奥运张立群任西安交通大学校长黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发妈妈回应孩子在校撞护栏坠楼考生莫言也上北大硕士复试名单了韩国首次吊销离岗医生执照奥巴马现身唐宁街 黑色着装引猜测沈阳一轿车冲入人行道致3死2伤阿根廷将发行1万与2万面值的纸币外国人感慨凌晨的中国很安全男子被流浪猫绊倒 投喂者赔24万手机成瘾是影响睡眠质量重要因素春分“立蛋”成功率更高?胖东来员工每周单休无小长假“开封王婆”爆火:促成四五十对专家建议不必谈骨泥色变浙江一高校内汽车冲撞行人 多人受伤许家印被限制高消费

聚圣源 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化