数据挖掘的应用决策树神经网络Autosav

上传人:wu****ei 文档编号:253022321 上传时间:2024-11-27 格式:PPTX 页数:31 大小:1.15MB
返回 下载 相关 举报
数据挖掘的应用决策树神经网络Autosav_第1页
第1页 / 共31页
数据挖掘的应用决策树神经网络Autosav_第2页
第2页 / 共31页
数据挖掘的应用决策树神经网络Autosav_第3页
第3页 / 共31页
点击查看更多>>
资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,For internal use only,#,Nokia Siemens Networks,R 255 G 211 B 8,R 255 G 175 B 0,R 127 G 16 B 162,R 163 G 166 B 173,R 137 G 146 B 155,R 175 G 0 B 51,R 52 G 195 B 51,R 0 G 0 B 0,R 255 G 255 B 255,Primary colours:,Supporting colours:,数据挖掘在优化中的应用,-,决策树,-,神经网络,数据挖掘解释,数据挖掘,又称为数据库中知识发现(,Knowledge discovery from database,,简称,KDD,),它是一个从大量数据中抽取挖掘出未知的、有价值的模式或规律等知识的复杂过程。数据挖掘的全过程定义描述如下,:,常用模型,决策树:该模型常常可以用来检验、预测离散型的数据。如客户的信用等级,贷款的优良与否等等。,人工神经网络:这是对人体大脑的模拟,.,该方法利用隐藏的一到两层,对数据进行分类或预测。但是速度比较慢。,多元回归:主要用于处理连续型的自变量和应变量,并可用于预测和其他分析。,Logistic,回归:与线性回归类似,但处理离散型的应变量比较合适,K-means,和聚类分析:主要用于分类,Kohonen self-organizing maps:,是一种类似神经网络,但主要用于聚类的分析工具。,关联准则:主要用于寻找在数据中频繁发生的记录间的关系,并可用于预测。,分类,(classification),;,估计,(estimation),;,预测,(prediction),;,关联分组,(affinity grouping),;,聚类,(clustering),。,数据挖掘的功能,数据挖掘功能与模型,决策树的应用,Link Adaption,优化,神经网络的应用,TDMR,的定位,数据挖掘的应用,决策树的概念,所谓决策树就是一个类似流程图的树型结构,其中树的每个内部结点代表对一个属性(取值)的测试,其分支就代表测试的每个结果;而树的每个叶结点就代表一个类别。树的最高层结点就是根结点,.,类别型,数值型,应用场景,两者关系很难通过其它函数关系不明确,难以建立映射,.,一条直线或者简单的曲线很难将内容分割,决策树生成方法,找出,起,始的分隔,:,用,来评估,一,个分,隔,数,的衡量,标准,是分散度(,diversity,)。分散度指,标,(,index of diversity,)很高,表示,这个组,合中包含,平,均分配到多個類別,而分散度指,标,很低,则,表示一,个单,一,类,別的,成员居优势,。,最好的分隔,变数,是能夠,降低,一,个,組的分散度,而且,降,得最多。,即下面式子,最大化:,分散度(分隔前),分散度(分隔,后,左,边,子集,合)分散度(分隔,后,右,边,子集合),数据业务对语音的影响,数据对业务信道的挤占,造成语音半速率比例增加,MOS,值的下降,影响用户的感受,;,数据对业务信道挤占的同时,与语音共享频率资源,对语音质量的影响,;,数据对公共信道的挤占,造成寻呼的负荷增加,影响语音业务的被叫,;,如何改善,?,提高单时隙的传输数据效率,减小数据占用信道的时间,改善对语音的影响,!,如何改善,?,减少数据对公共信道资源的挤占,增加公共信道资源的容量,!,合理分配数据和语音对频率资源的占用,让语音占用更好的频率资源,!,如何提高单时隙的传输数据效率,信道分配和释放机制的优化,:,信道分配,:,优先保证语音信道的分配,;,合理压缩数据信道的资源,提升数据信道效率,减少语音半速率的触发,;,信道释放,:,加快数据下行信道的释放,提升信道效率,;,增加,EDGE,资源的投入,使更多的用户使用,EDGE,提高整体的单时隙的吞吐率,;,自适应链路的优化研究,分析高编码比例和重传率对单时隙吞吐率的影响,;,研究在不同无线环境下,编码方式的调度修正值对高编码比例和重传率的影响,;,建立在不同无线环境下,自适应链路的参数与单时隙吞吐率的模型关系,;,找到最匹配的参数设置,来提高单时隙的传输效率,;,链路自适应工作机制,1/2,数据传输刚启动所应用的编码方式,是通过参数预先设定的。以下是诺基亚系统内的相应参数,为,BTS,级参数:,InitMCSAckMode 1,至,9(,默认值为,9=MCS9),InitMCSUnackMode 1,至,9(,默认值为,6=MCS6),由于,MCS14,为,GMSK,调制方式,而,MCS59,为,8PSK,调制。所以,应对无线环境的变化,首先要确定采用哪种调制方式。,诺基亚系统在进行上述判断时,首先根据以下两个测量值:,8PSK MEAN_BEP,8PSK CV_BEP,来对照下表,获取,BEP,查表值:,然后,把这个,BEP,查表值与,GMSK MEAN_BEP,测量值比较,如果:,BEP,查表值,GMSK MEAN_BEP,测量值,则采用,8PSK,调制方式,启动信道编码的设置,调制方式的动态选择,链路自适应工作机制,2/2,在,ACK,模式的,MCS,编码选择方式,重传的,MCS,编码选择方式,针对每个,RLC,数据块,,PCU,都能拿到测量报告,上行链路系统测量、下行链路手机上报,这样,,PCU,通过查找内置表格,如下图所示,来确定下一个,RLC,传送的编码。,在,EGPRS,系统,重传数据的编码方式是可以改变,这与,GPRS,技术有所不同。系统通过降低编码速率,提高数据的强壮性,来对抗恶化的无线环境,最终达到提高成功率的目的。而编码方式的改变,将涉及到数据块的重新组装,只有属于相同,Coding Family,的编码方式才可以达到这种兼容性。在,EGPRS,系统中,,9,种编码分别属于三个,FAMILY,,如下图所示:,优化思路,通过,LA,提高数据传送效率,一方面可以减少数据业务,PDCH,的资源占用,另一方面占用时间减少后,能够降低对语音业务的干扰。,优化目标的选择:,(,主要优化参数,MBP),每时隙吞吐率,=,总流量,/,平均占用,PDCH,数,该指标受平均占用,PDCH,数影响很大,如果小区的,CDED,配置较小,那么每时隙吞吐率必定会较大,无法反映传送效率。,数据业务等效话务量,=,传送的总块数,/,每时隙每小时能够传送的块数,该指标只能反映数据业务的流量大小。,每块传送字节数,=,总字节,/,总块数(包括重传的块数),该指标的分子部分隐含意义是是否高编码占比高,分母部分将重传率也纳入考虑,该指标最能体现数据传送效率。,相关性分析,-,寻找影响每块传送效率的主要因素,每块传送效率和重传率以及高编码占比,而重传率和高编码占比需要,LA,和,IR,参数优化来解决,通过相关性分析降纬,每块重传效率和下行平均质量相关度最大,其次是下行,1-5,级质量占比,下行,Path loss,和下行接收电平相关性很小。,下行平均质量和,1-5,级质量占比自相关度比较大,因此将下行平均质量作为决策树的因子。,决策树寻找最优,MBP,当平均接收接收质量小于,0.19,时(也就是无线质量非常良好时,,MBP,取,6,能够得到最大的块传送效率,0.12kyte/block.(960bit,每块),当平均接收接收质量大于,0.19,且小于,0.55,时,,MBP,取,5,能够得到最大的块传送效率,0.11kyte/block.(880bit,每块),MBP,是离散的,Quality,是连续的,其它的函数较难映射,决策树结果理解,将选择质量较差至少,9,个小区,分别设置,-6,-5,-4,-3,-2,-1,0,1,2,来观察每块传送效率,,LA,参数调整后效果评估,参考寻优结果后,调整,MBP,设置后,每块传送字节数从,112,字节上升到,118,字节,.,数据挖掘的应用,决策树的应用,Link Adaption优化,神经网络的应用,TDMR,的定位,生物神经元,人工神经网络的研究出发点是以生物神经元学说为基础的,神经网络处理信息的特点,在,微观内部结构,上模仿人脑的神经,并行分布系统处理的工作模式,:,实际上大脑中单个神经元的信息处理速度是很慢的,每次约,1,毫秒,(ms),,比通常的电子门电路要慢几个数量级。每个神经元的处理功能也很有限,估计不会比计算机的一条指令更复杂。,但是人脑对某一复杂过程的处理和反应却很快,一般只需几百毫秒。例如要判定人眼看到的两个图形是否一样,实际上约需,400 ms,,而在这个处理过程中,与脑神经系统的一些主要功能,如视觉、记亿、推理等有关。按照上述神经元的处理速度,如果采用串行工作模式,就必须在几百个串行步内完成,这实际上是不可能办到的。因此只能把它看成是一个由众多神经元所组成的超高密度的并行处理系统。例如在一张照片寻找一个熟人的面孔,对人脑而言,几秒钟便可完成,但如用计算机来处理,以现有的技术,是不可能在短时间内完成的。由此可见,大脑信息处理的并行速度已达到了极高的程度。,神经网络模型,x,2,w,2,x,n,w,n,x,1,w,1,F,y,F,特性函数,y,x,0,非线性,阶跃,人工神经网络的自我学习,(,训练,),这种学习归结为神经元连接权的变化。调整,Wij,的原则为:若第,i,和第,j,个神经元同时处于兴奋状态,则它们之间的连接应当加强,这一规则与“条件反射”学说一致,并已得到神经细胞学说的证实。,TDMR,的定位应用,TDMR,的定位数据,:,MR,数据,(OSS):,频点,扰码,电平,网络基础数据,小区信息,经,/,纬度,小区方向,频率,扰码,天线参数,包括主服务小区和相邻小区的,训练样本数据,(DT):,频点,扰码,电平,样本经纬度,原理,利用训练样本数据,结合网络基础数据,训练模型,将,MR,数据代入,得到待定位,MR,数据的经纬度,.,MR,数据,(OSS):,即,实际测量中待定位样本测得的临近小区的场强分贝数,其中每行表示一个样本,前,14,列表示每个样本测得的临近,7,个小区的小区号和相应场强值。,训练样本数据,(DT):,用于提供训练样本,构建训练样本库,训练模型。其中每行表示一个样本,前,14,列表示每个样本测得的临近,7,个小区的小区号和相应场强值;第,15-16,列为该样本的经度和纬度。,小区信息,:,提供所有小区的信息,其中每行提供一个小区的信息,第,1,列为小区号,第,2-3,列为小区的经纬度、第,4,列为该小区的方向角(单位:度),第,5,列为该小区的类型(,1,表示室外小区,,0,表示室内或全向的小区),天线参数,:,每个方向角的增益变化,用于对传播模型进行修正。行号为角度(单位:度)偏移量,每行的数字表示该角度偏移量的增益变化。,TDMR,定位模型的训练,MS,到各,BS,距离的相对关系可以通过,MS,所测到的各,BS,的信号强度的相对关系来表征,.,传统方法,:,根据训练样本数据,构建,MS,到,BS,的传播模型,得到距离与电平的映射关系,.,缺点,传播模型受限地理环境,失真较大,神经网络,:,根据训练样本数据,构建,MS,所测电平相对关系与位置相对关系的整体映射,.,特点,脱离传播模型,不受限地理环境,根据相对电平关系的总体映射,依据概率模糊识别,MS,的位置区域,.,TDMR,的算法实现,传统方法,+,神经网络,依据样本数据,对每个小区的传播模型进行修正,如果不匹配神经网络,则根据修正后的传播模型,进行定位,.,根据待定位数据的特点匹配结果,如果适合神经网络定位,则按照神经网络方法定位,拟合度,TDMR,定位误差分析,神经网络定位误差,:50m;,传统定位误差,:200m,受限网格内测试点的分布,The End,
展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 图纸专区 > 课件教案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!