资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,全闪存阵列的设计与实测,专业存储领域领导品牌,1,全闪存阵列设计,目录,2,典型应用场景与实测案例,什么是闪存?,=,闪,存的出现:去除在线存储系统内唯一的机械部件,磁存储方式、机械臂,电,存储方式、芯片,闪存的显著优点,性能高,固态硬盘,I,ntel,DC S3610 400GB,SAS15K,希捷,ST300MP0005,SAS10K,希捷,ST1200MM0088,SAS7.2K,希捷,ST4000NM0033,4K,随机,IOPS,8.4w(,读,),2.5w(,写,),180,155,76,顺序读,MB/s,550(,读,),400(,写,),160233,108215,175,平均延迟,55,s(,R),66,s(W),2,ms+3.5ms,2.9,ms+3.5ms,4.16,ms+9ms,固态硬盘的随机,读写性能是传统磁盘的数百倍,延迟只有传统磁盘的一百至数,百分之一!,闪,存性能举例,45,万,IOPS,1536,块传统硬盘,过去需要,1536,块硬盘完成的,任务,在今天的全,闪存上只需要,20,块硬盘,!,闪,存的显著缺点,擦写寿命与写放大,擦写,寿命:,SLC,:典型擦写寿命,10,万次,MLC,:典型擦写寿命,1,万次,eMLC,:典型擦写,1.53,万次,注:当然根据制,程不同,,又略有区别,写入放大:,SSD,是以,1 page,(如,4K,)写入,而擦除则是以,block,(,128,*,4K,)为最小单位。,当发生数据更改时,,需要先擦除,而擦除,block,就需要将其中有效的,page,移动并写入到其他位置,,于是就,发生了写放大问题。,闪存的典型寿命举例,SATA,接口的耐磨度和最大容量:,Intel 3710,:,10DWPD,,,Max 1.2TB,Intel 3610,:,3DWPD,,,Max 1.6TB,Intel 3510,:,0.3DWPD,,,Max 1.6TB,三星,SM863,:,3.6DWPD,,,Max 1.92TB,三星,PM863,:,0.8DWPD,,,Max 3.84TB,高可靠领域:,10,*,1.2=12TB/,天,传统阵列中的二级读缓存,典型的全闪存阵列配盘,DWPD,(Disk Write Per Day,)(,全盘磁盘写,/,每天,),基于闪存的三种阵列,传统阵列,:,常见形态,传统,阵列,+,少量,SSD,盘,,SSD,盘用作二级缓存,提升性能。二级缓存以读居多。,混合阵列,:,常见,形态,闪存,+,机械硬盘混合的阵列,闪存、机械硬盘都用于存放数据。数据可在闪存及机械硬盘之间进行迁移。,全闪存阵列:,未来,的方向,只,采用闪存用作存储介质的阵列,。,闪,存的性能完全不同,,全闪存,阵列需要完全不同的硬件架构!,闪,存的特性,完全不同,,全闪存,阵列,需要,完全不同的,软件处理方式,!,关于全闪存阵列的不同设计思路(,EMC,),关键字:,横向扩展节点(不是最强的),0.5ms,的延迟,(不是最强的,),采用,XDP,与重删,提高利用率,采用,eMLC,降低成本,注,重,性能与功能的平衡,基本单元,1,个,UPS,2,个控制器,1,个磁盘框,关于全闪存阵列的,不同设计思路(,IBM,),关键字:,特殊设计的硬件,,追求极致性能,,,如,4,模块,200,万,4K,随机,IOPS,低于,200,s,的延迟,基本没有高级特性,借助,SVC,等实现高级特性,全闪存阵列的,不同设计思路,(华为),关键字:,采用,传统双控存储硬件,不横向扩展、只纵向扩展,宣传最大,IOPS 60,万,延迟,0.5,毫秒,功能特性丰富,宏杉全闪存阵列的设计思路,闪,存的性能完全不同,,因此,,全闪存阵列,需要完全不同的硬件架构!,闪,存特性完全不同,,因此,,全,闪存,阵列,需要完全不同的,软件处理方式,!,硬件架构优化,横向扩展设计,引擎处理能力设计,硬盘通道设计,软件架构优化,全局磨损平衡,写入优化,性能与功能的平衡,MS7000AF,横向扩展硬件架构,控制矩阵(,8,引擎扩展),SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,硬盘通道,10,核,20,线程,10,核,20,线程,10,核,20,线程,10,核,20,线程,1.5TB,高速缓存,主机,通道,横向扩展:,通过控制矩阵,可横向扩展至,8,个控制,引擎(,PCIE3.0,或,40Gb/100Gb,低延迟以太网);,纵向扩展:,多个独立的,384Gb,通道扩展,6,个硬盘框(,SAS3.0,);,主打高性能,单,引擎处理能力,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,SSD,硬盘通道,10,核,20,线程,10,核,20,线程,10,核,20,线程,10,核,20,线程,1.5TB,高速缓存,主机,通道,80,CPU,线程的处理能力,1.5TB,高速缓存,384Gb,交换带宽,/25,盘,30W,IOPS/25,盘,硬盘,通道设计,全新设计的硬盘通道,确保吞吐性能,是传统存储的,4,倍以上,传统,SAS,架构:,采用,24Gb SAS2.0,或,4Gb FC,连续;,每个硬盘柜,2,条链路上行,,2,条链路向后端纵向扩展;,宏杉,SSD,架构:,采用,48Gb SAS3.0,连,接,;,每个硬盘,柜,8,条,链路上行,,不纵向扩展;,每个硬盘柜,25,盘,每,6,个,SSD,独享,2,条,48Gb SAS3.0,通道,前端总线,CPU,CPU,后端总线,前端总线,CPU,CPU,后端总线,SAS,SAS,SAS,SAS,SAS,SAS,SAS,SAS,SAS,SAS,硬盘柜,纵向继续扩展,传统,SAS,架构,24Gb SAS2.0/4Gb FC,48Gb SAS3.0,X2,前端总线,CPU,CPU,后端总线,前端总线,CPU,CPU,后端总线,SAS,SAS,SAS,SAS,SAS,SAS,SAS,SAS,SAS,SAS,硬盘柜,不纵向扩展,SSD,架构,X8,瓶颈,瓶颈,全局磨损平衡,基于,Cell,的,RAID3.0 AF,技术,全局磨损平衡:,CRAID3.0,将硬盘分块并打散到所有硬盘,实现全局硬盘磨损平衡,;,写入优化,重写软件代码,减少数据回读,满条带刷盘,,RAID5,写入放大控制在,1.6,倍左右;,同等业务条件下,采用,RAID10,可以更有效,减少回读,提升,IO,效率。,实际测试,MS7000AF,配置,1,个,SSU,配置,25,块盘,4,组,6,块盘,RAID10/1,块全局热备盘,性能,延时低于,1ms,,混合,IOPs,(,70%,读,+30%,写,,8KB,全随机),30,万(,1,个,SSU,),性能与,功能,的,平衡,生产卷,双活,卷,主机,B,存储引擎,A,存储引擎,B,虚拟卷,数据,中心,A,40GE/RDMA,灾备卷,存储引擎,A,数据,中心,C,数据,中心,B,GE/10GE,复制,快照,镜像,自动精简,双活,工作模式可选择,性能模式:去除复制、快照等高级特性,缩短,IO,路径,提供极致,性能;,提供,“功能模式”可供选择,在功能模式下,提供足够的性能,同时保留快照、复制等高级特性,;,MS7000AF,规格,项目描述,MS7000AF,架构,多引擎架构,支持,1-8,个引擎横向扩展,处理器(每引擎),2,*,2,路,Intel,多核处理器,最大缓存能力(每引擎),1.5TB,硬盘,柜扩展能力(每引擎),6,(,每硬盘,柜,25,盘位),硬盘,柜接口(每磁盘柜),8*4*12GbSAS,接口,IO,模块类型,8Gb/s FC,模块、,16,Gb/s,FC,模块,10,Gb/s iSCSI,模块、,40,Gb/s,iSCSI,模块,IOPS(,每引擎),300,000,(,8K,全随机,,70%,读,+30%,写混合),延迟,1,ms,对比,EMC XtremIO 4.0,1,、测试模型:,70,%,读,+30%,写,,8KB,全,随机,2,、,EMC,数据为官网标称数据,宏杉为实验室实测数据,宏杉,MS7000+,SSU,宏杉,MS7000+,SSU,宏杉,MS7000+,SSU,宏杉,MS7000+,SSU,宏杉,MS7000+,SSU,EMC,Starter X-Brick,EMC,1 X-Brick,SSD,盘数量,24,(可扩展至,50,),12,24,12,24,15,(可扩展至,25,),25,Rack,Space,7U,(,9U,),7U,7U,7U,7U,6U,6U,性能(,8K,全随机,,70%,读,+30%,写),300K,100K,200K,60K,120K,150K,150K,平均延时,0.9ms,0.5ms,0.5ms,0.5ms,0.5ms,0.5ms,0.5ms,最大带宽,6GB/s,6GB/s,6GB/s,6GB/s,6GB/s,3GB/s,3GB/s,RAID,类型,10,10,10,5,5,XDP,XDP,1,全闪存阵列设计,目录,2,典型应用场景与实测案例,闪存的,典型,应用场景,1,2,3,4,索引,数据,仓库,OLTP,VDI,随机,顺序,读取密集型,写入,密集型,索引,维护索引以实现更快的数据访问,在数据库上运行以加快查询数据块的定位,数据仓库,存储的数据用于创建报告或者获取商业智能,用于数据挖掘、分析、假设检验、建模,OLTP,零售、金融等面向交易应用,如果数据无法访问或者访问速度缓慢,业务可能会受到影响的应用,在使用高峰期间,客户体验可能会受到影响的应用,VDI,在集中式服务器的虚拟机上承载桌面操作系统,实现黄金映像的快速检索,存在启动风暴、写入分配和延迟等问题,闪存的最佳应用:,交易性、密集,IO,的工作负载,实测案例:数据库加速(,某,集团),测试环境,业务软件:用友,NC,系统报表处理,数据库:,Oracle 12,小机:,Power 840/AIX 7.1,厂商,存储阵列,任务耗时间,原有存储系统,原有混合阵列,01:03:40,IBM,测试存储,FlashSystem 840,;,20TB,;,00:44:36,宏杉测试存储,MS7000AF,;,20,*,400GB SSD,00:42:49,IBM,原有传统阵列,宏杉,宏杉科技,MS7000AF,实测试性能优于,IBM FS840,实测案例:服务器虚拟化(,某,银行),测试环境,平台软件:,VMware5.1/SUSE/DD,服务器:,4,台,Dell R720,测试方法,1,、,4,台物理机,每台物理机内创建,1,台虚拟机(,SUSE,);,2,、,4,台虚拟机中同时运行,DD,脚本读写数据,块大小,1K1638K,测试结果,记录每一个数据块下,存储的读写性能;,厂商,存储阵列,IBM,FlashSystem 900,;,21TB,;,宏杉,MS7000AF,;,25,*,400GB SSD,宏杉科技,MS7000AF,实测试性能优于,IBM FS900,MB/s,
展开阅读全文