什么是存储? 点击:456 | 回复:0



ahwintech

    
  • 精华:0帖
  • 求助:0帖
  • 帖子:7帖 | 2回
  • 年度积分:0
  • 历史总积分:24
  • 注册:2015年9月18日
发表于:2015-09-25 09:20:34
楼主


winner WDT5000系列统一存储系统

如今计算机已经渗透到企业运作的各个角落,企业依靠所存放的这些业务数据进行决策,因此企业如何存放数据成为企业信息系统的重中之重,这也掀起了如今的存储热潮,那么到底什么是存储?存储的含义究竟是什么?


存储就是根据不同的应用环境通过采取合理、安全、有效的方式将数据保存到某些介质上并能保证有效的访问,总的来讲可以包含两个方面的含义:一方面它是数据临时或长期驻留的物理媒介;另一方面,它是保证数据完整安全存放的方式或行为。存储就是把这两个方面结合起来,向客户提供一套数据存放解决方案。


说到存储介质,实际上它的范围非常的广,小到计算机系统中的几百KB的ROM芯片,大到上百TB的磁盘阵列系统都可以用来保存数据,又都可以称为存储,可以说存储无处不在、无处不有。

存储按照使用的方式和存储规模,又有移动存储设备(比如:具有拇指大小的霹雳碟、具有名片大小的PCMCIA硬盘、具有书本大小的USB移动硬盘)和非移动存储设备,企业中存储数据的绝大多数设备都是非移动存储设备。


通常计算机中的各种数据可以驻留在不同的介质上,按照存储介质和存储技术的不同又可分为磁盘存储、磁带存储、光存储、磁光存储,其中磁带是最为便宜的存储介质、而磁盘是存取速度最快的存储介质。


为了减少企业对存储的整体投入,通常对不同的数据采取不同的存储方式,因此在一个较大的存储系统中存储设备会分成三种角色:在线存储、近线存储、离线存储,通常将不经常访问的数据存放在离线存储的设备上(比如:磁带库),将要求传输速度快或经常访问的数据存放在在线存储的设备上(比如:磁盘阵列)。


存储设备与服务器的连接方式通常有三种形式:

1)存储设备与服务器直接相连接,又称为DAS;

2)存储设备直接联入现有的TCP/IP的网络中,这种设备称为NAS;

3)将各种存储设备集中起来形成一个存储网络,以便于数据的集中管理,这样的网络称为SAN。


一、什么是RAID?其具备哪些常用的工具模式?

即然提到了RAID磁盘阵列,那么我们就先来了解一下什么是RAID?所谓的RAID,是Redundant Arrays of Independent Disks的简称,中文为廉价冗余磁盘阵列。由1987年由加州大学伯克利分校提出的,初衷是为了将较廉价的多个小磁盘进行组合来替代价格昂贵的大容量磁盘,希望单个磁盘损坏后不会影响到其它磁盘的继续使用,使数据更加的安全。RAID作为一种廉价的磁盘冗余阵列,能够提供一个独立的大型存储设备解决方案。在提高硬盘容量的同时,还能够充分提高硬盘的速度,使数据更加安全,更加易于磁盘的管理。

了解RAID基本定义以后,我们再来看看RAID的几种常见工作模式。


1、RAID 0    RAID 0是最早出现的RAID模式,即Data Stripping数据分条技术。RAID 0是组建磁盘阵列中最简单的一种形式,只需要2块以上的硬盘即可,成本低,可以提高整个磁盘的性能和吞吐量。RAID 0没有提供冗余或错误修复能力,是实现成本是最低的。


RAID 0最简单的实现方式就是把N块同样的硬盘用硬件的形式通过智能磁盘控制器或用操作系统中的磁盘驱动程序以软件的方式串联在一起创建一个大的卷集。在使用中电脑数据依次写入到各块硬盘中,它的最大优点就是可以整倍的提高硬盘的容量。如使用了三块80GB的硬盘组建成RAID 0模式,那么磁盘容量就会是240GB。其速度方面,各单独一块硬盘的速度完全相同。最大的缺点在于任何一块硬盘出现故障,整个系统将会受到破坏,可靠性仅为单独一块硬盘的1/N。


为了解决这一问题,便出一了RAID 0的另一种模式。即在N块硬盘上选择合理的带区来创建带区集。其原理就是将原先顺序写入的数据被分散到所有的四块硬盘中同时进行读写。四块硬盘的并行操作使同一时间内磁盘读写的速度提升了4倍。


在创建带区集时,合理的选择带区的大小非常重要。如果带区过大,可能一块磁盘上的带区空间就可以满足大部分的I/O操作,使数据的读写仍然只局限在少数的一、两块硬盘上,不能充分的发挥出并行操作的优势。另一方面,如果带区过小,任何I/O指令都可能引发大量的读写操作,占用过多的控制器总线带宽。因此,在创建带区集时,我们应当根据实际应用的需要,慎重的选择带区的大小。


带区集虽然可以把数据均匀的分配到所有的磁盘上进行读写。但如果我们把所有的硬盘都连接到一个控制器上的话,可能会带来潜在的危害。这是因为当我们频繁进行读写操作时,很容易使控制器或总线的负荷超载。为了避免出现上述问题,建议用户可以使用多个磁盘控制器。最好解决方法还是为每一块硬盘都配备一个专门的磁盘控制器。    虽然RAID 0可以提供更多的空间和更好的性能,但是整个系统是非常不可靠的,如果出现故障,无法进行任何补救。所以,RAID 0一般只是在那些对数据安全性要求不高的情况下才被人们使用。


2、RAID 1    RAID 1称为磁盘镜像,原理是把一个磁盘的数据镜像到另一个磁盘上,也就是说数据在写入一块磁盘的同时,会在另一块闲置的磁盘上生成镜像文件,在不影响性能情况下最大限度的保证系统的可靠性和可修复性上,只要系统中任何一对镜像盘中至少有一块磁盘可以使用,甚至可以在一半数量的硬盘出现问题时系统都可以正常运行,当一块硬盘失效时,系统会忽略该硬盘,转而使用剩余的镜像盘读写数据,具备很好的磁盘冗余能力。虽然这样对数据来讲绝对安全,但是成本也会明显增加,磁盘利用率为50%,以四块80GB容量的硬盘来讲,可利用的磁盘空间仅为160GB。另外,出现硬盘故障的RAID系统不再可靠,应当及时的更换损坏的硬盘,否则剩余的镜像盘也出现问题,那么整个系统就会崩溃。更换新盘后原有数据会需要很长时间同步镜像,外界对数据的访问不会受到影响,只是这时整个系统的性能有所下降。因此,RAID 1多用在保存关键性的重要数据的场合。


RAID 1主要是通过二次读写实现磁盘镜像,所以磁盘控制器的负载也相当大,尤其是在需要频繁写入数据的环境中。为了避免出现性能瓶颈,使用多个磁盘控制器就显得很有必要。


3、RAID0+1

从RAID 0+1名称上我们便可以看出是RAID0与RAID1的结合体。在我们单独使用RAID 1也会出现类似单独使用RAID 0那样的问题,即在同一时间内只能向一块磁盘写入数据,不能充分利用所有的资源。为了解决这一问题,我们可以在磁盘镜像中建立带区集。因为这种配置方式综合了带区集和镜像的优势,所以被称为RAID 0+1。把RAID0和RAID1技术结合起来,数据除分布在多个盘上外,每个盘都有其物理镜像盘,提供全冗余能力,允许一个以下磁盘故障,而不影响数据可用性,并具有快速读/写能力。RAID0+1要在磁盘镜像中建立带区集至少4个硬盘。


由于我们此次只是介绍家用台式机如何组建RAID磁盘阵列功能,目前主流的主板也只是提供这三种组建模式,因此其它诸如服务等的高级RAID模式,这里我们将不再过多的介绍


随着信息技术的发展,磁盘阵列被越来越多地使用到各种应用系统中。开始只是简单地作为某台主机或服务器的附加外置存储设备,主要用于扩展单台主机或服务器的永久存储空间,一般通过SCSI或其他接口与主机直接相连;后来随着存储网络技术,尤其是光纤通道Fibre Channel技术的发展,磁盘阵列通过光纤通道FC接口接入到存储区域网SAN中,为多台主机提供共享的存储空间。


目前人们一方面正在致力于开发更多的接口技术(如iSCSI、InfiniBand等)让磁盘阵列接入到成本更低的存储网络(如IP网络)、或性能更高、功能更全的存储网络(如InfiniBand网络)中,一方面致力于通过存储虚拟化技术、全局文件系统技术提高磁盘阵列的利用率。


本文我们主要想讨论目前使用最为广泛的光纤磁盘阵列。之前我们先来看什么是光纤磁盘阵列,或者说讨论一下光纤磁盘阵列的定义。


首先我们做一下名词分解,先说说磁盘阵列。实际上我们日常所说的磁盘阵列一词的定义并不准确,根据SNIA(存储网络国际协会)的定义解释,磁盘阵列(disk array)就是通过一套控制软件结合在一起的、在一个或多个可访问磁盘子系统上的一系列磁盘;该控制软件将这些磁盘的存储空间以一个或多个虚拟磁盘的形式提供给主机;运行在控制器上的控制软件一般称为固件(firmware)或微码(microcode);运行在主机上的通常称为卷管理器。


而磁盘阵列子系统(disk array subsystem)才是我们通常所称的磁盘阵列,即具有可将其磁盘组织起来的控制软件的磁盘子系统。为了不引起误解,在此我们只是告诉大家要注意区分磁盘阵列disk array和磁盘阵列子系统disk array subsystem的细微区别,在后面的讨论中我们还是使用大伙熟悉的磁盘阵列这个词汇来代替较为晦涩的磁盘阵列子系统一词。


而为什么又称为光纤磁盘阵列呢?这是指这种磁盘阵列采用光纤通道技术。采用光纤通道技术有两层含义,一层是指其对外--即对主机--使用光纤通道接口连接方式,一层是指其内部采用光纤通道技术来连接其内部的各个磁盘。通常意义来说,光纤磁盘阵列指的是后一种含义。但在最初光纤磁盘阵列上市的时候,内部往往采用SCSI、SSA等存储接口,对外才是光纤通道接口。


现在越来越多的光纤磁盘阵列逐渐向内外俱是光纤通道接口的方向发展,这里我们想讨论的就是这种磁盘阵列。至于内部使用IDE、SCSI、SSA等接口技术、外部使用光纤通道技术,或者内部使用光纤通道技术,外部使用SCSI等其他接口技术的磁盘阵列(尽管这有些违背常识,但这种磁盘阵列的确存在),虽然也是光纤磁盘阵列,但不在我们的讨论范围内。


从光纤磁盘阵列的名词解释我们可以看出,从硬件构成来说它应当是由一堆磁盘和控制器及内外接口组成。一般的中、低端光纤磁盘阵列也正是这种结构:由一个或多个供大量磁盘放置的磁盘柜、两个阵列控制器、阵列背板、若干电源、风扇等硬件部件组成。


其中最为主要的部件就是阵列控制器和磁盘柜。控制器通过其内置的控制软件,实现整个阵列的管理。一般阵列对主机的接口就在阵列控制器上,一般每控制器至少有一个主机接口,有些控制器提供更多的主机接口;这些主机接口可以直接或通过光纤交换机与主机连接。此外各种管理接口(串口、以太网口等)也在控制器上。


而一般之所以采用两个控制器,主要是从高可用性、提高性能和负载均衡的角度考虑的。很多阵列都可以通过这两个控制器间的切换,防止控制器、连接线缆、网络设备(如光纤通道交换机和集线器)、主机HBA的单点故障。某些阵列则可以通过主机或阵列软件实现多通道的数据访问和通道间的负载均衡。


可以说阵列控制器是中低端磁盘阵列的核心,相当于PC的主板、内存和CPU;而放置硬盘的磁盘柜是阵列实际存储数据的地方,相当于PC的硬盘。光纤磁盘阵列磁盘柜的主要特点是内部一般至少采用冗余的双FC-AL仲裁环环路结构,内部硬盘实际上同时接在两条仲裁环上。而中端磁盘阵列支持的环路数更多,可以达到4、8、16条之多。这种多冗余仲裁环结构最主要的目的就是为了高可用性,它可以防止单个线路、接口的故障导致整个阵列的失效。而且每个环路采用旁路技术来防止无硬盘接入和硬盘故障对环路通信的影响




热门招聘
相关主题

官方公众号

智造工程师