欢迎user
稳定性是衡量存储系统性能的重要指标之一。分布式存储凭借灵活的可扩展性、高性能和易用性等优势开疆拓土的同时,也总是被多节点、集群化架构导致的网络环境依赖、数据一致性等问题所苦恼。
新华三全对称分布式存储系统H3C UniStor X10000以“多快稳简”四大特性,获得了行业客户的广泛应用和充分认可。之前,我们与大家分享了X10000的“多”和“快”。今天我们就来看看X10000如何从“稳”字着手,通过软件与硬件的完美结合,成功提升高可靠性和高可用性方面的卓越表现。
机柜故障不影响业务连续性
X10000通过按机柜、电源来划分故障域的方式,进一步提高了数据的安全性,保证系统的稳定运行。
基于X10000分布式存储系统高可靠的冗余组网及多副本/纠删码存储策略,按规则划分故障域之后,实现了故障域之间的冗余灾备。在数据写入时,可以保证数据副本被写入不同的故障域,保障了数据的安全性。采取故障域策略之后,即使遇到整个机柜故障,也不会影响业务的连续性。X10000故障域最大能够容忍4个机柜故障,最大限度提升了系统的稳定性。
优化重建大幅降低故障重构时间
X10000通过多副本、纠删码等技术,在运行过程中即使遭遇多磁盘故障,仍然不会影响数据的安全。新华三特别对数据重构进行了全面优化,重构时间与之前相比大大缩短。
采用多对多模式并经过优化后,X10000每TB的数据重构时间已经小于10分钟,且支持5档重构速度,客户可根据需要选择业务优先或者重构速度优先。
隔离亚健康网络,提高系统可靠性
分布式存储系统由于将数据分散存储于不同的节点甚至异地节点,因此更依赖于网络环境。网络质量的优劣会严重影响分布式存储系统的稳定性。为了避免因为网络原因导致系统MON服务反复选举节点和磁盘信息,以及OSD服务频繁操作磁盘管理而导致系统性能下降等问题,X10000系统提供了完备的网络监测和链路管理功能。
通过对网络质量的监测,X10000提供了完善的网络链路管理方案。一旦监测到相应链路出现异常,X10000的链路管理功能会根据预先设定的阈值及策略进行网络链路的自动化调整切换,将处于亚健康状态的网络进行隔离,提高系统的可靠性。当网络链路恢复正常后,链路管理功能会自动恢复之前隔离网络的接入。
慢盘隔离坏块修复,保障数据无忧
硬盘在长期运行过程中,部分硬盘由于体质或频繁读写的原因,会出现读写速率变慢的情况。硬盘出现“慢盘”现象时,会导致业务性能下降,严重时甚至会导致数据丢失、坏块、服务不可用等问题。X10000提供的慢盘隔离和坏块修复功能,充分保证了业务的正常运行和数据的安全性。
当监测到读写时延变高问题时,X10000会将慢盘进行隔离处理。隔离后的硬盘不再写入新数据。在数据校验或读取时如果发现坏块,X10000会进行坏块降级操作,将硬盘从读流程中降级和隔离。同时,X10000会启动坏块修复操作,对数据进行同步或异步重构修复。
以上为大家简要介绍了X10000故障域管理、数据快速重构、网络亚健康管理、慢盘隔离及坏块修复等特性。当然,X10000所采用的数据保护技术远不止这些。新华三还通过副本/纠删码、WORM、数据快照、智能视频容错、远程复制等丰富的数据保护特性提升存储系统的可靠性,让X10000运行更“稳”。
数据正在重构世界,分布式存储已成为承载数据世界的重要基础平台。过去的几年中,新华三UniStor X10000分布式存储系统连续在运营商、政企客户集采中大份额中标,在电信、政企、医疗、企业等百行百业均获得了广泛应用。X10000分布式存储的高性能、可靠性及新华三的服务能力,已经在广泛的应用场景中经受了严苛考验。在领略了X10000的“多”、“快”、“稳”之后,“简”又是体现在哪里呢?待我们下回分解。