到底什么叫“近线存储”?
发布于:09-05
作者:太平洋快讯

“近线存储”是一个时有耳闻,但大多数用户已经不太熟悉的概念。这个概念诞生的本意是在在线存储和离线存储之间细分出的应用场景。

近线、在线、离线存储的概念

在线存储:在线存储指存储设备和所存储的数据时刻保持“在线”状态,可供用户随时读取。这种“随时”是实时性的要求,要求较低的访问时延,通常是毫秒级。随着SSD的出现,相应的时延还可以进一步降低到微秒级。足够低的访问时延才能满足计算平台对数据访问的要求,否则计算资源会闲置,用户体验也会变差。典型的在线存储应用就是OLTP(在线事物处理)、OLAP(在线数据分析),以及Web、CND等。离线存储:离线存储一般是用于归档、备份用途,主要用于满足合、防灾等方面的需要。离线存储的数据不常被调用,一般远离系统应用,原则上会有较低的存储成本,但相应的,访问的时延也会激增。在这个概念诞生的时候,离线存储一般是由磁带库、光盘库承担。离线存储介质上的数据通常是顺序写入的,尽量避免进行改写。当需要访问离线存储的数据时,查询效率较低,可能会出现数分钟,甚至数十分钟的延迟。近线存储:近线存储定位于在线存储和离线存储间的应用场景,就是指那些并不是经常用到,或者访问量并不大的数据存储在性能较低的设备上。由于并非关键应用,或者并发访问量较低,可以容忍较长的时延,达到秒级也是可以接受的。原则上这类设备的传输率还是有一定的要求,因为不常用的数据在总数据量的中的比例通常很大,可能会达到90%以上,每次请求的数据量也可能是比较大的。较高的传输率有利于尽快完成任务、释放资源,或者较快速地转移数据。

(不同层次的存储)

近线存储的过往

在21世纪初,为了降低访问时延,市场上还曾经有过1万rpm、1.5万rpm的硬盘,主要使用2.5英寸的盘体。相较3.5英寸硬盘,2.5英寸硬盘使用较小直径的盘片,更适合提高转速,从而降低旋转延迟和寻道时间。2.5英寸高速硬盘主要承载关键业务,定位于在线存储;相应的,3.5英寸硬盘多数使用7200、5400rpm的转速,主打一个便宜、量大,可用于近线存储。

(典型的15000rpm 2.5英寸硬盘。虽然猛看结构与普通硬盘大同小异,但磁臂与盘片直径的相对大小透露了关键信息。)在SSD逐步进入主流后,其传输率可以达到硬盘的十倍以上,IOPS更是几个数量级的优势,因此很快就淘汰了容量小、性能上限低的2.5英寸高速硬盘。时至今日,高频数据大多会部署在SSD之上,而在传统硬盘厂商的注意力主要集中在提高单盘容量、保持单位存储成本的优势,对于性能的提升持一种“顺其自然”的态度。在硬盘厂商的语境中,多数3.5英寸硬盘就是近线盘。现在硬盘的规格已经出现了明显的收敛,外形尺寸只保留3.5英寸,转速基本上都是7200rpm,但也还是有一些技术上的细分。最重要的差异就是PMR/CMR和SMR:前二者是垂直磁记录(磁性粒子垂直于盘面),以区别于早年间的水平磁记录(LMR);SMR是叠瓦式磁记录,磁道排列更紧密,并存在局部的覆盖,就类似瓦片依次略微错开叠在下层的瓦片。SMR硬盘的特点是存储密度较大,读取性能与PMR/CMR类似,但写入模式有根本性的区别,尤其是随机写性能比较糟糕,更适合顺序写入的场景。对于SMR硬盘,它的技术特点决定了它更适合重视存储成本,愿意牺牲性能的场景,常用于归档用途,也包括视频监控为代表的顺序写的应用。这些场景基本都是连续写入,偶尔读取,极少甚至从不修改。在企业级市场中,使用模式相对“传统”的PMR/CMR硬盘可以承担近线存储的角色,如果用户对硬盘的性能不够满意,也可以辅以SSD做缓存/缓冲盘。不适合改写的SMR硬盘用作归档,有点儿类似离线存储的角色——毕竟多数企业的数据量并不是特别巨大,还没有必要上磁带库、光盘库。这般定位倒也算是清晰,但也并不总能岁月静好。随着阵列规模、单盘容量的逐步增长,人们渐渐发现硬盘的单位容量性能并没有跟上节奏,甚至出现了倒退(具体的技术分析我们可以在其他文章中展开),维持可用性的难度越来越高,甚至还损害了硬盘的成本优势。

AI时代的近线存储

近线存储的概念在当下存在感偏弱,与大家已经习惯了数据随时在线有关。毕竟近线也还是在线的,只是性能要求低一些罢了。但是,随着大语言模型的普及,企业级的AI应用进入了新的阶段:数据成为企业核心竞争力,各个行业都在在考虑如何充分挖掘私有数据的价值,打造垂直领域的AI应用。企业的历史数据除了用于大语言模型的后训练/微调,还开始用于RAG,以提高推理输出质量。对数据价值的重新认识唤醒了沉睡的数据,并明显增加了数据的访问频次。这种需求也带火了“温存储”的概念,意思是相关的数据虽然没有核心业务那么热,但也需要比较积极的访问。在面对这种需求时,传统的近线存储遭遇了性能瓶颈。譬如,硬盘阵列相对较慢的数据传输率会限制训练时GPU获取数据的效率,浪费宝贵的GPU时间。再以RAG为例,如果向量数据库存储在硬盘阵列上,会极大降低相似检索的效率,影响推理输出的吞吐量。另外,由于AI需要访问的数据范围变大,还导致过去常被用于温存储的混闪阵列难以适应,因为混闪阵列中用于缓存的SSD容量有限。这也是部分存储解决方案商开始转向在存储节点内使用单一层,用基于QLC SSD的全闪节点替代混闪的重要原因。

(因为数据热度差异,近线存储出现了分层)简而言之,近线存储也会存在相对温和凉的概念(类似于关键业务的热与冷)。其中温数据的性能需求可以用混闪或者QLC全闪存储满足。但也这带来了新挑战:QLC SSD的单位存储成本相对TLC SSD并没有便宜太多,差价甚至还没当年10000rpm硬盘与7200rpm那么大。AI时代的近线存储有向在线存储的特征靠拢的趋势,但如何继续保持足够吸引人的成本优势就成为特别值得期待的话题。

网友评论