English

鼎甲 InfoStor-TL 分(fēn)布式磁帶存儲技術白(bái)皮書(shū)

2021.02 第2.1版

冷數據的存儲從來沒有如現在一(yī)般迫切,其增長勢頭,價值體(tǐ)現,來源都與以往不同,磁帶做爲冷數據存儲介質,在現今IT環境中(zhōng)角色越發關鍵,把這個變化比做鳳凰涅磐也毫不誇大(dà)其辭。

此白(bái)皮書(shū)基于這一(yī)背景,磁帶在現有技術條件下(xià),承載這些新的業務需求的磁帶布署方式也一(yī)樣發生(shēng)了變化,企業對于彈性、簡化以及成本的考量,促使磁帶技術以一(yī)種輕量級的方式提供服務,分(fēn)布式磁帶庫的應用變得更爲廣泛。

分(fēn)布式磁帶庫,以模塊的方式,能夠像搭積木的方式在機房中(zhōng)靈活部署,按照需求擴展,安裝和運維幾乎不需原廠幹預,采用LTFS開(kāi)放(fàng)軟件,使磁帶庫輕松融入客戶整體(tǐ)架構,另外(wài),最重要的是各項成本和支出表現優異,這使其成爲企業的最佳選擇。

本白(bái)皮書(shū)同時對鼎甲INFOSTOR-TL産品做了基礎性的介紹,爲用戶提供參考,以方便用戶作出最佳決定。

1. 分(fēn)布式磁帶存儲技術

1.1 磁帶技術的重生(shēng)

衆所周知(zhī),磁帶技術幾乎伴随着信息技術而生(shēng),曾經作爲主存儲使用,有着光輝的曆史,但與硬盤的技術及市場的競争中(zhōng)逐漸勢弱,不斷邊緣化,似有被磁盤技術完全替代的趨勢。然而,随着移動技術,大(dà)數據及雲計算的興旺發展,信息技術革命真正進入數據主導時代。

數據改變一(yī)切,當然也改變了數據存儲的方式,縱覽全球的大(dà)型的雲數據中(zhōng)心,包括Microsoft, Google, AWS, Facebook, 磁帶技術已經被大(dà)規模應用于冷數據存儲,成爲歸檔及備份類應用當仁不讓的第一(yī)選擇。

磁帶技術浴火(huǒ)重生(shēng),鳳凰涅槃,其背後的驅動力仍在于數據,在于數據的價值,以及這些價值呈現方式,還包括數據的獲取成本,使用時機,難以衡量的生(shēng)命周期,最關鍵的還是數據規模。與其他存儲介質相比,磁帶存儲技術完美契合了這些新的需求,這表現在:

  • 從成本上,不論是購買成本(CAPEX, 資(zī)本性支出),還是運維成本(OPEX,管理性支出),相比于閃存和硬盤(包括SMR類高密度近線硬盤),磁帶的成本優勢巨大(dà),這種數倍甚至十數倍的TCO(總擁有成本)優勢反饋到超大(dà)規模的數據量(通常數百PB甚至數個EB)層面,這就爲企業節省了千萬甚至數億人民币級别的成本支出,這種節省,對改善企業基本面,增強企業顯示競争力,具有無可抵禦的吸引力。
  • 從技術上,磁帶技術潛力巨大(dà),磁錄密度幾乎線性增長,這與磁盤後繼乏力形成鮮明對比,根據現有的路線圖,磁帶介質容量幾乎每3年增長50%甚至100%,實驗室環境中(zhōng)單柄磁帶已經做到了528TB,這确是磁盤甚至閃存難以企及的技術底蘊,更是光盤存儲望塵莫及的。除去(qù)密度之外(wài),磁帶與生(shēng)俱來的空隙(Air Gap)技術爲網絡及數據安全提供最後的保障。
  • 從産品生(shēng)命周期及可靠性來講,磁帶技術(包括磁帶庫,磁帶機和磁帶)可謂超長待機,磁帶的可靠性相較硬盤技術高3個數量級,這使磁帶機和磁帶庫的生(shēng)命周期包括售後在内往往超過20年,而在數據中(zhōng)心中(zhōng)的30年前的磁帶比比皆是。
  • 從企業社會責任來講,磁帶技術因其離(lí)線特性,天然對環境較爲友好,電(diàn)力消耗相對于閃存和硬盤來講幾乎忽略不計,這不僅節省運維成本,同時切實踐行了企業的社會責任承諾。除了電(diàn)力消耗,磁帶對環境的友好性還表現在對數據中(zhōng)心的環境要求上,對機架,空氣質量,溫濕度等等相比于其他存儲介質均較爲寬松。

 

1.2 LTO磁帶技術及路線圖

LTO 技術聯盟 (LTO Consortium)提供開(kāi)放(fàng)磁帶技術發展路線,包括LTO Ultrium磁帶技術以及LTFS (Linear Tape File System)磁帶開(kāi)源文件系統,聯盟廠商(shāng)采用統一(yī)的技術路線,提供标準化,統一(yī)開(kāi)放(fàng)的産品,使磁帶技術能得以簡單有效的方式提供給客戶。

LTO Ultrium的技術路線如圖1所示,2020年4季度末,LTO9産品已發布,并計劃于2021年第一(yī)季度向市場推出相應的産品。按照LTO聯盟的技術路線圖,今後的磁帶密度皆比上一(yī)代提升一(yī)倍。

圖1:LTO Ultrium磁帶技術路線圖

附表1則爲目前及未來市場中(zhōng)的LTO磁帶技術的數據表:

LTO 6 LTO 7 LTO 8 M8 LTO 9 LTO 10 LTO 11 LTO 12
發布時間 2012/12 2015/12 2017/12 2020/09 2023*** 2026*** 2029***
磁帶裸容量 (TB) 2.5 6 12 9 18 36 72 144
磁帶壓縮容量 (TB)* 6.25 15 30 22.5 45 90 180 360
磁帶長度(m) 846 960 960 960 1035 / / /
磁帶材料 MP或BaFe BaFe BaFe BaFe / / / /
磁帶内存 (KiB) 16 16 16 16 / / / /
磁帶機未壓縮最大(dà)讀寫速度(MB/s) 160 300 360 300 400 1100** / /
磁帶機壓縮後最大(dà)讀寫速度(MB/s) 400 750 900 750 1000 2750** / /
全磁帶寫入時間(按未壓縮速度hh:mm) 04:20 05:33 09:16 08:20 12:30 12:07** / /
WORM 可以 可以 可以 不可以 可以 / / /
加密 可以 可以 可以 可以 可以 / / /
注: * 磁帶按2.5:1壓縮; **爲技術計劃;***爲預計時間; “/”表示尚無可披露數據

1.3 冷數據存儲技術方向以及對磁帶庫的要求

根據IDC的預測,企業數據産生(shēng)的年度複合增長率水平爲40%-50%,每2-3年數據增長一(yī)倍,這也意味着全球範圍内,數據在2025年之前将達到甚至超過200ZB,其中(zhōng)産生(shēng)于中(zhōng)國的數據将占據1/4。在這些數據中(zhōng),溫冷數據占據總量的90%, 按照IDC的定義,超過30天的純冷數據則占總量的60%以上,這就是說,即便在中(zhōng)國,屆時每年會有将近30ZB的冷數據需要存儲。

與數據爆發式容量增長的同時,冷數據的價值體(tǐ)現也在發生(shēng)改變,或者說,數據的價值呈現變得多元化,既存在數據價值相對較高的數據庫,ERP類的數據,這類數據增長相對平緩;也存在大(dà)量AI科學訓練,媒體(tǐ)及醫學影像數據這類相對價值稀薄的數據;還包括爲滿足政策法規要求所必須存儲的價值幾乎爲零的數據,可以說數據的價值是與其複原或恢複的概率直接相關。

大(dà)幅降低冷數據單位存儲成本,這個要求變得愈發迫切,在存儲介質一(yī)端,閃存通過技術的更新(如3D NAND)大(dà)幅增加容量以降低成本,而希捷大(dà)規模HAMR (Heat Assited magnetic Recording),西數借助MAMR (Microwave Assisted Magnetic Recards)技術期望提升硬盤容量,但值得指出的是磁記錄面密度的提升,磁帶的可提升空間相較于磁盤具有巨大(dà)優勢,2020年底,Fujifilm聯合IBM發布基于锶鐵氧體(tǐ)(SrFe)技術的磁帶技術,單柄磁帶容量達到580TB,而磁記錄面密度也僅僅約爲12TB硬盤密度的1/3。從技術角度而言,磁帶是唯一(yī)能解決這一(yī)要求的唯一(yī)選擇,包括DNA存儲,5D晶體(tǐ)技術,磁阻式随機訪問存儲器(MRAM)都無法勝任。

包括Google、微軟、AWS一(yī)批雲計算廠商(shāng)大(dà)規模部署磁帶庫,雲應用也改變了磁帶庫的傳統應用方式,最明顯的莫過于采用對象接口(S3)方式,在這方面有開(kāi)源項目可供利用,如OpenStack Swift,名爲SwiftHLM的組件可插入OpenStack Swift堆棧以便在系統中(zhōng)添加磁帶作爲二級或三級存儲使用,當然有更多的商(shāng)業對象存儲軟件可供選擇,比如Xtreme Store以及PoINT歸檔網關等等。

冷數據應用還體(tǐ)現在量子計算領域,現有的非對稱加密算法ECC,RSA以及AES-128/256都将變得不安全,新的量子安全加密(QSC)機制已經提上日程,技術上,加密的數據無法壓縮(compresion)或除重(dedup),這對磁帶機的性能也提出了要求。另外(wài),在超大(dà)規模歸檔存儲中(zhōng),糾删碼(EC)的使用會大(dà)幅降低數據存儲的安全成本,使用糾删碼的環境下(xià),作爲可移動存儲,磁帶與硬盤及SSD有着很大(dà)不同,實踐中(zhōng)需要利用獨特方法例如小(xiǎo)文件的聚合及片段讀取以提升整體(tǐ)性能。

雲,AI以及邊緣計算的另一(yī)個技術趨向在于磁帶庫部署方式的改變,多點部署,業務可彈性,簡化運維已成爲互聯網及雲計算廠商(shāng)的三大(dà)基礎要求,基于這些要求,分(fēn)布式磁帶庫成爲更切實的選擇。

 

1.4 集中(zhōng)式及分(fēn)布式磁帶存儲技術選擇

從産品形态上,集中(zhōng)式磁帶存儲技術最重要的技術特性表現在可橫向擴展上,例如IBM TS4500,昆騰Scalar i6000等産品,集中(zhōng)式磁帶存儲技術更多的應用在一(yī)兩個數據中(zhōng)心中(zhōng),單個磁帶庫可擴充至一(yī)萬甚至數萬個磁帶槽位,同時賦予大(dà)量I/O槽位以便磁帶離(lí)庫操作,軟件上配置齊全,如磁帶虛拟化,多路徑以滿足傳統的,大(dà)規模備份和歸檔需要。配置強大(dà)是集中(zhōng)式磁帶技術的優勢,但這種形态的磁帶庫劣勢同樣明顯,首先,其安裝相當複雜(zá),很多情景下(xià)需要機房改造,全程需要原廠介入,其次,運維難度較高,有較高的學習成本,故障後隻能依靠原廠資(zī)源,再有,部署無法靈活,遷移成本代價高昂,如果涉及到數據的大(dà)規模遠程複制難度幾乎無法想象,最後,集中(zhōng)式存儲的硬件價格,軟件許可,售後維保成本都比較昂貴。

如上文所述,分(fēn)布式磁帶存儲技術是類似于雲歸檔存儲部署的最佳選擇,集中(zhōng)式磁帶技術的劣勢在新的技術環境中(zhōng)則成爲優勢,分(fēn)布式磁帶技術從機械構件上相對簡單,通常單機架部署,可充分(fēn)利用現有機架空間,容量可通過3U或6U模塊擴充;安裝及維護簡單,部件可熱插拔或僅需要較短的停機窗口更換并重新啓用,這些過程基本上可不需要原廠參與,在數據需要大(dà)規模遷移的情況下(xià),甚至可以直接以物(wù)理遷移的方式,将一(yī)個數據中(zhōng)心的磁帶庫運送并挂載到新的數據中(zhōng)心使用,數據使用完畢後,再拆卸運送回原處或其他數據中(zhōng)心使用,這會極大(dà)降低網絡開(kāi)銷并切實提升業務效率。

在實際部署中(zhōng),分(fēn)布式磁帶存儲技術可以圖2所示類似以細胞(Cell)形式無限擴展,每個細胞都由一(yī)組磁帶庫模塊構成,單個細胞内獨立擁有一(yī)個緩存及數據庫節點(服務器),也可多個細胞共享一(yī)個節點(服務器),節點提供的功能包括元數據(metadata)管理,HTTP接口服務, 或作爲備份服務器,另外(wài)最重要的的是作爲讀寫緩存(cache),作爲應用和帶庫之間的臨時性存儲池。

圖2:分(fēn)布式磁帶存儲細胞化部署

 

在細胞化結構中(zhōng),節點之間通過以太網連接,節點和磁帶庫之間囿于現有技術可以FC或SAS方式直連,也可通過FC SAN交換機集中(zhōng)式管理,在一(yī)些商(shāng)業軟件中(zhōng),節點和磁帶機之間構築分(fēn)區,這種分(fēn)區可以專有也可以動态方式存在,每個分(fēn)區所管理的磁帶(catridge)則固定不變。節點之間可互爲冗餘,當某個節點發生(shēng)故障時,其他節點可接管故障節點所管理的分(fēn)區。如圖3所示:

圖3:PAG的動态分(fēn)區架構 (使用交換機及3/4 EC部署)

2. 鼎甲infostor-TL分(fēn)布式磁帶存儲産品

2.1 INFOSTOR-TL磁帶庫總體(tǐ)情況

INFOSTOR-TL磁帶庫大(dà)緻可分(fēn)爲兩類,一(yī)類爲中(zhōng)小(xiǎo)客戶備份所需的入門級自動加載器及磁帶庫, 均爲機架安裝,包括1U和2U兩種形态;另一(yī)類則爲模塊化分(fēn)布式磁帶庫,每個模塊以3U或6U形式體(tǐ)現,可擴展至1個标準機架。

表2:爲入門級自動加載器及磁帶庫技術參數彙總如下(xià):

1U磁帶自動加載器 2U磁帶庫
型号 FlexStor 1U FlexStor 2U
安裝方式及機架高度 機架, 1U 機架, 2U
磁帶機數量 1個半高 1個全高或2個半高
磁帶機接口 SAS, iSCSI, FC SAS, iSCSI, FC
可支持的磁帶機 LTO6, 7, 8, 9* LTO6, 7, 8, 9*
磁帶總槽位數 8 24
I/O槽位數 1 1
機器人MCBF 50萬次 50萬次
電(diàn)源數量 1 1
電(diàn)源功率 80W 160W
噪音輻射 ≤ 5.8dB ≤ 5.8dB
溫度 10°C – 35°C 10°C – 35°C
相對濕度 20% -80% 20% – 80%
尺寸 447.5x740x43.8mm 447.5x740x87.6mm
重量 10Kg (不含磁帶) 12Kg (不含磁帶)
*表示計劃;

 

2.2 INFOSTOR-TL分(fēn)布式磁帶庫

INFOSTOR-TL分(fēn)布式磁帶庫技術參數可彙總如下(xià):

  • (1)3U/42U塊化磁帶庫
3U模塊 42U磁帶庫
型号 Multistor 3U /
安裝方式及機架高度 機架, 3U 機架, 42U, 1個基本模塊, 13個擴展模塊
磁帶機數量 3個半高或1個全高或1個全高+1個半高 14個全高或42個半高或14個全高+14個半高
磁帶機接口 SAS, FC
可支持的磁帶機 LTO6, 7, 8, 9*
磁帶總槽位數 80 560
I/O槽位數 5 最大(dà)70個
帶倉數量 2 28
操作前面闆 3.5”顯示器; 配置, 管理, 狀态及診斷菜單
遠程管理接口 通過标準以太網連接(10/100/1000 Mbit), 基于Web管理
安全 SSL/TLS 1.2, 用戶管理/LDAP集成
網絡協議 IPv4/IPv6
錯誤及告警(alert)管理 SNMP Trap告警, 錯誤及警報郵件告警系統
分(fēn)區 20
機器人MCBF 100萬次
電(diàn)源數量 2 最大(dà)28個
單個電(diàn)源最大(dà)功率 300W
噪音輻射 ≤ 5.8dB
海拔 5000m
溫度 10°C – 35°C 10°C – 35°C
相對濕度 20% -80% 20% – 80%
單模塊尺寸 475x892x134mm 475x892x134mm
重量 20Kg (不含磁帶) 280Kg (不含磁帶)
*表示計劃;

 

 

  • (2)6U/42U塊化磁帶庫
6U模塊 42U磁帶庫
型号 Multistak 6U /
安裝方式及機架高度 機架, 6U 機架, 42U, 1個基本模塊, 6個擴展模塊
磁帶機數量 6個半高或3個全高 21個全高或42個半高
磁帶機接口 SAS, FC
可支持的磁帶機 LTO6, 7, 8, 9*
磁帶總槽位數 80 560
I/O槽位數 5 最大(dà)70個
帶倉數量 2 14
操作前面闆 5.7”觸碰顯示器; 配置, 管理, 狀态及診斷菜單
遠程管理接口 通過标準以太網連接(10/100/1000 Mbit), 基于Web管理
安全 SSL/TLS 1.2, 用戶管理/LDAP集成
網絡協議 IPv4/IPv6
錯誤及告警(alert)管理 SNMP Trap告警, 錯誤及警報郵件告警系統
分(fēn)區 20
機器人MCBF 200萬次
電(diàn)源數量 2 最大(dà)14個
單個電(diàn)源最大(dà)功率 300W
噪音輻射 ≤ 5.8dB ≤ 5.8dB
海拔 5000m
溫度 10°C – 35°C 10°C – 35°C
相對濕度 20% -80% 20% – 80%
單模塊尺寸 475x892x268mm
重量 44Kg (不含磁帶) 308Kg (不含磁帶)
*表示計劃;

 

  • (3)适配的LTO驅動器

 

LTO驅動器 接口及高度
LTO 6 LTO 6 HH FC 單口半高

LTO 6 HH FC 雙口半高

LTO 6 HH SAS 雙口半高

LTO 7 LTO 7 HH FC 單口半高

LTO 7 HH FC 雙口半高

LTO 7 HH SAS 雙口半高

LTO 8 LTO 8 HH FC 單口半高

LTO 8 HH FC 雙口半高

LTO 8 FH FC 雙口半高

LTO 8 HH SAS 雙口全高

  • (4)支持的SAS及FC接口速度
接口 LTO磁帶機 端口速率
SAS LTO 6/7/8/9 1.5 Gbps, 3 Gbps, 6 Gbps
FC LTO 6/7/8/9 2 Gbps, 4 Gbps, 8 Gbps
  • (5)Ultrium LTO 讀寫兼容性表
LTO 5磁帶機 LTO 6磁帶機 LTO 7磁帶機 LTO 8磁帶機
LTO 5磁帶(未加密) 讀/寫 讀/寫 隻讀
LTO 5磁帶(加密) 讀/寫(使用密鑰) 讀/寫(使用密鑰) 隻讀(使用密鑰)
LTO 6磁帶(未加密) 讀/寫 讀/寫
LTO 6磁帶(加密) 讀/寫(使用密鑰) 讀/寫(使用密鑰)
LTO 7磁帶(未加密) 讀/寫 讀/寫
LTO 7磁帶(加密) 讀/寫(使用密鑰) 讀/寫(使用密鑰)
LTO 8磁帶(未加密) 讀/寫
LTO 8磁帶(加密) 讀/寫(使用密鑰)

 

 

聯系我(wǒ)們