背景:大海里,魚(yú)類(lèi)可以毫不費力地做到兼具速度與優(yōu)雅于一身,最快游速達每小時(shí) 70 英里,而人類(lèi)甚至難以達到每小時(shí) 4 英里,即便潛艇也只能達到每小時(shí) 50 英里。魚(yú)類(lèi)為何能獲得如此快的速度,這個(gè)問(wèn)題令物理學(xué)家、生物學(xué)家和工程師們著(zhù)迷;如今面對“數據密集型”新范式,為了幫助企業(yè)在數據海洋里游出加速度,各家存儲廠(chǎng)商也紛紛放出大招。
真實(shí)海洋里,魚(yú)類(lèi)的高速游動(dòng)涉及到復雜的3D流體動(dòng)力作用
在數據“海洋”,浪潮面對數據密集型新范式帶來(lái)的性能挑戰提出應對策略
圖片來(lái)源:麻省理工科技評論
正文:
7月28日,2022全球閃存峰會(huì )線(xiàn)上召開(kāi),匯聚了國內外專(zhuān)家學(xué)者,共同論道全球閃存與存儲半導體產(chǎn)業(yè)發(fā)展趨勢。浪潮信息存儲產(chǎn)品線(xiàn)副總經(jīng)理李博樂(lè )表示,隨著(zhù)云、大數據、AI等新技術(shù)快速發(fā)展,數據成為數字經(jīng)濟時(shí)代的關(guān)鍵要素和核心引擎。浪潮存儲的使命是秉承浪潮信息智慧計算戰略,為企業(yè)構建以存儲平臺為核心的業(yè)界領(lǐng)先的數據基礎設施,基于盤(pán)控協(xié)同充分釋放閃存力量。

浪潮信息存儲產(chǎn)品線(xiàn)副總經(jīng)理 李博樂(lè )
數據密集型新范式 考驗數據處理能力
模擬腦神經(jīng)網(wǎng)絡(luò ),探索人腦上千億個(gè)神經(jīng)元之間是如何連接與工作的,帶來(lái)每秒百TB級數據高吞吐量;1000輛自動(dòng)駕駛汽車(chē)每天產(chǎn)生數十PB的實(shí)時(shí)數據,用來(lái)訓練AI視覺(jué)識別算法;油氣勘探,一次三維勘探會(huì )產(chǎn)生PB級原始實(shí)時(shí)數據,后期數據分析和處理中還會(huì )生成15倍體量的次生數據……
數字經(jīng)濟時(shí)代,在“數據密集型”的新范式驅動(dòng)下,傳統數據中心正在向云化數據中心快速演進(jìn)。這是因為在傳統數據中心中,應用與基礎設施緊耦合,IT架構呈現孤島狀,數據不流動(dòng)、不共享,如同一潭死水。而在云化數據中心中,計算資源實(shí)現了虛擬化,信息孤島被打通,涓涓數據河流匯聚成汪洋大海,各個(gè)行業(yè)可以基于海量數據間的相關(guān)性分析加速業(yè)務(wù)創(chuàng )新,創(chuàng )造新商業(yè)、新業(yè)態(tài)。
例如,在當前非常熱門(mén)的類(lèi)腦科學(xué)研究,有一個(gè)重要的方向就是多模態(tài)多尺度數據分析理論與應用。首先建立腦成像中心,全套磁共振成像設備對小動(dòng)物或者人體進(jìn)行腦成像,不斷采集和分析腦科學(xué)數據,構建起多模態(tài)多尺度腦數據庫;然后,再利用模式識別、深度學(xué)習等類(lèi)腦智能方法尋找基因、腦影像和認知功能的診斷指標,以揭示腦疾病致病機制、提升腦疾病臨床診斷以及藥物療效評估的準確性和效率。這個(gè)例子只是冰山一角,“數據密集型”新范式已經(jīng)成為驅動(dòng)各行各業(yè)創(chuàng )新型發(fā)展、高質(zhì)量增長(cháng)的加速器。
然而,正如硬幣的AB面,數據密集型新范式、數據中心云化在為大數據挖掘帶來(lái)利好的同時(shí),也使得數據基礎設施需要面對海量的客戶(hù)端、應用,爆炸式增長(cháng)的海量多模態(tài)數據,對數據基礎設施的處理能力提出了更高要求。
以盤(pán)控協(xié)同為核心 釋放閃存潛能
面對海量新數據、新應用挑戰,浪潮存儲如何釋放閃存的性能呢?對此,李博樂(lè )表示,浪潮提出新存儲之道,堅持存儲即平臺理念,以盤(pán)控協(xié)同策略為核心,充分發(fā)揮閃存性能,打造極致性?xún)r(jià)比。

浪潮存儲
首先,存儲系統要想發(fā)揮出閃存的性能,需要闖過(guò)三道關(guān)。第一,隨著(zhù)NAND介質(zhì)、NVMe協(xié)議、SCM等新介質(zhì)的出現,存儲系統性能的瓶頸已經(jīng)不在盤(pán)上,而在于軟件棧,要想用好性能較高的閃存盤(pán),就需要優(yōu)化存儲系統軟件棧,解決系統性能瓶頸。第二,過(guò)去的若干年CPU的發(fā)展一直遵循摩爾定律,性能飛躍式發(fā)展,但最近幾年,CPU性能的發(fā)展進(jìn)入瓶頸期,性能提升緩慢,如果想進(jìn)一步提升存儲系統性能,就需要借助DPU、FPGA、數據壓縮卡等額外的硬件做協(xié)處理,對系統進(jìn)行加速。第三,數據存儲需要優(yōu)化元數據和數據的寫(xiě)入策略,減少不必要的垃圾回收,提升系統性能。
其次,存儲系統如何降低閃存的使用成本。雖然閃存的成本在趨勢上不斷下降,會(huì )替代2.5寸機械盤(pán),但成本仍高于3.5寸大容量機械盤(pán)。另外,不同閃存介質(zhì),對應的可擦寫(xiě)次數或者說(shuō)使用壽命是不同的,而且差異很大,比如當前主流的TLC和QLC介質(zhì)可擦寫(xiě)次數就相差5倍。所以根據數據熱度的不同,合理使用介質(zhì),以及提升介質(zhì)壽命和空間利用率,可以有效降低使用成本。
對于上面兩個(gè)難題,李博樂(lè )認為,盤(pán)控協(xié)同是最優(yōu)解。
比如在提升性能方面,浪潮存儲是業(yè)界唯一具備存儲軟件棧和閃存盤(pán)全棧的技術(shù)研發(fā)能力的廠(chǎng)商,可以通過(guò)盤(pán)控協(xié)同,推進(jìn)閃存盤(pán)面向特定場(chǎng)景的定向調優(yōu),存儲系統性能;還能基于元數據與數據的寫(xiě)入優(yōu)化,降低寫(xiě)放大,讓系統性能再上一個(gè)臺階。在SPC-1國際基準測試中,浪潮存儲六次刷新存儲性能世界記錄。
李博樂(lè )表示,今年IPF上,浪潮存儲還出新一代PCIe 4.0 NVMe 企業(yè)級SSD。我們通過(guò)拓展NAND與控制器之間的通道,大幅提升SSD性能,實(shí)現業(yè)界領(lǐng)先的性能水平,其中順序寫(xiě)性能超過(guò)5GB/s,隨機寫(xiě)性能超過(guò)45萬(wàn)IOPS,超越所有主流廠(chǎng)商。
又如圍繞降低閃存使用成本這個(gè)難題,浪潮存儲采用介質(zhì)分層技術(shù),將不同熱度的數據存在不同的介質(zhì)中,避免介質(zhì)性能瓶頸和介質(zhì)“大材小用”,此外,像浪潮這樣擁有介質(zhì)研發(fā)能力的廠(chǎng)商,通過(guò)不斷優(yōu)化數據管理算法和容錯算法,能夠提升SSD盤(pán)本體壽命,降低客戶(hù)TCO;并且通過(guò)盤(pán)控協(xié)同,通過(guò)合理的數據組織減少寫(xiě)放大縮減閃存盤(pán)的OP,提升SSD的空間利用率。
李博樂(lè )表示,目前,浪潮信息聚焦智慧計算戰略,以算力、算法、數據、網(wǎng)絡(luò )四大支柱,為客戶(hù)構建開(kāi)放、敏捷、集約、高效的數字信息基礎設施。浪潮存儲近幾年表現非常亮眼,市場(chǎng)增速中國第一,存儲裝機容量已經(jīng)位居全球前三、中國前一。今后,浪潮存儲希望借助新一代G6存儲平臺、企業(yè)級SSD,以全棧技術(shù)創(chuàng )新加速存儲業(yè)務(wù)增長(cháng),釋放數據價(jià)值加速數實(shí)相融。