中國數據存儲服務平臺

英特爾劉鋼:異構存儲,完美互補

8月22日,以“閃存加速數字經濟”為主題的2019全球閃存峰會在杭州國際博覽中心(G20主會場)舉行,會上杭州集成電路設計產業園正式啟動。浙江省政協副主席、兩院院士、工信部、省經信廳、杭州市及蕭山區等主管領導出席。這是百易傳媒(DOIT)繼7月23日在西安成功舉辦“2019存儲與數據峰會”之后的又一產業盛會。

英特爾中國區非易失性存儲事業部總經理劉鋼應邀出席首日主論壇,并發表《異構存儲,完美互補》的主題演講。

以下內容根據現場速記整理(未經演講人確認)。

大家上午好!非常榮幸有機會能夠跟大家介紹英特爾在存儲領域的項目。在全閃領域我們發現有新的應用、新的業務,可以看到凡是新的應用對存儲的要求不僅僅是量,還有性能。最近比較熱門的詞是5G和AI,也為計算和存儲帶來了更多的挑戰。

為了滿足這些新業務對存儲提出的挑戰,什么樣的存儲能更好的滿足這個需求呢?其實答案不是某一種存儲介質,而是針對不同應用場景要優化異構存儲的架構。大家可以看到傳統存儲架構最上面是DRAM,最下面是HDD。經過演變在DRAM和硬盤之間又增加了一層SSD,這個時候當大量的存儲進入到SSD之后,在SSD和DRAM之間還有非常大的差距。

這個差距一方面是容量,還有一個是時延,這方面的差距不是說百分之多少或者幾倍,是幾個數量級的差距。所以說在SSD和DRAM之間還需要存儲架構,這個在前面演講當中或者在最新存儲文章當中也聽到了SCM(存儲級內存),大家最常聽到的是英特爾傲騰(Persistent Memory),最近大家可能也聽到更多廠商發布新的材料或者新產品來瞄準SCM這一塊。

英特爾傲騰在用到SSD和內存這兩個之間的時候,我們幫助用戶解決哪些問題呢?大家可以看到用戶面對很多難題,隨著多樣化應用對內存的需求越來越多,可能內存太貴,不僅是貴,而且容量不夠,可能一兩個T滿足不了要求,要十幾個T才行。

另外,還有IO吞吐量瓶頸等等方面很多問題,而通過多種存儲介質的異構來做到優勢互補,既能夠節省成本,也能打破IO的瓶頸,還能夠做縱向容量擴展。我們來看一下為什么傲騰這種新型存儲介質和存儲設備能夠帶來這些改變?

現在非常多的應用的最大挑戰是時延,5G解決了網絡時延,但對用戶來說整個體驗當中只是減少了網絡時延,而不是減少存儲時延,整個用戶體驗沒有得到最終的改善。

存儲時延可以看出來,剛開始如果是機械時代最大的時延來自于介質,后來時延來自于控制器,當你用SAS和SATA傳統控制器的時候,你發現時延在控制器上面,尤其是當你采用傲騰這樣的介質的時候,你會發現控制器就是最大時延的貢獻者,所以必須換新的控制器。

在采用傲騰的時候,分為兩種產品,一種是傲騰固態盤,采用PCIe的接口,還有一種傲騰,因為傲騰的材料都非常快,以至于你必須用到更新的接口,所以還有一種傲騰是傲騰內存,叫傲騰持久內存,用的是DDR4的接口。如此可以看到接口的時延會進一步降低,以及主要的存儲介質在時延上的對比。

傲騰之所以能夠有如此的低時延,高效率有兩個原因,一個是材料本身就很快,還有傲騰是按字節尋址的,無論在做快速緩存的時候,還是做內存擴展的時候都能夠很好的發揮效力。

我提到傲騰有兩個系列產品,當傲騰作為固態盤來應用的時候,兩個非常重要的特點,第一個,傲騰在大量寫入工作負載時,它的讀取時延幾乎是不變的,傲騰的數據是幾乎不變的。另外,傲騰優勢還有它的耐用性,至少提高20倍,這是我們承諾的,其實材料的耐用性遠不止這樣,至少比我們講的非常好固態盤高出20倍。

這兩大特性讓傲騰在存儲緩存層或者快速存儲這塊有非常適合的應用,待會兒會講到一些大的成功案例都是發揮了傲騰這兩大特點。而且當傲騰用做快速緩存的時候不必是一對一的代替傳統固態盤。原本用2T固態盤做緩存的,用傲騰只需用400、500G或者300多G,傲騰可以達到同樣的效果,反而降低了總成本。

除了傲騰固態盤以外,各位可能也聽說過我之前沒有特別講到的傲騰內存,當時成功案例還沒那么多,我們講一個新技術不僅講技術,講產品的特點,同時還要看到有沒有成功的應用。

今年上半年以來,我們看到傲騰在內存領域有非常多的應用,傲騰內存是DDR4的接口,有兩種工作模式,一種軟件不用做任何改動,直接當內存使用,叫做內存模式。還有一種是在應用軟件上進行優化調優,以便發揮更好的性能,這個叫應用直接訪問模式。而且因為傲騰也是非易失性介質,所以它的數據不是馬上消失的。當你把它當內存使用的時候,內存是一樣的。

如果我們把這三種結合起來,傲騰內存兩種工作模式加上傲騰固態盤,將其應用到不同的場景。剛才我們講到新興應用導致其需要新型的存儲材料,把它放到這里可以看到在存儲中高亮綠色的部分是非常適合用傲騰固態盤,橘色部分就適用于傲騰內存的內存模式,黃色部分比較適用于傲騰內存的應用直接訪問模式,這個部分可以看到大致的對應。

接下來在生態系統里,這不是英特爾獨立完成的,我們有非常多的生態合作伙伴,包括很多的軟件公司和互聯網公司,做軟件和系統的優化。

下面再給各位分享一些具體應用。其中一個應用,剛才講到傲騰固態盤有好的耐用性,還有非常好的時延,將它用于分布式存儲里做緩存,你會發現性能有極大的提升,再往下在OST數據部分配以QLC的固態盤,這樣結合QLC固態盤容量和低成本加上傲騰的高性能、低時延是非常完美的互補組合,所以異構存儲,完美互補,既有了傲騰的高性能、低延遲,又有了QLC部分的低成本、大容量。

一個案例就是浪潮存儲產品線副總經理孫斌,孫總有介紹,英特爾跟浪潮有合作。上次我們在軟件定義存儲峰會(深圳)演講的時候,這一頁是浪潮的總經理在介紹的。這次我把這一頁找出來,可以看到在同等TCO情況下,當你采用左邊傳統的全閃存固態盤的方法,右邊當你采用傲騰+QLC這兩種方案的對比,可以看出來在同等價格型號下面采用傲騰+QLC的方案,容量更大,性能更好,而成本是一樣的。

另一個比較是當你達到同樣的IOPS,在性能一樣情況下,異構存儲還更便宜。當你采用異構存儲的時候其實是優勢互補,成本反而降低了,不要只看其中傲騰的價格。

其實阿里也是這方面的先行者,在分布式存儲方面,阿里在2017年就已經發布了PolarDB也是軟件定義的分布式存儲,它用傲騰放到系統里來進行優化,整個系統性能提高了六倍。

除了阿里以外,百度云在它的ABC Storage云存儲部分,也是用到了傲騰+QLC固態盤,在存儲和性能上實現了突破。其實BAT都用了傲騰,現在來不急把它們用的案例講出來,我就講幾個比較有代表性的。

除了BAT以外,除了互聯網服務商以外,另外還有很多的互聯網服務商也在把傲騰用在它們的系統里面,做快速存儲或者是內存擴展。這個部分已經進入到了行業,我們看到金融電信行業也在開始采用傲騰來實現異構存儲,來提高系統性能和降低成本。

這是中國電信四川的ABM系統,是一個連接事務處理,大家可以看到傲騰在里面的貢獻。

前面幾個案例講的是傲騰固態盤,傲騰作為DDR4接口的傲騰內存也有很多的應用,百度的Feed流服務,根據用戶畫像進行個性化服務推送。這個部分需要極強的在線數據庫實時處理功能,百度建立了一個完全基于內存的在線數據庫原先叫Feed-Q。百度面對的是億級的用戶,當你面對這么大客戶群的時候,你要建立個性化用戶畫像,用Feed流提供個性化服務,對內存的消耗是非常大的。而為了性能去擴大內存還是有新的方法,所以百度剛開始第一步采用內部加上傲騰內存來做優化,后來是非常大一部分運行在傲騰內存上面,可以看到性能提高非常快,而且沒有引起成本增加,反而有了大概30%左右的成本降低。

還有人工智能的應用,其中的一個是在人體生物特征的識別方面,包括語音。海鑫科金在指紋識別上面也是百萬級、千萬級的實時生物特征對比,這個時候它也是一個計算密集和內存密集的應用,這個時候也可以采用內存和擴大內存,但成本會飆升,而采用傲騰的內存去替換部分,這樣使得總體成本降低了29%。這還是沒有做軟件優化,直接采用的傲騰內存的內存模式。

除了剛才我們講的這幾個例子以外,其實還有很多的應用例子,包括現今短視頻發展迅猛,已經超過了直播視頻的量級,且對后臺存儲數據挑戰非常大。例如快手需要一些新的應用,去優化對客戶的服務,這對它的存儲挑戰也是非常大的,當快手用了傲騰的內存,做了一些應用上的優化,性能上得到很好的提升。

還有更多的成功案例包括第四范式,京東云,科大訊飛,青云,金山云等。我們希望看到更多這樣的例子,也希望跟各位一起合作能夠開發更多這方面異構存儲應用。

最后,新業務和新應用帶來了數據分層的需求,數據分層需要異構化存儲,沒有單一的存儲介質能夠滿足所有數據分層的需要,因此數據分層需要異構存儲。異構存儲當我們將傲騰介質放到異構存儲架構里,在DRAM和SSD增加這么一層后會發現,它很好的做到優勢互補,謝謝各位。

未經允許不得轉載:存儲在線 » 英特爾劉鋼:異構存儲,完美互補
分享到: 更多 (0)
澳客500