久久影院午夜理论片无码,久久久无码人妻精品无码,久久黄色视频,国产亚洲精品久久久久久郑州

更多 選擇語言

基于英特爾® 傲騰? 持久內(nèi)存200系列的Spark方案實踐

摘要

  英特爾® 傲騰? 持久內(nèi)存是一款革命性的持久內(nèi)存產(chǎn)品,補齊了DRAM與磁盤之間的需求缺口,重構(gòu)內(nèi)存/存儲層次架構(gòu),集大容量、經(jīng)濟性和持久性于一身,幫助用戶優(yōu)化數(shù)據(jù)中心基礎(chǔ)設(shè)施,滿足大數(shù)據(jù)分析、數(shù)據(jù)庫、云與虛擬化、分布式存儲等多種應(yīng)用場景需求。為了幫助用戶通過傲騰持久內(nèi)存來實現(xiàn)應(yīng)用創(chuàng)新優(yōu)化,助力企業(yè)業(yè)務(wù)系統(tǒng)實現(xiàn)性能突破,浪潮發(fā)布了基于英特爾® 傲騰? 持久內(nèi)存的多種場景方案,本方案是基于英特爾® 傲騰? 持久內(nèi)存200系列的Spark應(yīng)用方案。

背景介紹

  Spark 是一種快速、通用、可擴展的大數(shù)據(jù)分析引擎,目前已經(jīng)發(fā)展成為一個包含多個子項目集合的生態(tài)系統(tǒng)。Spark 基于內(nèi)存計算,提高大數(shù)據(jù)環(huán)境下數(shù)據(jù)處理的實時性,同時提供高容錯性和高可伸縮性,用戶可以將 Spark以集群的形式部署在大量廉價的硬件之上,滿足低成本下高性能計算需求。

  Spark 搭載了高效的 DAG 執(zhí)行引擎,可以通過基于內(nèi)存來高效處理數(shù)據(jù)流。與Hadoop 的 MapReduce 相比,Spark 基于內(nèi)存的運算要快100倍以上,基于硬盤的運算也要快10 倍以上。Spark 提供了統(tǒng)一的解決方案,支持批處理、交互式查詢(Spark SQL)、實時流處理(Spark Streaming)、機器學習(Spark MLlib)和圖計算(GraphX),這些不同類型的數(shù)據(jù)處理都可以在同一個應(yīng)用中無縫使用。

  Spark擁有眾多的優(yōu)勢,廣泛應(yīng)用于云計算、物聯(lián)網(wǎng)、機器學習等前沿領(lǐng)域的超大型數(shù)據(jù)集快速分析處理,并得到眾多大數(shù)據(jù)公司的支持。

  挑戰(zhàn):成本限制了內(nèi)存容量擴展

  Spark的內(nèi)存計算能力受限于服務(wù)器自身對于內(nèi)存容量的支持,這導(dǎo)致Spark作業(yè)執(zhí)行期間經(jīng)常出現(xiàn)內(nèi)存不足,中間數(shù)據(jù)落磁盤,Spark內(nèi)存計算的性能優(yōu)勢無法發(fā)揮的情況。

  傳統(tǒng)的解決方案是利用Spark的分布式體系結(jié)構(gòu),使其在集群上運行,以解決內(nèi)存不足的問題,為了擴展內(nèi)存,企業(yè)將不得不部署更多的服務(wù)器,這顯然增加了企業(yè)的成本壓力。

解決方案介紹

  英特爾®傲騰?持久內(nèi)存創(chuàng)新性解決方案新增內(nèi)存擴展方式專為打破服務(wù)器內(nèi)存容量限制而優(yōu)化,補齊了DRAM內(nèi)存與磁盤之間的需求缺口,打造高性能、大容量的持久內(nèi)存層,有助于更加高效地挖掘數(shù)據(jù)的潛在價值。

       

  圖1:英特爾®傲騰?持久內(nèi)存存儲層

  英特爾®傲騰?持久內(nèi)存新一代產(chǎn)品200系列(Barlow Pass,即BPS)基于第三代英特爾®至強®可擴展處理器優(yōu)化,容量有128GB、256GB和512GB三種。相對于上一代100系列產(chǎn)品,Ice Lake平臺單顆CPU容量最大支持到4TB,內(nèi)存頻率提升至3200MT/Sec,單通道平均性能提升25%。

  英特爾®傲騰?持久內(nèi)存200系列具有兩種工作模式:內(nèi)存模式(MM)和App Direct 模式(AD)。

  內(nèi)存模式,CPU內(nèi)存控制器將所有英特爾®傲騰?持久內(nèi)存200系列視為易失性系統(tǒng)內(nèi)存(無數(shù)據(jù)持久性),以更低的成本提供更大的內(nèi)存容量,無需更改應(yīng)用,并且性能接近 DRAM。

  App Direct模式,能夠?qū)崿F(xiàn)較大內(nèi)存容量和數(shù)據(jù)持久性,支持持久內(nèi)存編程,軟件和應(yīng)用能夠直接與英特爾®傲騰?持久內(nèi)存通信,降低了堆棧的復(fù)雜性,并充分利用緩存一致性的字節(jié)可尋址特性,將持久內(nèi)存的使用擴展到本地節(jié)點之外;App Direct模式提供一致的低延遲,同時支持更大的數(shù)據(jù)集。

  圖2:英特爾®傲騰?持久內(nèi)存工作模式

  本方案使用App Direct模式,利用BPS的數(shù)據(jù)持久化、高容量、高可用性特性來加速Spark數(shù)據(jù)存儲速度,實現(xiàn)以更低的內(nèi)存成本達到更高的性能。

  圖3:BPS內(nèi)存擴展方案與DRAM方案對比

方案驗證:性能提升,成本降低

  本次使用TPC-DS測試了Spark在DRAM和BPS平臺下的性能

  測試配置(表)

配置項

BPS

DRAM

環(huán)境配置

CPU

2*Icelake 6348 2.60GHz(112 vcore)

Memory

256G(16*16G)

1T(32*32G)

BPS

1T(8*128G)App Direct

None

Disk Drive

8*2T HDD

1:測試配置對比表

  集群網(wǎng)絡(luò)拓撲圖(圖4)

  圖4:測試方案集群網(wǎng)絡(luò)拓撲圖

  測試結(jié)果

  Spark SQL測試結(jié)果

  圖5:Spark SQL集群性能測試結(jié)果

  Spark SQL集群對比測試結(jié)果說明: 數(shù)據(jù)cache后,BPS整體性能是DRAM的6.5倍。BPS通過OAP緩存了9個I/0需求高的SQL全部數(shù)據(jù),而DRAM受服務(wù)器內(nèi)存資源的限制測試數(shù)據(jù)不能全部放在內(nèi)存中,部分數(shù)據(jù)落在磁盤上,導(dǎo)致Spark數(shù)據(jù)處理能力無法充分發(fā)揮。

客戶收益

  在Spark場景下,英特爾®傲騰?持久內(nèi)存200系列表現(xiàn)了優(yōu)秀的穩(wěn)定性和性能,可作為內(nèi)存擴展方案使用,滿足Spark應(yīng)用更大容量內(nèi)存的需求。英特爾®傲騰?持久內(nèi)存擴展方案讓Spark以更低的成本使用更多的內(nèi)存,從而發(fā)揮Spark基于內(nèi)存計算的性能優(yōu)勢,該方案相對于DRAM方案有明顯的性能提升。




?
聯(lián)


×
聯(lián)系我們
ERP、企業(yè)軟件購買熱線
400-018-7700
云服務(wù)產(chǎn)品銷售熱線
400-607-6657
集團客戶投訴熱線
400-691-8711
智能終端產(chǎn)品客服熱線
400-658-6111
固镇县| 武功县| 家居| 柳林县| 望都县| 双辽市| 道真| 思茅市| 普陀区| 沈阳市| 兴海县| 盐亭县| 苍南县| 行唐县| 监利县| 行唐县| 云霄县| 鹰潭市| 黑水县| 平陆县| 梁山县| 贵阳市| 六枝特区| 延边| 武安市| 噶尔县| 定州市| 大竹县| 正宁县| 广饶县| 屏南县| 疏勒县| 保山市| 鄂温| 平原县| 河曲县| 衡南县| 景谷| 元氏县| 河西区| 土默特右旗|