國際頂會(huì)認(rèn)可!浪潮 KaiwuDB 論文入選 ICDE 2024
近日,KaiwuDB 與中國人民大學(xué)合作的論文 FOSS: A Self-Learned Doctor for Query Optimizer 被數(shù)據(jù)庫領(lǐng)域頂會(huì)The 40th IEEE International Conference on Data Engineering (ICDE 2024) 錄用。論文中提出了具備自學(xué)習(xí)、自診斷能力的查詢優(yōu)化器 FOSS,推動(dòng)了基于 AI 算法的學(xué)習(xí)型查詢優(yōu)化技術(shù)創(chuàng)新發(fā)展。KaiwuDB 高級(jí)研發(fā)工程師、人大信息學(xué)院博士孫路明為共同作者。
ICDE 是電氣與電子工程師協(xié)會(huì)(IEEE)舉辦的旗艦會(huì)議,與 SIGMOD、VLDB 并稱數(shù)據(jù)庫三大頂會(huì),也是中國計(jì)算機(jī)學(xué)會(huì) ( CCF ) 推薦的 A 類國際會(huì)議,主要聚焦設(shè)計(jì)、構(gòu)建、管理和評(píng)估高級(jí)數(shù)據(jù)密集型系統(tǒng)和應(yīng)用等研究問題,在國際上享有盛譽(yù)并具有廣泛的學(xué)術(shù)影響力。此次在荷蘭召開的ICDE 2024大會(huì),吸引到北京大學(xué)、清華大學(xué)、中國人民大學(xué)、浙江大學(xué)、MIT、斯坦福等高校及全球知名科技企業(yè)參會(huì),共同探討數(shù)據(jù)庫、數(shù)據(jù)處理領(lǐng)域的先進(jìn)技術(shù)問題。
近年來,數(shù)據(jù)庫研究人員提出了多個(gè)基于 AI 算法的學(xué)習(xí)型查詢優(yōu)化器,它們或者通過自下而上的方式從頭學(xué)習(xí)構(gòu)建查詢計(jì)劃,或者通過提示(Hint)引導(dǎo)或者限制傳統(tǒng)優(yōu)化器的執(zhí)行計(jì)劃生成過程。雖然這些方法取得了一些成功,但它們卻面臨訓(xùn)練效率低下、計(jì)劃搜索空間有限等方面的挑戰(zhàn)。
而本篇論文提出的 FOSS —— 基于深度強(qiáng)化學(xué)習(xí)的查詢優(yōu)化新框架,與引導(dǎo)傳統(tǒng)優(yōu)化器行為的黑盒方法不同,F(xiàn)OSS 是一個(gè)白盒方法,通過優(yōu)化傳統(tǒng)查詢優(yōu)化器生成的計(jì)劃,更好地利用專家優(yōu)化知識(shí)。其行為類似一個(gè)診療查詢計(jì)劃的醫(yī)生,它從傳統(tǒng)優(yōu)化器生成的原始計(jì)劃開始優(yōu)化,發(fā)現(xiàn)其中的性能問題,通過系列優(yōu)化動(dòng)作逐步改進(jìn)計(jì)劃中的次優(yōu)節(jié)點(diǎn)。此外, FOSS 還采用了不對(duì)稱的收益模型來評(píng)估兩個(gè)計(jì)劃之間的性能差異。為了提高 FOSS 的訓(xùn)練效率,我們將 FOSS 與傳統(tǒng)優(yōu)化器集成以形成一個(gè)模擬環(huán)境。利用該模擬環(huán)境,F(xiàn)OSS 可以自動(dòng)快速生成大量高質(zhì)量的模擬經(jīng)驗(yàn),然后從這些經(jīng)驗(yàn)中學(xué)習(xí)以提高其優(yōu)化能力。論文在 Join Order Benchmark, TPC-DS 和 Stack Overflow 等多組數(shù)據(jù)集和負(fù)載上評(píng)估了 FOSS 的性能。實(shí)驗(yàn)結(jié)果表明:FOSS 在模型收斂速度、查詢優(yōu)化效果上優(yōu)于現(xiàn)有學(xué)習(xí)型查詢優(yōu)化器,與 PostgreSQL 默認(rèn)查詢優(yōu)化器相比,更是獲得了最高 8.33 倍的加速效果。通過引入該技術(shù),數(shù)據(jù)庫查詢性能、響應(yīng)時(shí)間及用戶體驗(yàn)或?qū)⒂行嵘?,適用于 OLAP、HTAP 等數(shù)據(jù)密集型場景的查詢需求。
作為業(yè)內(nèi)首款分布式、多模融合、支持原生AI 的數(shù)據(jù)庫產(chǎn)品,KaiwuDB 長期致力于為 AIoT 等重點(diǎn)場景提供更豐富的數(shù)據(jù)運(yùn)管能力和更卓越的數(shù)據(jù)庫性能,力求不斷在 SQL 優(yōu)化、數(shù)據(jù)庫自治等重點(diǎn)技術(shù)上實(shí)現(xiàn)突破。未來也將始終堅(jiān)持以先進(jìn)技術(shù)打磨產(chǎn)品,加速學(xué)術(shù)研究與產(chǎn)業(yè)應(yīng)用融合,為中國數(shù)據(jù)庫技術(shù)創(chuàng)新發(fā)展、數(shù)據(jù)處理效能提升等方面貢獻(xiàn)新思路,為政企客戶伙伴提供高性能、高可用、易運(yùn)維的數(shù)據(jù)服務(wù),助力產(chǎn)業(yè)數(shù)字化升級(jí)與應(yīng)用創(chuàng)新。