OceanBase打破甲骨文長達9年的“壟斷”

2020/05/21 21:11:57 網誌分類: 科技
21 May

5月20日,世界上權威數據庫評測機構——國際事務處理性能委員會(TPC),發布最新評測榜單,螞蟻金服自研的分布式關系數據庫OceanBase,以7.07億的tpmC的評測成績再次奪冠,並將自己之前創造的記錄提升了近11倍。
2019年10月,OceanBase打破甲骨文長達9年的“壟斷”,登頂TPC榜首時,業界有不少的評論稱,阿裏的第一名成績不會保持太久的,甲骨文、IBM等老牌數據庫廠商很快就會刷新OceanBase創造的記錄。OceanBase這次直接用提升11倍的成績,對那些唱衰言論給出最好回應。
除了tmpC,TPC-C的評測還有一個重要指標,就是用系統的總價格除以tmpC得分,得到性能價格比的指標(Price/tpmC)。
在這一項指標中,OceanBase是3.98cny/tmpc,在折算後比甲骨文的Orcale數據庫低了近50%。其中最為關鍵的一點是,Orcale在TPC-C使用頂配的專用設備,計算集群動用了108 顆 T3 SPARC 處理器,1728 個物理核心和 13824 個執行線程,同時使用了97 臺 COMSTAR 專用存儲設備,這些存儲設備都經過專門的優化,使用Intel 服務器作為存儲機頭。
Oceanbase是布署在1557 臺增強型阿裏雲ECS i2d服務器上的,並未使用專門存儲。數據庫的性能是很依賴服務器的計算與I/O能力,在這方面阿裏雲ECS i2d不但配備了Intel Xeon(Skylake) Platinum 8163 處理器、NVMe SSD本地磁盤,同時其網絡性能也達到了25G的帶寬和400萬PPS的轉發能力,這使得i2d適用於各種如OLTP、NoSQL與數據倉庫等數據庫應用場景。可以說阿裏奪冠,不僅體現了阿裏在數據庫研發方面的實力,也展示了阿裏雲基礎設施ECS的高性能與穩定性。
筆者在200 行代碼解讀國產數據庫阿裏 OceanBase 的速度源頭!中曾經介紹過,OceanBase是基於Paxos分布式協議構架的數壯陽藥 壯陽藥哪裡買 壯陽藥價格 壯陽藥副作用 壯陽藥評價 壯陽藥效果 壯陽藥品 持久藥 持久藥推薦 持久藥哪裡買 持久液 持久液哪裡買據庫,其中如布隆過濾器等設計都對於其性能優化的問題,這裏就不加贅述了。除了性能外,Oceanbase最大的亮點在於其HTAP的混合屬性,這讓Oceanbase解決了業界很多的痛點。


HTAP是2014年由Garnter提出的:混合事務/分析處理(HTAP)是一種新興的應用體系結構,兼容兩種業務場景。混合負載(HTAP Hybrid Transactional/Analytical Processing)是在保留原有在線交易功能的同時,強調了數據庫原生計算分析的能力。支持混合負載的數據庫能夠避免在傳統架構中,在線與離線數據庫之間大量的數據交互,同時也能夠針對最新的業務數據進行實時統計分析。簡單的講TP可以看作是戰鬥機的敏捷迅速屬性,AP則相當於載彈量大、威力強的轟炸機。OceanBase就是這種混合式戰機的典範。

緣起HTAP


HTAP的出現主要原因是當今大時代時代的數據和以前相比出現了明顯的變化。根據筆者在銀行業的觀察,目前數據的生產者有以下幾種類型:
第一類是應用產生數據。最早的數據生產機制是應用系統的副產品,也就是應用產生數據。為了滿足業務,需要構建業務IT系統,隨著IT業務系統不斷在運行,大量應用數據就產生了。
這些數據經過ETL加工進入數據倉庫進行再處理,供業務應用。這些數據都是單一的關系型數據,數據量級是GB的。這些數據利用早期傳統的關系印度雙效威而鋼 雙效威而鋼 雙效威而鋼評價 雙效威而鋼購買型數據庫和數據倉庫都可以處理完成。
第二類是行為產生數據。隨著互聯網和電商的快速發展,大量人的操作行為和使用行為產生的數據,像谷歌、臉書等大數據互聯公司,都記錄人的形成產生的數據。上網瀏覽、購買、評論、刷微博、玩抖音等行為都可以產生大量數據。這些數據不再是單一的結構化數據,出現了大量文檔、音頻和視頻數據,數據量級是TB級的。
第三類是機器產生數據。進入萬物互聯的時代,大量機器傳感器和IoT設備都會產生大量數據。這些設備 7*24小時產生數據,數據格式也是多種多樣,有的是日誌數據,有的是時序數據,有的是網格數據等等,數據量級是PB的。
由於處理的數據的規格、速度和多樣性發生了根本變化,它不僅僅是要支撐到萬億記錄數據庫表的處理,還要支撐分析場景。而傳統的TP數據庫支撐交易業務,再吐出數據將給AP分析報表的用法,無法看到實時的戰報結果,無法滿足時間要求,這種變化,是傳統的關系數據庫,數據倉庫以及大數據的Nosql數據庫都是無法支撐的。因此以Oceanbase為代表HTAP數據庫開始興起了。

大數據時代的秘籍——唯快不破

傳統的數據消費者是一般是決策層的領導。當業務系統產生數據,經過ETL加工處理進入數據倉庫,經過數據主題設計和統計匯總,形成KPI儀表盤,提供給領導決策者服務,領導根據數據分析結果進行宏觀決策服務。因此管理層不只需要對上一日的數據進行追蹤即可。傳統的純AP或者TP數據庫在這種背景下需適應節奏的。

隨著移動互聯網時代到來,大量個性化服務需求產生,數據分析結果不再是推送給公司管理層,而是要提供給一線營銷人員,供他們直接使用。
例如,OceanBase支持阿裏媽媽的廣告報表查詢,這使得數據實時性大幅度提升。再如,現在銀行的一個移動啟瓶器系統就需要向理財經理實時提供大客戶的結息、凈值等一系列個性化指標,用戶有六萬多人,需要支持至少五百個在線並發印度必利勁 印度必利勁代購 印度必利勁藥局 印度必利勁哪裡買 必利勁 印度必利勁副作用/秒。這些場景都要求基於實時數據的分析,傳統TP與AP分享的數據庫已經無法滿足要求了。

OceanBase讓數據產生價值

隨著數據體量不斷增大,傳統的單機IOE計算框架向分布式計算框架轉變,又一次實現移動數據和移動程序之間的轉移。
在傳統IOE計算框架下,數據在不同業務系統之間移動;進入分布式計算框架下,數據存在HDFS文件系統上,根據不同業務需求編寫MR程序,進行數據處理。當數據庫的計算框架從單機計算框架轉向分布式計算框架,整個IT業務應用系統的架構也發生根本的變化。
數據在傳統業務系統中從核心業務系統(TP),向數據倉庫系統(AP),再向模型分析系統(SAS)進行遷移。
在新一代大數據應用系統中,數據可以不進行遷移,在大數據體系架構下,同時實現TP(實時交易),AP(數據分析)和ML(機器學習)等應用處理,極大提高數據利用率和工作效率。在大數據體系架構下,想要提升數據的價值,就必須減少無謂移動。這就要有一個全新的數據庫架構體系進行支撐,可以說只有使用HTAP數據庫架構體系,才能滿足實時數據分析結果的需求,而OceanBase也是在這樣的背景下孕育而生的。
為了支撐上述三大趨勢變化,數據庫除了應對操作型業務,還會在業務實時數據監控,數據報告和決策輔助方面有許多數據實時應用的場景。傳統架構中OLTP和OLAP兩類業務是完全分離的。兩者的隔離導致整個系統在數據一致性必利吉 必利吉藥局 必利吉哪裡買 必利吉效果 必利吉正品 必利吉副作用 必利吉心得 印度必利吉,數據平臺管理上帶來了巨大的阻礙。
此前, RDBMS和大數據(Hadoop)分別成為數據處理的兩個方面,一旦一種架構選擇了一種場景,就不得不放棄另一種場景。因此,以OceanBase為代表的HTAP混合數據庫,終將成為數據庫發展的一個新要求,必將成為數據庫發展的主流。

回應 (0)
我要發表
user