摘要:性能加持下的超融合,才是真正的超融合。選擇YMatrix,一次選型支持所有數(shù)據(jù)類型,滿足所有復雜分析需求,降低選型和開發(fā)運維成本。
10月26日,由北京四維縱橫數(shù)據(jù)技術有限公司自主研發(fā)的超融合數(shù)據(jù)庫 YMatrix 5.0正式發(fā)布 。
不同于傳統(tǒng)以及專用數(shù)據(jù)庫產(chǎn)品,YMatrix實現(xiàn)了“一庫多用”,可以支持各類傳統(tǒng)及新興數(shù)據(jù)場景,廣泛支持多種數(shù)據(jù)類型,包括關系、時序、GIS、JSON、文本、圖片數(shù)據(jù)等,也能滿足包括機器學習、高級查詢在內(nèi)的全場景數(shù)據(jù)管理和復雜分析需求。
YMatrix創(chuàng)始團隊曾在全球排名Top3的Greenplum工作多年, 是 分析型數(shù)據(jù)庫領域少見的世界級完整建制團隊 。 創(chuàng)始人姚延棟所帶領團隊有大量服務全球500強企業(yè)的經(jīng)驗,對企業(yè)級數(shù)據(jù)庫產(chǎn)品的需求、研發(fā)和應用有深刻理解。
從第一行代碼到5.0版本,僅兩年時間,公司已獲得累計近 2億元人民幣的4輪融資 ,股東包括晨山資本、順義產(chǎn)業(yè)基金、某頭部云廠商、東方富海、中科創(chuàng)星、清華啟迪等。
此次產(chǎn)品發(fā)布會上,YMatrix CEO 與創(chuàng)始人姚延棟分享了超融合數(shù)據(jù)庫的發(fā)展趨勢,以及 萬物智聯(lián) 場景下 數(shù)據(jù)庫的最佳形態(tài) 。另外,杭州自動化技術研究院院長徐赤、小米智能制造軟件產(chǎn)品部負責人封楊博士、三一重工泵送研究院泵誦云平臺大數(shù)據(jù)負責人褚鳳天 ,也參與了此次發(fā)布會,分別從工廠數(shù)字化、智能制造和工業(yè)互聯(lián)網(wǎng)、智能設備運維等不同應用場景角度,分享了他們對下一代數(shù)據(jù)庫的需求和理解。
專用數(shù)據(jù)庫 vs. 超融合:下一代技術棧的競賽
下一個時代,是萬物智聯(lián)和數(shù)智化轉型的時代。那么,作為數(shù)字基石之一的數(shù)據(jù)庫應該是什么樣的?
過去20年間,互聯(lián)網(wǎng)飛速發(fā)展,為了應對不斷升級、升維的數(shù)據(jù)環(huán)境,涌現(xiàn)了很多優(yōu)秀的產(chǎn)品,或是功能強大,或是性能驚艷,或是易用性極佳。然而 , 用戶選擇時,功能、性能 、 易用性 似乎構成了一個 ” 不可能三角 ” ,總是需要 權衡和取舍 。

為了應對新增的需求,用戶不得已的選擇是不斷疊加,先一個個疊加新的專用數(shù)據(jù)庫產(chǎn)品,再疊加運維不同產(chǎn)品的專業(yè)化團隊。最終造成的困境,杭州自動化技術研究院院長徐赤將其總結為“難、混、亂、散”:
每出現(xiàn)一個新需求,就要疊加一個新產(chǎn)品,從選型、試點到驗證,少則一兩個月,多則半年甚至一年,堪比“煉獄”。由于目標混沌、路徑混亂、缺少核心系統(tǒng),數(shù)據(jù)總是呈現(xiàn)散亂并難以整合的狀態(tài)。
最后導致的直接結果就是“用戶成本高“、”需求難以滿足、痛點永遠存在”。

對此,徐赤在發(fā)布會上表示,在過去以專用類產(chǎn)品為主流的市場中,服務商忙著生產(chǎn)孤島、企業(yè)忙著購買孤島,工程師們忙著打通孤島,循環(huán)往復,永無止境 。而且,這樣強行耦合的結構,牽一發(fā)動全身,非常不穩(wěn)定。
YMatrix創(chuàng)始人姚延棟介紹,作為數(shù)據(jù)庫人,成立團隊的初心,就是想從用戶需求出發(fā),做一款通用性強的產(chǎn)品,而不是和大多同行一樣,開發(fā)專用數(shù)據(jù)庫產(chǎn)品,繼續(xù)一個問題接一個問題,只解決當下問題。
據(jù)了解,在國際市場上,類似 YMatrix 這樣具備 “超融合”特性的產(chǎn)品,已經(jīng)成為了近年的研發(fā)趨勢。
海外市場,Snowflake 和 Databricks 曾先后提出 “one data platform”理念;傳統(tǒng)數(shù)據(jù)庫頭把交椅的Oracle也在走向融合方向;對復雜新興場景需求更加熟悉的時序數(shù)據(jù)庫大佬 InfluxDB 和 TimescaleDB,也先后啟動了新一代融合型數(shù)據(jù)庫的研發(fā),對比大廠采取了更為激進的策略。
國內(nèi)市場中,YMatrix率先提出超融合數(shù)據(jù)庫概念,在2020年完成了相應產(chǎn)品的研發(fā);目前也有少數(shù)創(chuàng)業(yè)公司試水,從專用產(chǎn)品出發(fā),研發(fā)符合新一代融合理念的產(chǎn)品。
如何定義一款優(yōu)秀的“超融合 ” 數(shù)據(jù)庫產(chǎn)品?
首先,回到用戶需求。
小米智能制造軟件產(chǎn)品部負責人封楊博士是這么定義的:以工業(yè)互聯(lián)網(wǎng)場景為例,其本質(zhì)是以“數(shù)據(jù)”為核心要素,企業(yè)實現(xiàn)全面連接。 企業(yè)經(jīng)營者的核心訴求,是如何最大化利用數(shù)據(jù)智能,為企業(yè)經(jīng)營帶來看得見的價值。
再向上一層,則是跨過每個企業(yè)的微觀需求,在垂直產(chǎn)業(yè)或多個產(chǎn)業(yè)交叉的維度,構建起全要素、全產(chǎn)業(yè)鏈、全價值鏈融合的新制造體系和新產(chǎn)業(yè)生態(tài)。

為了實現(xiàn)這個目標,需要搭建一個閉環(huán)的數(shù)據(jù)鏈條。在企業(yè)內(nèi)到企業(yè)外,從采集、診斷、預測到智能決策,實現(xiàn)全環(huán)節(jié)覆蓋。依賴優(yōu)化后的結果,可以更及時、更準確的做商業(yè)決策,比如確定一個月后生產(chǎn)什么,需要提前備好多少原材料,技術工藝能怎么調(diào)優(yōu),等等。
封楊博士介紹,從企業(yè)級用戶的角度來看,代表最先進生產(chǎn)力的產(chǎn)品,首先應該是極致簡單的,最好是一個頂 N個,能 降低企業(yè)的財務、人力、學習成本;其次,要好用易用,因為制造場景采集的數(shù)據(jù)類型五花八門,不同數(shù)據(jù)類型的交叉分析、應對業(yè)務訴求的復雜分析也是層出不窮。
對此,姚延棟進一步解釋,“用戶并不關心什么TP、AP、湖倉、批流,他們想要的就是一個強大的數(shù)據(jù)庫,能接入所有數(shù)據(jù),做得了各種各樣的分析 。有數(shù)據(jù)就可以往里寫,想用的時候隨時用,允許他們把精力放在數(shù)據(jù)價值上,而不是數(shù)據(jù)庫上。所以,行業(yè)內(nèi)曾熱烈討論的湖倉之分、批流之分,只會是階段性產(chǎn)物”。
“使用YMatrix,用戶只需要做一次選型,運維一個產(chǎn)品,就可以支持所有數(shù)據(jù)類型,滿足所有可能的需求。每次新需求出現(xiàn)時,只需要考慮在YMatrix中怎么實現(xiàn)。這大大降低了選型成本和開發(fā)運維成本”,姚延棟介紹。

“企業(yè)內(nèi)很難有精通不同產(chǎn)品的通才,所以廠商應該把復雜度處理掉,把簡單應用給到我們用戶,這樣既省錢,又省心省力”, 封楊博士表示在應用YMatrix的超融合產(chǎn)品后,相當于實現(xiàn)了“無縫集成”,僅僅需要管理“1個極致輕松的數(shù)倉建設團隊+1個極致專注的工業(yè)算法團隊”。
三一重工泵送研究院泵誦云平臺大數(shù)據(jù)負責人褚鳳天表示,“使用高效的產(chǎn)品,可以大量釋放出精力和創(chuàng)造力,讓團隊聚焦工廠運營、設備管理、工藝調(diào)優(yōu)等更有價值的工作 ”。
“以常見的堵管故障為例,以前總是很難明確堵管的真實原因,現(xiàn)在可以在庫內(nèi)通過批量的算法,在采集到的工礦數(shù)據(jù)上,更好的定位原因,提升服務水平,降低客戶投訴率”,褚鳳天介紹,“在嘗試從制造企業(yè)向服務型企業(yè)升級的過程中,數(shù)據(jù)能力會是重點之一,直接決定了服務水平和盈利水平” 。
性能突破,是超融合價值放大的必要前提
在數(shù)據(jù)庫行業(yè),性能似乎是一個永遠有吸引力的話題。
性能數(shù)據(jù)直觀,誰高誰低,誰強誰弱,一目了然。最近,很多數(shù)據(jù)庫廠商都開始性能打榜打擂。姚延棟對此表示,“這是好事,說明技術在進步。但是,僅僅在某個場景下實現(xiàn)性能快 20%-30% ,甚至 1 倍,是很難贏得客戶的。客戶需要的是鐵人三項,甚至是十項全能 ” 。
“在YMatrix團隊內(nèi)部,我們關注全場景性能表現(xiàn),包括寫入能力、時序查詢能力、單表OLAP分析、多表關聯(lián)OLAP分析、Machine Learning性能以及 OLTP 能力等諸多方面”,姚延棟介紹,“性能加持下的超融合,才是 真正的 超融合 ,才能給用戶提供價值 ” 。
目前,YMatrix在生產(chǎn)場景下的寫入速度實現(xiàn)了1.52 億數(shù)據(jù)點/秒。通常一個工廠的數(shù)據(jù)點大概在10萬點以內(nèi),1.52億是該場景規(guī)模的1500倍,哪怕是對寫入能力要求最高的時序場景,也可以輕松滿足其高并發(fā)、低延遲的寫入需求。

此外,對比時序數(shù)據(jù)庫獨角獸TimescaleDB,查詢耗時是YMatrix的5.1倍;對比知名OLAP數(shù)據(jù)庫產(chǎn)品Clickhouse,YMatrix在SSB基礎測試上快27%;對比MPP數(shù)據(jù)庫主流廠商Greenplum,YMatrix在多表關聯(lián)分析場景上實現(xiàn)了數(shù)倍的性能提升;對比全球流行的開源大數(shù)據(jù)平臺Spark,YMatrix在機器學習場景上的性能是其8倍;在Intel實驗室的TPC-B 國際標準測試中,YMatrix主鍵查詢tps高達160萬,數(shù)十倍于絕大多數(shù)產(chǎn)品。
對于性能優(yōu)化的重要性,三一重工褚鳳天表示,“最直接的體現(xiàn)就是提高運行速度,我們可以更快速的反應,大大提高了運維團隊的效率 ”。
姚延棟介紹,此次發(fā)布的YMatrix 5.0版本,還包含了多至138項的性能優(yōu)化,特別是針對寫入和分析等重點領域,進行了深度的指令級優(yōu)化。

在易用性方面,YMatrix設計了用戶體驗極佳的圖形化installer,只需10分鐘左右就可以完成數(shù)據(jù)庫集群的搭建。同時,為了降低初學者的學習曲線,YMatrix提供了on boarding功能,用戶可以在3分鐘內(nèi)體驗一個完整的IoT場景,包括數(shù)據(jù)寫入和查詢分析。
目前, YMatrix 已經(jīng)獲得了從創(chuàng)業(yè)公司到大型企業(yè)的認可,其中有超過萬億市值的行業(yè)龍頭企業(yè),包括寧德時代、比亞迪等,以及世界 500 強企業(yè),包括小米、三一重工等。
“后續(xù),YMatrix會在已經(jīng)存在海量需求的時序場景深耕,嘗試替代傳統(tǒng)數(shù)據(jù)庫和專用類產(chǎn)品”,創(chuàng)始人姚延棟介紹,“數(shù)據(jù)量大、指標量多的車聯(lián)網(wǎng)、智能制造、智慧能源、智慧城市、智慧園區(qū)、智慧醫(yī)療等場景會是重要方向。這些場景所產(chǎn)生的業(yè)務需求,將最大化體現(xiàn)超融合產(chǎn)品的價值”。
(新媒體責編:wan123)
聲明:
1、凡本網(wǎng)注明“人民交通雜志”/人民交通網(wǎng),所有自采新聞(含圖片),如需授權轉載應在授權范圍內(nèi)使用,并注明來源。
2、部分內(nèi)容轉自其他媒體,轉載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3、如因作品內(nèi)容、版權和其他問題需要同本網(wǎng)聯(lián)系的,請在30日內(nèi)進行。電話:010-67683008
人民交通24小時值班手機:17801261553 商務合作:010-67683008轉602 E-mail:zzs@rmjtzz.com
Copyright 人民交通雜志 All Rights Reserved 版權所有 復制必究 百度統(tǒng)計 地址:北京市豐臺區(qū)南三環(huán)東路6號A座四層
增值電信業(yè)務經(jīng)營許可證號:京B2-20201704 本刊法律顧問:北京京師(蘭州)律師事務所 李大偉
京公網(wǎng)安備 11010602130064號 京ICP備18014261號-2 廣播電視節(jié)目制作經(jīng)營許可證:(京)字第16597號