數(shù)字時代,數(shù)據(jù)共享互通成為剛需
數(shù)字經(jīng)濟時代,云計算、大數(shù)據(jù)、人工智能等新技術(shù)快速發(fā)展,非結(jié)構(gòu)化數(shù)據(jù)爆發(fā)式增長,數(shù)據(jù)類型變得愈發(fā)復(fù)雜多樣。在自動駕駛、基因測序、氣象預(yù)報等云數(shù)智應(yīng)用場景中,一次數(shù)據(jù)處理可能會涉及到文件、對象、大數(shù)據(jù)等多種協(xié)議,數(shù)據(jù)間的互通轉(zhuǎn)換成為數(shù)據(jù)存儲中至關(guān)重要的一環(huán),具備平臺化能力的融合存儲成為數(shù)字基礎(chǔ)設(shè)施建設(shè)的核心。
以基因測序場景為例,一次完整的基因測序涉及到數(shù)據(jù)采集、格式化、脫敏、壓縮、分析、發(fā)布等操作,其過程可以大致分為樣本采集、DNA/RNA測序、數(shù)據(jù)分析和發(fā)布四個步驟。在不同的處理階段,需要使用不同的數(shù)據(jù)協(xié)議進行操作。其中在樣本采集和DNA/RNA測序階段采用NFS文件協(xié)議,數(shù)據(jù)分析階段采用HDFS大數(shù)據(jù)協(xié)議,數(shù)據(jù)發(fā)布階段則是通過公網(wǎng)數(shù)據(jù)共享采用S3對象協(xié)議。整個數(shù)據(jù)處理過程涉及三種協(xié)議格式,這就意味著完成一次基因的測序流程需要在NFS、HDFS和S3之間進行兩次數(shù)據(jù)拷貝和數(shù)據(jù)格式的轉(zhuǎn)換。傳統(tǒng)存儲僅支持單一的訪問協(xié)議,這就會造成兩個問題:一是數(shù)據(jù)格式轉(zhuǎn)換和數(shù)據(jù)拷貝會降低整個數(shù)據(jù)處理流程的效率;二是多套存儲副本增加存儲空間成本。

基因測序應(yīng)用需要使用多種數(shù)據(jù)協(xié)議
百川入海:浪潮基于一套存儲 承載多樣化數(shù)據(jù)
浪潮分布式存儲平臺AS13000基于對非結(jié)構(gòu)化數(shù)據(jù)協(xié)議(NFS/CIFS/HDFS/S3)融合互通的研究進行技術(shù)創(chuàng)新,采用統(tǒng)一的數(shù)據(jù)管理和元數(shù)據(jù)管理、統(tǒng)一的增值特性服務(wù)、統(tǒng)一的分布式存儲資源池和統(tǒng)一的管理軟件系統(tǒng),保證各種協(xié)議共享同一份數(shù)據(jù)和元數(shù)據(jù)。訪問過程中無需數(shù)據(jù)轉(zhuǎn)換和拷貝,并且為每種協(xié)議提供原生語義服務(wù),每種服務(wù)均可直接訪問,無需安裝網(wǎng)關(guān)、插件或在計算側(cè)或應(yīng)用層進行改造。

AS13000非結(jié)構(gòu)化數(shù)據(jù)融合架構(gòu)
基于“多合一”極簡架構(gòu),浪潮分布式存儲得以實現(xiàn)四個“統(tǒng)一”。
首先,提供統(tǒng)一的數(shù)據(jù)管理和元數(shù)據(jù)管理。
數(shù)據(jù)管理和元數(shù)據(jù)管理是非結(jié)構(gòu)化數(shù)據(jù)存儲的關(guān)鍵,浪潮分布式存儲平臺AS13000根據(jù)NFS、CIFS、HDFS和S3的語義和元數(shù)據(jù)特點,抽象各協(xié)議的數(shù)據(jù)和元數(shù)據(jù)操作,通過一套統(tǒng)一的非結(jié)構(gòu)化數(shù)據(jù)和元數(shù)據(jù)管理架構(gòu)有效地保證各協(xié)議的原生訪問。
其次,提供統(tǒng)一的增值特性服務(wù)。
基于統(tǒng)一的數(shù)據(jù)訪問接口和元數(shù)據(jù)管理的架構(gòu)設(shè)計,浪潮AS13000對外提供統(tǒng)一的增值特性服務(wù),包括統(tǒng)一配額、QoS、加密、壓縮、快照、回收站、分級存儲、遠程復(fù)制、元數(shù)據(jù)檢索等等。
以下圖為例:同一個元數(shù)據(jù)檢索服務(wù)ElasticSearch支持NFS、CIFS、S3、HDFS多種協(xié)議,并且各協(xié)議為同一配置入口和查詢?nèi)肟凇?/p>

統(tǒng)一增值特性示例:元數(shù)據(jù)檢索服務(wù)
再次,構(gòu)建統(tǒng)一的分布式存儲資源池。
AS13000支持NFS/CIFS/HDFS/S3等多種服務(wù)協(xié)議共享非結(jié)構(gòu)化存儲資源池,并且同一個文件不同協(xié)議訪問的數(shù)據(jù)和元數(shù)據(jù)為同一份。例如,通過文件NFS協(xié)議寫入的一個文件,通過對象存儲AWS S3協(xié)議、大數(shù)據(jù)HDFS協(xié)議和文件CIFS協(xié)議均可讀取;每個節(jié)點都可以啟動文件NAS、大數(shù)據(jù)HDFS和對象存儲S3服務(wù)。
最后,打造統(tǒng)一的管理系統(tǒng)。
管理軟件負責(zé)集群的安裝、部署、業(yè)務(wù)配置、設(shè)備管理、監(jiān)控、告警等功能。浪潮分布式存儲平臺AS13000打造了融合互通的管理系統(tǒng),可同時支持NFS/CIFS/HDFS/S3等多種服務(wù)協(xié)議,增值特性通過統(tǒng)一的配置入口對所有非結(jié)構(gòu)化存儲協(xié)議同時生效,減少了企業(yè)的管理成本。
浪潮分布式存儲平臺AS13000通過多年來的持續(xù)技術(shù)創(chuàng)新,以一份數(shù)據(jù)支持多種協(xié)議訪問,實現(xiàn)了非結(jié)構(gòu)化數(shù)據(jù)融合互通,在提升數(shù)據(jù)處理效率的同時降低了存儲購置和運維成本,保障各協(xié)議的語義無損和性能無損,構(gòu)筑了面向“云數(shù)智”應(yīng)用的融合存儲平臺,助力企業(yè)數(shù)字化轉(zhuǎn)型,加速釋放數(shù)據(jù)價值。
(新媒體責(zé)編:wa12)
聲明:
1、凡本網(wǎng)注明“人民交通雜志”/人民交通網(wǎng),所有自采新聞(含圖片),如需授權(quán)轉(zhuǎn)載應(yīng)在授權(quán)范圍內(nèi)使用,并注明來源。
2、部分內(nèi)容轉(zhuǎn)自其他媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)。
3、如因作品內(nèi)容、版權(quán)和其他問題需要同本網(wǎng)聯(lián)系的,請在30日內(nèi)進行。電話:010-67683008
人民交通24小時值班手機:17801261553 商務(wù)合作:010-67683008轉(zhuǎn)602 E-mail:zzs@rmjtzz.com
Copyright 人民交通雜志 All Rights Reserved 版權(quán)所有 復(fù)制必究 百度統(tǒng)計 地址:北京市豐臺區(qū)南三環(huán)東路6號A座四層
增值電信業(yè)務(wù)經(jīng)營許可證號:京B2-20201704 本刊法律顧問:北京京師(蘭州)律師事務(wù)所 李大偉
京公網(wǎng)安備 11010602130064號 京ICP備18014261號-2 廣播電視節(jié)目制作經(jīng)營許可證:(京)字第16597號