隨著云計算、大數(shù)據(jù)、移動互聯(lián)網(wǎng)和社交網(wǎng)絡(luò)的快速發(fā)展,企業(yè)信息化過程中非結(jié)構(gòu)化數(shù)據(jù)呈現(xiàn)出爆炸式增長的趨勢。這種數(shù)據(jù)類型包括文檔、圖片、音頻、視頻、郵件等多種形式,其增長速度遠(yuǎn)超結(jié)構(gòu)化數(shù)據(jù),給企業(yè)的數(shù)據(jù)管理帶來了前所未有的挑戰(zhàn)。傳統(tǒng)的存儲系統(tǒng)在處理海量小文件、跨地域數(shù)據(jù)共享、多級文件夾訪問以及并發(fā)性能等方面存在明顯局限性,難以滿足當(dāng)前企業(yè)對數(shù)據(jù)存儲和管理的需求。如何在控制存儲成本的同時保障業(yè)務(wù)高性能,成為企業(yè)亟待破解的核心難題。 面對這一嚴(yán)峻挑戰(zhàn),F(xiàn)OS海量對象存儲如何提供高效、經(jīng)濟(jì)的應(yīng)對之道?其核心功能設(shè)計正是解決這些痛點(diǎn)的關(guān)鍵!
一、產(chǎn)品簡介
FOS 是一款針對海量對象存儲的存儲系統(tǒng),支持萬億級非結(jié)構(gòu)化數(shù)據(jù)存儲,提供 S3 Over RDMA 高性能協(xié)議訪問,支持多中心多活。具備高擴(kuò)展性、靈活性和低成本優(yōu)勢。采用的糾刪碼(EC)技術(shù)在成本控制方面與傳統(tǒng)的副本存儲方案相比具有顯著優(yōu)勢,于傳統(tǒng)的 RAID 配置相比具有更高的靈活性。對象存儲解決方案支持幾乎無限的容量擴(kuò)展,企業(yè)能夠根據(jù)業(yè)務(wù)需求靈活地調(diào)整存儲資源。特別是在公有云環(huán)境中,用戶可以按需使用存儲空間,從而實現(xiàn)資源的最優(yōu)配置和成本效益的最大化。且支持多租戶架構(gòu),允許多個用戶或組織在同一個存儲基礎(chǔ)設(shè)施上獨(dú)立操作,同時保持?jǐn)?shù)據(jù)隔離。通過扁平化結(jié)構(gòu)和跨地域訪問能力,為企業(yè)提供安全、便捷的數(shù)據(jù)存儲與管理服務(wù)。適用于大數(shù)據(jù)分析、視頻/媒體存儲、數(shù)據(jù)備份與檔等業(yè)務(wù)。
二、核心優(yōu)勢
1.對象存儲優(yōu)勢
● 與傳統(tǒng)的三副本存儲方案相比,對象存儲采用的糾刪碼(EC)技術(shù)在成本控制方面具有顯著優(yōu)勢。同時,相較于傳統(tǒng)的 RAID 配置,對象存儲展現(xiàn)出更高的靈活性(RAID 使用異或計算校驗碼,無法支持多位的校驗碼)
● 對象存儲解決方案支持幾乎無限的容量擴(kuò)展,使得,企業(yè)能夠根據(jù)業(yè)務(wù)需求靈活地調(diào)整存儲資源。特別是在公有云環(huán)境中,用戶可以按需使用存儲空間,從而實現(xiàn)資源的最優(yōu)配置和成本效益的最大化
● 支持多租戶架構(gòu),允許多個用戶或組織在同一個存儲基礎(chǔ)設(shè)施上獨(dú)立操作,同時保持?jǐn)?shù)據(jù)隔離
*無中心化架構(gòu)是支持萬億級非結(jié)構(gòu)化數(shù)據(jù)存儲的關(guān)鍵
無單點(diǎn)故障
系統(tǒng)中沒有單點(diǎn)故障,所有節(jié)點(diǎn)都是對等的,共同承擔(dān)存儲和管理任務(wù),顯著提高了系統(tǒng)的可靠性和可用性。
極高的水平擴(kuò)展性
可根據(jù)需求動態(tài)增加存儲容量和性能,而無需停機(jī)或進(jìn)行復(fù)雜的配置更改,支持平滑的在線擴(kuò)展。
數(shù)據(jù)持續(xù)可訪問性
即使部分節(jié)點(diǎn)發(fā)生故障,系統(tǒng)也能繼續(xù)正常運(yùn)行,確保數(shù)據(jù)的持續(xù)可訪問性,提供高可用性存儲服務(wù)。
數(shù)據(jù)分散存儲
將數(shù)據(jù)分散到多個節(jié)點(diǎn),有效避免單點(diǎn)故障風(fēng)險,同時提高數(shù)據(jù)讀寫的并行度和吞吐量。
*國內(nèi)技術(shù)領(lǐng)先者
FOS是國內(nèi)首家提供S3 Over RDMA高性能協(xié)議訪問的對象存儲系統(tǒng),為高性能計算場景提供突破性解決方案。
S3 Over RDMA技術(shù)創(chuàng)新
突破傳統(tǒng)限制: 傳統(tǒng)S3協(xié)議基于TCP/IP,在數(shù)據(jù)傳輸過程中引入延遲和CPU開銷
RDMA直接內(nèi)存訪問: 數(shù)據(jù)直接在存儲設(shè)備和應(yīng)用程序內(nèi)存之間傳輸,繞過CPU和操作系統(tǒng)內(nèi)核
高吞吐量低延遲: 大幅降低數(shù)據(jù)傳輸延遲,提高吞吐量,接近本地存儲性能
無縫集成: 兼容標(biāo)準(zhǔn)S3 API,無需更改現(xiàn)有應(yīng)用程序代碼
性能突破
S3 Over RDMA技術(shù)使FOS在處理大規(guī)模數(shù)據(jù)集時,能夠提供接近本地存儲的性能,對于AI/ML訓(xùn)練、大數(shù)據(jù)分析等對數(shù)據(jù)訪問速度要求極高的場景至關(guān)重要。
多中心多活
FOS支持多中心多活部署,將數(shù)據(jù)實時同步到多個地理位置分散的數(shù)據(jù)中心。
多中心多活部署是提高數(shù)據(jù)可用性和災(zāi)備能力的重要特性
強(qiáng)大的災(zāi)難恢復(fù)能力
即使一個數(shù)據(jù)中心發(fā)生災(zāi)難性故障,其他數(shù)據(jù)中心也能立即接管服務(wù),確保業(yè)務(wù)連續(xù)性。有效應(yīng)對區(qū)域性停電、自然災(zāi)害等不可預(yù)測的事件。
降低訪問延遲
通過將數(shù)據(jù)放置在更接近用戶的位置,顯著降低訪問延遲,提升用戶體驗。特別適用于全球協(xié)作的AI/ML工作負(fù)載。
實時數(shù)據(jù)同步
數(shù)據(jù)在多個數(shù)據(jù)中心之間實時同步和訪問,保證數(shù)據(jù)的一致性和可用性。多個節(jié)點(diǎn)共同承擔(dān)存儲和管理任務(wù),無單點(diǎn)故障。
業(yè)務(wù)連續(xù)性保障
核心業(yè)務(wù)數(shù)據(jù)的安全與穩(wěn)定得到保障,確保在極端情況下的業(yè)務(wù)連續(xù)性。
高速緩存池
通過利用 SSD 構(gòu)建高速緩存池,實現(xiàn)垂直方向的數(shù)據(jù)訪問加速,大幅度提升性能。
混合存儲池
支持混動引擎,允許用戶靈活地標(biāo)記存儲池類型和 IO 分發(fā)規(guī)則(目前支持根據(jù)文件大小分發(fā)到 SSD 或 HDD,具體規(guī)則可以自定義)。這種靈活性使得用戶能夠根據(jù)數(shù)據(jù)特性和業(yè)務(wù)需求,優(yōu)化存儲資源的分配和使用。
根據(jù)數(shù)據(jù)訪問頻率、使用場景和生命周期,將數(shù)據(jù)智能分層存儲于性能、成本和容量各異的存儲介質(zhì)中,充分發(fā)揮本地私有云的高性能和公有云的彈性計費(fèi)優(yōu)勢。
采用 DKES(Distributed Key Encryption Service)技術(shù),實現(xiàn)對每個數(shù)據(jù)對象使用獨(dú)立密鑰的加密,同時保持高性能。這種細(xì)粒度的加密控制為用戶提供了更高級別的數(shù)據(jù)安全保障。
支持 EC、動態(tài) EC、折疊 EC 等高級數(shù)據(jù)保護(hù)技術(shù)。
動態(tài) EC
支持動態(tài)糾刪碼技術(shù),可以根據(jù)數(shù)據(jù)的重要性和訪問頻率動態(tài)調(diào)整 EC 策略,更好地保護(hù)數(shù)據(jù)免受丟失和損壞的風(fēng)險。比如 8+2 的 EC,在有一塊盤故障時,會自動把新寫入對象的 EC 比例提高為 7+3,確保數(shù)據(jù)安全性。此功能可以開啟或關(guān)閉。
折疊 EC
支持折疊糾刪碼技術(shù),例如 4+2:2 部署僅需 3 節(jié)點(diǎn),這種高效的 EC 配置可以在少量節(jié)點(diǎn)中實現(xiàn)大比例的數(shù)據(jù)保護(hù)。例如在深度歸檔功能中能夠在少量節(jié)點(diǎn)上實現(xiàn)高效的數(shù)據(jù)保護(hù)和存儲。
提供多版本控制和 WORM 功能,以及 Bucket 回收站和 Bucket Replication方案,全面保障數(shù)據(jù)安全。
支持靜默錯誤檢查機(jī)制,配合 Bitrot 技術(shù),能夠主動監(jiān)測和修復(fù)數(shù)據(jù)損壞問題,從而提供更高級別的數(shù)據(jù)完整性保護(hù)。
使用與 AWS IAM 兼容的基于策略的訪問控制 (PBAC),對經(jīng)過身份驗證的應(yīng)用程序進(jìn)行精細(xì)的授權(quán)管理,確保只有授權(quán)用戶和應(yīng)用程序才能訪問相應(yīng)的數(shù)據(jù)資源。
助力企業(yè)實現(xiàn)數(shù)據(jù)分析的湖倉一體架構(gòu)革新,支持包括 Iceberg、Hudi 和 Delta Laked 等多種湖倉一體解決方案,以滿足不同業(yè)務(wù)場景下的數(shù)據(jù)存儲和分析需求。
想想 ML 分析需要數(shù)百萬個傳感器日志的情況,或者上傳數(shù)千個小型 Microsoft Excel 或 Word 文檔,如果您單獨(dú)上傳每個文件,則在設(shè)置和關(guān)閉大量連接時,在進(jìn)行數(shù)千個 API PutObject 調(diào)用時,會產(chǎn)生大量的網(wǎng)絡(luò)開銷。
一種常見的解決方案是將所有文件一起壓縮成一個大文件,上傳它,然后在服務(wù)端提取所有文件,即在線解壓縮功能。
S3Zip 功能允許在上傳到 FOS 的 ZIP 文件中檢索單個文件, 使用此功能,可以上傳包含數(shù)千個文件的單個 ZIP 文件。然后,F(xiàn)OS 索引工具確保訪問 ZIP 文件中的文件時,性能與單個對象相同。
Query in Place 功能允許用戶直接對存儲在 S3 中的數(shù)據(jù)進(jìn)行查詢,而無需將數(shù)據(jù)提取到外部計算環(huán)境。
這是一個非常強(qiáng)大的功能,尤其是當(dāng)你處理大規(guī)模數(shù)據(jù)集時,它可以大幅減少數(shù)據(jù)移動、降低延遲和節(jié)省成本。
Select 功能支持檢索以 CSV 和 JSON 格式存儲的對象,也支持檢索通過 GZIP 或 BZIP2 壓縮的對象(僅對于 CSV、JSON 格式的對象)。
除此之外,Select 功能還支持指定結(jié)果的格式為 CSV 或 JSON,并且可以確定結(jié)果中記錄的分隔方式。
Modify in Place 功能允許用戶直接在服務(wù)器端修改對象的某一部分?jǐn)?shù)據(jù),而無需將整個對象下載到本地進(jìn)行修改后再重新上傳。
這種機(jī)制極大地優(yōu)化了對象存儲的讀寫性能,減少數(shù)據(jù)傳輸量,提高操作效率。
對 Bucket 或?qū)ο罂梢源蛏?Tag 來進(jìn)行多維度的標(biāo)識。
這種多維度標(biāo)識在生命周期,桶復(fù)制,策略,Lambda 等功能里生效,幫助你進(jìn)行多維度的篩選操作。
FOS 可以監(jiān)控存儲桶中的文件操作,比如上傳、下載或刪除文件。
當(dāng)這些操作發(fā)生時,F(xiàn)OS 會發(fā)送通知到指定的地方,比如消息隊列、Webhook、數(shù)據(jù)庫等。
這使得下游應(yīng)用程序可以對存儲層中的變化做出實時響應(yīng),是構(gòu)建現(xiàn)代事件驅(qū)動架構(gòu)(EDA)的核心能力。
Lambda 功能讓你可以在 FOS 內(nèi)直接運(yùn)行代碼。
當(dāng)文件操作發(fā)生時(比如上傳一個新文件),F(xiàn)OS 會自動觸發(fā)預(yù)先定義好的程序來執(zhí)行任務(wù)。
這個功能就像“小機(jī)器人”,能夠幫你自動完成比如圖片審查、文件格式轉(zhuǎn)換或分析數(shù)據(jù)等任務(wù)。
三、公司理念
我們力爭為企業(yè)構(gòu)建強(qiáng)有力的專業(yè)存儲平臺和分布式混合基礎(chǔ)設(shè)施,幫助企業(yè)打破數(shù)據(jù)孤島,優(yōu)化存儲成本,并加速數(shù)字化轉(zhuǎn)型。
-END-