在大數據時代,海量數據不斷產生。企業數據量預計每 18 到 24 個月就會翻一番,且增速未見放緩。同時,企業數據的范圍越來越廣,從客戶信息、財務交易、邊緣計算到 IT 運營服務日志,各路數據匯聚成了“數據海洋”。
云計算架構的快速發展帶來了更多數據處理方案。邊緣、內部部署、公有云和私有云產品層出不窮,按需隨選和一切即服務(as a service)解決方案也在迅速擴張。毋庸置疑,我們處在一個多云世界,數據幾乎可以被存儲在任何地方。從中挖掘數據價值對于企業至關重要,卻也絕非易事。
在琳瑯滿目的云解決方案中,Cloudera 的與眾不同之處就在于幫助企業有效處理和管理存儲在任何地方的任何數據。Cloudera 所提出的企業數據云理念正是這個全面云化時代中的滄海明珠。
企業數據云 - 聚焦多云及混合云
在云計算發展早期,公有云似乎可以滿足 IT 部門的所有需求。公有云所提供的簡單模型,能夠節省企業數據中心擴張帶來的成本。然而其弊端也很快暴露出來,數據可能會被供應商鎖定,導致企業無法隨需應用,但轉移出來成本又很高。面對這些問題,IT 部門從實際經驗中總結了一條真理——更多選擇,絕不設限。數據和工作負載應該被放在最便于應用且能夠創造價值的地方。企業的多樣化部署,造就了今天的混合和多云世界,也帶來了管理多個環境中數據的諸多挑戰。
Cloudera 的愿景是建立現代數據架構,幫助企業從數據中快速獲得價值。數據管理應該從邊緣處的數據創建開始,直至最終的數據處理,無論是在公有云、私有云,還是本地數據中心。這種貫穿數據整個生命周期的管理方式,支持 Cloudera 平臺能夠打通企業內部的數據孤島,讓相關業務部門能夠獲得其所需數據。畢竟,數據只有在對整個企業都實時可見、且被應用時,才真正能夠釋放價值。
業界普遍認為,非結構化數據是企業數據的主要組成部分。在下一個十年里,非結構化數據在所有數據中的占比預計將達到 80%。為了管理這些數據,首先需要了解它們。企業需要對元數據進行規范化和分類,并且從經濟和運營角度考慮,將數據存放在最能產生價值的地方。任務雖然艱巨,但 Cloudera 在這一領域獨具優勢。Cloudera 的產品在全球范圍內管理著超過 40 萬臺服務器,從 5EB 數據中為企業不斷挖掘有價值的數據洞察。
企業數據云的落地 – Cloudera Data Platform (CDP)
Cloudera 在借助 AI 和機器學習管理數據領域已經深耕多年。Cloudera 認為,任何企業的數據戰略都必須跨越邊緣到云,數據管理必須自始至終。2019 年 1 月 Cloudera 宣布與 Hortonworks 合并。這兩家企業的強強聯手,使 Cloudera 一躍成為全球數據管理市場的佼佼者。Cloudera 的傳統 AI 驅動數據管理與 Hortonworks 端到端數據管理方式相結合,創建了全球領先的下一代數據平臺 Cloudera Data Platform。Cloudera 希望為企業提供一個本身即是多云且多功能的平臺,用于管理企業數據云。通過統一的平臺界面,對數據進行整個生命周期管理,并提供一致的安全和治理服務。
兩家企業的合并十分順利,短短 9 個月,Cloudera 就推出了公有云版本的 Cloudera Data Platform,其中包括 Cloudera Data Warehouse 和 Cloudera Machine Learning 服務,目前已在 AWS 和 Microsoft Azure 上商用。除了將邊緣和云中數據管理整合在現有解決方案中,Cloudera 目前的重點在于為 CDP 提供私有云功能。上述功能的測試版將于今年夏天正式推出。
Cloudera 面對的是一個 260 億美元的巨大市場。未來三年內,市場規模預計將會翻倍至 520 億美元,這無疑是一個巨大的發展機遇。盡管市面上有很多企業數據管理產品,但是能夠縱觀全局、提供從邊緣到云的一致性體驗和全套功能的產品卻很少。Cloudera 將借此機會定義未來 15 至 20 年后的數據管理方式,并對新一代 IT 技術產生深遠影響。