作為大數據+混合云業務戰略的一部分,Red Hat沒有選擇推出自己的hadoop商業版本或者收購一家Hadoop發行廠商,而是推出了首個Hadoop HDFS文件存儲系統的開源替代產品。
Red Hat本周三宣布開源其Red Hat Storage Hadoop插件,作為HDFS的替代產品。RedHat Storage hadoop插件基于Gluster文件系統——Red Hat于2011年以1.36億美元收購了Gluster,目前已經將Gluster的技術整合到了Red hat的存儲服務器產品(RHSS)中。Red hat計劃在今年某個時候將該插件發布到Apache軟件基金會。
Red Hat在新聞發布會上表示:
“Red Hat存儲產品將企業級功能帶到了大數據環境,例如異地備份、高可用性、POSIX合規、災備和管理等,而這些不以犧牲API兼容性和數據歸屬為代價。客戶目前有了一個統一的可擴展存儲軟件平臺來管理部署在不同物理、虛擬、公共或者混合云資源中的文件和對象。”
由于實現了完全的分布式,Red Hat的文件系統能夠取代Hadoop集群中負責數據追蹤的NameNode,從而消除其性能瓶頸和單點失敗問題。(不過Hadoop社區已經通過Apache hadoop 2.0已經改善了NameNode,而Facebook的工程師則開發出了替代技術AvatarNode)Red Hat還將其存儲和虛擬化技術進行組合,同時使用這兩者的用戶將擁有一個存儲的虛擬池,而計算資源能駐留在相同的物理基礎架構上。
大數據的重點不是基礎設施而是應用
除了Red hat,如今很多公司都試圖解決HDFS存在的問題,提高其在大型企業或者互聯網公司中的可用性。EMC、NetApp等公司都提出了自己的替代方案。Quantcast甚至開發并開源了自己的HDFS版本——Quantcast File System。Hadoop的未來取決于能否成功開拓大型企業市場,而HDFS的替代技術目前是企業應用的首選,除非Apache hadoop能夠快速跟上。
對于Red Hat來說,開源Hadoop存儲系統只是混合云戰略的一部分,Red Hat表示希望在Hadoop上的努力能夠推動其更宏大的云計算戰略——讓客戶能夠在混合云計算的大數據環境中運行應用,橫跨包括OpenStack和亞馬遜AWS這樣的私有云或公用云環境。