標簽:
隨著“云物移大智”(指云計算、物聯網、移動互聯網、大數據、智慧城市)的發展,今天企業的數據中心正變得越來越復雜,一方面是各種應用層出不窮,這些應用對后端的計算、存儲、網絡提出了不同的要求,有些是計算密集型,有些是數據密集型,有些是IO密集型等等,另一方面則是IT硬件技術也出現了多樣化發展,如CPU核數越來越多,虛擬機和云計算使用越來越普及,萬兆以太網和Infiniband各有千秋,機械硬盤和固態磁盤各有優勢……這些對用戶的異構資源管理、IT應用資源匹配都提出了新的挑戰,需要通過管理軟件來解決,“軟件定義”也因此受到了大家的廣泛關注。
近日,在位于北京上地的IBM中國區開發中心,IT168記者就”軟件定義基礎架構“這一話題,采訪到了IBM系統部軟件定義基礎架構大中華區業務經理周立旸和IBM系統部軟件研發實驗室軟件開發總監謝東博士。
何謂”軟件定義基礎架構“?
首先,我們來了解一下什么是”軟件定義基礎架構“。
據介紹,IBM所謂的軟件定義基礎架構主要涉及三個層面,分別是軟件定義計算、軟件定義存儲和基礎架構管理。具體來說,就是通過Platform Computing、Spectrum Scale、Cluster Manager、Cloud Manager、SoftLayer等一系列軟件,來幫助用戶實現分布式計算環境的整合,從而為不同類型水平擴展的應用提供彈性的共享資源池,實現IT應用的靈活性和資源調度管理的智能化。
其一,在軟件定義計算層面,近年來,不同類型的分布式架構應用越來越多,從最早的高性能計算集群,到Hadoop大數據集群,再到內存計算、流計算、Spark、MongoDB等一些新型應用,由于采用不同的軟件堆棧,需要不同的底層基礎設施,進而造成集群蔓延、成本增加的現象。
IBM提出的一個可行辦法是通過資源管理和應用管理軟件,來在一套彈性的資源池上整合不同的應用負載。這套軟件就是IBM Platform Computing系列家族產品,包括Symphony、LSF、Application Service Controller(ASC)等。其中LSF主要是針對高性能計算應用的資源調度,Symphony則主要面向高性能分析和Hadoop大數據應用,ASC針對Spark 和MongoDB等新型云應用,并通過容器的技術來保障應用的業務連續性。
其二,在軟件定義存儲層面,隨著數據類型越來越多,冷熱度不均的數據也需要存儲在不同的介質上,對存儲架構、存儲技術、IO帶寬都有各自的需求,因而也需要有智能的流程來管理存儲資源和數據。
對此,IBM近期已經推出了全新的存儲軟件產品系列IBM Spectrum Storage(光譜存儲),將之前分散的存儲管理軟件重新整合,涉及“監控、保護、虛擬化、加速、備份、擴展”等6大類功能。IBM承諾未來5年將投入超過10億美元開發下一代技術,以強化其在軟件定義存儲領域的領導地位,這些投資將主要用于新的云存儲軟件、對象存儲與包括OpenStack在內的開放標準技術的研發。據了解,IBM光譜存儲管理軟件通過存儲虛擬化、GPFS、XIV等技術,能夠集中管理超過300種不同存儲設備,以及高達YB級別的數據規模,幫助用戶以自動化方式選擇合適的、更經濟的存儲設備。
其三,在基礎架構管理層面,對用戶而言,數據中心的異構化也日益突出,傳統集群、私有云、公有云都可能涉及,從而形成一種混合云的IT環境。對此,IBM也推出了不同的方案來應對這些基礎設施的管理,比如Cluster Manager可以實現多個物理機的管理和部署,基于OpenStack的Cloud Manager可以實現多個虛擬機的部署,同時這些技術也在IBM的云數據中心SoftLayer上面應用,提供平臺即服務的軟件。通過這一系列技術,IBM得以幫助用戶實現異構基礎架構的管理。
周立旸談到,IBM所謂的軟件定義基礎架構中的”軟件“一詞有雙重含義,其一是指IBM的全系列產品本身就是軟件,二是指客戶的應用軟件。對用戶來說,IBM的軟件可以針對應用特點來實現底層基礎設施的優化、自動化等功能,賦予IT基礎設施自動感知和適應上層應用負載的能力。
Platform:隨分布式架構起舞
早在2011年,IBM收購了Platform Computing,這家企業在當時就已經是為分布式計算環境提供集群和網格管理軟件的全球領導者,尤其是在高性能計算領域有著重要的影響力。四年后,Platform Computing變身為IBM軟件定義基礎架構戰略中的重要一環。這當中發生了哪些變化?
周立旸告訴記者,Platform最大的專長在于”工作負載感知“,在加入IBM大家庭之后,以一種中間件的形式,構成了IBM系列通用產品如服務器、存儲、GPFS與各種不同應用負載之間的接口,從而可以通過資源管理、作業調度等方式來實現工作負載的優化。而這正是Platform系列產品對于IBM和用戶的價值所在。
謝東也談到,Platform在被IBM收購之后,產品定位并沒有大的改變,但側重點有一些不同,主要是與IBM原有產品結合更加緊密,比如針對GPFS文件系統、POWER平臺、大數據分析軟件進行了深度優化。
另外一個較大變化是Platform Computing的適用面在擴寬。周立旸告訴記者,誕生于1994年的Platform實際上已經有20多年歷史。但早在2000年,Platform在國外的一大部分收入就已經不是純高性能計算類業務,而是幫助很多金融機構、投行做高性能分析應用。相比之下,國內高性能分析運算要晚于國外,但這幾年隨著大數據的產生,需要復雜的、分布式架構來實現,因此國內也看到越來越多的市場機會。對Platform而言,無論是高性能計算,還是大數據或云計算應用,其本質都是分布式計算,因此,隨著應用的擴展,Platform的適用范圍也正變得更加寬廣。
謝東補充道,在研發思路上,IBM不只是關注Platform產品本身,而是會更多關注行業應用,針對不同行業、不同用戶的需求來定制方案。據他介紹,IBM在收購Platform之后,將其全球主要研發力量都集中在中國,經過幾年發展,團隊規模已經達到近400人,不僅有開發、測試還有售后技術支持,主要分布在北京、西安、上海。。
案例知多少
從具體實際案例,周立旸介紹了包括花旗銀行、USAA保險公司、大港油田在內的多個客戶案例,有的是數據密集型應用,有的是計算密集型應用。
比如,花旗銀行采用了軟件定義基礎架構的解決方案,通過使用Symphony、GPFS、Spectrum Scale等,實現了百倍的應用性能提升,涉及全球4個數據中心、超過300個應用。
美國USAA保險公司由于業務快速發展導致基礎架構成本急速增加。IBM通過使用BigInsights高級分析工具、Platform Symphony、Spectrum Scale等軟件解決方案,最終將其5個業務部門30多個組的大數據和分析應用,包括CRM、欺詐檢測、網頁點擊流分析等,整合在一個平臺上,實現了多租戶共享服務,即在一套集群上可以同時運行多種不同的大數據和分析應用,大幅度減少硬件投入及管理成本。
又如,紅牛賽車通過Platform實現高性能計算調度、軟件許可調度和流程調度等功能,以提升硬件使用率和設計流程效率。
這里值得一提的是高性能計算云的應用。過去業界有說法認為高性能計算和云計算兩者之間是不可調和的,因為虛擬化環境不太適用于HPC這類應用。但實際上,云計算的構建并不一定要依賴于虛擬化來實現。周立旸告訴記者,通過Platform、SoftLayer和其他軟件,也可以實現基于物理機集群環境的彈性資源池,可以動態實現軟硬件部署,或者讓應用在不同集群之間切換等,使得用戶可以通過私有云或公有云的方式來實現高性能計算。
如中石油大港油田通過Platform Computing實現高性能計算云,在一套云環境中運行十幾個不同的HPC應用,而無需構建多套集群。
又如,Transvalor和MINES ParisTech等公司面臨的挑戰是其數字風洞實驗需要先進的HPC解決方案,而其研究人員又沒有能力搭建自己的HPC環境。對此,這兩家公司聯合多個商家嘗試建造HPC云服務,匯集先進的流體模擬軟件,IBM為其提供了基于Platform Computing和SoftLayer的HPC云服務,讓用戶可以通過即用即付費的模式來獲得低成本、高質量的HPC能力,大大降低了中小企業和大學研究人員進行HPC研究實驗的門檻。
|