標簽:
云對每個人來說都是又大、又白、又輕柔的夢境。當有人說他們的大數(shù)據(jù)戰(zhàn)略是“把悉數(shù)投入云端”時,你無法斷定他們能否是一個有遠見的人,或僅僅是重復(fù)一個教授在一次職業(yè)會議上通知他們的事。
大數(shù)據(jù)和云典范之間實踐的重復(fù)十分廣泛,你能夠聲稱你正在一個內(nèi)部布置的Hadoop、NoSQL、或公司數(shù)據(jù)倉庫環(huán)境下處置根據(jù)云的大數(shù)據(jù)。請記住云被廣泛理解為包含“私有”布置以彌補或替代公共云、SaaS、和多租戶保管環(huán)境。
可是若是你把云的實踐界說約束于公共訂貨效勞內(nèi),你就能找到疑問的中心:辨認哪些大數(shù)據(jù)運用相對于內(nèi)部布置更適合公共云/SaaS 布置(比方那些觸及提早優(yōu)化的硬件設(shè)備或虛擬效勞器集群的運用)。
換句話說:你什么時候能夠經(jīng)過引入一個外部效勞供貨商為你辦理它們,然后進步大數(shù)據(jù)的可擴展性、靈活性、功能、本錢效益、可靠性、以及可辦理性?以下是一些清晰的大數(shù)據(jù)在公共云中的運用實例。
現(xiàn)已在云中保管的公司運用程序:若是和許多公司相同——尤其是中小型公司——你運用了一個外部效勞供貨商供給的根據(jù)云的運用程序,許多你的源買賣數(shù)據(jù)現(xiàn)已被置于公共云之上。若是你在這個云渠道上有更深化的歷史數(shù)據(jù),那么它能夠現(xiàn)已堆集至大數(shù)據(jù)級。若是外部效勞供貨商或它的合作伙伴之一供給了一個增值的剖析效勞——如客戶丟失剖析、推廣優(yōu)化、或客戶數(shù)據(jù)的異地備份和歸檔——那么運用這些效勞會比將這些數(shù)據(jù)置于內(nèi)部來得有意義。
需求相當大的預(yù)處置才能的大容量外部數(shù)據(jù)源:例如,若是你計劃經(jīng)過監(jiān)測交際媒體數(shù)據(jù)的聚合輸入來剖析客戶的情感,內(nèi)部的效勞器、存儲、或帶寬容量能夠無法極好地為你完結(jié)這項使命。這是一個顯著的關(guān)于運用程序的比方,在這里你會期望運用一個根據(jù)公共云的、大數(shù)據(jù)驅(qū)動的效勞所供給的交際媒體過濾效勞解決疑問。
超越你內(nèi)部布置的大數(shù)據(jù)處置才能的戰(zhàn)略型運用程序:若是你現(xiàn)已有一個專門為某個運用程序內(nèi)部布置的大數(shù)據(jù)渠道(比方高容量非布局化數(shù)據(jù)源ETL專用的Hadoop集群),那么運用一個公共云來處置當時渠道所不適用的、或是按需效勞會更強健或合算的新的運用程序(例如多渠道推廣、交際媒體剖析、地輿空間剖析、可查詢歸檔、彈性數(shù)據(jù)沙盒技能)能夠會更行得通。事實上,若是你需求趕快取得PB級規(guī)劃的、流媒體的、多布局的大數(shù)據(jù)處置才能,那么一個公共云商品能夠是僅有可行的挑選。
十分大但僅僅時間短存在的沙盒的彈性供給:若是你有一個短期周轉(zhuǎn)的短期數(shù)據(jù)科學項目,而這個項目需求比慣常大一個數(shù)量級的探究型數(shù)據(jù)集市(又叫沙盒),那么云能夠是你僅有可行或能夠付出的挑選。你能夠很快在項目時間運作根據(jù)云的存儲和處置才能,然后當項目完畢時又能夠很快的撤銷之前裝備的全部。我稱之為“泡沫集市”布置模型,它是為云量身定制的。
若是你現(xiàn)已有過這其間任一的閱歷,那么根據(jù)云的大數(shù)據(jù)的戰(zhàn)略疑問就不是你該從何開端。跟著根據(jù)云的大數(shù)據(jù)效勞逐步老練以及性價比(包含功能、可擴展性、靈活性和可辦理性)不斷進步,這個疑問將會是你該在哪完畢。到本個十年的晚期,跟著越來越多的運用程序和數(shù)據(jù)遷移到公共云上,樹立和運作你個人的大數(shù)據(jù)布置的主意好像好像如今你想描繪個人的效勞器通常不切實踐。
|