誰在用Hadoop?這是個問題。在大數(shù)據(jù)背景下,Apache Hadoop已經(jīng)逐漸成為一種標(biāo)簽性,業(yè)界對于這一開源分布式技術(shù)的了解也在不斷加深。但誰才是Hadoop的最大用戶呢?首先想到的當(dāng)然是它的“發(fā)源地”,像Google這樣的大型互聯(lián)網(wǎng)搜索引擎,以及Yahoo專門的廣告分析系統(tǒng)。也許你會認(rèn)為,Hadoop平臺發(fā)揮作用的領(lǐng)域是互聯(lián)網(wǎng)行業(yè),用來改善分析性能并提高擴(kuò)展性。其實(shí)Hadoop的應(yīng)用場景遠(yuǎn)不止這一點(diǎn),深入挖掘的話你會發(fā)現(xiàn)Hadoop能夠在許多地方發(fā)揮巨大的作用。
美國著名科技博客GigaOM的專欄作家Derrick Harris跟蹤云計算和Hadoop技術(shù)已有多年時間,他也在最近的一篇文章中總結(jié)了10個Hadoop的應(yīng)用場景,下面分享給大家:
在線旅游:你知道嗎,目前全球范圍內(nèi)80%的在線旅游網(wǎng)站都是在使用Cloudera公司提供的Hadoop發(fā)行版,其中SearchBI網(wǎng)站曾經(jīng)報道過的Expedia也在其中。
移動數(shù)據(jù):Cloudera運(yùn)營總監(jiān)稱,美國有70%的智能手機(jī)數(shù)據(jù)服務(wù)背后都是由Hadoop來支撐的,也就是說,包括數(shù)據(jù)的存儲以及無線運(yùn)營商的數(shù)據(jù)處理等,都是在利用Hadoop技術(shù)。
電子商務(wù):這一場景應(yīng)該是非常確定的,eBay就是最大的實(shí)踐者之一。國內(nèi)的電商在Hadoop技術(shù)上也是儲備頗為雄厚的。
能源開采:美國Chevron公司是全美第二大石油公司,他們的IT部門主管介紹了Chevron使用Hadoop的經(jīng)驗(yàn),他們利用Hadoop進(jìn)行數(shù)據(jù)的收集和處理,其中這些數(shù)據(jù)是海洋的地震數(shù)據(jù),以便于他們找到油礦的位置。
節(jié)能:另外一家能源服務(wù)商Opower也在使用Hadoop,為消費(fèi)者提供節(jié)約電費(fèi)的服務(wù),其中對用戶電費(fèi)單進(jìn)行了預(yù)測分析。
基礎(chǔ)架構(gòu)管理:這是一個非常基礎(chǔ)的應(yīng)用場景,用戶可以用Hadoop從服務(wù)器、交換機(jī)以及其他的設(shè)備中收集并分析數(shù)據(jù)。
圖像處理:創(chuàng)業(yè)公司Skybox Imaging 使用Hadoop來存儲并處理圖片數(shù)據(jù),從衛(wèi)星中拍攝的高清圖像中探測地理變化。
詐騙檢測:這個場景用戶接觸的比較少,一般金融服務(wù)或者政府機(jī)構(gòu)會用到。利用Hadoop來存儲所有的客戶交易數(shù)據(jù),包括一些非結(jié)構(gòu)化的數(shù)據(jù),能夠幫助機(jī)構(gòu)發(fā)現(xiàn)客戶的異常活動,預(yù)防欺詐行為。
IT安全:除企業(yè)IT基礎(chǔ)機(jī)構(gòu)的管理之外,Hadoop還可以用來處理機(jī)器生成數(shù)據(jù)以便甄別來自惡意軟件或者網(wǎng)絡(luò)中的攻擊。
醫(yī)療保健:醫(yī)療行業(yè)也會用到Hadoop,像IBM的Watson就會使用Hadoop集群作為其服務(wù)的基礎(chǔ),包括語義分析等高級分析技術(shù)等。醫(yī)療機(jī)構(gòu)可以利用語義分析為患者提供醫(yī)護(hù)人員,并協(xié)助醫(yī)生更好地為患者進(jìn)行診斷。