8個值得關注的SQL-on-Hadoop框架(轉)
數據的操作語言是SQL,因此很多工具的開發目標自然就是能夠在Hadoop上使用SQL。這些工具有些只是在MapReduce之上做了簡單的包裝,有些則是在HDFS之上實現了完整的數據倉庫,而有些則介于這兩者之間。這樣的工具有很多,來自于Shoutlet的軟件開發工程師Matthew Rathbone最近發表了一篇文章,他列舉了一些常用的工具并對各個工具的應用場景和未來進行了分析。Apache Hiv…
數據的操作語言是SQL,因此很多工具的開發目標自然就是能夠在Hadoop上使用SQL。這些工具有些只是在MapReduce之上做了簡單的包裝,有些則是在HDFS之上實現了完整的數據倉庫,而有些則介于這兩者之間。這樣的工具有很多,來自于Shoutlet的軟件開發工程師Matthew Rathbone最近發表了一篇文章,他列舉了一些常用的工具并對各個工具的應用場景和未來進行了分析。Apache Hiv…
原文作者:曹格 ??http://blog.sina.com.cn/caojiangppt 在傳遞信息時,有數據比沒數據更有說服力,而一旦有了數據,那就牽涉到如何呈現。PowerPoint為我們提供了諸多圖表,它們在一定程度上已經可以滿足我們平時需求。當然,若能夠有更加簡潔清晰的選擇(并且又不會增加太多的負擔),我們又何樂而不為。 (一)單一數據的表示 有些時候(演講類居多),我們只用提供一個最重…
2014年,我們會聽到關于可視化數據、云計算和移動應用的更高呼聲,人們對這些技術的熱情會超過2013年。而大數據領域,還將獲得持續關注,但用戶考慮更多的是切合業務需求的落地方法。簡言之,云計算和移動技術將引起2014年的BI二次革命。 可視化數據和自助式BI 2013年,可視化數據已進入了探索征程,專業供應商在畫面場景、QlikView、TIBCO Spotfire平臺分析等方面的應用開始增多。諸…
準備環境 192.168.80.10 Master Master.Hadoop192.168.80.11 Slave1 Slave1.Hadoop192.168.80.12 Slave2 Slave2.Hadoop三臺機器均為Centos_x64_6.5 Master主節點配置4G內存 另兩臺Slave配置為2G內存由于通過在線安裝的方式未能安裝成功,轉換思路將在本地建yum源的方式來安裝,個人覺…
1. 概述 ODI11G默認提供了WebService的調用接口,供其他各種應用程序通過接口控制、訪問ODI自身的同步任務。 ODI11G在安裝完成,啟動代理后,會自動啟動webservice的服務端口,對外提供WSDL文件服務,外部應用可以通過WSDL文件利用各種技術反向生成自身應用程序所需要的調用代碼,本文將以Axis作為WebService容器來介紹,如何生成代碼并調用ODI接口。 2.??…
集成策略 ? ? ? ? 數據集成是指將來源于不同系統的數據組合在一起,供業務用戶研究不同的行業行為及客戶行為的數據處理方式。在數據集成應用早期,數據僅限于交易系統及其應用。業務決策的制定以決策平臺為指導,而有限的數據集提供了創建決策平臺的基礎。 數據容量與數據類型在過去三十年里大幅增長,數據倉庫技術從無到有,基礎架構和技術的發展滿足了分析和數據存儲需求。這一切徹底改變了數據集成的前景。 傳統數據…
對數據可視化的需求正急劇增長。一部分原因是更多的公司正在尋求通過對大數據分析來獲得可視化的業務洞察力。 ? ? ? ? 大數據的可視化個人認為還是以儀表盤為展現的最終載體,當然儀表盤會包含移動端、云端和企業端。那么,儀表盤中的內容應該包含哪些? ? ? ? ? 1、單純的數字展示 ? ? ? ? 大數據的最終分析結果,其中有一種是對關鍵指標的計算結果,如:市場模糊占有率,總體情感指數,用戶粘度系數…