微軟Azure已開始支持hadoop,對於有需要彈性大數據運算的公司可能是個好消息。據悉,近期微軟已提供一個預覽版的Azure HDInsight(Hadoop on Azure)服務,運行在Linux操作系統上。與對應的Windows一樣,Azure HDInsight on Linux服務也是構建在Hortonworks Data Platform(HDP)之上。HDInsight與Apache Hadoop全面兼容,同時集成了微軟自己的商業智能工具,例如Excel、SQL Server和PowerBI。正如對Windows版本所做的,微軟計划將針對Linux HDInsight版本開發的后端代碼貢獻給Apache社區,微軟方面這樣表示。
微軟向Linux用戶提供Hadoop on Azure服務
目前HDInsight支持的唯一Linux版本是Ubuntu(在虛擬機中),是由Canonical提供支持的。微軟現在已經開始提供Storm for Azure HDInsight。Storm是一種開源的流分析平台,已經從2014年10月開始針對Azure HDInsight進行預覽。
微軟的Azure機器學習服務現在已經全面提供。微軟在2014年6月預覽了Azure ML,允許開發者和數據科學家更快速地構建和部署應用,並且能夠訪問應用編程接口和服務,例如推薦、異常檢測以及預測,通過Machine Learning Marketplace。
微軟將使用Hadoop連接器把自己的NoSQL Azure服務、DocumentDB與HDInsight進行集成。這使得DocumentDB要么是運行Hadoop查詢的一個輸入源,要么是輸出Hive、Pig和MapReduce工作可以發送到的地方。
數據集成提供商Informatica已經支持在Azure上的Linux和Windows Server虛擬機中提供自己的Informatica Cloud Agent技術。Informatica通過Azure Marketplace提供Cloud Agent,實現Informatica技術和各種Azure數據服務之間的連接。
目前Azure機器學習預覽定價將從2015年3月31日開始生效。從2015年4月1日開始,所有新的和現有的Azure機器學習訂購用戶都將自動轉換到標准版本,相應計費,不需要用戶干預。那些不希望遷移的現有用戶可以在2015年4月1日開始刪除他們的工作區。
微軟表示,從Azure網站提供的免費版Auzre機器學習沒有變化也不收費。
雖然已經支持hadoop,但對於任何商用環境,還是需要多一份謹慎。