前言部分
大家可以關注我的公眾號,公眾號里的排版更好,閱讀更舒適。
正文部分
此處聲明一點,很多亂七八糟的網站或者人轉載文章的時候不注明出處,也不通知本人。該當何罪。
我們都知道SAP HANA的費用很高,原因就是內存數據庫,內存計算,大部分要歸功於硬件的支撐
而SAP還有個產品也是處理大數據的,就是BW,現在BW4也推出了
但是在這個互聯網發達的時代里,數據增長想當迅速,因此問題出現了
SAP提供了將熱量數據存儲在由HANA直接管理的基於磁盤的商店(動態分層)中的選項
這比HANA在內存中便宜得多,從而提高了解決方案的價格到內存比例
隨着客戶對存儲和處理數據需求的增長,SAP必須提供一種利用Big Data / Hadoop作為冷庫的方法
個普遍的策略是使用SDA通過Hive或Spark訪問Hadoop
大多數人不知道的是,這不是利用Hadoop的好方法(此處應有得意表情,O(∩_∩)O哈哈~)
通過簡單地將查詢發送到Hadoop,數據將返回給HANA進行處理
HANA是發送數據的,所以SDA不是大數據的正確方法
HANA需要能夠將其查詢注入Hadoop節點並利用Hadoop的處理能力
例如,要對非常大的數據集進行轉換,無法將其加載到HANA內存中
所以,重要嘉賓出場了,就是主咖出場了,我們的SAP Vora來了
SAP Vora是位於Hadoop中Spark的頂層的層。
SAP Vora的作用只是讓HANA利用Hadoop來處理密集的工作。
當然還有其他作用,例如支持符合HANA的層次結構和貨幣。
Vora的缺點在於其對Hadoop集群的規模要求是三倍,並增加了SAP許可成本。
這可能會暫時損害SAP的大數據。
但是,Vora仍然是新的,隨着時間的流逝,我們將看到更多的改進,也許是SAP更可行的許可策略。