桔妹導讀:Presto在滴滴內部發展三年,已經成為滴滴內部Ad-Hoc和Hive SQL加速的首選引擎。目前服務6K+用戶,每天讀取2PB ~ 3PB HDFS數據,處理30萬億~35萬億條記錄,為了承接業務及豐富使用場景,滴滴Presto需要解決穩定性、易用性、性能、成本等諸多 ...
桔妹導讀:定位是所有LBS服務的基礎服務。在滴滴的業務場景下,定位主要是指各類終端設備的位置,包括手機 單車 行車記錄儀 車機端等。作為底層服務,在滴滴日均提供 億次定位服務,支撐着平台的各類業務。 今天給大家分享的是機器學習在滴滴網絡定位中的實踐工作,會重點介紹三階段的演進:無監督模型 有監督回歸模型 端到端CNN模型。 .什么是網絡定位 目前定位技術主要包括GPS 網絡定位 慣性航位推算 M ...
2020-09-18 17:40 0 797 推薦指數:
桔妹導讀:Presto在滴滴內部發展三年,已經成為滴滴內部Ad-Hoc和Hive SQL加速的首選引擎。目前服務6K+用戶,每天讀取2PB ~ 3PB HDFS數據,處理30萬億~35萬億條記錄,為了承接業務及豐富使用場景,滴滴Presto需要解決穩定性、易用性、性能、成本等諸多 ...
數據集背景介紹 2009年的《紐約市基准法律》要求對建築的能源和水的使用信息進行說明和評分。 涵蓋的建築包括具有單個建築物的總建築面積超過50,000平方英 ...
機器學習的一般步驟 1.確定特征(1)數據探索(2)數據預處理2.確定模型(1)確定目標函數3.模型訓練(1)確定優化算法,估計模型參數4.模型選擇選擇不同參數下的模型。5.模型評估對所選擇的模型進行評估:估計模型在未知數據上的性能(泛化能力). 以上 ...
,機器學習的文章,多半一定要說到 熵 這個概念的。什么是熵? 百度一下: 熵(entropy) ...
關於人肉工程,包括業務知識、領域知識,經驗等,在實際的機器學習問題中的應用,是一個屢見不鮮的話題,典型的有苦逼的數據清洗、人肉特征工程等。大家都想把盡可能多的過程由機器自動完成,但是目前的狀態是,大部分機器學習問題中,最困難也最重要的部分,還是依靠人的經驗來生成特征。那么人的經驗為什么重要,能否 ...
知道某個算法,和運用一個算法是兩碼事兒。 當你訓練出數據后,發覺模型有太大誤差,怎么辦? 1)獲取更多的數據。也許有用吧。 2)減少特征維度。你可以自己手動選擇,也可以利用諸如PCA等數學 ...
網絡安全中機器學習大合集 from:https://github.com/jivoi/awesome-ml-for-cybersecurity/blob/master/README_ch.md#-datasets 歷年來那些與網絡安全中機器學習相關最好的工具與資源 目錄 數據集 ...
教學機器是一個實驗,讓所有人都非常方便的探索機器學習,在瀏覽器中實時瀏覽,不需要編程。學習更多實驗,然后親自嘗試它 訪問:https://teachablemachine.withgoogle.com/ Teachable Machine About Teachable Machine ...