桔妹导读:Presto在滴滴内部发展三年,已经成为滴滴内部Ad-Hoc和Hive SQL加速的首选引擎。目前服务6K+用户,每天读取2PB ~ 3PB HDFS数据,处理30万亿~35万亿条记录,为了承接业务及丰富使用场景,滴滴Presto需要解决稳定性、易用性、性能、成本等诸多 ...
桔妹导读:定位是所有LBS服务的基础服务。在滴滴的业务场景下,定位主要是指各类终端设备的位置,包括手机 单车 行车记录仪 车机端等。作为底层服务,在滴滴日均提供 亿次定位服务,支撑着平台的各类业务。 今天给大家分享的是机器学习在滴滴网络定位中的实践工作,会重点介绍三阶段的演进:无监督模型 有监督回归模型 端到端CNN模型。 .什么是网络定位 目前定位技术主要包括GPS 网络定位 惯性航位推算 M ...
2020-09-18 17:40 0 797 推荐指数:
桔妹导读:Presto在滴滴内部发展三年,已经成为滴滴内部Ad-Hoc和Hive SQL加速的首选引擎。目前服务6K+用户,每天读取2PB ~ 3PB HDFS数据,处理30万亿~35万亿条记录,为了承接业务及丰富使用场景,滴滴Presto需要解决稳定性、易用性、性能、成本等诸多 ...
数据集背景介绍 2009年的《纽约市基准法律》要求对建筑的能源和水的使用信息进行说明和评分。 涵盖的建筑包括具有单个建筑物的总建筑面积超过50,000平方英 ...
机器学习的一般步骤 1.确定特征(1)数据探索(2)数据预处理2.确定模型(1)确定目标函数3.模型训练(1)确定优化算法,估计模型参数4.模型选择选择不同参数下的模型。5.模型评估对所选择的模型进行评估:估计模型在未知数据上的性能(泛化能力). 以上 ...
,机器学习的文章,多半一定要说到 熵 这个概念的。什么是熵? 百度一下: 熵(entropy) ...
关于人肉工程,包括业务知识、领域知识,经验等,在实际的机器学习问题中的应用,是一个屡见不鲜的话题,典型的有苦逼的数据清洗、人肉特征工程等。大家都想把尽可能多的过程由机器自动完成,但是目前的状态是,大部分机器学习问题中,最困难也最重要的部分,还是依靠人的经验来生成特征。那么人的经验为什么重要,能否 ...
知道某个算法,和运用一个算法是两码事儿。 当你训练出数据后,发觉模型有太大误差,怎么办? 1)获取更多的数据。也许有用吧。 2)减少特征维度。你可以自己手动选择,也可以利用诸如PCA等数学 ...
网络安全中机器学习大合集 from:https://github.com/jivoi/awesome-ml-for-cybersecurity/blob/master/README_ch.md#-datasets 历年来那些与网络安全中机器学习相关最好的工具与资源 目录 数据集 ...
教学机器是一个实验,让所有人都非常方便的探索机器学习,在浏览器中实时浏览,不需要编程。学习更多实验,然后亲自尝试它 访问:https://teachablemachine.withgoogle.com/ Teachable Machine About Teachable Machine ...