---恢复内容开始--- 我们参加的大数据竞赛初赛已经结束,经过这些天的努力,我们也成功进入复赛。我们在初赛的最高成绩的准确率为97.65%;作为一名大一生,在与那些名校的竞争中,我们有这样的成绩,我们倍感高兴与自豪;现在我想从我们刚开始参加比赛时做一个简要的总结。 matlab入门 ...
转:大数据比赛常用模型 阅读目录 一:安装Anaconda 二:JupyterNotebook 三:Numpy 四:Matplotlib 五:Pandas 六:Scikit learn 七:Kaggle 学完了Coursera上Andrew Ng的Machine Learning后,迫不及待地想去参加一场Kaggle的比赛,却发现从理论到实践的转变实在是太困难了,在此记录学习过程. 回到顶部 一: ...
2018-09-16 15:18 0 959 推荐指数:
---恢复内容开始--- 我们参加的大数据竞赛初赛已经结束,经过这些天的努力,我们也成功进入复赛。我们在初赛的最高成绩的准确率为97.65%;作为一名大一生,在与那些名校的竞争中,我们有这样的成绩,我们倍感高兴与自豪;现在我想从我们刚开始参加比赛时做一个简要的总结。 matlab入门 ...
1、冒泡排序 冒泡排序(Bubble Sort),是一种计算机科学领域的较简单的排序算法 它重复地走访过要排序的元素列,依次比较两个相邻的元素,如果他们的顺序(如从大 到小、首字母从A到Z)错误 ...
大数据常用组件 Hadoop Hadoop是干什么用的:https://www.zhihu.com/question/333417513/answer/742465814 Hadoop的特点:https://www.cnblogs.com/chenligeng/p/9313752.html ...
基本流程: 数据收集、数据建模、构建数据画像、风险定价。 数据收集:网络行为数据、企业服务范围内行为数据、用户内容偏好数据、用户交易数据、授权数据源、第三方数据源、合作方数据源、公开数据源。 数据建模:文本挖掘、自然语言处理、机器学习、预测算法、聚类算法。 数据画像:基本属性、购买能力 ...
技术最终为业务服务,没必要一定要追求先进性,各个企业应根据自己的实际情况去选择自己的技术路径。 它不一定具有通用性,但从一定程度讲,这个架构可能比BAT的架构更适应大多数企业的情况,毕竟,大多数企业,数据没到那个份上,也不可能完全自研,商业和开源的结合可能更好一点,权当抛砖引玉。 大数据平台 ...
一、大数据框架: Impala:hadoop的sql平台、支持hbase/hdfs、支持超大数据、支持多并发、sql支持好、对内存依赖比较严重。需要自己优化,并且有的语句超过内存会报错。 Spark:各种格式、各种计算(机器学习、图形计算)、可sql、可代码 ...