數據來源 數據頁面: 鏈家網南京(https://nj.lianjia.com/chengjiao/) 鏈家網數據量很大,這里只用南京的二手房成交數據。 如下圖: 數據采集 鏈家網的頁面數據比較整齊,采集很簡單,為了避免影響別人使用,只采集的南京的二手房成交數據, 采集頻率也很低,總共 ...
本文成文於 年 月 日,為作者原創,發布在博客園方便諸君閱讀 前段時間發了一篇分析房價的文章,於是這兩天在微信上咨詢我的朋友絡繹不絕。今天是光棍節,我什么都沒搶到。下午,有一位學姐在微信上找我,懷着激動的心情打開微信。 學姐說, 看到你之前發的文章了,能不能幫我在北京選一套婚房啊 學姐求我,焉有不應。於是,我們約了今天晚上在北郵校園的零一咖啡廳見面。學姐是我們實驗室比我大兩級的女神,追求者眾,據 ...
2016-04-02 17:59 4 1994 推薦指數:
數據來源 數據頁面: 鏈家網南京(https://nj.lianjia.com/chengjiao/) 鏈家網數據量很大,這里只用南京的二手房成交數據。 如下圖: 數據采集 鏈家網的頁面數據比較整齊,采集很簡單,為了避免影響別人使用,只采集的南京的二手房成交數據, 采集頻率也很低,總共 ...
項目分享目的:在學習完Numpy,Pandas,matplotlib后,熟練運用它們的最好方法就是實踐並總結。在下面的分享中,我會將每一步進行分析與代碼展示, 希望能對大家有所幫助。 項目名稱:鏈家二手房數據分析 項目概述:本項目主要利用上面提到的三個工具進行數據的處理 ...
在微博上看到這么個游戲,還是挺有意思的。http://segmentfault.com/game/ 第一關: 只是將超鏈接字體顏色和背景色搞成一樣,當然,我們一般也不點擊超鏈接 第二關: ...
繼續上一篇的工作繼續分析廣州鏈家二手房的數據。 >> Normality Test 用nortest package 的 ad.test() 分別對三個主要因素(面積,總價和均價)進行正態分布檢驗,結果顯示這三個變量都不滿足正態分布,而 Q-Q Plot 的表現方式就更直 ...
均值回歸理論 均值回歸:“跌下去的遲早要漲上來” , 選股用, 不適合做擇時,因為不知道什么時候是偏離最低 均值回歸的理論基於以下觀測:價格的波動一般會以它的均線為中心。也就是說, 當標的價格由於波動而偏離移動均線時,它將調整並重新歸於均線。 定義偏離程度:(MA-P)/MA ...
一、單因子選股策略--小市值策略 二、多因子選股策略--市值+ROE(凈資產收益率)選股策略 一、單因子選股策略--小市值策略 因子選股策略 因子:選擇股票的某種標准 增長率、市值、市盈率、ROE(凈資產收益率)............ 選股策略: 對於某個因子,選取 ...
上一篇分享了爬取鏈家二手房的數據,接下來就應該是分析這份數據。 小插曲:懶洋洋的夏天到了連人也變得懶洋洋的了(借口!)。拖拖拉拉地等到了鏈家網頁改版等到了二手房放盤數目又多了 10,000 + 套(樓市小復蘇?),總之又不得不重新爬了一份 51,000 + 的數據。 Inspect Data ...
環境: R 研究對象: 1. 二手房數據的區域特征 2. 二手房數據的面積特征 1. 導入原始數據 setwd("/Users/mac/Desktop/lianjia/") d = read.csv("/Users/mac/Desktop/lianjia ...