博客總目錄,記錄學習R與數據分析的一切:http://www.cnblogs.com/weibaar/p/4507801.html
---
好久沒發博客
且容我大吼一句
終於做完這周R Programming的作業了!
之前一直有報coursera的課程,但是總是沒有堅持下去,這次收到他們的郵件推廣,說data science系列課程開通了R語言的中文課程,有中文版論壇,有中文字幕,如此誠意滿滿,再不報名,就實在太落伍了。
為了讓自己堅持,還花錢買了signature track,所以當這周五收到助教通知說,第一個編程作業周日就要截止啦,簡直讓我晴天霹靂
然后周六花了一天時間看視頻,看GITHUB里一位大牛對這篇assignment的講解,終於完成了三個函數的編寫
總結一下經驗
1)遍歷文件夾,讀取所有數據
files_list<-list.files(directory,full.names=TRUE) #遍歷文件夾里的文件名,這里選擇fullname,就可以讀取工作目錄下文件夾內的文件了 dat<-data.frame() #需要事先設定data.frame框架,否則下列rbind循環會報錯 for (i in id){ dat<-rbind(dat,read.csv(files_list[i])) #這里用rbind,把dat與新讀取的文件聯合。 }
2)循環與if嵌套時,要注意}的應用,否則程序會報錯
for (i in 1:332) { #這里有嵌套 語句 if (sum(complete)>threshold) #注意括號以及下列{}的引用 {語句1} else {語句2} }
然后對於WEEK2的課程,總結下來是:
1)盡量用有hard limit的for語句,而不是repeat或者while語句做循環,避免無限循環
2)循環語句嵌套2-3層即可,如果要多層嵌套,請先思考有無簡易函數可用
3)R的全局環境,R包等,以及R為什么要把所有數據都讀入內存(控制流)
4)R自編函數的主要目的是,省略重復勞作,對代碼引用更加輕松
題外話
另外,在學習這門課之余,到MOOC逛,他們最近有一個叫做hour of code的活動,號召大家從小代碼開始(放下IPHONE,開始編程)。
如果新生代從小開始就接觸編程,那么十幾年后,我們這些老人的優勢在哪里呢?上海R語言會議上,有多個公司展示了他們用R做自動化報表的過程,這些原本需要人工多天的勞動,引入R后,均自動化了。那么如果所有的事情都自動化了后,拿着excel當飯吃,不思進取的所謂數據分析師,他們未來的出路又在哪里?
當編程語言逐步發展,當編程成為小學生必修課程,當excel可以做得事情,有R可以做得更好,不進步的人,就會被社會淘汰
believe tech, use tech, follow tech, can't stop
以此共勉。
---
博客總目錄,記錄學習R與數據分析的一切:http://www.cnblogs.com/weibaar/p/4507801.html