Coursera系列-R Programming第二周


博客總目錄,記錄學習R與數據分析的一切:http://www.cnblogs.com/weibaar/p/4507801.html

 ---

好久沒發博客

且容我大吼一句

終於做完這周R Programming的作業了!

之前一直有報coursera的課程,但是總是沒有堅持下去,這次收到他們的郵件推廣,說data science系列課程開通了R語言的中文課程,有中文版論壇,有中文字幕,如此誠意滿滿,再不報名,就實在太落伍了。

為了讓自己堅持,還花錢買了signature track,所以當這周五收到助教通知說,第一個編程作業周日就要截止啦,簡直讓我晴天霹靂

然后周六花了一天時間看視頻,看GITHUB里一位大牛對這篇assignment的講解,終於完成了三個函數的編寫

總結一下經驗

1)遍歷文件夾,讀取所有數據

files_list<-list.files(directory,full.names=TRUE) #遍歷文件夾里的文件名,這里選擇fullname,就可以讀取工作目錄下文件夾內的文件了
  dat<-data.frame() #需要事先設定data.frame框架,否則下列rbind循環會報錯
  for (i in id){
    dat<-rbind(dat,read.csv(files_list[i])) #這里用rbind,把dat與新讀取的文件聯合。
  }

2)循環與if嵌套時,要注意}的應用,否則程序會報錯

    for (i in 1:332) { #這里有嵌套
      語句
        if (sum(complete)>threshold) #注意括號以及下列{}的引用
            {語句1}
            else {語句2}
    }

然后對於WEEK2的課程,總結下來是:

1)盡量用有hard limit的for語句,而不是repeat或者while語句做循環,避免無限循環

2)循環語句嵌套2-3層即可,如果要多層嵌套,請先思考有無簡易函數可用

3)R的全局環境,R包等,以及R為什么要把所有數據都讀入內存(控制流)

4)R自編函數的主要目的是,省略重復勞作,對代碼引用更加輕松

題外話

另外,在學習這門課之余,到MOOC逛,他們最近有一個叫做hour of code的活動,號召大家從小代碼開始(放下IPHONE,開始編程)。

如果新生代從小開始就接觸編程,那么十幾年后,我們這些老人的優勢在哪里呢?上海R語言會議上,有多個公司展示了他們用R做自動化報表的過程,這些原本需要人工多天的勞動,引入R后,均自動化了。那么如果所有的事情都自動化了后,拿着excel當飯吃,不思進取的所謂數據分析師,他們未來的出路又在哪里?

當編程語言逐步發展,當編程成為小學生必修課程,當excel可以做得事情,有R可以做得更好,不進步的人,就會被社會淘汰

believe tech, use tech, follow tech, can't stop

以此共勉。

 

---

博客總目錄,記錄學習R與數據分析的一切:http://www.cnblogs.com/weibaar/p/4507801.html

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM