編碼不友好,對中文不友好,逼着你用RStudio、Jupyter Notebook/Jupyter Lab。圖標丑,每次點擊感覺辣眼睛。
為節省內存,R語言計算默認有效數字為7位,比Excel的15位還坑,幸好可以用options(digit=20)調整。為節省內存,很多函數默認會把strings轉為factor,部門、性別等轉化尚能接受,姓名等轉化不能接受。
嚴格區分等於、賦值、參數設置。
向量化,代碼簡潔,寫起來爽。為統計而生,函數化,寫起來快。
序號從1開始,方便排版報表。write.csv導出,加上“序號”兩字。
社保、公積金本月和上月比較,用setdiff()求差集知增減。本月社保、公積金,用intersect()求交集知都買者。總公司、分公司的社保、公積金,用union()求並集。
對數據框merge()時,沒有相同字段是cross join,有相同字段,默認是inner join,也可以設參數,all=TRUE、all.x=TRUE、all.y=TRUE,對應full join、left join、right join。