一、學習視頻
https://www.bilibili.com/video/BV1oE411s7h7?p=46
二、保存方式
df.write.txt("文件目錄") 保存為txt文件
df.write.json() 保存為json文件
df.write.parquet() 保存為parquet文件
df.write.formate("txt").save("文件目錄")
三、常用操作
3.1 df.printSchema() 打印df的模式信息
3.2 df.select(df["列名"]).show 選取列值並展示
3.3 df.filter(過濾條件) 將符合條件的信息過濾出來
3.4 df.groupBy("列名").count().show 分組后統計該列的數據並展示
3.5 df.sort(df["列名"].desc()).show() 按照列名的降序進行排序,升序是asc()