在提取 dataframe 里面的列時,需要傳入不定參數,即 dataframe.select(args) 。例如某個 dataframe 如下:
一般提取某列或者某幾列的時候是這樣子寫的:
dataframe.select("id", "col1", "col2")
但是有需求需要傳入不定參數提取不定的列,則可以將需要提取的列放入到一個 Array 中,再如此調用:
dataframe.select(Array.head, Array.tail: _*)
因為 select 官方定義的時候是支持傳入不定參數的:
def select(col: String, cols: String*): DataFrame = select((col +: cols).map(Column(_)) : _*)
唯一的要求是 Array 里面元素的類型是 String 類型。
