spark dataframe 正則表達式匹配

本文轉載自查看原文 2019-10-15 21:44 865 spark

val fake_data=hivecontext.read
.format("com.databricks.spark.csv")
.option("header","true") //這里如果在csv第一行有屬性的話，沒有就是"false"
.option("inferSchema",true.toString)//這是自動推斷屬性列的數據類型。
.option("delimiter", ",")
.load("file:///C:\\Users\\csv\\fix_price.csv")//文件的路徑
import org.apache.spark.sql.functions.regexp_extract
fake_data.show()
val data =fake_data.select(regexp_extract(fake_data("gid"),"^\\d{2}",0).alias("gid"))
data.show(10)

spark的正則表達式匹配暫時只找到一個可用於dataframe處理數據的函數

————————————————
原文鏈接：https://blog.csdn.net/qingumeng4466/article/details/78932970

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 正則表達式匹配題 postgres正則表達式匹配正則表達式匹配密碼正則表達式—匹配原則正則表達式匹配回溯正則表達式之匹配替換 oracle 正則表達式匹配正則表達式中文匹配正則表達式匹配次數 sql的匹配和正則表達式