spark dataframe 正则表达式匹配

本文转载自查看原文 2019-10-15 21:44 865 spark

val fake_data=hivecontext.read
.format("com.databricks.spark.csv")
.option("header","true") //这里如果在csv第一行有属性的话，没有就是"false"
.option("inferSchema",true.toString)//这是自动推断属性列的数据类型。
.option("delimiter", ",")
.load("file:///C:\\Users\\csv\\fix_price.csv")//文件的路径
import org.apache.spark.sql.functions.regexp_extract
fake_data.show()
val data =fake_data.select(regexp_extract(fake_data("gid"),"^\\d{2}",0).alias("gid"))
data.show(10)

spark的正则表达式匹配暂时只找到一个可用于dataframe处理数据的函数

————————————————
原文链接：https://blog.csdn.net/qingumeng4466/article/details/78932970

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 正则表达式的汉字匹配匹配url的正则表达式 js正则表达式匹配 [正则表达式]匹配Unicode LeetCode–正则表达式匹配正则表达式匹配+过滤正则表达式循环匹配正则表达式字符匹配正则表达式位置匹配正则表达式的结尾匹配