我有一个Column,如下图
这是一个数组,现在我想把这一列的数组转换成向量,请我应该怎么做。
显然楼上是错误的答案,都没有试过就网上写
import org.apache.spark.ml.feature.{HashingTF, IDF, Tokenizer}
import org.apache.spark.sql.types.IntegerType
val sqlContext = new SQLContext(sc)
val tokenizer = new Tokenizer().setInputCol("features").setOutputCol("numbers")
val Data = tokenizer.transform(arraydata) //arraydata指你原先声明的数据名称