Spark実践 #5 PySpark ML

DataFrameに対するMachine LearningライブラリーであるMLを試す。入門PySpark Ch-06
———————————————-
データは、前回と同じく乳児の生存確率

Create transformers

Create a pipeline

Fit the model

Model performance

Saving the model

Parameter hyper-tuning

Train-Validation splitting

Regression