Spark実践 #7 PySpark MLlib その4

前回に続いて、23,534件の麻酔データ:エホチール、エフェドリン、ネオシネジンのいずれかを使用したどうかを術前データから予想。今回は、RDDとMLlibを用いる。 ーーーーーーーーーーーーーーーーーーーーーーーー ML […]

Spark実践 #6 PySpark ML その3

自前のデータでPySpark MLに挑戦: 23,534件の麻酔データ:エホチール、エフェドリン、ネオシネジンのいずれかを使用したどうかを術前データから予想。 術前データ: ーーーーーーーーーーーーーーーーー 昇圧剤 p […]

Spark実践 #4 PySpark MLlib

PySparkの学習を通じて、Sparkの解析プロセスがRDDから、DataFrameへ移行していること、さらにMLlibの開発は終了し、MLに移行していることなどを学ぶ。 今回は、799万件の米国における2014年と2 […]

Spark実践 #1

自前のデータでSparkに挑戦してみる。 データは、昇圧剤の使用の有無と他の術前因子の相関を見る24010件のコード化した過去4年の麻酔データ —————&#8 […]