Advanced Analytics from Spark #3 協調フィルタリング #2

Advanced Analytics with Spark、協調フィルタリングの続き:
前回のレコメンデーションの問題点は、すでにユーザーが再生したことのあるアーティストが選ばれている可能性があり、改善の余地があるとのことで、潜在的な隠されていたアーティストのランクを高くする工夫が必要。
受信者操作特性(ROC)曲線下の面積AUCの計算によるランダムに選択された良いレコメンデーションが、ランダムに選択された悪いレコメンデーションより高くなるとみなすレトリックを用いることになる。
———————–
RunRecommender.scalaをビルドして実行してみる。
O’Reillyの
https://github.com/sryza/aas
から、2nd Editionのaas-masterをダウンロードして、zipを展開。(注意点は1st Editionとは、コードが異なる点。日本語版解説は、1st Edition)
ターミナルでダウンロードしたファイルのルートフォルダに移動して、まとめて全部をmvn packageでビルド。

次は、上記ビルドで生成されたCh03のRunRecommenderオブジェクトを含むjarファイルであるch03-recommender-2.0.0.jarをsparkのルートフォルダに戻って、./bin/spark-shell –class クラス名 –master local –driver-memory 6g “で実行。
この歳、scalaコード内のhdsfを指定のこと。

と大量の出力コードの中に、ちらほらと結果が!
RunRecommender.scalaの中身の意味を分析してみよう。。。。