データサイエンス100本ノックをKNIME(ナイム)でやってみる - 19本目 『データの順位 順位付けする(同一順位あり)』

「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の19本目です。

 
実際に公開されている演習問題(100問はこちらに公開されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し!
  • KNIMEのインストールが完了していない場合はこちらを参考にしてみてください
  • KNIMEの基本的な使用方法などをざっと確認したい場合はアーカイブ
  • 「データサイエンス100本ノック」って何ですか?という場合はこちら


 


 

 

データサイエンス 100本ノック 19本目

P-019: レシート明細データ(receipt.csv)に対し、1件あたりの売上金額(amount)が高い順にランクを付与し、先頭から10件表示せよ。項目は顧客ID(customer_id)、売上金額(amount)、付与したランクを表示させること。
なお、売上金額(amount)が等しい場合は同一順位を付与するものとする。


 

 

 
 
 
 以下の答え・解説を見る前に実際にチャレンジしてみてください。
 
 
 
 
 
 
 
 
 
 

では、実際にKNIME(ナイム)でやってみよう!

さてさて、、いろんなやり方があると思うんですがKNIME(ナイム)を使ってデータの順位付けする(同一順位あり)をやっていきましょう。

KNIME(ナイム)でのデータのランキング(順位)を付ける

順位付け、、そうですランキングですね。ノード検索でRANKと入れると、出てきますね!RANKノードです。こちらを使い順位付け出来そうです。
 
Ranking Attributeは順位付する対象のフィールドである売上金額(amount)を。
売上金額(amount)が等しい場合は同一順位を付与するということなのでRanking ModeはDenseを選びます(数値が等しい場合は同一順位を付与し、その後の順位は1つだけ下がる)。Ranking Modeに関してはRANKノードのヘルプページを参考にしてみてください。
 
 
順位付け、同数値には同順位でそのあとは1つだけ順位が動く

 
 
 


 
 お疲れ様でした。
 
 
という感じで今回は終了となります!
 
もちろん他の方法もあるので探ってみてください :)
 
 
本日のデータサイエンス100本ノックをKNIME(ナイム)でやってみるはここで終了です!

 

お疲れ様でした!





このブログの人気の投稿

KNIME - CSV Readerのエンコード設定を調整してCSVファイル内の日本語の文字化けを回避する

KNIME - 複数ファイルの読み込み(ワイルドカード ユニオン)について

データサイエンス100本ノックをKNIME(ナイム)でやってみる