データサイエンス100本ノックをKNIME(ナイム)でやってみる - 6本目 『複数条件に合致する行を抽出する2』

「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の6本目です。

 
実際に公開されている演習問題(100問はこちらに公開されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し!
  • KNIMEのインストールが完了していない場合はこちらを参考にしてみてください
  • KNIMEの基本的な使用方法などをざっと確認したい場合はアーカイブ
  • 「データサイエンス100本ノック」って何ですか?という場合はこちら


 


 

 

データサイエンス 100本ノック 6本目

P-006: レシート明細データ(receipt.csv)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上数量(quantity)、売上金額(amount)の順に列を指定し、以下の全ての条件を満たすデータを抽出せよ。

・顧客ID(customer_id)が”CS018205000001″
・売上金額(amount)が1,000以上または売上数量(quantity)が5以上

 
 
 
 以下の答え・解説を見る前に実際にチャレンジしてみてください。
 
 
 
 
 
 
 
 
 
 

では、実際にKNIME(ナイム)でやってみよう!

今回のは、「複数条件に合致する行を抽出する」するということで5本目の延長ですね。抽出する条件が追加されるものとなります。

 
設定ではフィルターしたいのは、顧客ID(customer_id)が"CS018205000001"で、売上金額(amount)が1,000以上で、さらに売上数量(quantity)が5以上。。。これは前回のKNIMEの条件構文に少し付け足すことで完了します。
 
$customer_id$ = "CS018205000001" AND ($amount$ >= 1000 OR $quantity$ >= 5) => TRUE
 
 AND以下の構文はカッコで括ってあげないと正しい結果とならないので注意です。
 

 
 
 その他だと、、顧客ID(customer_id)だけ先に絞ってしまう方法もございますね。
 

 
 
 
 
という感じで今回も終了です!
もちろん他の方法もあるので探ってみてください :)
 
 
本日のデータサイエンス100本ノックをKNIME(ナイム)でやってみるはここで終了です!

 

お疲れ様でした!

このブログの人気の投稿

KNIME - CSV Readerのエンコード設定を調整してCSVファイル内の日本語の文字化けを回避する

KNIME - 複数ファイルの読み込み(ワイルドカード ユニオン)について

データサイエンス100本ノックをKNIME(ナイム)でやってみる