データサイエンス100本ノックをKNIME(ナイム)でやってみる - 8本目 『特定条件に合致しない行を抽出する』

「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の8本目です。

 
実際に公開されている演習問題(100問はこちらに公開されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し!
  • KNIMEのインストールが完了していない場合はこちらを参考にしてみてください
  • KNIMEの基本的な使用方法などをざっと確認したい場合はアーカイブ
  • 「データサイエンス100本ノック」って何ですか?という場合はこちら


 


 

 

データサイエンス 100本ノック 8本目

P-008: レシート明細データ(receipt.csv)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、以下の全ての条件を満たすデータを抽出せよ。

  • 顧客ID(customer_id)が”CS018205000001″
  • 商品コード(product_cd)が”P071401019″以外
 
 
 
 以下の答え・解説を見る前に実際にチャレンジしてみてください。
 
 
 
 
 
 
 
 
 
 

では、実際にKNIME(ナイム)でやってみよう!

今回はですね、「特定条件に合致しない行を抽出する(!=)」ということで不一致を探すというものですね!
 
設定ではフィルターしたいのは、顧客ID(customer_id)が"CS018205000001"で、その中の商品コード(product_cd)が”P071401019″以外のものということになります。


 
 
 
ここでは、前回までとは異なり、フィールド「product_cd」の条件は不一致を取得するものとなります。条件は「以外」、ということなので「等しくない」という演算子を選びます。
 
最初は不一致の「!=」を探したのですが、 KNIME(ナイム)では不一致は NOT でいいようです。以下のようにかっこで後ろの条件の方を囲ってあげて、その中に商品コード(product_cd)が”P071401019″の条件を作ります。
 
$customer_id$ = "CS018205000001" AND NOT ($product_cd$ = "P071401019") => TRUE
 

 
 
 
という感じで今回は終了となります!
もちろん他の方法もあるので探ってみてください :)
 
 
本日のデータサイエンス100本ノックをKNIME(ナイム)でやってみるはここで終了です!

 

お疲れ様でした!

このブログの人気の投稿

KNIME - CSV Readerのエンコード設定を調整してCSVファイル内の日本語の文字化けを回避する

KNIME - 複数ファイルの読み込み(ワイルドカード ユニオン)について

データサイエンス100本ノックをKNIME(ナイム)でやってみる