データサイエンス100本ノックをKNIME(ナイム)でやってみる - 8本目 『特定条件に合致しない行を抽出する』
「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の8本目です。
実際に公開されている演習問題(100問はこちらに公開されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し!
- KNIMEのインストールが完了していない場合はこちらを参考にしてみてください
- KNIMEの基本的な使用方法などをざっと確認したい場合はアーカイブを
- 「データサイエンス100本ノック」って何ですか?という場合はこちらを
データサイエンス 100本ノック 8本目
P-008: レシート明細データ(receipt.csv)から売上日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、以下の全ての条件を満たすデータを抽出せよ。
- 顧客ID(customer_id)が”CS018205000001″
- 商品コード(product_cd)が”P071401019″以外
以下の答え・解説を見る前に実際にチャレンジしてみてください。
では、実際にKNIME(ナイム)でやってみよう!
今回はですね、「特定条件に合致しない行を抽出する(!=)」ということで不一致を探すというものですね!
設定ではフィルターしたいのは、顧客ID(customer_id)が"CS018205000001"で、その中の商品コード(product_cd)が”P071401019″以外のものということになります。
ここでは、前回までとは異なり、フィールド「product_cd」の条件は不一致を取得するものとなります。条件は「以外」、ということなので「等しくない」という演算子を選びます。
最初は不一致の「!=」を探したのですが、 KNIME(ナイム)では不一致は NOT でいいようです。以下のようにかっこで後ろの条件の方を囲ってあげて、その中に商品コード(product_cd)が”P071401019″の条件を作ります。
$customer_id$ = "CS018205000001" AND NOT ($product_cd$ = "P071401019") => TRUE
という感じで今回は終了となります!
もちろん他の方法もあるので探ってみてください :)
本日のデータサイエンス100本ノックをKNIME(ナイム)でやってみるはここで終了です!
お疲れ様でした!