データサイエンス100本ノックをKNIME(ナイム)でやってみる - 15本目 『Regular Expression 正規表現の部分一致で条件指定する』
「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の15本目です。
実際に公開されている演習問題(100問はこちらに公開されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し!
- KNIMEのインストールが完了していない場合はこちらを参考にしてみてください
- KNIMEの基本的な使用方法などをざっと確認したい場合はアーカイブを
- 「データサイエンス100本ノック」って何ですか?という場合はこちらを
データサイエンス 100本ノック 15本目
P-015: 顧客データ(customer.csv)から、ステータスコード(status_cd)の先頭がアルファベットのA〜Fで始まり、末尾が数字の1〜9で終わるデータを全項目抽出し、10件表示せよ。
以下の答え・解説を見る前に実際にチャレンジしてみてください。
では、実際にKNIME(ナイム)でやってみよう!
さてさて、、いろんなやり方があると思うんですがKNIME(ナイム)にて前回と同じように正規表現(Regular Expression)を使って条件の抽出ができるかやってみます。今回はなかなか手強そうな感じですね。
KNIME(ナイム)での正規表現(Regular Expression)を使った方法。
「ステータスコード(status_cd)の先頭がアルファベットのA〜Fで始まり、末尾が数字の1〜9で終わるデータ」の取得が必要となります。
その後で先頭の10件をお馴染みのTOP K Selectorノードで取得します。
お疲れ様でした。
という感じで今回は終了となります!
もちろん他の方法もあるので探ってみてください :)
本日のデータサイエンス100本ノックをKNIME(ナイム)でやってみるはここで終了です!
お疲れ様でした!