データサイエンス100本ノックをKNIME(ナイム)でやってみる - 14本目 『Regular Expression 正規表現の後方一致で条件指定する』

「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の14本目です。

 
実際に公開されている演習問題(100問はこちらに公開されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し!
  • KNIMEのインストールが完了していない場合はこちらを参考にしてみてください
  • KNIMEの基本的な使用方法などをざっと確認したい場合はアーカイブ
  • 「データサイエンス100本ノック」って何ですか?という場合はこちら


 


 

 

データサイエンス 100本ノック 14本目

P-014: 顧客データ(customer.csv)から、ステータスコード(status_cd)の末尾が数字の1〜9で終わるデータを全項目抽出し、10件表示せよ。

 

 

 
 
 
 以下の答え・解説を見る前に実際にチャレンジしてみてください。
 
 
 
 
 
 
 
 
 
 

では、実際にKNIME(ナイム)でやってみよう!

さてさて、、いろんなやり方があると思うんですがKNIME(ナイム)にて前回と同じように正規表現(Regular Expression)を使って条件の抽出ができるかやってみます。


KNIME(ナイム)での正規表現(Regular Expression)を使った方法。

「末尾が数字の1〜9 で終わるデータ」を正規表現をRow filterノードで実行してみます。
『.*[1-9]$』 が正規表現の条件となります

 
 
 
その後で先頭の10件をお馴染みのTOP K Selectorノードで取得します。




 
 
 
 
 お疲れ様でした。
 
 
という感じで今回は終了となります!
 
もちろん他の方法もあるので探ってみてください :)
 
 
本日のデータサイエンス100本ノックをKNIME(ナイム)でやってみるはここで終了です!

 

お疲れ様でした!

このブログの人気の投稿

KNIME - CSV Readerのエンコード設定を調整してCSVファイル内の日本語の文字化けを回避する

KNIME - 複数ファイルの読み込み(ワイルドカード ユニオン)について

データサイエンス100本ノックをKNIME(ナイム)でやってみる