データサイエンス100本ノックをKNIME(ナイム)でやってみる - 13本目 『Regular Expression 正規表現の前方一致で条件指定する』

「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の 13本目 です。 実際に公開されている演習問題(100問は こちらに公開 されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し! KNIMEのインストールが完了していない場合は こちら を参考にしてみてください KNIMEの基本的な使用方法などをざっと確認したい場合は アーカイブ を 「データサイエンス100本ノック」って何ですか?という場合は こちら を データサイエンス 100本ノック 13本目 P-013: 顧客データ(customer.csv)から、ステータスコード(status_cd)の先頭がアルファベットのA〜Fで始まるデータを全項目抽出し、10件表示せよ。 以下の答え・解説を見る前に実際にチャレンジしてみてください。 では、実際にKNIME(ナイム)でやってみよう! さてさて、、いろんなやり方があると思うんですがKNIME(ナイム)にて正規表現(Regular Expression)を使って条件の抽出ができるかやってみます。 それ以外にも少し力技でマニュアルで抽出する方法も試していきましょう。 KNIME(ナイム)での正規表現(Regular Expression)を使った方法から。 「先頭がアルファベットのA〜Fで始まるデータを全項目抽出」の正規表現をRow filterノードで実行してみます。その後で先頭の10件をお馴染みのTOP K Selectorノードで取得します。 『^[A-F].*』 が正規表現の条件となります Regular Expression 正規表現からの先頭の10件の結果です それでは次の方法、最初の一文字目を抽出して、条件となるアルファベット(A〜F)を含んでいる行を探し出す方法について String Manipulationノードで『subst...