投稿

11月, 2022の投稿を表示しています

データサイエンス100本ノックをKNIME(ナイム)でやってみる - 16本目 『フォーマット一致 特定のデータ書式で条件指定する』

イメージ
「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の 16本目 です。   実際に公開されている演習問題(100問は こちらに公開 されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し! KNIMEのインストールが完了していない場合は こちら を参考にしてみてください KNIMEの基本的な使用方法などをざっと確認したい場合は アーカイブ を 「データサイエンス100本ノック」って何ですか?という場合は こちら を       データサイエンス 100本ノック 16本目 P-016: 店舗データ(store.csv)から、電話番号(tel_no)が3桁-3桁-4桁のデータを全項目表示せよ。            以下の答え・解説を見る前に実際にチャレンジしてみてください。                     では、実際にKNIME(ナイム)でやってみよう! さてさて、、いろんなやり方があると思うんですがKNIME(ナイム)にて前回と同じように 正規表現(Regular Expression) を使って条件の抽出ができるかやってみます。     KNIME(ナイム)での正規表現(Regular Expression)を使った方法。 「店舗データ(store.csv)から、電話番号(tel_no)が3桁-3桁-4桁のデータを全項目表示」の取得が必要となります。つまり 03-XXXX-XXXX などがあれば除く必要があるってことですね。   店舗データ(store.csv)の電話番号(tel_no)データを見ると、、 確かに混在している。 それでは、、KNIME(ナイム)での正規表現(Regular Expression)を使って取得してみます。 『\d{3}-\d{3}-\d{4}』が正規表現の条件でした    お疲れ様でした。     という感じで今回は終了となります!   もちろん他の方法もあるので探ってみてください :) ...

データサイエンス100本ノックをKNIME(ナイム)でやってみる - 15本目 『Regular Expression 正規表現の部分一致で条件指定する』

イメージ
「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の 15本目 です。   実際に公開されている演習問題(100問は こちらに公開 されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し! KNIMEのインストールが完了していない場合は こちら を参考にしてみてください KNIMEの基本的な使用方法などをざっと確認したい場合は アーカイブ を 「データサイエンス100本ノック」って何ですか?という場合は こちら を       データサイエンス 100本ノック 15本目 P-015: 顧客データ(customer.csv)から、ステータスコード(status_cd)の先頭がアルファベットのA〜Fで始まり、末尾が数字の1〜9で終わるデータを全項目抽出し、10件表示せよ。            以下の答え・解説を見る前に実際にチャレンジしてみてください。                     では、実際にKNIME(ナイム)でやってみよう! さてさて、、いろんなやり方があると思うんですがKNIME(ナイム)にて前回と同じように 正規表現(Regular Expression) を使って条件の抽出ができるかやってみます。今回はなかなか手強そうな感じですね。 KNIME(ナイム)での正規表現(Regular Expression)を使った方法。 「ステータスコード(status_cd)の 先頭がアルファベットのA〜Fで始まり、末尾が数字の1〜9で終わる データ」の取得が必要となります。 『^[A-F].*[1-9]$』が正規表現の条件でした       その後で先頭の10件をお馴染みのTOP K Selectorノードで取得します。          お疲れ様でした。     という感じで今回は終了となります!   もちろん他の方法もあるので探ってみてください :)     本日のデータサイ...

データサイエンス100本ノックをKNIME(ナイム)でやってみる - 14本目 『Regular Expression 正規表現の後方一致で条件指定する』

イメージ
「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の 14本目 です。   実際に公開されている演習問題(100問は こちらに公開 されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し! KNIMEのインストールが完了していない場合は こちら を参考にしてみてください KNIMEの基本的な使用方法などをざっと確認したい場合は アーカイブ を 「データサイエンス100本ノック」って何ですか?という場合は こちら を       データサイエンス 100本ノック 14本目 P-014: 顧客データ(customer.csv)から、ステータスコード(status_cd)の末尾が数字の1〜9で終わるデータを全項目抽出し、10件表示せよ。            以下の答え・解説を見る前に実際にチャレンジしてみてください。                     では、実際にKNIME(ナイム)でやってみよう! さてさて、、いろんなやり方があると思うんですがKNIME(ナイム)にて前回と同じように 正規表現(Regular Expression) を使って条件の抽出ができるかやってみます。 KNIME(ナイム)での正規表現(Regular Expression)を使った方法。 「末尾が数字の1〜9 で終わるデータ」を正規表現をRow filterノードで実行してみます。 『.*[1-9]$』 が正規表現の条件となります       その後で先頭の10件をお馴染みのTOP K Selectorノードで取得します。          お疲れ様でした。     という感じで今回は終了となります!   もちろん他の方法もあるので探ってみてください :)     本日のデータサイエンス100本ノックをKNIME(ナイム)でやってみる はここで終了です!   お疲れ様でした!