投稿

データサイエンス100本ノックをKNIME(ナイム)でやってみる - 19本目 『データの順位 順位付けする(同一順位あり)』

イメージ
「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の 19本目 です。   実際に公開されている演習問題(100問は こちらに公開 されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し! KNIMEのインストールが完了していない場合は こちら を参考にしてみてください KNIMEの基本的な使用方法などをざっと確認したい場合は アーカイブ を 「データサイエンス100本ノック」って何ですか?という場合は こちら を       データサイエンス 100本ノック 19本目 P-019: レシート明細データ(receipt.csv)に対し、1件あたりの売上金額(amount)が高い順にランクを付与し、先頭から10件表示せよ。項目は顧客ID(customer_id)、売上金額(amount)、付与したランクを表示させること。 なお、売上金額(amount)が等しい場合は同一順位を付与するものとする。            以下の答え・解説を見る前に実際にチャレンジしてみてください。                     では、実際にKNIME(ナイム)でやってみよう! さてさて、、いろんなやり方があると思うんですがKNIME(ナイム)を使ってデータの順位付けする(同一順位あり)をやっていきましょう。 KNIME(ナイム)でのデータのランキング(順位)を付ける 順位付け、、そうですランキングですね。ノード検索でRANKと入れると、出てきますね! RANKノード です。こちらを使い順位付け出来そうです。   Ranking Attributeは順位付する対象のフィールドである売上金額(amount)を。 売上金額(amount)が等しい場合は同一順位を付与するということなのでRanking ModeはDenseを選びます(数値が等しい場合は同一順位を付与し、その後の順位は1つだけ下がる)。Ranking Modeに関しては RANKノード のヘルプページを参考にしてみてください。     順位付け、同数値には同順位でそのあとは1つだけ順位が動く          お疲れ様でした。     という感じで今回は終了となります!   もちろん他の方法もあるので探ってみてください :)     本日のデータサイエンス100

データサイエンス100本ノックをKNIME(ナイム)でやってみる - 18本目 『データを降順に並べる ソート順 並び替え』

イメージ
「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の 18本目 です。   実際に公開されている演習問題(100問は こちらに公開 されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し! KNIMEのインストールが完了していない場合は こちら を参考にしてみてください KNIMEの基本的な使用方法などをざっと確認したい場合は アーカイブ を 「データサイエンス100本ノック」って何ですか?という場合は こちら を       データサイエンス 100本ノック 18本目 P-018: 顧客データ(customer.csv)を生年月日(birth_day)で若い順にソートし、先頭から全項目を10件表示せよ。            以下の答え・解説を見る前に実際にチャレンジしてみてください。                     では、実際にKNIME(ナイム)でやってみよう! さてさて、、いろんなやり方があると思うんですがKNIME(ナイム)を使ってデータの並び順をの変更は、前回と同じですね。 KNIME(ナイム)でのデータの並び替え(ソート順変更して降順に並べる) KNIME(ナイム)で、データの並び替え(降順にし)、そして先頭から全項目を10件表示は1つのノード( top k selector )で完了することができます。   降順(descending)の設定をすればOKです              お疲れ様でした。     という感じで今回は終了となります!   もちろん他の方法もあるので探ってみてください :)     本日のデータサイエンス100本ノックをKNIME(ナイム)でやってみる はここで終了です!   お疲れ様でした!

データサイエンス100本ノックをKNIME(ナイム)でやってみる - 17本目 『データを昇順に並べる ソート順 並び替え』

イメージ
「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の 17本目 です。   実際に公開されている演習問題(100問は こちらに公開 されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し! KNIMEのインストールが完了していない場合は こちら を参考にしてみてください KNIMEの基本的な使用方法などをざっと確認したい場合は アーカイブ を 「データサイエンス100本ノック」って何ですか?という場合は こちら を       データサイエンス 100本ノック 17本目 P-017: 顧客データ(customer.csv)を生年月日(birth_day)で高齢順にソートし、先頭から全項目を10件表示せよ。            以下の答え・解説を見る前に実際にチャレンジしてみてください。                     では、実際にKNIME(ナイム)でやってみよう! さてさて、、いろんなやり方があると思うんですがKNIME(ナイム)を使ってデータの並び順を変えてみましょう。 日付型を扱う際には、データが持っている日付型のフォーマットを確認しておく必要がありますね。今回は、日付型の標準フォーマット「YYYY-MM-DD」です。 KNIME(ナイム)でのデータの並び替え(ソート順変更) KNIME(ナイム)で、データの並び替え、そして先頭から全項目を10件表示は1つのノードで完了することができました。     ソートするフィールドを選んで、昇順or降順を選びます   詳細設定にてOutput OrderにてSort outputを選んでおきます          お疲れ様でした。     という感じで今回は終了となります!   もちろん他の方法もあるので探ってみてください :)     本日のデータサイエンス100本ノックをKNIME(ナイム)でやってみる はここで終了です!   お疲れ様でした!

データサイエンス100本ノックをKNIME(ナイム)でやってみる - 16本目 『フォーマット一致 特定のデータ書式で条件指定する』

イメージ
「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の 16本目 です。   実際に公開されている演習問題(100問は こちらに公開 されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し! KNIMEのインストールが完了していない場合は こちら を参考にしてみてください KNIMEの基本的な使用方法などをざっと確認したい場合は アーカイブ を 「データサイエンス100本ノック」って何ですか?という場合は こちら を       データサイエンス 100本ノック 16本目 P-016: 店舗データ(store.csv)から、電話番号(tel_no)が3桁-3桁-4桁のデータを全項目表示せよ。            以下の答え・解説を見る前に実際にチャレンジしてみてください。                     では、実際にKNIME(ナイム)でやってみよう! さてさて、、いろんなやり方があると思うんですがKNIME(ナイム)にて前回と同じように 正規表現(Regular Expression) を使って条件の抽出ができるかやってみます。     KNIME(ナイム)での正規表現(Regular Expression)を使った方法。 「店舗データ(store.csv)から、電話番号(tel_no)が3桁-3桁-4桁のデータを全項目表示」の取得が必要となります。つまり 03-XXXX-XXXX などがあれば除く必要があるってことですね。   店舗データ(store.csv)の電話番号(tel_no)データを見ると、、 確かに混在している。 それでは、、KNIME(ナイム)での正規表現(Regular Expression)を使って取得してみます。 『\d{3}-\d{3}-\d{4}』が正規表現の条件でした    お疲れ様でした。     という感じで今回は終了となります!   もちろん他の方法もあるので探ってみてください :)     本日のデータサイエンス100本ノックをKNIME(ナイム)でやってみる はここで終了です!   お疲れ様でした!

データサイエンス100本ノックをKNIME(ナイム)でやってみる - 15本目 『Regular Expression 正規表現の部分一致で条件指定する』

イメージ
「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の 15本目 です。   実際に公開されている演習問題(100問は こちらに公開 されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し! KNIMEのインストールが完了していない場合は こちら を参考にしてみてください KNIMEの基本的な使用方法などをざっと確認したい場合は アーカイブ を 「データサイエンス100本ノック」って何ですか?という場合は こちら を       データサイエンス 100本ノック 15本目 P-015: 顧客データ(customer.csv)から、ステータスコード(status_cd)の先頭がアルファベットのA〜Fで始まり、末尾が数字の1〜9で終わるデータを全項目抽出し、10件表示せよ。            以下の答え・解説を見る前に実際にチャレンジしてみてください。                     では、実際にKNIME(ナイム)でやってみよう! さてさて、、いろんなやり方があると思うんですがKNIME(ナイム)にて前回と同じように 正規表現(Regular Expression) を使って条件の抽出ができるかやってみます。今回はなかなか手強そうな感じですね。 KNIME(ナイム)での正規表現(Regular Expression)を使った方法。 「ステータスコード(status_cd)の 先頭がアルファベットのA〜Fで始まり、末尾が数字の1〜9で終わる データ」の取得が必要となります。 『^[A-F].*[1-9]$』が正規表現の条件でした       その後で先頭の10件をお馴染みのTOP K Selectorノードで取得します。          お疲れ様でした。     という感じで今回は終了となります!   もちろん他の方法もあるので探ってみてください :)     本日のデータサイエンス100本ノックをKNIME(ナイム)でやってみる はここで終了です!   お疲れ様でした!

データサイエンス100本ノックをKNIME(ナイム)でやってみる - 14本目 『Regular Expression 正規表現の後方一致で条件指定する』

イメージ
「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の 14本目 です。   実際に公開されている演習問題(100問は こちらに公開 されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し! KNIMEのインストールが完了していない場合は こちら を参考にしてみてください KNIMEの基本的な使用方法などをざっと確認したい場合は アーカイブ を 「データサイエンス100本ノック」って何ですか?という場合は こちら を       データサイエンス 100本ノック 14本目 P-014: 顧客データ(customer.csv)から、ステータスコード(status_cd)の末尾が数字の1〜9で終わるデータを全項目抽出し、10件表示せよ。            以下の答え・解説を見る前に実際にチャレンジしてみてください。                     では、実際にKNIME(ナイム)でやってみよう! さてさて、、いろんなやり方があると思うんですがKNIME(ナイム)にて前回と同じように 正規表現(Regular Expression) を使って条件の抽出ができるかやってみます。 KNIME(ナイム)での正規表現(Regular Expression)を使った方法。 「末尾が数字の1〜9 で終わるデータ」を正規表現をRow filterノードで実行してみます。 『.*[1-9]$』 が正規表現の条件となります       その後で先頭の10件をお馴染みのTOP K Selectorノードで取得します。          お疲れ様でした。     という感じで今回は終了となります!   もちろん他の方法もあるので探ってみてください :)     本日のデータサイエンス100本ノックをKNIME(ナイム)でやってみる はここで終了です!   お疲れ様でした!

データサイエンス100本ノックをKNIME(ナイム)でやってみる - 13本目 『Regular Expression 正規表現の前方一致で条件指定する』

イメージ
「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の 13本目 です。   実際に公開されている演習問題(100問は こちらに公開 されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し! KNIMEのインストールが完了していない場合は こちら を参考にしてみてください KNIMEの基本的な使用方法などをざっと確認したい場合は アーカイブ を 「データサイエンス100本ノック」って何ですか?という場合は こちら を       データサイエンス 100本ノック 13本目 P-013: 顧客データ(customer.csv)から、ステータスコード(status_cd)の先頭がアルファベットのA〜Fで始まるデータを全項目抽出し、10件表示せよ。            以下の答え・解説を見る前に実際にチャレンジしてみてください。                     では、実際にKNIME(ナイム)でやってみよう! さてさて、、いろんなやり方があると思うんですがKNIME(ナイム)にて正規表現(Regular Expression)を使って条件の抽出ができるかやってみます。 それ以外にも少し力技でマニュアルで抽出する方法も試していきましょう。 KNIME(ナイム)での正規表現(Regular Expression)を使った方法から。   「先頭がアルファベットのA〜Fで始まるデータを全項目抽出」の正規表現をRow filterノードで実行してみます。その後で先頭の10件をお馴染みのTOP K Selectorノードで取得します。 『^[A-F].*』 が正規表現の条件となります   Regular Expression 正規表現からの先頭の10件の結果です         それでは次の方法、最初の一文字目を抽出して、条件となるアルファベット(A〜F)を含んでいる行を探し出す方法について   String Manipulationノードで『substr($status_cd$, 0, 1)』で最初の1文字目だけの列を作成      追加の列に対し、IN構文のフィルターで該当のアルファベットの条件だけを抽出します。       さて、取得結果です。正規表現のものと一緒ですね!          お疲れ様でした。