データサイエンス100本ノックをKNIME(ナイム)でやってみる - 2本目 『特定の列を抽出する』

 

「データサイエンス100本ノックをKNIME(ナイム)でやってみる」の2本目です。
 
実際に公開されている演習問題(100問はこちらに公開されております)に取り組んでいきます。一緒に手を動かしてやってみましょう。大リーグへの道は長し!
  • KNIMEのインストールが完了していない場合はこちらを参考にしてみてください
  • KNIMEの基本的な使用方法などをざっと確認したい場合はアーカイブ
  • 「データサイエンス100本ノック」って何ですか?という場合はこちら


 


 

 

データサイエンス 100本ノック 2本目(2問目) 

P-002: レシート明細データ(receipt.csv)から売上年月日(sales_ymd)、顧客ID(customer_id)、商品コード(product_cd)、売上金額(amount)の順に列を指定し、10件表示せよ。
 
 
 
 以下の答え・解説を見る前に実際にチャレンジしてみてください。
 
 
 
 
 
 
 
 
 

KNIMEで実際にやってみよう!

さて、こちら前回もお話ししたようにKNIME(ナイム)はとてもいろんな事ができるので回答を得る方法はいくつかあると思います。
 
今回の課題ですが、一つのノード、CSV Readerノードだけで完結できてしまいます(すごいシンプル!)。
 
 データサイエンス100本ノックの1本目をやった方ならピンときているかもしれませんが、CSVを読み込んでそこで取得列(Transformationタブから)と取得行数(Limit Rowsタブから)を設定するだけでOKです。
 


 
という感じでかなり簡単です!もちろん他の方法もあるので探ってみてください :)
 
 
データサイエンス100本ノックをKNIME(ナイム)でやってみるノック2本目はここで終了です!
 
お疲れ様でした!

このブログの人気の投稿

KNIME - CSV Readerのエンコード設定を調整してCSVファイル内の日本語の文字化けを回避する

KNIME - 複数ファイルの読み込み(ワイルドカード ユニオン)について

データサイエンス100本ノックをKNIME(ナイム)でやってみる