投稿

11月, 2021の投稿を表示しています

KNIME - データサイエンスを学ぶ66日間チャレンジのすすめ! #66daysofdata by KNIME

イメージ
Data Loversの皆さんこんにちは!  データサイエンスの勉強を始めたいけどどこから手を付けていいか分からないってこともありますよね。この前、私が導入し勉強中のツールのKNIMEが「データサイエンスを学ぶ66日間チャレンジ」をやっていることを発見しました。 こちらです。  Data Exploration in #66daysofdata with KNIME    #66daysofdata by KNIME 一日、約5から15分くらいで終わる内容のデータサイエンス学習を66日間やってみるというチャレンジで、完了したらソーシャルネットワーク(TwitterやFacebook、Linkedinなどに)ハッシュタグ #66daysofdata を付けて投稿するだけです。なかなか細切れでストレスなく進めていけそうです。 先に載せたページに66日間の学習項目が載っておりますよ。 こちらは、今のところ英語だけで発信されておりますが、データサイエンス学習を英語でという方などにオススメかと思いますのでここに投稿してみました。 何かわからないことがあった際には、KNIMEの KNIME Forum で質問してみてください。KNIMEユーザーの方々がきっとアドバイスをしてくれると思います! それでは また!

KNIME - 複数データを結合して利用する(Union、内部結合、外部結合)

イメージ
Hello Data Lovers! 今回はKNIME(ナイム)を使ってデータファイルの結合とユニオンを行ってみます。この前の記事ではワイルドカードユニオンで複数(2つ以上)のCSVを読み込んでみる方法でしたが、今回は特定の二つのデータソースを結合、ユニオンする際に使うノードとなります。   KNIME - 複数データを結合して利用する(Union、内部結合、外部結合)   さて、複数のデータソース(データ表)を結合させる際に複数のパターンがありますよね、KNIME(ナイム)で行うことができる結合の種類を見ていきたいと思います。   ユニオン 複数データ表をユニオン結合する場合には、 Concatenate ノード を使用します。同じ列名のものだけを拾って連結したい場合にはColumn handlingで「Use intersection of columns」を。共通の列名でないものも全て連結してしまう場合には「Use union of columns」を使用してください。後者の場合、存在しない列の箇所には「?」を含む行が生成される事になります。 Concatenate ノードの構成画面     内部結合・外部結合 複数データ表を共通のキー列を使用し結合を行うには、 Joiner ノード を使用します。このノードを使用することで、内部結合(inner join)、右外部結合(right outer join) 、 左外部結合( left outer join)、完全外部結合(full outer join) を実施することができます。結合をした後で、列選択(Column Selection)から後続のワークフローで不要な列は除外選択しておくこともできます。   ベン図(Venn diagram)が表示されていてどの結合タイプにするかわかりやすい 結合タイプ名が切り替わる 今回のKNIMEでの表結合やユニオンに関しては、以下のリンクが参考になります。 KNIME Join and Concatenate https://knime.learnupon.com/enrollments/97790676/page/385670338   それでは、Happy Data analytics!!