Hello Data Lovers! 今回はKNIME(ナイム)を使ってデータファイルの結合とユニオンを行ってみます。この前の記事ではワイルドカードユニオンで複数(2つ以上)のCSVを読み込んでみる方法でしたが、今回は特定の二つのデータソースを結合、ユニオンする際に使うノードとなります。 KNIME - 複数データを結合して利用する(Union、内部結合、外部結合) さて、複数のデータソース(データ表)を結合させる際に複数のパターンがありますよね、KNIME(ナイム)で行うことができる結合の種類を見ていきたいと思います。 ユニオン 複数データ表をユニオン結合する場合には、 Concatenate ノード を使用します。同じ列名のものだけを拾って連結したい場合にはColumn handlingで「Use intersection of columns」を。共通の列名でないものも全て連結してしまう場合には「Use union of columns」を使用してください。後者の場合、存在しない列の箇所には「?」を含む行が生成される事になります。 Concatenate ノードの構成画面 内部結合・外部結合 複数データ表を共通のキー列を使用し結合を行うには、 Joiner ノード を使用します。このノードを使用することで、内部結合(inner join)、右外部結合(right outer join) 、 左外部結合( left outer join)、完全外部結合(full outer join) を実施することができます。結合をした後で、列選択(Column Selection)から後続のワークフローで不要な列は除外選択しておくこともできます。 ベン図(Venn diagram)が表示されていてどの結合タイプにするかわかりやすい 結合タイプ名が切り替わる 今回のKNIMEでの表結合やユニオンに関しては、以下のリンクが参考になります。 KNIME Join and Concatenate https://knime.learnupon.com/enrollments/97790676/page/385670338 それでは、Happy Data analytics!!