KNIME - 複数データを結合して利用する(Union、内部結合、外部結合)
Hello Data Lovers!
今回はKNIME(ナイム)を使ってデータファイルの結合とユニオンを行ってみます。この前の記事ではワイルドカードユニオンで複数(2つ以上)のCSVを読み込んでみる方法でしたが、今回は特定の二つのデータソースを結合、ユニオンする際に使うノードとなります。
KNIME - 複数データを結合して利用する(Union、内部結合、外部結合) |
さて、複数のデータソース(データ表)を結合させる際に複数のパターンがありますよね、KNIME(ナイム)で行うことができる結合の種類を見ていきたいと思います。
ユニオン
複数データ表をユニオン結合する場合には、Concatenate ノードを使用します。同じ列名のものだけを拾って連結したい場合にはColumn handlingで「Use intersection of columns」を。共通の列名でないものも全て連結してしまう場合には「Use union of columns」を使用してください。後者の場合、存在しない列の箇所には「?」を含む行が生成される事になります。
Concatenate ノードの構成画面 |
内部結合・外部結合
複数データ表を共通のキー列を使用し結合を行うには、Joiner ノードを使用します。このノードを使用することで、内部結合(inner join)、右外部結合(right outer join) 、左外部結合(left outer join)、完全外部結合(full outer join) を実施することができます。結合をした後で、列選択(Column Selection)から後続のワークフローで不要な列は除外選択しておくこともできます。
ベン図(Venn diagram)が表示されていてどの結合タイプにするかわかりやすい |
結合タイプ名が切り替わる |
今回のKNIMEでの表結合やユニオンに関しては、以下のリンクが参考になります。
- KNIME Join and Concatenate
https://knime.learnupon.com/enrollments/97790676/page/385670338
それでは、Happy Data analytics!!