はじめに
どういった場合にDataFusionとDataFlowを使用するのが適しているのかを理解することが重要です。どちらのツールにもメリットデメリットがありますが、最初に、各ツールの主要な用途について説明します。
-
DataFusion:大量のデータ(2,000万を超える行と25を超える列を持つデータ)を別のデータ(日次売上データなど、決まった時間帯に定期的に更新されるデータ)にすばやく組み合わせる(結合、統合、挿入など)必要がある場合に、このツールを使用します。
-
DataFlow:単純なデータの組み合わせやBeast Modeの計算機能によるジョブの実行では不可能な変換処理を実行する場合に、このツールを使用します。
DataFusionのメリットとデメリット
-
DataFusionは単純なデータビューであるため、出力をDomoデータベースに取り込んでインデックスを作成する必要はありません。これにより、データの結合、表示、更新をDomoで非常にすばやく行うことができます。
-
大量のデータを処理する場合、短時間でデータを変換することができます。具体的には、2,000万を超える行と25を超える列が含まれているデータを持つDataSetの場合、DataFusionを使用してデータを結合する必要があります。
-
AnalyzerでクリエイティブBeast Modeの計算機能を使用して、表示するデータとその表示方法を指定することができます。
-
DataFusionの初期設定時に、列の名前を変更することができます。
-
データに含める列とデータから除外する列をいつでも変更することができます。
-
データの結合や追加を行う場合は、DataFusionを使用する必要があります。
-
DataFusionをDataFlowの入力として使用することはできません。
-
一度DataFusionを作成すると、バックエンド側で列名の変更を行うのが難しくなります。
DataFlowのメリットとデメリット
-
DataFlowの特長は、DataFusionよりも柔軟性が高いことです。列の折りたたみ、列の結合、列名の変更に関する制限を受けることなく、ほとんどのタイプの変換処理を設定することができます。また、操作別に日付とグループを管理できるなど、さまざまなメリットがあります。Analyzerで多くのBeast Modeを使用する必要がないため、柔軟な方法でデータを視覚化することができます。
-
実行する変換処理によっては、Domoでのビッグデータの実行や更新に時間がかかる場合があります。大量の列や行を持つDataSetを処理する際に、グループ化されていない列や行をDataFlowに組み合わせる場合、これらのDataSetをDomoで更新すると非常に時間がかかる可能性があります。DataSetの更新が完了するまで、数時間かかる場合もあります。
コメント
0件のコメント
サインインしてコメントを残してください。