はじめに
Amazon Redshiftは、ホスト型Data Warehouseプロジェクトで、大型クラウドコンピューティングプラットフォームであるAmazon Web Servicesの一部です。Redshiftは、列型DBMS原理で保存された大規模なDataSet上の解析ワークロードを取り扱うことができます。Amazon Redshift Upsertコネクターで、マージ(アップサート)オプションを使用することにより、データを表に反映できます。
Amazon Redshift Upsertのアカウントには、Data Centerから接続します。このトピックでは、Amazon Redshift Upsertコネクターのインターフェースに固有のフィールドとメニューについて説明します。DataSetの追加とDataSet情報の編集に関する一般的な情報については、「データコネクターを使ってDataSetを追加する」を参照してください。
必要条件
Amazon Redshift Upsert DataSetの作成を開始できるように、Amazon Redshiftに接続するには、以下が必要です。
-
JDBCドライバー
-
Redshiftデータベースのホスト名
-
Redshiftデータベースのデータベース名
-
Redshiftのユーザー名とパスワード
-
Redshiftデータベースのポート番号
-
証明書の形式これは、[証明書]フィールドに入力した内容と一致している必要があります。
-
CA証明書用テキスト、または証明書がある場所のURLを入力します。デフォルトでは、証明書は必要ありません。
ホワイトリスト化
Redshiftデータベースに接続する前に、接続先となるデータベースサーバーのポートでIPアドレスをいくつかホワイトリストに登録する必要があります。IPアドレスの詳細なリストは、「コネクターのIPアドレスをホワイトリスト化する」を参照してください。
Amazon Redshift Upsertアカウントに接続する
このセクションでは、Amazon Redshift Upsertコネクターページの[認証情報]および[詳細]ペインのオプションについて説明します。このページのほかのペインの項目にある[スケジュール設定]や[DataSetの名前を付け説明を入力]に関しては、ほとんどのタイプのコネクターで共通しています。詳細については、「データコネクターを使ってDataSetを追加する」を参照してください。
[認証情報]ペイン
このペインには、Amazon Redshift Upsertアカウントに接続する認証情報の入力フィールドが含まれています。下表は、各フィールドに必要な内容を説明しています。
フィールド |
説明 |
---|---|
JDBCドライバー |
使用するJDBCドライバーを選択します。 |
ホスト |
SQLデータベースのホスト名を入力します。ホスト名が不明な場合は、Amazon Redshiftデータベース管理者にお問い合わせください。 |
データベース |
SQLデータベース名を入力します。データベース名が不明な場合は、Amazon Redshiftデータベース管理者にお問い合わせください。 |
ユーザー名 |
Redshiftユーザー名を入力します。ユーザー名が不明な場合は、Amazon Redshiftデータベース管理者にお問い合わせください。 |
パスワード |
Redshiftパスワードを入力します。ユーザー名が不明な場合は、Amazon Redshiftデータベース管理者にお問い合わせください。 |
データベースポート |
Redshiftデータベースのポート番号を入力します。ポート番号が不明な場合は、Amazon Redshiftデータベース管理者にお問い合わせください。 |
証明書書式 |
証明書書式を選択します。これは、[証明書]フィールドに入力した内容と一致している必要があります。特別な証明書が分からない場合、[証明書なし]を選択します。 |
証明書 |
CA証明書用テキストを貼り付けるか、証明書がある場所のURLを入力します。デフォルトでは、証明書は必要ありません。 |
有効な認証情報を一度入力しておくと、いつでも同じアカウントを使用して新しいAmazon Redshift Upsert DataSetを作成することができます。コネクターのアカウントはData Centerの[アカウント]タブで管理することができます。このタブについて詳しくは、「コネクターのユーザーアカウントを管理する」を参照してください。
[詳細]ペイン
このペインには、Domoにロードするデータを指定するための、様々なオプションが含まれています。
メニュー | 説明 |
---|---|
クエリタイプ |
クエリタイプを選択します。 クエリ:パラメーターなしの通常SQLクエリ クエリパラメーター:パラメーターを伴うSQLクエリ |
クエリ | 必要なデータの選択に使用するSQLクエリを入力します。例:SELECT * FROM Employee |
フェッチサイズ | メモリのパフォーマンスのフェッチサイズを入力します。空白の場合、デフォルト値は1000です。値に対してメモリー不足の例外が発生した場合、フェッチサイズを縮小します。 |
クエリパラメーター | クエリパラメーターの値を入力します。この値は、クエリパラメーターの初期値となります。最終実行日はオプションです。指定しない場合はデフォルトで「1700年2月1日」となります。例:!{lastvalue:_id}!=1,{lastrundate:start_date}!=02/01/1944 |
検証タイプ |
検証タイプを選択します。 検証なし:検証を実行しません。 検証スキーマ:現在のスキーマと直前のスキーマを検証し、スキーマが同じではない場合、ジョブの実行が失敗します。 |
検証手段 |
検証するケースを選択します。 列名の大文字と小文字を区別:現在の列名と直前の列名が同じで大文字・小文字のみが異なる場合、列名が一致するとはみなしません。 列の順序:現在の列と直前の列が同じ順序ではない場合、列名が一致するとはみなしません。 |
Booleanの形式 |
返されるデータにおけるBooleanの形式を選択します。 1 = true、0 = false:すべてのBoolean型のデータ列で、真の場合は1を返し、その他の場合は0を返します。 t = true、f = false:すべてのBoolean型のデータ列で、真の場合はtを返し、その他の場合はfを返します。 T = true、F = false:すべてのBoolean型のデータ列で、真の場合はTを返し、その他の場合はFを返します。 true = true、false = false:すべてのBoolean型のデータ列で、真の場合はtrueを返し、その他の場合はfalseを返します。 |
タイムアウトクエリ(オプション) | 使用されるクエリタイムアウト値を入力します。 |
スケジュール設定
このコネクター特有のスケジュール設定機能により、データのマージ(アップサート)を実現します。この方法では、更新された行はすべて置き換えられ、新しい行は追加されます。
更新されたデータを正確に結合するには、データ中の「結合キー」を特定する必要があります。結合キーは、プライマリーキーまたはDataSetに固有の列の組み合わせとすることができます。バージョンが異なるDataSetの行を比較するのに用いられます。SELECT文でCONCAT()機能を使用して、複雑な結合キーを作成できます。このDataSetの結合キーがはっきりわからない場合は、データベースを所有するDBA、またはDomo管理者に問い合わせてください。
その他のペイン
スケジュール設定、再試行、更新に関するオプションなど、コネクターインターフェースのその他のペインに表示されるオプションについては、「データコネクターを使用してDataSetを追加する」を参照してください。
コメント
0件のコメント
サインインしてコメントを残してください。