Amazon Redshift コネクタ

カテゴリ: データベースコネクタ

はじめに

本書は、mindzieDataDesigner の Amazon Redshift データベースコネクタのセットアップを支援するために作成されました。mindzieDataDesigner は mindzieStudio で使用される ETL ツールで、データベーステーブルをプロセスマイニングのイベントログに変換します。本書の目的は、接続文字列の作成方法および必要に応じてファイアウォールのポート開放方法を支援することです。

概要

Amazon Redshift コネクタは、大規模な分析ワークロードやプロセスマイニングのシナリオに適した、Redshift クラスターへの最適化された接続性を提供します。

システム要件

  • クラウドプラットフォーム: Amazon Web Services (AWS)
  • データベースシステム: Amazon Redshift クラスター
  • 認証: データベース資格情報、IAM 認証
  • ネットワーク: VPC 設定、セキュリティグループ
  • 依存関係: Amazon Redshift .NET ドライバー

接続文字列の形式

基本形式

Server=cluster-endpoint.region.redshift.amazonaws.com;Port=5439;Database=database_name;User ID=username;Password=password;

接続パラメータ

パラメータ 説明 必須
Server Redshift クラスターのエンドポイント はい mycluster.abc123.us-east-1.redshift.amazonaws.com
Port ポート番号 いいえ 5439 (デフォルト)
Database データベース名 はい analytics
User ID ユーザー名 はい mindzie_user
Password パスワード はい SecurePassword123
SSL SSL 有効化 いいえ true
Connection Timeout 接続タイムアウト いいえ 60

接続例

標準 Redshift 接続

Server=mycluster.abc123.us-east-1.redshift.amazonaws.com;Port=5439;Database=process_analytics;User ID=mindzie_user;Password=SecurePassword123;SSL=true;

IAM 認証

Server=mycluster.abc123.us-east-1.redshift.amazonaws.com;Port=5439;Database=analytics;User ID=IAM:iam_user;Password=temp_password;SSL=true;

Redshift Serverless

Server=workgroup.account.region.redshift-serverless.amazonaws.com;Port=5439;Database=dev;User ID=admin;Password=password;SSL=true;

トラブルシューティング

よくある問題

「接続タイムアウト」エラー

  • VPC セキュリティグループおよびネットワーク ACL を確認してください
  • 必要に応じて Redshift クラスターがパブリックにアクセス可能か確認してください
  • クラスターエンドポイントの DNS 解決を検証してください

「認証に失敗しました」エラー

  • ユーザー名とパスワードが正しいか確認してください
  • ユーザーにデータベースへの CONNECT 権限があるか確認してください
  • IAM 認証の場合は、適切なロールとポリシーが設定されていることを確認してください

「SSL 接続に失敗しました」エラー

  • 接続文字列に SSL=true が設定されていることを確認してください
  • 証明書検証設定をチェックしてください
  • ポート 5439 での SSL 接続をネットワークが許可していることを確認してください

mindzie サーバーアクセス: セキュリティ向上のため、ファイアウォールを設定して特定の mindzie サーバーの IP アドレスのみからの接続を許可することが可能です。ご使用中の mindzie サーバーの最新 IP アドレスは mindzie サポートにお問い合わせください。

関連情報


💡 ヒント: Redshift の COPY コマンドを使用して、大量のプロセスデータセットを S3 から効率的にロードし、タイムスタンプ列にソートキーを活用して時間ベースのプロセス分析クエリを高速化しましょう。