このガイドでは、MashuがMicrosoft Purviewからメタデータを同期するための設定手順を説明します。設定は、Purview側での権限設定とMashu側での接続設定の2つのステップで構成されます。
1. Microsoft Purview側の設定
はじめに、MashuがPurviewへ接続するためのサービスプリンシパルを作成し、必要な権限を付与します。
1.1. サービスプリンシパル(アプリ)の登録と認証情報の発行
-
Azure Portalにサインインし、App registration(アプリの登録) へ移動します。
-
「新規登録」をクリックし、任意の名前(例: ForMashu)を入力してアプリを登録します。
登録が完了すると、アプリの概要ページが表示されます。以下の2つの値をコピーし控えてください。
- アプリケーション (クライアント) ID
- ディレクトリ (テナント) ID
- 左側のメニューから 「証明書とシークレット」を選択し、「新しいクライアントシークレット」をクリックします。
- 説明を入力し、有効期限を選択して「追加」をクリックします。
- 生成されたクライアントシークレットの「値」 をコピーして控えます。この値はページを離れると二度と表示されないため、必ずこのタイミングで保存してください。
控える情報まとめ:
- クライアントID
- テナントID
- クライアントシークレットの値
1.2. サービスプリンシパル(アプリ)への権限付与
作成したサービスプリンシパルに、Purviewコレクションのデータを読み取るための権限を付与します。
- Microsoft Purview ガバナンスポータルを開き、「データ マップ」>「ドメイン」 へ移動します。
- メタデータを同期したいコレクション(またはドメイン)を選択し、「ロールの割り当て」 タブを開きます。
- 「データリーダー」 ロールの 「メンバー」 に、先ほど登録したサービスプリンシパル(アプリ名で検索)を追加して保存します。
2. Mashu 側の設定
次に、Mashuの画面でPurviewへの接続を設定します。
2.1 メタデータソースの作成
-
Mashuにログインし、データソース作成画面を開きます。
-
データソースのタイプとして 「Microsoft Purview」 を選択して、新しいデータソースを作成します。
2.2 接続情報設定
データソース画面の「接続設定」タブで、Microsoft Purview への接続情報を設定します。
- テナントID(TenantId): 1.1 で控えた「テナントID」を指定します。
- クライアントID(ClientId): 1.1 で控えた「クライアントID」を指定します。
- クライアントシークレット(ClientSecret): 1.1. で控えた「クライアントシークレットの値」を指定します。
「保存する」ボタンを押下して接続情報を保存します。
2.3 コレクション選択
接続設定が正しく保存されると、サービスプリンシパルに権限を付与したPurviewコレクションの一覧が表示されます。メタデータを同期したいコレクションを選択してください。選択したコレクション配下のすべてのデータ資産(アセット)が同期対象となります。
2.4 データソース設定(メタデータ同期オプション)
「データソース設定」タブでは、メタデータの同期に関する3つのオプション(マッピング、マージ、同期対象)を設定できます。
2.4.1. マッピング設定
Purviewの「説明」を、Mashuのどの項目(エイリアス/説明)に対応させるかを設定します。
- データ資産の説明のマッピング先:
- エイリアス: データ資産の説明をMashuメタデータの「エイリアス」にマッピングします。
- 説明: データ資産の説明をMashuメタデータの「説明」にマッピングします。
- エイリアスと説明: 両方にマッピングします。
- カラムの説明のマッピング先:
- エイリアス: カラムの説明をMashuカラムの「エイリアス」にマッピングします。
- 説明: カラムの説明をMashuカラムの「説明」にマッピングします。
- エイリアスと説明: 両方にマッピングします。
2,4.2. メタデータマージ設定
2回目以降の同期時に、Purviewの「データ資産の説明」と「カラムの説明」でMashu上の「エイリアス」と「説明」を上書きする際のルールを設定します。
- メタデータのエイリアスを上書きする: ONにすると、「データ資産の説明」でMashu メタデータのエイリアスを上書きします。
- メタデータの説明を上書きする: ONにすると、「データ資産の説明」でMashu メタデータの説明を上書きします。
- カラムのエイリアスを上書きする: ONにすると、「カラムの説明」でMashu カラムのエイリアスを上書きします。
- カラムの説明を上書きする: ONにすると、「カラムの説明」でMashuカラムの説明を上書きします。
2.4.3 同期対象設定
Purview から同期するデータ資産の種類を選択します。チェックを外した種類のデータ資産は同期されません。
2.5 メタデータ同期の実行
「メタデータ」タブに移動し、「メタデータ同期」ボタンをクリックすることで、Purview からのメタデータ同期が開始されます。
