メタデータを同期する(Microsoft Purview)

このガイドでは、MashuがMicrosoft Purviewからメタデータを同期するための設定手順を説明します。設定は、Purview側での権限設定とMashu側での接続設定の2つのステップで構成されます。

1. Microsoft Purview側の設定

はじめに、MashuがPurviewへ接続するためのサービスプリンシパルを作成し、必要な権限を付与します。

1.1. サービスプリンシパル(アプリ)の登録と認証情報の発行

  • Azure Portalにサインインし、App registration(アプリの登録) へ移動します。

  • 「新規登録」をクリックし、任意の名前(例: ForMashu)を入力してアプリを登録します。

登録が完了すると、アプリの概要ページが表示されます。以下の2つの値をコピーし控えてください。 

  • アプリケーション (クライアント) ID
  • ディレクトリ (テナント) ID

  • 左側のメニューから 「証明書とシークレット」を選択し、「新しいクライアントシークレット」をクリックします。
  • 説明を入力し、有効期限を選択して「追加」をクリックします。
  • 生成されたクライアントシークレットの「値」 をコピーして控えます。この値はページを離れると二度と表示されないため、必ずこのタイミングで保存してください。

控える情報まとめ:

  • クライアントID
  • テナントID
  • クライアントシークレットの値

1.2. サービスプリンシパル(アプリ)への権限付与

作成したサービスプリンシパルに、Purviewコレクションのデータを読み取るための権限を付与します。

  • Microsoft Purview ガバナンスポータルを開き、「データ マップ」>「ドメイン」 へ移動します。
  • メタデータを同期したいコレクション(またはドメイン)を選択し、「ロールの割り当て」 タブを開きます。
  • 「データリーダー」 ロールの 「メンバー」 に、先ほど登録したサービスプリンシパル(アプリ名で検索)を追加して保存します。

2. Mashu 側の設定

次に、Mashuの画面でPurviewへの接続を設定します。

2.1 メタデータソースの作成

  • Mashuにログインし、データソース作成画面を開きます。

  • データソースのタイプとして 「Microsoft Purview」 を選択して、新しいデータソースを作成します。

2.2 接続情報設定

データソース画面の「接続設定」タブで、Microsoft Purview への接続情報を設定します。

  • テナントID(TenantId): 1.1 で控えた「テナントID」を指定します。
  • クライアントID(ClientId): 1.1 で控えた「クライアントID」を指定します。
  • クライアントシークレット(ClientSecret): 1.1. で控えた「クライアントシークレットの値」を指定します。

「保存する」ボタンを押下して接続情報を保存します。

2.3 コレクション選択

接続設定が正しく保存されると、サービスプリンシパルに権限を付与したPurviewコレクションの一覧が表示されます。メタデータを同期したいコレクションを選択してください。選択したコレクション配下のすべてのデータ資産(アセット)が同期対象となります。

2.4 データソース設定(メタデータ同期オプション)

「データソース設定」タブでは、メタデータの同期に関する3つのオプション(マッピング、マージ、同期対象)を設定できます。

2.4.1. マッピング設定

Purviewの「説明」を、Mashuのどの項目(エイリアス/説明)に対応させるかを設定します。

  • データ資産の説明のマッピング先:
    • エイリアス: データ資産の説明をMashuメタデータの「エイリアス」にマッピングします。
    • 説明: データ資産の説明をMashuメタデータの「説明」にマッピングします。
    • エイリアスと説明: 両方にマッピングします。
  • カラムの説明のマッピング先:
    • エイリアス: カラムの説明をMashuカラムの「エイリアス」にマッピングします。
    • 説明: カラムの説明をMashuカラムの「説明」にマッピングします。
    • エイリアスと説明: 両方にマッピングします。

2,4.2. メタデータマージ設定
2回目以降の同期時に、Purviewの「データ資産の説明」と「カラムの説明」でMashu上の「エイリアス」と「説明」を上書きする際のルールを設定します。

  • メタデータのエイリアスを上書きする: ONにすると、「データ資産の説明」でMashu メタデータのエイリアスを上書きします。
  • メタデータの説明を上書きする: ONにすると、「データ資産の説明」でMashu メタデータの説明を上書きします。
  • カラムのエイリアスを上書きする: ONにすると、「カラムの説明」でMashu カラムのエイリアスを上書きします。
  • カラムの説明を上書きする: ONにすると、「カラムの説明」でMashuカラムの説明を上書きします。

2.4.3 同期対象設定
Purview から同期するデータ資産の種類を選択します。チェックを外した種類のデータ資産は同期されません。

2.5 メタデータ同期の実行

「メタデータ」タブに移動し、「メタデータ同期」ボタンをクリックすることで、Purview からのメタデータ同期が開始されます。