Amazon DataZone: 人とデータをつなぐ

概要

チーム間でシームレスにコラボレーションし、データや分析ツールへのセルフサービスアクセスを提供することで、ビジネスチームの効率を高めます。ビジネス用語を使用して、AWS、オンプレミス、またはサードパーティープロバイダーに保存されているカタログ化されたデータを検索、共有、およびアクセスします。使用したいデータについて詳しくは、ビジネス用語集をご覧ください。

Page Topics

主な特徴

主な特徴

プロジェクトは、ユーザーのグループが互いに協力し合い、ビジネス成果を生み出すのに役立ちます。プロジェクトメンバーは、1 つ以上の分析ワークフローを使用してビジネスデータカタログのアセットを消費し、1 つ以上の分析ワークフローを使用して新しいアセットを作成します。データプロジェクトを使用すると、使用状況の監査機能によりプロジェクト全体のデータアセットを管理および監視できます。プロジェクトに明示的に追加されたユーザーだけが、プロジェクトのデータとツールにアクセスできます。

データパブリッシャーはすべてのアセットをインベントリに入れ、アセットを共有する前に、他のユーザーがビジネスコンテキストでデータをエンリッチさせることができます。ユーザー間のシームレスなハンドシェイクは Amazon DataZone ポータルによって管理されます。このポータルは、セルフサービス方式でデータや分析ツールを操作しながら、部門横断的なコラボレーションを促進するコンソール外のエクスペリエンスです。ポータルは ID プロバイダーからの既存の認証情報を使用します。

お好みの BI および分析ツールを活用して、管理対象データを簡単に分析できます。Amazon DataZone は、Athena JDBC ドライバーを通じた認証をサポートするため、サブスクライブしたデータレイクアセットに対するシームレスなアクセスが可能です。Tableau、Domino、Power BI、Excel、SQL Workbench、DBeaver などの一般的なツールに接続して、強化されたインサイトを得ることができます。

ユースケース

アナリストやデータサイエンティストに、組織全体のデータを発見、アクセス、準備、分析、レポートするための統合データ管理ポータルを提供します。単一のポータルにより、データエンジニアや IT 管理者とのコラボレーションが容易になり、データからより迅速にインサイトを得ることができます。データガバナンスの一元化と分散化の適切なバランスを実現することで、ビジネスチームが IT チームに依存せずに機敏に対応できるようになるとともに、データガバナンスポリシーの順守とコンプライアンスを確保できます。

データチームの可視性とアクセスを向上させ、データがどこに保存されているかをより簡単に検索し、分析できるようにします。ソースからメタデータを取得してデータを信頼できるようにすることで、適切なレベルのデータガバナンスを実現します。データの可視性が向上すれば、データを扱うすべての人にコピーを作成する必要がなくなります。

Amazon Simple Storage Service (Amazon S3) データレイクAmazon Relational Database Service (Amazon RDS) などの AWS 目的別データベースの多く、70 を超える AWS Glue クローラーを使用するその他のデータソースから、メタデータをカタログ化します。AWS Glue を 100 以上の Amazon AppFlow コネクタと統合することで、はるかに多くのデータソースをカタログ化して、組織全体でデータを表示して利用できるようになり、サイロ化されたデータや隠れたデータを排除できるようになりました。 

よくある質問

自分の組織全体のユーザーが Amazon DataZone ポータルにアクセスするにはどうすればいいですか?

Amazon DataZone を最初にセットアップするとき、管理者は自分の AWS 認証情報を使用してルートドメインをデプロイし、AWS IAM アイデンティティセンターを通じてルートドメインへのアクセスを有効にすることもできます。その後、ユーザーは IAM または SSO 認証情報を使用して Amazon DataZone ポータルにアクセスできるため、既存の ID プロバイダーを使用してポータルにシームレスにアクセスできます。既存のユーザーとグループをデータスチュワードとして割り当てることも、特定のプロジェクトに関連付けることもできます。