Amazon SageMaker 데이터 및 AI 거버넌스 FAQ

데이터 및 AI 거버넌스

차세대 Amazon SageMaker는 레이크하우스, AI 모델, 애플리케이션 전반에서 데이터 및 AI에 대한 검색, 거버넌스, 협업을 간소화합니다. Amazon DataZone에 구축된 Amazon SageMaker Catalog를 사용하면 사용자는 생성형 AI가 생성한 메타데이터를 사용하는 시맨틱 검색으로 승인된 데이터 및 모델을 안전하게 검색하고 액세스할 수 있습니다. 아니면 그냥 자연어를 사용하여 Q Developer에게 데이터를 찾으라고 요청할 수도 있습니다. 사용자는 SageMaker Unified Studio(평가판)에서 중앙 집중식으로 세분화된 액세스 제어가 포함된 단일 권한 모델을 사용하여 액세스 정책을 일관되게 정의하고 적용할 수 있습니다. 간편한 게시/구독 워크플로를 통해 데이터 및 AI 자산을 원활하게 공유하고 협업합니다. Amazon SageMaker를 사용하면 Amazon Bedrock 가드레일을 사용하여 AI 모델을 보호하고 책임 있는 AI 정책을 구현할 수 있습니다. 데이터 품질 모니터링 및 자동화, 민감한 데이터 탐지, 데이터 및 ML 계보를 통해 조직 전체에 신뢰를 구축합니다.

데이터 및 AI 개발을 위한 단일 환경인 Amazon SageMaker Unified Studio(평가판)를 통해 SageMaker Catalog에 액세스할 수 있습니다. SageMaker Catalog에는 기존 프로세스를 프로그래밍 방식으로 설정, 구성 또는 통합할 수 있도록 기존 Amazon DataZone API 사용 방법에 대한 지침과 함께 API가 게시되어 있습니다.

  • 팀 간 데이터 검색 및 공유의 어려움: 데이터 생산자 및 소비자는 조직 전체에서 관련 데이터세트를 신속하게 찾고 공유하는 데 어려움을 겪는 경우가 많습니다. 이러한 비효율성은 데이터 검색에 시간을 낭비하고 협업을 제한합니다.
  • 데이터 품질 및 AI 모델 출력에 대한 신뢰 부족: 조직은 데이터 출처, 품질 및 액세스 패턴에 대한 가시성 부족으로 인해 데이터 품질과 AI 모델 출력의 정확성을 신뢰하는 데 어려움을 겪습니다.
  • 일관성 없는 데이터 액세스 및 개인 정보 침해: 조직은 일관된 데이터 액세스 정책을 시행하는 데 어려움을 겪고 있으며 이로 인해 민감한 정보에 대한 무단 액세스가 발생할 수 있습니다.
  • 규정 및 내부 정책 준수 유지의 어려움: 조직은 포괄적인 감사 및 모니터링 도구의 부족으로 인해 규정 준수를 유지하고 내부 정책을 준수하는 데 어려움을 겪습니다.

Amazon SageMaker의 데이터 및 AI 거버넌스는 데이터 팀에 다음과 같은 이점을 제공합니다.

  • 데이터 검색 및 협업 속도 향상: 사용자는 조직 전체에서 관련 데이터를 빠르게 찾고 공유할 수 있으므로 정보 검색에 소요되는 시간을 줄이고 팀워크를 증진할 수 있습니다.
  • 계보 및 품질을 통한 신뢰 제고: 데이터 출처를 추적하고 데이터 품질을 개선하여 데이터 기반 의사 결정과 AI 모델 출력에 대한 신뢰도를 높입니다.
  • 데이터 및 AI 모델 보안 강화: 프로젝트를 통해서만 데이터 및 모델에 액세스할 수 있도록 보호하므로 프로젝트의 자산을 볼 권한이 있는 사용자만 액세스할 수 있도록 보장하고 보안 및 프라이버시 표준을 유지합니다.
  • 비즈니스 위험 감소 및 규정 준수 지원: 활동 로깅은 조직이 산업 규정 및 내부 정책을 준수하도록 지원하여 조직 위험을 줄이는 데 도움이 됩니다.
  • 자산 검색 및 발견을 통한 비즈니스 생산성 향상: 데이터 및 AI 자산을 검색하여 팀의 역량을 강화하고, 중요 자산을 찾는 데 소요되는 시간을 줄이고, 데이터 기반 의사 결정을 더 빠르게 추진합니다.
  • 중앙 집중식 데이터 액세스 정책 관리: 단일 지점에서 데이터 액세스 규칙을 정의하고 관리하여 다양한 AWS 서비스 및 서드 파티 환경에서 일관되게 적용할 수 있습니다.
  • 비즈니스 컨텍스트 및 분류를 통한 데이터 보강: 사용자가 데이터 관련성과 특정 비즈니스 요구에 대한 적용 가능성을 쉽게 이해할 수 있도록 데이터세트에 메타데이터 및 분류를 추가합니다.
  • 사용자 및 시스템 활동 로깅: 데이터 및 AI 시스템과의 상호 작용을 모니터링하고 기록하여 사용 패턴 및 잠재적 보안 문제에 대한 가시성을 제공합니다.
  • AI/ML 데이터 거버넌스 구현: 데이터 거버넌스 원칙을 AI 및 기계 학습 프로세스로 확장하여 승인된 데이터만 모델 훈련에 사용하고 AI 시스템이 정의된 권한 및 윤리 지침을 준수하도록 합니다.

Amazon SageMaker Catalog는 Amazon DataZone을 기반으로 구축되어 통합된 사용자 경험에서 동일한 거버넌스 기능을 제공합니다. 기존 Amazon DataZone 고객이 원하는 경우 익숙한 인터페이스를 계속 사용할 수 있도록 Amazon DataZone 경험은 그대로 유지됩니다.

요금 세부 정보는 https://thinkwithwp.com/datazone/pricing/에서 확인할 수 있습니다.