使用 Amazon SageMaker 進行 ML 管理

簡化存取控制並增強透明度

為什麼要進行 ML 管控

Amazon SageMaker AI 提供專用的管理工具來協助您負責任地執行 ML。透過 Amazon SageMaker Role Manager,管理員可在幾分鐘之內定義最小許可。Amazon SageMaker Model Cards 可以更輕鬆地儲存、擷取與共享從概念到部署的基本模型資訊,例如用途、風險評級和訓練詳細資訊。Amazon SageMaker Model Dashboard 會通知您單一位置的生產中模型行為。整合 Amazon SageMaker AI 與 Amazon DataZone,讓簡化 ML 和資料控管變得更輕鬆。

SageMaker ML 管控的優勢

在幾分鐘內佈建具備企業級安全控制的 ML 開發環境,管理對專案中的 ML 和資料資產的存取。
產生自訂角色,讓機器學習 (ML) 從業人員能夠更快地開始使用 SageMaker
簡化模型文件並提供從概念到部署的主要假設、特性和成品的可見性
透過統一檢視快速稽核所有模型、端點和模型監控任務的效能,並進行疑難排解。使用自動化提醒追蹤與預期模型行為的偏差,以及遺失或非作用中的監控任務

與 Amazon DataZone 整合

設定控制與佈建

IT 管理員可在 Amazon DataZone 中定義您的企業和使用案例特定的基礎設施控制與許可。然後,您只需點按幾下,即可建立適當的 SageMaker 環境,並在 SageMaker Studio 中啟動開發程序。

搜尋和探索資產

在 SageMaker Studio 中,您可有效地搜尋和探索組織企業型錄中的資料和 ML 資產。您還可透過訂閱,來請求存取您可能需要在專案中使用的資產。

搜尋和探索資產

取用資產

您的訂閱請求獲得核准後,即可使用 JupyterLab 和 SageMaker Canvas,在 ML 任務中取用這些訂閱的資產,例如 SageMaker Studio 內的資料準備、模型訓練和特徵工程等。

發佈資產

完成 ML 任務後,您可將資料、模型和特徵群組發佈到業務型錄,以便其他使用者進行控管和探索。

發佈資產

定義許可

簡化 ML 活動的許可

SageMaker Role Manager 透過預先建置的 AWS Identity and Access Management (IAM) 政策型錄,為 ML 活動和角色提供一組基線許可。ML 活動可包含資料準備和訓練,角色可包含 ML 工程師和資料科學家。您可以保留基準許可,或根據您的特定需求進一步自定許可。

Role Manager 簡化許可

自動產生 IAM 政策

透過一些自助提示,您可以快速輸入常見的治理建構模組,例如網路存取邊界和加密金鑰。SageMaker Role Manager 接著會自動產生 IAM 政策。您可以透過 AWS IAM 主控台發現產生的角色與關聯的政策。

連接您的受管政策

若要進一步針對您的使用案例客製化許可,請將您的受管 IAM 政策連接到使用 SageMaker Role Manager 建立的 IAM 角色。您也可以新增標籤,以協助識別和組織各個 AWS 服務的角色。

附接您的受管政策

簡化文件

擷取模型資訊

SageMaker Model Cards 是 Amazon SageMaker Console 中模型資訊的儲存庫,可幫助您集中和標準化模型文件,以便您可以負責任地執行 ML。您可以自動填入訓練細節,例如輸入資料集、訓練環境還有訓練結果,以加速文件編制流程。您還可以新增模型用途和效能目標等詳細資訊。

SageMaker 主控台中的模型資訊

視覺化評估結果

您可以將模型評估結果附加至模型卡,例如偏差和品質指標,並新增視覺化效果,例如圖表,以獲得對模型效能的關鍵見解。

模型卡視覺化評估結果

共享模型卡

您可以將 Model Cards 匯出為 PDF 格式,以便更輕鬆地共享給業務利益相關者、內部團隊或您的客戶。

模型監控

追蹤模型行為

SageMaker Model Dashboard 為您提供部署模型和端點的全面概觀,讓您可追蹤單一位置的資源和模型行為違規情況。您可以從四個維度監控模型行為:資料品質、模型品質、偏差漂移以及特徵歸因漂移。SageMaker Model Dashboard 透過與 Amazon SageMaker Model Monitor 和 Amazon SageMaker Clarify 整合來監控行為。

模型儀表板

自動化提醒

SageMaker Model Dashboard 提供一種整合體驗,可針對缺失和非作用中模型監控任務,以及模型行為偏差來設定和接收提醒。

自動化提醒

疑難排解模型偏差

您可以進一步檢查各個模型,並分析隨著時間影響模型效能的因素。接著您就能聯繫 ML 從業人員以採取修正措施。