Häufig gestellte Fragen zu AWS Clean Rooms

Allgemeines

AWS Clean Rooms erleichtert es Ihnen und Ihren Partnern, Ihre kollektiven Datensätze zu analysieren und gemeinsam zu bearbeiten, um neue Erkenntnisse zu gewinnen, ohne die zugrunde liegenden Daten gegenseitig preiszugeben. Sie können in wenigen Minuten ihre eigenen Clean Rooms erstellen und mit wenigen Schritten mit der Analyse ihrer gemeinsamen Datensätze mit Ihren Partnern beginnen. Mit AWS Clean Rooms können Sie problemlos mit jedem Unternehmen in AWS und Snowflake zusammenarbeiten, ohne dass eine Partei ihre zugrunde liegenden Datensätze verschieben, veröffentlichen oder kopieren muss.

Bei AWS Clean Rooms handelt es sich um sichere logische Grenzen, die es den Mitgliedern der Zusammenarbeit ermöglichen, SQL-Abfragen auszuführen und ML-Modellierungen durchzuführen, ohne Rohdaten mit ihren Partnern teilen zu müssen. Nur Unternehmen, die zum Zusammenarbeitsbereich eingeladen wurden, können daran teilnehmen. Mehrere Teilnehmer können Daten zu einem Zusammenarbeitsbereich beitragen, und ein Mitglied kann Ergebnisse erhalten. Nur Unternehmen, die eingeladen wurden, können über AWS Clean Rooms einer Zusammenarbeit beitreten.

In der AWS-Managementkonsole können Sie auswählen, welche Art von Analyse Sie durchführen möchten, mit welchen Partnern Sie zusammenarbeiten möchten und welche Datensätze Sie zu einer Zusammenarbeit beitragen möchten. Mit AWS Clean Rooms können Sie zwei Arten von Analysen durchführen: SQL-Abfragen und Machine Learning.

Wenn Sie SQL- oder Spark-SQL-Abfragen ausführen, liest AWS Clean Rooms die Daten dort, wo sie sich befinden, und wendet integrierte, flexible Analyseregeln an, damit Sie die Kontrolle über Ihre Daten behalten. AWS Clean Rooms bietet eine breite Palette datenschutzfreundliche SQL-Kontrollen, einschließlich Abfragekontrollen, Abfrageausgabebeschränkungen und Abfrageprotokollierung, mit denen Sie die Beschränkungen für die von jedem Clean-Room-Teilnehmer ausgeführten Abfragen anpassen können. Sie können die Spark-Analytik-Engine verwenden, um Abfragen mithilfe des Spark-SQL-Dialekts in Zusammenarbeiten mit AWS Clean Rooms auszuführen. AWS Clean Rooms Spark SQL bietet konfigurierbare Rechengrößen, um mehr Flexibilität bei der Anpassung und Zuweisung von Ressourcen für die Ausführung von SQL-Abfragen auf der Grundlage Ihrer Leistungs-, Skalierungs- und Kostenanforderungen zu bieten. AWS Clean Rooms Spark SQL ist nur für die benutzerdefinierte Analyseregel verfügbar. AWS Clean Rooms Differential Privacy hilft Ihnen, die Privatsphäre Ihrer Benutzer mit mathematisch gestützten und intuitiven Steuerelementen mit wenigen Klicks zu schützen. Mit der SQL-Analytik-Engine können Sie AWS Clean Rooms Differential Privacy verwenden, indem Sie eine benutzerdefinierte SQL-Analyseregel auswählen und dann Ihre gewünschten differenziellen Datenschutzparameter konfigurieren. Und Cryptographic Computing for Clean Rooms (C3R) hilft Ihnen dabei, vertrauliche Daten während Ihrer SQL-Analysen zu verschlüsseln, wenn Sie die Spark-Analytik-Engine oder die SQL-Analytik-Engine zur Ausführung Ihrer Abfragen verwenden. Um AWS Clean Rooms Differential Privacy anzuwenden oder Aggregations- oder Listenanalyseregeln in einer Zusammenarbeit zu verwenden, müssen Sie SQL als Analytik-Engine verwenden.

AWS Clean Rooms ML hilft Ihnen und Ihren Partnern, datenschutzfreundliches Machine Learning (ML) anzuwenden, um prädiktive Erkenntnisse zu gewinnen, ohne Rohdaten freigeben zu müssen. AWS Clean Rooms ML unterstützt benutzerdefinierte und Lookalike-Machine-Learning-Modellierung. Mit der benutzerdefinierten Modellierung können Sie ein benutzerdefiniertes Modell für das Training erstellen und Inferenzen auf kollektiven Datensätzen ausführen, ohne die zugrunde liegenden Daten oder das geistige Eigentum unter den Mitarbeitern zu teilen. Mit der Lookalike-Modellierung können Sie ein von AWS erstelltes Modell verwenden, um einen erweiterten Satz ähnlicher Profile zu generieren, der auf einer kleinen Stichprobe von Profilen basiert, die Ihre Partner in eine Zusammenarbeit einbringen.

AWS Clean Rooms ML-Lookalike-Modelling, das ein von AWS erstelltes Modell verwendet, wurde für eine Vielzahl von Datensätzen wie E-Commerce und Streaming-Video erstellt und getestet und kann Kunden dabei helfen, die Genauigkeit des Lookalike-Modellings im Vergleich zu repräsentativen Branchen-Baselines um bis zu 36 % zu verbessern. In realen Anwendungen wie bei der Suche nach neuen Kunden kann diese Verbesserung der Genauigkeit zu Einsparungen in Millionenhöhe führen.

Über die AWS-Managementkonsole oder API-Vorgänge erstellen Sie eine Clearn-Room-Kollaboration, laden die Unternehmen ein, mit denen Sie zusammenarbeiten möchten, und wählen die Fähigkeiten aus, die jeder Teilnehmer innerhalb der Kollaboration hat. Die Teilnehmer können dann Regeln dafür einrichten, wie strukturierte Daten abgefragt werden können, und ML-Modelle anhand ihrer Daten trainieren. Datensätze werden nicht von den Konten der Teilnehmer kopiert und nur bei Bedarf abgerufen. Mit AWS Clean Rooms können Sie wählen, welche Art von Analyse Sie durchführen möchten: SQL-Abfragen und ML-Modellierung mithilfe von AWS Clean Rooms ML. Bei der Verwendung von SQL-Abfragen verwenden Sie auch zusätzliche Funktionen wie den No-Code Analysis Builder, AWS Clean Rooms Differential Privacy und Cryptographic Computing. Sobald die Kollaborationsteilnehmer einer Zusammenarbeit Daten oder Modelle zugeordnet haben und Analysen ausgeführt wurden, werden die Ergebnisse der Zusammenarbeit in einem dafür vorgesehenen Amazon Simple Storage Service (Amazon S3) -Bucket gespeichert.

AWS Clean Rooms kann Daten von Amazon S3, Amazon Athena oder Snowflake verwenden, ohne dass Sie Ihre zugrunde liegenden Datensätze verschieben, anzeigen oder kopieren müssen. AWS Clean Rooms liest Daten aus der Quelle, wenn Abfragen ausgeführt werden, wodurch die Komplexität und die Kosten der Replikation von Datensätzen in eine separate Umgebung vermieden werden. Erfahren Sie hier mehr über die Unterstützung mehrerer Clouds und Datenquellen durch AWS Clean Rooms.

AWS Clean Rooms unterstützt bis zu fünf Teilnehmer pro Zusammenarbeitsbereich.

Sie bestimmen, wer an Ihrer Zusammenarbeit mit AWS Clean Rooms teilnehmen kann, und Sie können eine Zusammenarbeit erstellen oder einer Einladung zur Zusammenarbeit beitreten. Die Teilnahme an einem Zusammenarbeitsbereich ist für alle Teilnehmer transparent und es können keine neuen Konten hinzugefügt werden, nachdem der Zusammenarbeitsbereich erstellt wurde. Sie können jedoch bei Bedarf neue Zusammenarbeitsbereiche mit anderen Kunden oder Partnern einrichten. Sie erstellen und verwalten den Zugriff auf Ihre Inhalte und auch den Zugriff auf AWS-Services und -Ressourcen über Benutzer, Gruppen, Berechtigungen und Anmeldeinformationen, die Sie kontrollieren.

Kunden können mithilfe der SQL- oder AWS-Clean-Rooms-ML-Modellierung für ihre kollektiven Datensätze Erkenntnisse mit ihren Partnern generieren – ohne die zugrunde liegenden Daten zu teilen oder preiszugeben.

Mit SQL können mehrere Mitarbeiter Daten beitragen, aber nur ein Mitarbeiter kann SQL-Abfragen ausführen und nur einer kann die Ergebnisse erhalten. Beim Beitritt zu einer Kollaboration vereinbaren die Mitarbeiter, welche Partei die Abfragen durchführt, welche Partei die Ergebnisse erhält und welche Partei für die Rechenkosten verantwortlich ist. Nur diejenigen, die Sie zu dieser Zusammenarbeit einladen, können auf der Grundlage der von Ihnen festgelegten Analyseregeln Erkenntnisse gewinnen. Wenn Sie eine AWS-Clean-Rooms-Kollaboration einrichten, können Sie für jedes Kollaborationsmitglied unterschiedliche Fähigkeiten angeben, um Ihren spezifischen Anwendungsfällen gerecht zu werden. Wenn Sie beispielsweise möchten, dass die Abfrageausgabe an ein anderes Element gesendet wird, können Sie ein Mitglied als Abfrageausführer festlegen, der Abfragen schreiben kann, und ein anderes Mitglied als Empfänger der Abfrageergebnisse, der die Ergebnisse empfangen kann. Auf diese Weise kann der Ersteller der Zusammenarbeit sicherstellen, dass das Mitglied, das die Anfrage stellen kann, keinen Zugriff auf die Abfrageergebnisse hat.

Mit AWS Clean Rooms ML bringt ein Mitarbeiter die Stichprobe von Datensätzen, auf deren Grundlage er ähnliche Segmente von seinem Partner finden möchte. Die andere Partei hat die größere Population, aus der wir Lookalike-Segmente anhand ihrer Ähnlichkeit mit den Beispieldatensätzen generieren. AWS Clean Rooms ML sendet die ausgegebenen Lookalike-Segmente an ein Ziel, das von der Partei angegeben wird, die die größere Population mitbringt, von der wir die Lookalike-Segmente ableiten.

AWS Entity Resolution ist nativ in AWS Clean Rooms integriert. Sie können den regelbasierten oder auf Datendienstleistern basierenden Abgleich verwenden, um Ihre Benutzerdaten mit den Daten Ihrer Partnerinnen und Partner aufzubereiten, abzugleichen und zu verknüpfen. Verwenden Sie dazu einen beliebigen gemeinsamen Schlüssel (z. B. pseudonymisierte Identifikatoren) im Rahmen einer datenschutzorientierten Zusammenarbeit mit AWS Clean Rooms. Um die AWS-Entity-Resolution-Matching-Funktionen in einer Zusammenarbeit anzuwenden, müssen Sie in Amazon S3 gespeicherte Daten verwenden.

AWS Clean Rooms ist verfügbar in USA Ost (Ohio), USA Ost (Nord-Virginia), USA West (Oregon), Asien-Pazifik (Seoul), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney), Asien-Pazifik (Tokio), Europa (Frankfurt), Europa (Irland), Europa (London) und Europa (Stockholm).

Mit AWS Clean Rooms können Sie flexible SQL-Analyseregeln und datenschutzverbesserndes ML verwenden, um Ihre Geschäftsanforderungen zu erfüllen. Wenn Sie die SQL-Analyse verwenden, können Sie flexibel wählen, welcher Mitarbeiter für die Rechenkapazität der in einer Kollaboration ausgeführten SQL-Abfragen bezahlt, und zwar in einer Reinraumverarbeitungseinheit (CRPU) – Stunden pro Sekunde (mit einer Mindestgebühr von 60 Sekunden). Wenn Sie AWS Clean Rooms ML verwenden, zahlen Sie nur für die von Ihnen angeforderten Modelltrainings und für die erstellten Ähnlichkeitssegmente auf Basis eines Preises pro 1 000 Profile. Weitere Informationen finden Sie unter Preise für AWS Clean Rooms.

Mit AWS Entity Resolution in AWS Clean Rooms können Sie einen regelbasierten oder auf Datendienstleistern basierenden Abgleich verwenden, der Anbieterdatensätze (wie LiveRamp) nutzt.

Wenn Sie den regelbasierten Abgleich verwenden, muss mindestens ein Mitglied einer Zusammenarbeit seine Daten vor dem Abgleich mit den Datensätzen seiner Mitarbeitenden aufbereiten, es sei denn, es hat seine Daten bereits mit AWS Entity Resolution vorbereitet, bevor es die Zusammenarbeit erstellt oder ihr beigetreten ist. Dieses Mitglied zahlt nur für die Datenaufbereitung, wenn sie verwendet wird. Jedes Mitglied, das an einer Zusammenarbeit teilnimmt, kann für den Datenabgleich bezahlen. Für den Datenabgleich ist außerdem eine einmalige Gebühr pro Zusammenarbeit erforderlich. Diese Gebühr wird allen Mitarbeitenden zugewiesen, die für den Datenabgleich bezahlen.

Wenn Sie den Abgleich basierend auf Datendienstleistern verwenden, müssen alle Zusammenarbeitsmitglieder über ein Abonnement des Dienstleisters verfügen, um ihre Daten mithilfe der Dienstleister-IDs aufbereiten zu können. Alle Zusammenarbeitsmitglieder müssen ihre Daten mithilfe von Dienstleister-IDs aufbereiten, bevor sie mit den Datensätzen ihrer Mitarbeitenden abgeglichen werden, es sei denn, sie haben ihre Daten bereits mit AWS Entity Resolution aufbereitet, bevor sie die Zusammenarbeit erstellt oder ihr beigetreten sind. Jedes Mitglied, das an einer Zusammenarbeit teilnimmt, kann für den Datenabgleich mittels Dienstleister-IDs bezahlen. Darüber hinaus muss das Mitglied, das für den Datenabgleich bezahlt, über ein Abonnement des Dienstleisters verfügen. Sie können die auf AWS Data Exchange (ADX) aufgeführten öffentlichen Abonnements verwenden oder ein privates Abonnement direkt beim Datendienstleister Ihrer Wahl erwerben und dann Bring Your Own Subscription (BYOS) für ADX verwenden. 

Weitere Informationen finden Sie unter Preisgestaltung von AWS Entity Resolution in AWS Clean Rooms.

AWS Clean Rooms ML

AWS Clean Rooms ML unterstützt Sie und Ihre Partner bei der Anwendung von datenschutzförderndem Machine Learning (ML), um prädiktive Insights zu generieren, ohne dass Sie Rohdaten miteinander teilen müssen. AWS Clean Rooms ML unterstützt benutzerdefinierte und Lookalike-Machine-Learning-Modellierung. Mit der benutzerdefinierten Modellierung können Sie ein benutzerdefiniertes Modell für das Training erstellen und Inferenzen auf kollektiven Datensätzen ausführen, ohne die zugrunde liegenden Daten oder das geistige Eigentum unter den Mitarbeitern zu teilen. Mit der Lookalike-Modellierung können Sie ein von AWS erstelltes Modell verwenden, um einen erweiterten Satz ähnlicher Profile zu generieren, der auf einer kleinen Stichprobe von Profilen basiert, die Ihre Partner in eine Zusammenarbeit einbringen.

AWS Clean Rooms ML hilft Kunden bei mehreren Anwendungsfällen. Werbetreibende können beispielsweise ihr proprietäres Modell und ihre Daten in eine Clean-Rooms-Zusammenarbeit einbringen und Publisher einladen, ihre Daten hinzuzufügen, um ein benutzerdefiniertes ML-Modell zu trainieren und bereitzustellen, das ihnen dabei hilft, die Effektivität ihrer Kampagnen zu steigern. Finanzinstitute können historische Transaktionsaufzeichnungen verwenden, um ein benutzerdefiniertes ML-Modell zu trainieren, und Partner zu einer Clean-Rooms-Zusammenarbeit einladen, um potenziell betrügerische Transaktionen zu erkennen; Forschungseinrichtungen und Krankenhausnetzwerke können Kandidaten finden, die bestehenden Teilnehmern an klinischen Studien ähneln, um klinische Studien zu beschleunigen; und Marken und Publisher können ähnliche Segmente von Kunden im Markt modellieren und hochrelevante Werbeerlebnisse liefern, ohne dass eines der Unternehmen die zugrunde liegenden Daten mit dem anderen teilt.

Mit der benutzerdefinierten Modellierung von AWS Clean Rooms ML können Sie Ihre eigenen Machine Learning (ML)-Modelle, -Algorithmen und -Daten in eine Zusammenarbeit mit Ihren Partnern einbringen, um ML-Modelle zu trainieren und Inferenzen auf kollektiven Datensätzen durchzuführen, ohne sensible Daten oder proprietäre ML-Modelle teilen zu müssen.

Die benutzerdefinierte Modellierung von AWS Clean Rooms ML unterstützt ML-Trainings- und ML-Inferenz-Workflows. Bei beiden Workflows definieren Sie zunächst eine AWS Clean Rooms Spark SQL-Abfrage, die zur Generierung eines Datensatzes für den Trainings- oder Inferenzschritt verwendet wird. Der Zwischendatensatz wird innerhalb der Clean Room-Zusammenarbeit aufbewahrt und kann nur für genehmigte AWS Clean Rooms ML-Aufgaben verwendet werden. Der zweite Schritt ist das Training oder die Inferenz des ML-Modells. ML-Modelle und Code werden in einem Container-Image verpackt. Ein trainiertes Modell kann in der Zusammenarbeit beibehalten und als Teil eines Inferenz-Workflows verwendet werden. Mit AWS Clean Rooms ML werden Ihre Daten nur zum Trainieren Ihres benutzerdefinierten Modells verwendet und nicht an andere Beteiligte weitergegeben oder für das Training von AWS-Modellen verwendet. Sie können Ihre Daten jederzeit aus Clean Rooms ML entfernen oder ein benutzerdefiniertes Modell löschen und datenschutzfördernde Kontrollen anwenden, um sensible Daten zu schützen, die Sie in eine Zusammenarbeit einbringen. Um die benutzerdefinierte Modellierung von AWS Clean Room ML anzuwenden, müssen Sie Spark SQL als Analyse-Engine verwenden.

Mit AWS Clean Rooms ML Lookalike Modeling können Sie ein von AWS erstelltes Modell verwenden, um einen erweiterten Satz ähnlicher Profile auf der Grundlage einer kleinen Stichprobe von Profilen zu generieren, die Ihre Partner in eine Zusammenarbeit einbringen, wobei die zugrunde liegenden Daten von Ihnen und Ihren Partnern geschützt werden. Sie können Ihre Partner in einen Clean Room einladen und das von AWS erstellte ML-Modell anwenden, das für jede Zusammenarbeit trainiert wird, um in wenigen Schritten Lookalike-Datensätze zu generieren. So sparen Sie sich monatelange Entwicklungsarbeit für den Aufbau, das Training, die Feinabstimmung und die Bereitstellung Ihres eigenen Modells. Die AWS-Clean-Rooms-ML-Lookalike-Modellierung wurde für verschiedene Datensätze wie E-Commerce und Streaming-Video entwickelt und getestet und kann Kunden dabei helfen, die Genauigkeit der Lookalike-Modellierung im Vergleich zu repräsentativen Branchen-Baselines um bis zu 36 % zu verbessern. In realen Anwendungen wie der Neukundenakquise kann diese Verbesserung der Genauigkeit zu Einsparungen in Millionenhöhe führen.

AWS Clean Rooms ML Lookalike Modeling nimmt eine kleine Stichprobe von Datensätzen einer Partei und findet eine viel größere Menge von Datensätzen oder Lookalike-Segmenten aus dem Datensatz eines anderen Kooperationspartners. Sie können die gewünschte Größe des resultierenden Lookalike-Segments angeben, und AWS Clean Rooms ML gleicht die eindeutigen Profile in Ihrer Stichprobenliste privat mit denen im Datensatz Ihres Partners ab und trainiert dann ein ML-Modell, das vorhersagt, wie ähnlich jedes Profil im Datensatz Ihres Mitarbeiters denen in Ihrer Stichprobe ist. AWS Clean Rooms ML gruppiert automatisch die Profile, die der Beispielliste ähneln, und gibt das resultierende Lookalike-Segment aus. Mit AWS Clean Rooms ML müssen Sie keine Daten austauschen, um ML-Modelle mit Ihren Partnern zu erstellen, zu trainieren und bereitzustellen. Mit AWS Clean Rooms ML werden Ihre Daten nur zum Trainieren Ihres Modells und nicht für das AWS-Modelltraining verwendet. Sie können intuitive Kontrollen verwenden, mit denen Sie und Ihre Partner die Prognoseergebnisse des Modells optimieren können. Um die Lookalike-Modellierung von AWS Clean Rooms ML anzuwenden, muss Ihr Trainingsdatensatz Daten verwenden, die in Amazon S3 gespeichert sind. Startdaten können in Amazon S3 gespeichert oder mithilfe einer SQL-Abfrage in einer Zusammenarbeit erstellt werden.

Sicherheit und Datenschutz

Datenschutz beginnt mit der Sicherheitsgrundlage von AWS, und AWS Clean Rooms basiert auf AWS-Sicherheitsservices wie AWS Identity and Access Management (IAM), AWS Key Management Service (KMS) und AWS CloudTrail. Auf diese Weise können Sie Ihre bestehende Datenschutzstrategie auf Workloads für die Datenzusammenarbeit ausweiten. Mit AWS Clean Rooms brauchen Sie keine Kopie Ihrer Daten mehr außerhalb Ihrer AWS-Umgebung zu speichern oder zu pflegen und an eine andere Partei zu senden, um Analysen für Kundenerkenntnisse, Marketingmessungen, Prognosen oder Risikobewertungen durchzuführen.

Wenn Sie eine AWS-Clean-Rooms-Kollaboration einrichten und die SQL-Analyse verwenden, können Sie für jedes Kollaborationsmitglied unterschiedliche Fähigkeiten angeben, um Ihren spezifischen Anwendungsfällen gerecht zu werden. Wenn Sie beispielsweise möchten, dass die Ausgabe der Abfrage an ein anderes Element gesendet wird, können Sie ein Mitglied als Abfrageausführer festlegen, der Abfragen schreiben kann, und ein anderes Mitglied als Empfänger der Abfrageergebnisse, der die Ergebnisse empfangen kann. Auf diese Weise kann der Ersteller der Zusammenarbeit sicherstellen, dass das Mitglied, das die Anfrage stellen kann, keinen Zugriff auf die Abfrageergebnisse hat.

AWS Clean Rooms verfügt auch über SQL-Abfragekontrollen, mit denen Sie die Art der Abfragen oder bestimmte Abfragen, die auf Ihren Datentabellen ausgeführt werden können, durch die Konfiguration von Analyseregeln einschränken können. AWS Clean Rooms unterstützt drei Arten von SQL-Analyseregeln: Aggregation, Liste und benutzerdefinierte Regeln. Mit der Aggregations-Analyseregel können Sie Ihre Tabelle so konfigurieren, dass nur Abfragen erlaubt sind, die aggregierte Statistiken erzeugen (z. B. Kampagnenmessung oder Attribution). Mit der Listen-Analyseregel können Sie Steuerelemente so konfigurieren, dass Abfragen nur die Schnittmenge Ihrer Datensätze mit der des Mitglieds analysieren können, das Abfragen durchführen kann. Mit der benutzerdefinierten Analyseregel können Sie Steuerelemente auf Abfrageebene so konfigurieren, dass bestimmte Konten oder Abfragen für Ihren Datensatz ausgeführt werden können. Wenn Sie benutzerdefinierte Analyseregeln verwenden, können Sie Differential Privacy verwenden. AWS Clean Rooms Differential Privacy hilft Ihnen, die Privatsphäre Ihrer Benutzer mit mathematisch gestützten und intuitiven Steuerelementen mit wenigen Klicks zu schützen. Da es sich um eine vollständig verwaltete Funktion von AWS Clean Rooms handelt, ist keine vorherige Erfahrung im Bereich Datenschutz erforderlich, um die erneute Identifizierung Ihrer Benutzer zu verhindern. Eine weitere Kontrolle sind Aggregationsschwellenwerte, die verhindern, dass Abfragen auf kleine, potenziell wiederidentifizierbare Gruppen zugreifen.

Mit AWS Clean Rooms ML werden Ihre Daten nur zum Trainieren Ihres Modells und nicht für das AWS-Modelltraining verwendet. AWS Clean Rooms ML verwendet keine Schulungs- oder Lookalike-Segmentdaten eines Unternehmens mit einem anderen, und Sie können Ihre Modell- und Trainingsdaten jederzeit löschen.

Nein. Datensätze werden in den AWS- oder Snowflake-Data Lakes der Mitarbeiter gespeichert und nicht verschoben. AWS Clean Rooms liest vorübergehend Daten aus Konten von Mitarbeitenden, um Abfragen auszuführen, Datensätze abzugleichen, ML-Modelle zu trainieren oder Startsegmente zu erweitern. Die Ergebnisse einer Analyse werden an den S3-Standort gesendet, der für die Analyse vorgesehen ist. Während der Zusammenarbeit werden keine Daten, die aus einem Data Lake gelesen werden, dauerhaft in AWS gespeichert, und alle Daten, die vorübergehend in die AWS-Cleanrooms-Umgebung gelesen werden, werden nach Abschluss der Anfrage gelöscht.

AWS Entity Resolution in AWS Clean Rooms generiert einen Datensatz, der den Identifikatoren der einzelnen Parteien in einer Zusammenarbeit zugeordnet wird. Der Zuordnungsdatensatz wird von AWS Clean Rooms verwaltet. Kein Mitglied der Zusammenarbeit kann die Zuordnungstabelle anzeigen oder herunterladen. Wenn sich alle Mitglieder der Zusammenarbeit darauf einigen, diese Datenschutzbestimmungen zu lockern, kann die Zuordnungstabelle für bestimmte Anwendungsfälle abgefragt werden. Jede Partei kann die Tabelle jederzeit löschen.

Von AWS Clean Rooms ML generierte Modelle werden vom Service gespeichert, können mit einem vom Kunden verwalteten AWS-KMS-Schlüssel verschlüsselt werden und können vom Kunden jederzeit gelöscht werden.

Mit den Verschlüsselungs- und Analyseregeln von AWS Clean Rooms können Sie die Art der Informationen, die Sie freigeben möchten, genau steuern. Als Datenmitarbeiter sind Sie dafür verantwortlich, das Risiko jeder Zusammenarbeit zu bewerten, einschließlich des Risikos einer erneuten Identifizierung, und Ihre eigenen zusätzlichen Sorgfaltspflichten durchzuführen, um die Einhaltung aller Datenschutzgesetze sicherzustellen. Wenn es sich bei den von Ihnen weitergegebenen Daten um sensible oder gesetzlich geregelte Daten handelt, empfehlen wir Ihnen, geeignete rechtliche Vereinbarungen und Prüfmechanismen anzuwenden, um die Risiken für den Datenschutz weiter zu verringern.

Ja. Die AWS-Servicebedingungen verbieten bestimmte Anwendungsfälle für die Zusammenarbeit in AWS Clean Rooms.

Ja. Das HIPAA-Compliance-Programm von AWS umfasst Amazon SNS als HIPAA-fähigen Service. Wenn Sie ein Business Associate Agreement (BAA) mit AWS abgeschlossen haben, können Sie jetzt AWS Clean Rooms verwenden, um HIPAA-konforme Kooperationen zu erstellen. Wenn Sie keine BAA oder weitere Fragen zur Verwendung von AWS für Ihre HIPAA-konformen Anwendungen haben, setzen Sie sich mit uns in Verbindung.

Weitere Informationen finden Sie in den folgenden Ressourcen:

AWS-Seite zur Compliance mit HIPAA

AWS-Seite zum Cloud Computing im Gesundheitswesen

SQL-Analysen

Sie können wählen, ob Sie die Spark-Analytik-Engine verwenden möchten, um Abfragen mithilfe des Spark-SQL-Dialekts in Zusammenarbeiten mit AWS Clean Rooms auszuführen. AWS Clean Rooms Spark SQL bietet konfigurierbare Rechengrößen, um bei der Ausführung von SQL-Workloads eine bessere Kontrolle über das Preis-Leistungs-Verhältnis zu ermöglichen. Um AWS Clean Rooms Differential Privacy anzuwenden oder Aggregations- oder Listenanalyseregeln in einer Zusammenarbeit zu verwenden, müssen Sie SQL als Analytik-Engine verwenden.

AWS Clean Rooms Spark SQL verwendet den Standard-Instance-Typ CR.1X, der 4 vCPUs, 30 GB Arbeitsspeicher und 100 GB Speicher bereitstellt. Sie können sich dafür entscheiden, mehr Ressourcen für die Ausführung Ihrer Spark-SQL-Workloads bereitzustellen, indem Sie den größeren CR.4X-Instance-Typ auswählen, der 16 vCPUs, 120 GB Arbeitsspeicher und 400 GB Speicher bietet. Größere Instance-Größen können SQL-Workloads zugute kommen, die große Datenmengen verarbeiten und komplexe Analytik durchführen, wodurch die Workloads auf eine höhere Anzahl von Ressourcen verteilt werden können. Weitere Informationen über die zugehörige vCPU, den Arbeitsspeicher und den Speicher für jede Konfiguration finden Sie hier.

In den SQL-Analyseregeln konfigurieren Sie Kontrollen auf Spaltenebene, mit denen Sie festlegen können, wie die einzelnen Spalten in Abfragen verwendet werden können. Sie können zum Beispiel festlegen, welche Spalten zur Berechnung von Aggregatstatistiken (z. B. SUM(Preis)) verwendet werden können und welche Spalten zur Verknüpfung Ihrer Tabelle mit anderen Teilnehmern des Zusammenarbeitsbereichs verwendet werden können. In der Aggregationsanalyseregel können Sie auch einen Mindestaggregationsschwellenwert festlegen, den jede Ausgabezeile erfüllen muss. Zeilen, die den Mindestschwellenwert nicht erfüllen, werden von AWS Clean Rooms automatisch herausgefiltert.

Ja. Sie können AWS Clean Rooms so konfigurieren, dass Abfrageprotokolle in Amazon CloudWatch Logs veröffentlicht werden. Mit der benutzerdefinierten Analyseregel können Sie auch Abfragen (in Analysevorlagen gespeichert) überprüfen, bevor sie in der Kollaboration ausgeführt werden. 

AWS Clean Rooms Differential Privacy

Differentieller Datenschutz ist ein mathematisch erprobtes Framework zur Unterstützung des Datenschutzes. Der Hauptvorteil von differentiellem Datenschutz besteht darin, Daten auf individueller Ebene zu schützen, indem ein kontrolliertes Maß an Zufälligkeit – Rauschen – hinzugefügt wird, um die Anwesenheit oder Abwesenheit einer einzelnen Person in einem Datensatz, der analysiert wird, zu verschleiern.

AWS Clean Rooms Differential Privacy hilft Ihnen, die Privatsphäre Ihrer Benutzer mit mathematisch gestützten und intuitiven Steuerelementen mit wenigen Schritten zu schützen. Da es sich um eine vollständig verwaltete Funktion von AWS Clean Rooms handelt, ist keine vorherige Erfahrung im Bereich Datenschutz erforderlich, um die erneute Identifizierung Ihrer Benutzer zu verhindern. AWS Clean Rooms Differential Privacy verschleiert den Beitrag der Daten einzelner Personen zur Generierung aggregierter Erkenntnisse über Kollaborationen, sodass Sie eine Vielzahl von SQL-Abfragen ausführen können, um Erkenntnisse über Werbekampagnen, Investitionsentscheidungen, klinische Forschung und mehr zu erhalten.

Sie können mit der Nutzung von AWS Clean Rooms Differential Privacy in nur wenigen Schritten beginnen, nachdem Sie als Mitglied, das Daten beisteuern kann, eine Zusammenarbeit mit AWS Clean Rooms gestartet oder dieser beigetreten sind. Nachdem Sie eine konfigurierte Tabelle erstellt haben, die ein Verweis auf Ihre Tabelle im AWS-Glue-Datenkatalog ist, aktivieren Sie einfach den differenziellen Datenschutz, während Sie der konfigurierten Tabelle eine benutzerdefinierte Analyseregel hinzufügen, wenn Sie die SQL-Analytik-Engine verwenden. Als Nächstes verknüpfen Sie die konfigurierte Tabelle mit Ihrer AWS-Clean-Rooms-Kollaboration und konfigurieren eine unterschiedliche Datenschutzrichtlinie in der Zusammenarbeit, um Ihre Tabelle für Abfragen verfügbar zu machen. Sie können eine Standardrichtlinie verwenden, um das Setup schnell abzuschließen, oder sie an Ihre spezifischen Anforderungen anpassen. Um AWS Clean Rooms Differential Privacy in einer Zusammenarbeit anzuwenden, müssen Daten verwenden, die in Amazon S3 und SQL als Analytik-Engine gespeichert sind.

Sobald AWS Clean Rooms Differential Privacy eingerichtet ist, kann Ihr Kooperationspartner damit beginnen, Abfragen auf Ihrem Tisch auszuführen – ohne dass er Fachwissen über unterschiedliche Datenschutzkonzepte oder zusätzliche Einstellungen von seinen Partnern benötigt. Mit AWS Clean Rooms Differential Privacy können Abfragerunner benutzerdefinierte und flexible Analysen durchführen, einschließlich komplexer Abfragemuster mit Common Table Expressions (CTEs) und häufig verwendeten Aggregatfunktionen wie ANZAHL und SUMME.

Kryptografische Datenverarbeitung

Das kryptografische Computing ist eine Methode zum Schutz und zur Verschlüsselung vertraulicher Daten, während sie verwendet werden. Daten können im Ruhezustand verschlüsselt werden, wenn sie gespeichert werden,, wenn sie übertragen werden und wenn sie in Gebrauch sind. Verschlüsselung bedeutet die Umwandlung von Klartextdaten in verschlüsselte Daten, die ohne einen bestimmten „Schlüssel“ nicht entschlüsselt werden können. Die Überkreuzung privater Datensätze (Private Set Intersection, PSI) ist eine Art der Verarbeitung kryptografischer Daten, die es zwei oder mehr Parteien, die über Datensätze verfügen, ermöglicht, verschlüsselte Versionen zu vergleichen, um Berechnungen durchzuführen. Die Verschlüsselung erfolgt On-Premises mit dem geheimen Schlüssel des gemeinsamen Teilnehmers. C3R ist sowohl für die Spark-SQL-Analytik-Engine als auch für die SQL-Analytik-Engine verfügbar.

AWS Clean Rooms umfasst die Verarbeitung kryptografischer Daten für Reinräume (C3R), die die Möglichkeit bietet, Daten mit einem clientseitigen Verschlüsselungstool – einem SDK oder einer Befehlszeilenschnittstelle (CLI) – vorzuverschlüsseln, das/die einen gemeinsamen geheimen Schlüssel mit anderen Teilnehmern eines AWS-Clean-Rooms-Zusammenarbeitsbereichs verwendet. Dadurch werden die Daten bei der Ausführung von Abfragen verschlüsselt.