Volltext herunterladen
(331.5 KB)
Zitationshinweis
Bitte beziehen Sie sich beim Zitieren dieses Dokumentes immer auf folgenden Persistent Identifier (PID):
https://nbn-resolving.org/urn:nbn:de:0168-ssoar-319499
Export für Ihre Literaturverwaltung
Releasing multiply-imputed synthetic data generated in two stages to protect confidentiality
Die Veröffentlichung multipel-imputierter in zwei Phasen generierter synthetischer Daten zur Gewährleistung des Datenschutzes
[Arbeitspapier]
Körperschaftlicher Herausgeber
Institut für Arbeitsmarkt- und Berufsforschung der Bundesagentur für Arbeit (IAB)
Abstract Eine Methode, um die Vertraulichkeit von Daten, die in statistischen Ämtern erhobenen werden, zu gewährleisten, ist das Ersetzen vertraulicher Werte durch synthetische Daten, die mittels multipler Imputation generiert werden. Es wird ein zweistufiges Verfahren zur Generierung der synthetischen Daten... mehr
Eine Methode, um die Vertraulichkeit von Daten, die in statistischen Ämtern erhobenen werden, zu gewährleisten, ist das Ersetzen vertraulicher Werte durch synthetische Daten, die mittels multipler Imputation generiert werden. Es wird ein zweistufiges Verfahren zur Generierung der synthetischen Daten vorgestellt, das eine unterschiedliche Anzahl von Imputationen für unterschiedliche Variablen ermöglicht. Die Vorteile eines zweistufigen Verfahren liegen in der Reduzierung der Laufzeit bei der Berechnung, in der Verringerung des Risikos der Deanonymisierung, und in der Erhöhung der inferentiellen Genauigkeit. Es wird beschrieben, wie das zweistufige Verfahren bei der Generierung eines Public-Use-Files des IAB-Betriebpanels zur Anwendung kommt. (IAB)... weniger
"To protect the cofidentiality of survey respondents' identities and sensitive attributes, statistical agencies can release data in which cofidential values are replaced with multiple imputations. These are called synthetic data. We propose a two-stage approach to generating synthetic data that enab... mehr
"To protect the cofidentiality of survey respondents' identities and sensitive attributes, statistical agencies can release data in which cofidential values are replaced with multiple imputations. These are called synthetic data. We propose a two-stage approach to generating synthetic data that enables agencies to release different numbers of imputations for different variables. Generation in two stages can reduce computational burdens, decrease disclosure risk, and increase inferential accuracy relative to generation in one stage. We present methods for obtaining inferences from such data. We describe the application of two stage synthesis to creating a public use file for a German business database." (author's abstract)... weniger
Thesaurusschlagwörter
Bundesrepublik Deutschland; statistische Methode; Statistik; Datenschutz; Anonymität; Datenaufbereitung; Arbeitsmarktforschung
Klassifikation
Arbeitsmarktforschung
Methode
Methodenentwicklung; Grundlagenforschung
Sprache Dokument
Englisch
Publikationsjahr
2007
Erscheinungsort
Nürnberg
Seitenangabe
26 S.
Schriftenreihe
IAB Discussion Paper: Beiträge zum wissenschaftlichen Dialog aus dem Institut für Arbeitsmarkt- und Berufsforschung, 20/2007
Status
Veröffentlichungsversion; begutachtet
Lizenz
Deposit Licence - Keine Weiterverbreitung, keine Bearbeitung
DatenlieferantDieser Metadatensatz wurde vom Sondersammelgebiet Sozialwissenschaften (USB Köln) erstellt.