SSOAR Logo
    • Deutsch
    • English
  • English 
    • Deutsch
    • English
  • Login
SSOAR ▼
  • Home
  • About SSOAR
  • Guidelines
  • Publishing in SSOAR
  • Cooperating with SSOAR
    • Cooperation models
    • Delivery routes and formats
    • Projects
  • Cooperation partners
    • Information about cooperation partners
  • Information
    • Possibilities of taking the Green Road
    • Grant of Licences
    • Download additional information
  • Operational concept
Browse and search Add new document OAI-PMH interface
JavaScript is disabled for your browser. Some features of this site may not work without it.

Download PDF
Download full text

(331.5Kb)

Citation Suggestion

Please use the following Persistent Identifier (PID) to cite this document:
https://nbn-resolving.org/urn:nbn:de:0168-ssoar-319499

Exports for your reference manager

Bibtex export
Endnote export

Display Statistics
Share
  • Share via E-Mail E-Mail
  • Share via Facebook Facebook
  • Share via Bluesky Bluesky
  • Share via Reddit reddit
  • Share via Linkedin LinkedIn
  • Share via XING XING

Releasing multiply-imputed synthetic data generated in two stages to protect confidentiality

Die Veröffentlichung multipel-imputierter in zwei Phasen generierter synthetischer Daten zur Gewährleistung des Datenschutzes
[working paper]

Reiter, J. P.
Drechsler, Jörg

Corporate Editor
Institut für Arbeitsmarkt- und Berufsforschung der Bundesagentur für Arbeit (IAB)

Abstract

Eine Methode, um die Vertraulichkeit von Daten, die in statistischen Ämtern erhobenen werden, zu gewährleisten, ist das Ersetzen vertraulicher Werte durch synthetische Daten, die mittels multipler Imputation generiert werden. Es wird ein zweistufiges Verfahren zur Generierung der synthetischen Daten... view more

Eine Methode, um die Vertraulichkeit von Daten, die in statistischen Ämtern erhobenen werden, zu gewährleisten, ist das Ersetzen vertraulicher Werte durch synthetische Daten, die mittels multipler Imputation generiert werden. Es wird ein zweistufiges Verfahren zur Generierung der synthetischen Daten vorgestellt, das eine unterschiedliche Anzahl von Imputationen für unterschiedliche Variablen ermöglicht. Die Vorteile eines zweistufigen Verfahren liegen in der Reduzierung der Laufzeit bei der Berechnung, in der Verringerung des Risikos der Deanonymisierung, und in der Erhöhung der inferentiellen Genauigkeit. Es wird beschrieben, wie das zweistufige Verfahren bei der Generierung eines Public-Use-Files des IAB-Betriebpanels zur Anwendung kommt. (IAB)... view less


"To protect the cofidentiality of survey respondents' identities and sensitive attributes, statistical agencies can release data in which cofidential values are replaced with multiple imputations. These are called synthetic data. We propose a two-stage approach to generating synthetic data that enab... view more

"To protect the cofidentiality of survey respondents' identities and sensitive attributes, statistical agencies can release data in which cofidential values are replaced with multiple imputations. These are called synthetic data. We propose a two-stage approach to generating synthetic data that enables agencies to release different numbers of imputations for different variables. Generation in two stages can reduce computational burdens, decrease disclosure risk, and increase inferential accuracy relative to generation in one stage. We present methods for obtaining inferences from such data. We describe the application of two stage synthesis to creating a public use file for a German business database." (author's abstract)... view less

Keywords
data protection; statistical method; anonymity; data preparation; Federal Republic of Germany; statistics; labor market research

Classification
Labor Market Research

Method
development of methods; basic research

Document language
English

Publication Year
2007

City
Nürnberg

Page/Pages
26 p.

Series
IAB Discussion Paper: Beiträge zum wissenschaftlichen Dialog aus dem Institut für Arbeitsmarkt- und Berufsforschung, 20/2007

Status
Published Version; reviewed

Licence
Deposit Licence - No Redistribution, No Modifications

Data providerThis metadata entry was indexed by the Special Subject Collection Social Sciences, USB Cologne


GESIS LogoDFG LogoOpen Access Logo
Home  |  Legal notices  |  Operational concept  |  Privacy policy
© 2007 - 2025 Social Science Open Access Repository (SSOAR).
Based on DSpace, Copyright (c) 2002-2022, DuraSpace. All rights reserved.
 

 


GESIS LogoDFG LogoOpen Access Logo
Home  |  Legal notices  |  Operational concept  |  Privacy policy
© 2007 - 2025 Social Science Open Access Repository (SSOAR).
Based on DSpace, Copyright (c) 2002-2022, DuraSpace. All rights reserved.