More documents from Krug, Gerhard
More documents from Methoden, Daten, Analysen (mda)

Export to your Reference Manger

Please Copy & Paste
Bibtex-Export
Endnote-Export

       

Fehlende Daten bei der Verknüpfung von Prozess- und Befragungsdaten : ein empirischer Vergleich ausgewählter Missing Data Verfahren

Missing data due to record linkage of register and survey information : an empirical comparison of selected missing data techniques
[journal article]

Krug, Gerhard

fulltextDownloadDownload full text

(1131 KByte)

Citation Suggestion

Please use the following Persistent Identifier (PID) to cite this document:http://nbn-resolving.de/urn:nbn:de:0168-ssoar-128382

Further Details
Abstract "Die Verknüpfung von Prozess- und Befragungsdaten gewinnt in der empirischen Sozialforschung zunehmend an Bedeutung. Aus Datenschutzgründen können Befragte die Verknüpfung aber ablehnen, weshalb die verbleibende Stichprobe selektiv sein kann. Hier können Missing Data Techniken helfen, eventuelle Selektionsverzerrungen in empirischen Analysen zu korrigieren. Das Papier nutzt eine Befragung, in der unter anderem die Zustimmung zur Verknüpfung erbeten wurde, um den Erfolg ausgewählter Missing Data Techniken bei der Ausfallkorrektur im Rahmen einer Fallstudie zu vergleichen. Bei nicht zustimmenden Befragten werden ihre faktisch gegebenen Antworten auf 'fehlend' gesetzt, um so pseudo-fehlende Werte auf Basis eines empirischen (im Vergleich zu einem statistisch simulierten) Ausfallmechanismus zu erzeugen. Eine KQRegressionsanalyse wird durchgeführt und eventuelle Verzerrungen durch den Datenausfall werden jeweils alternativ durch fallweisen Ausschluss von Beobachtungen mit fehlenden Werten, eine Multiple Imputation (Ergänzung) der fehlenden Werte und durch Selektionskorrektur nach Heckman korrigiert. Die Ergebnisse der Korrekturverfahren werden mit Regressionsanalysen auf Basis der vollständigen Daten verglichen, welche die 'wahren' Regressionskoeffizienten liefern. Es zeigt sich in einer Beispielanalyse mit geringer Selektivität des Datenausfalles, dass hier alle Korrekturverfahren ähnlich gut abschneiden. In einer zweiten Analyse mit starker Selektivität lieferte ausschließlich die Multiple Imputation gute Ergebnisse, jedoch nur, wenn die abhängige Variable keine fehlenden Werte aufwies." (Autorenreferat)

"Linking register to survey data is becoming more and more important for empirical social science. Due to reasons of data protection the respondents have be asked for their permission to link their data. The resulting sample can therefore be selective. Missing data techniques can be used to correct for any record linkage bias. In this paper the author uses a survey where participants were asked permission for combining the survey with administrative data (record linkage). Based upon this survey the performance of different missing data techniques is compared. For those who refuse their permission he sets their survey answers to missing, creating pseudo-missing data following an empirical relevant but unknown mechanism (rather than a statistical simulation of a missing data process). OLS Regression is performed using casewise deletion, multiple imputation and two versions of Heckman's sample selection model, respectively, to correct for the pseudo-missing data. The results are compared to a regression that is based on the complete data set and that gives us the 'true' regression parameters. In an empirical example analysis characterized by weak selectivity of the missing data, all missing data techniques performed quite well. In a second example analysis with strong selectivity, it was only multiple imputation that was able to correct for the record linkage bias, given that missing values were present only in one or more independent variables. In the case of strong selectivity and missing values in the dependent variable, none of the missing data techniques eliminated the bias." (author's abstract)
Keywords comparison of methods; method; empirical social research; data; process-produced data; survey; statistics; employment research
Classification Research Design; Methods and Techniques of Data Collection and Data Analysis, Statistical Methods, Computer Methods
Method basic research; development of methods
Free Keywords Rekord Linkage; Missing Data Verfahren; multiple imputation
Document language German
Publication Year 2010
Page/Pages p. 27-57,A1-A17
Journal Methoden, Daten, Analysen (mda), 4 (2010) 1
Status Published Version; peer reviewed
Licence Deposit Licence - No Redistribution, No Modifications
top