Download full text
(1.104Mb)
Citation Suggestion
Please use the following Persistent Identifier (PID) to cite this document:
https://nbn-resolving.org/urn:nbn:de:0168-ssoar-128382
Exports for your reference manager
Fehlende Daten bei der Verknüpfung von Prozess- und Befragungsdaten: ein empirischer Vergleich ausgewählter Missing Data Verfahren
Missing data due to record linkage of register and survey information: an empirical comparison of selected missing data techniques
[journal article]
Abstract "Die Verknüpfung von Prozess- und Befragungsdaten gewinnt in der empirischen Sozialforschung zunehmend an Bedeutung. Aus Datenschutzgründen können Befragte die Verknüpfung aber ablehnen, weshalb die verbleibende Stichprobe selektiv sein kann. Hier können Missing Data Techniken helfen, eventuelle Sel... view more
"Die Verknüpfung von Prozess- und Befragungsdaten gewinnt in der empirischen Sozialforschung zunehmend an Bedeutung. Aus Datenschutzgründen können Befragte die Verknüpfung aber ablehnen, weshalb die verbleibende Stichprobe selektiv sein kann. Hier können Missing Data Techniken helfen, eventuelle Selektionsverzerrungen in empirischen Analysen zu korrigieren. Das Papier nutzt eine Befragung, in der unter anderem die Zustimmung zur Verknüpfung erbeten wurde, um den Erfolg ausgewählter Missing Data Techniken bei der Ausfallkorrektur im Rahmen einer Fallstudie zu vergleichen. Bei nicht zustimmenden Befragten werden ihre faktisch gegebenen Antworten auf 'fehlend' gesetzt, um so pseudo-fehlende Werte auf Basis eines empirischen (im Vergleich zu einem statistisch simulierten) Ausfallmechanismus zu erzeugen. Eine KQRegressionsanalyse wird durchgeführt und eventuelle Verzerrungen durch den Datenausfall werden jeweils alternativ durch fallweisen Ausschluss von Beobachtungen mit fehlenden Werten, eine Multiple Imputation (Ergänzung) der fehlenden Werte und durch Selektionskorrektur nach Heckman korrigiert. Die Ergebnisse der Korrekturverfahren werden mit Regressionsanalysen auf Basis der vollständigen Daten verglichen, welche die 'wahren' Regressionskoeffizienten liefern. Es zeigt sich in einer Beispielanalyse mit geringer Selektivität des Datenausfalles, dass hier alle Korrekturverfahren ähnlich gut abschneiden. In einer zweiten Analyse mit starker Selektivität lieferte ausschließlich die Multiple Imputation gute Ergebnisse, jedoch nur, wenn die abhängige Variable keine fehlenden Werte aufwies." (Autorenreferat)... view less
"Linking register to survey data is becoming more and more important for empirical social science. Due to reasons of data protection the respondents have be asked for their permission to link their data. The resulting sample can therefore be selective. Missing data techniques can be used to correct ... view more
"Linking register to survey data is becoming more and more important for empirical social science. Due to reasons of data protection the respondents have be asked for their permission to link their data. The resulting sample can therefore be selective. Missing data techniques can be used to correct for any record linkage bias. In this paper the author uses a survey where participants were asked permission for combining the survey with administrative data (record linkage). Based upon this survey the performance of different missing data techniques is compared. For those who refuse their permission he sets their survey answers to missing, creating pseudo-missing data following an empirical relevant but unknown mechanism (rather than a statistical simulation of a missing data process). OLS Regression is performed using casewise deletion, multiple imputation and two versions of Heckman's sample selection model, respectively, to correct for the pseudo-missing data. The results are compared to a regression that is based on the complete data set and that gives us the 'true' regression parameters. In an empirical example analysis characterized by weak selectivity of the missing data, all missing data techniques performed quite well. In a second example analysis with strong selectivity, it was only multiple imputation that was able to correct for the record linkage bias, given that missing values were present only in one or more independent variables. In the case of strong selectivity and missing values in the dependent variable, none of the missing data techniques eliminated the bias." (author's abstract)... view less
Keywords
survey; process-produced data; comparison of methods; data; empirical social research; method; statistics; employment research
Classification
Methods and Techniques of Data Collection and Data Analysis, Statistical Methods, Computer Methods
Research Design
Method
development of methods; basic research
Free Keywords
Rekord Linkage; Missing Data Verfahren; multiple imputation
Document language
German
Publication Year
2010
Page/Pages
p. 27-57, A1-A17
Journal
Methoden, Daten, Analysen (mda), 4 (2010) 1
ISSN
2190-4936
Status
Published Version; peer reviewed
Licence
Deposit Licence - No Redistribution, No Modifications