Bibtex export

 

@article{ Krug2010,
 title = {Fehlende Daten bei der Verknüpfung von Prozess- und Befragungsdaten: ein empirischer Vergleich ausgewählter Missing Data Verfahren},
 author = {Krug, Gerhard},
 journal = {Methoden, Daten, Analysen (mda)},
 number = {1},
 pages = {27-57, A1-A17},
 volume = {4},
 year = {2010},
 issn = {2190-4936},
 urn = {https://nbn-resolving.org/urn:nbn:de:0168-ssoar-128382},
 abstract = {"Die Verknüpfung von Prozess- und Befragungsdaten gewinnt in der empirischen Sozialforschung zunehmend an Bedeutung. Aus Datenschutzgründen können Befragte die Verknüpfung aber ablehnen, weshalb die verbleibende Stichprobe selektiv sein kann. Hier können Missing Data Techniken helfen, eventuelle Selektionsverzerrungen in empirischen Analysen zu korrigieren. Das Papier nutzt eine Befragung, in der unter anderem die Zustimmung zur Verknüpfung erbeten wurde, um den Erfolg ausgewählter Missing Data Techniken bei der Ausfallkorrektur im Rahmen einer Fallstudie zu vergleichen. Bei nicht zustimmenden Befragten werden ihre faktisch gegebenen Antworten auf 'fehlend' gesetzt, um so pseudo-fehlende Werte auf Basis eines empirischen (im Vergleich zu einem statistisch simulierten) Ausfallmechanismus zu erzeugen. Eine KQRegressionsanalyse wird durchgeführt und eventuelle Verzerrungen durch den Datenausfall werden jeweils alternativ durch fallweisen Ausschluss von Beobachtungen mit fehlenden Werten, eine Multiple Imputation (Ergänzung) der fehlenden Werte und durch Selektionskorrektur nach Heckman korrigiert. Die Ergebnisse der Korrekturverfahren werden mit Regressionsanalysen auf Basis der vollständigen Daten verglichen, welche die 'wahren' Regressionskoeffizienten liefern. Es zeigt sich in einer Beispielanalyse mit geringer Selektivität des Datenausfalles, dass hier alle Korrekturverfahren ähnlich gut abschneiden. In einer zweiten Analyse mit starker Selektivität lieferte ausschließlich die Multiple Imputation gute Ergebnisse, jedoch nur, wenn die abhängige Variable keine fehlenden Werte aufwies." (Autorenreferat)"Linking register to survey data is becoming more and more important for empirical social science. Due to reasons of data protection the respondents have be asked for their permission to link their data. The resulting sample can therefore be selective. Missing data techniques can be used to correct for any record linkage bias. In this paper the author uses a survey where participants were asked permission for combining the survey with administrative data (record linkage). Based upon this survey the performance of different missing data techniques is compared. For those who refuse their permission he sets their survey answers to missing, creating pseudo-missing data following an empirical relevant but unknown mechanism (rather than a statistical simulation of a missing data process). OLS Regression is performed using casewise deletion, multiple imputation and two versions of Heckman's sample selection model, respectively, to correct for the pseudo-missing data. The results are compared to a regression that is based on the complete data set and that gives us the 'true' regression parameters. In an empirical example analysis characterized by weak selectivity of the missing data, all missing data techniques performed quite well. In a second example analysis with strong selectivity, it was only multiple imputation that was able to correct for the record linkage bias, given that missing values were present only in one or more independent variables. In the case of strong selectivity and missing values in the dependent variable, none of the missing data techniques eliminated the bias." (author's abstract)},
 keywords = {Methodenvergleich; survey; process-produced data; comparison of methods; prozessproduzierte Daten; data; Befragung; empirical social research; Methode; method; statistics; Statistik; employment research; Daten; Arbeitsmarkt- und Berufsforschung; empirische Sozialforschung}}