Show simple item record

[journal article]

dc.contributor.authorAxenfeld, Julian B.de
dc.contributor.authorBruch, Christiande
dc.contributor.authorWolf, Christofde
dc.date.accessioned2022-09-01T07:36:21Z
dc.date.available2022-09-01T07:36:21Z
dc.date.issued2022de
dc.identifier.issn1935-7516de
dc.identifier.urihttps://www.ssoar.info/ssoar/handle/document/81227
dc.description.abstractPlanned missing survey data, for example stemming from split questionnaire designs are becoming increasingly common in survey research, making imputation indispensable to obtain reasonably analyzable data. However, these data can be difficult to impute due to low correlations, many predictors, and limited sample sizes to support imputation models. This paper presents findings from a Monte Carlo simulation, in which we investigate the accuracy of correlations after multiple imputation using different imputation methods and predictor set specifications based on data from the German Internet Panel (GIP). The results show that strategies that simplify the imputation exercise (such as predictive mean matching with dimensionality reduction or restricted predictor sets, linear regression models, or the multivariate normal model without transformation) perform well, while especially generalized linear models for categorical data, classification trees, and imputation models with many predictor variables lead to strong biases.de
dc.description.abstractGeplant fehlende Werte in sozialwissenschaftlichen Befragungen, beispielsweise infolge eines Split Questionnaire Designs, treten in der Umfrageforschung immer häufiger auf. Um hinlänglich analysierbare Daten zu erhalten, ist hierbei oftmals eine Imputation erforderlich. Die statistische Modellierung bei der Imputation solcher Daten kann jedoch aufgrund niedriger Korrelationen, einer Großzahl möglicher Prädiktoren und begrenzter Stichprobengrößen mit enormen Herausforderungen verbunden sein. Der vorliegende Beitrag stellt Ergebnisse aus einer Monte-Carlo-Simulation vor, in der basierend auf Daten des German Internet Panels (GIP) die Validität von Korrelationsschätzungen in einem Split Questionnaire Design unter Verwendung verschiedener Imputationsstrategien untersucht wird. Dabei zeigt sich, dass Ansätze, die die Imputation vereinfachen, zu guten Ergebnissen führen können (z.B. Predictive Mean Matching mit Dimensionsreduktion oder wenigen Prädiktorvariablen). Demgegenüber können insbesondere Generalisierte Lineare Modelle für kategoriale Daten, Klassifikationsbäume (CART) und Imputationsmodelle mit vielen Prädiktorvariablen starke Verzerrungen zur Folge haben.de
dc.languageende
dc.subject.ddcSozialwissenschaften, Soziologiede
dc.subject.ddcSocial sciences, sociology, anthropologyen
dc.subject.otherbias; imputation methods; Monte Carlo simulation; multiple imputation; split questionnaire design; German Internet Panel (GIP)de
dc.titleGeneral-purpose imputation of planned missing data in social surveys: Different strategies and their effect on correlationsde
dc.description.reviewbegutachtet (peer reviewed)de
dc.description.reviewpeer revieweden
dc.source.journalStatistics Surveys
dc.source.volume16de
dc.publisher.countryUSAde
dc.subject.classozErhebungstechniken und Analysetechniken der Sozialwissenschaftende
dc.subject.classozMethods and Techniques of Data Collection and Data Analysis, Statistical Methods, Computer Methodsen
dc.subject.thesozValiditätde
dc.subject.thesozDatengewinnungde
dc.subject.thesozKorrelationde
dc.subject.thesozsurveyen
dc.subject.thesozSchätzungde
dc.subject.thesozBefragungde
dc.subject.thesozDatenqualitätde
dc.subject.thesozquestionnaireen
dc.subject.thesozcorrelationen
dc.subject.thesozdata qualityen
dc.subject.thesozvalidityen
dc.subject.thesozsurvey researchen
dc.subject.thesozdata captureen
dc.subject.thesozestimationen
dc.subject.thesozUmfrageforschungde
dc.subject.thesozFragebogende
dc.rights.licenceCreative Commons - Attribution 4.0en
dc.rights.licenceCreative Commons - Namensnennung 4.0de
ssoar.contributor.institutionGESISde
internal.statusformal und inhaltlich fertig erschlossende
internal.identifier.thesoz10040714
internal.identifier.thesoz10040547
internal.identifier.thesoz10055811
internal.identifier.thesoz10037910
internal.identifier.thesoz10049626
internal.identifier.thesoz10037914
internal.identifier.thesoz10049791
internal.identifier.thesoz10057146
dc.type.stockarticlede
dc.type.documentjournal articleen
dc.type.documentZeitschriftenartikelde
dc.source.pageinfo182-209de
internal.identifier.classoz10105
internal.identifier.journal2453
internal.identifier.document32
internal.identifier.ddc300
dc.identifier.doihttps://doi.org/10.1214/22-SS137de
dc.description.pubstatusPublished Versionen
dc.description.pubstatusVeröffentlichungsversionde
internal.identifier.licence16
internal.identifier.pubstatus1
internal.identifier.review1
ssoar.wgl.collectiontruede
internal.pdf.wellformedtrue
internal.pdf.encryptedfalse
ssoar.urn.registrationfalsede
ssoar.licence.fundGefördert durch die Deutsche Forschungsgemeinschaft (DFG) - Projektnummern BL 1148/1-1, BR 5869/1-1, WO 739/20-1 / Funded by the German Research Foundation (DFG) - Project numbers BL 1148/1-1, BR 5869/1-1, WO 739/20-1


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record