Show simple item record

[conference paper]

dc.contributor.authorHein-Pensel, Franziskade
dc.contributor.editorBlättel-Mink, Birgitde
dc.date.accessioned2025-02-05T10:57:13Z
dc.date.available2025-02-05T10:57:13Z
dc.date.issued2021de
dc.identifier.issn2367-4504de
dc.identifier.urihttps://www.ssoar.info/ssoar/handle/document/99709
dc.description.abstractAufgrund der steigenden Verfügbarkeit großer Textdaten sind Text Mining und insbesondere Topic Modeling relevante Methoden, um sich Forschungsfragen in verschiedenen Fachbereichen zu nähern (Roberts et al. 2019). Topic Modeling kann dabei als eine explorative Technik beschrieben werden, um Informationen aus Textdaten in großem Maßstab zu gewinnen (DiMaggio et al. 2013). Dies führt dazu, dass das Interesse an Topic Modeling im letzten Jahrzehnt deutlich gewachsen ist und sich von der Informatik in andere Disziplinen, wie der Soziologie (z.B. Apishev et al. 2016; Bohr, Dunlap 2018) oder den Wirtschaftswissenschaften (z.B. Wang et al. 2017; Schmiedel et al. 2019), verzweigt hat. Mit Hilfe einer methodischen Kombination von Topic Modeling und qualitativer Kodierung können Wissenschaftler*innen Informationen aus einem Datenkorpus gewinnen, die von Hand nicht vollständig auswertbar gewesen wären (z.B. Shimizu 2017; Croidieu, Kim 2018). Dieser methodengemischte Ansatz erfordert eine konstante Zirkulation zwischen der Interpretation des Outputs und der Datenaufbereitung für die quantitative Analyse. Aufgrund der Komplexität dieses Prozesses ist sowohl Zeit als auch Sorgfalt gefordert. Trotz der wachsenden Popularität von Topic Modeling in den Sozialwissenschaften fehlt es nach wie vor an gemeinsamen Qualitätsrichtlinien für Wissenschaftler*innen, um die Transparenz ihrer Arbeit zu gewährleisten (Antons et al. 2020). Im Vergleich dazu gehört es in der Informatik zur gängigen Praxis, den Leser*innen einen detaillierten technischen Bericht anzubieten, der alle Informationen zur Erstellung der präsentierten Ergebnisse enthält. Hierdurch wird die Nachvollziehbarkeit der Analyseschritte gewährleistet. Der vorliegende Beitrag plädiert dafür, dass bei der Implementierung eines Text Mining Algorithmus aus der Informatik in die Sozialwissenschaft die erzeugten Ergebnisse mit den gleichen Standards wie in ihrer Ursprungsdisziplin behandelt werden sollten und zeigt hierfür Möglichkeiten auf. In diesem Beitrag wird die Verwendung von Topic Modeling und induktiver Kodierung sowie das Zusammenspiel beider Methoden diskutiert. Der Mehrwert dieser Studie besteht darin, Qualitätsleitlinien für den Umgang mit unstrukturierten Textdaten zur Gewährleistung von Transparenz vorzustellen.de
dc.languagedede
dc.subject.ddcSozialwissenschaften, Soziologiede
dc.subject.ddcSocial sciences, sociology, anthropologyen
dc.subject.otherMixed-Methods; Qualitative Textanalyse; Qualitätsleitlinien; Quantitative Textanalyse; Text Miningde
dc.titleDie Arbeit mit unstrukturierten textbasierten Daten: Eine Reflexion zu Mixed-Methods-Ansätzen für Textanalysende
dc.description.reviewbegutachtetde
dc.description.reviewrevieweden
dc.identifier.urlhttps://publikationen.soziologie.de/index.php/kongressband_2020/article/view/1339/1606de
dc.source.collectionGesellschaft unter Spannung: Verhandlungen des 40. Kongresses der Deutschen Gesellschaft für Soziologie 2020de
dc.publisher.countryDEUde
dc.subject.classozErhebungstechniken und Analysetechniken der Sozialwissenschaftende
dc.subject.classozMethods and Techniques of Data Collection and Data Analysis, Statistical Methods, Computer Methodsen
dc.subject.thesozTextanalysede
dc.subject.thesoztext analysisen
dc.subject.thesozqualitative Methodede
dc.subject.thesozqualitative methoden
dc.subject.thesozquantitative Methodede
dc.subject.thesozquantitative methoden
dc.subject.thesozAlgorithmusde
dc.subject.thesozalgorithmen
dc.rights.licenceCreative Commons - Namensnennung, Nicht-kommerz. 4.0de
dc.rights.licenceCreative Commons - Attribution-NonCommercial 4.0en
internal.statusformal und inhaltlich fertig erschlossende
internal.identifier.thesoz10035477
internal.identifier.thesoz10052182
internal.identifier.thesoz10052183
internal.identifier.thesoz10035039
dc.type.stockincollectionde
dc.type.documentKonferenzbeitragde
dc.type.documentconference paperen
dc.type.documentSammelwerksbeitragde
dc.type.documentcollection articleen
internal.identifier.classoz10105
internal.identifier.document16
internal.identifier.document25
dc.contributor.corporateeditorDeutsche Gesellschaft für Soziologie (DGS)
dc.source.conferenceKongress der Deutschen Gesellschaft für Soziologie "Gesellschaft unter Spannung"de
internal.identifier.corporateeditor71
internal.identifier.ddc300
dc.identifier.doihttps://doi.org/10.21241/ssoar.99709
dc.date.conference2020de
dc.source.conferencenumber40de
dc.description.pubstatusVeröffentlichungsversionde
dc.description.pubstatusPublished Versionen
internal.identifier.licence32
internal.identifier.pubstatus1
internal.identifier.review2
internal.dda.referencehttps://publikationen.soziologie.de/index.php/kongressband_2020/oai@@oai:ojs.pkp.sfu.ca:article/1339
ssoar.doi.registrationtruede


Files in this item

No Thumbnail [100%x80]

This item appears in the following Collection(s)

Show simple item record