Show simple item record

Automatic indexing of domain-specific information: an evaluation of automated content cataloguing of social science research literature
[journal article]

dc.contributor.authorKempf, Andreas Oskarde
dc.date.accessioned2015-10-16T12:44:04Z
dc.date.available2015-10-16T12:44:04Z
dc.date.issued2013de
dc.identifier.issn1434-4653de
dc.identifier.urihttp://www.ssoar.info/ssoar/handle/document/45003
dc.description.abstractDer Artikel basiert auf einer Masterarbeit mit dem Titel „Automatische Indexierung in der sozialwissenschaftlichen Fachinformation. Eine Evaluationsstudie zur maschinellen Erschließung für die Datenbank SOLIS“ (Kempf 2012), die im Rahmen des Aufbaustudiengangs Bibliotheks- und Informationswissenschaft an der Humboldt-Universität zu Berlin am Lehrstuhl Information Retrieval verfasst wurde. Auf der Grundlage des Schalenmodells zur Inhaltserschließung in der Fachinformation (vgl. Krause 1996, 2006) stellt der Artikel Evaluationsergebnisse eines automatischen Erschließungsverfahrens für den Einsatz in der sozialwissenschaftlichen Fachinformation vor. Ausgehend von dem von Krause beschriebenen Anwendungsszenario, wonach SOLIS-Datenbestände (Sozialwissenschaftliches Literaturinformationssystem) von geringerer Relevanz automatisch erschlossen werden sollten, wurden auf dieser Dokumentgrundlage zwei Testreihen mit der Indexierungssoftware MindServer der Firma Recommind durchgeführt. Neben den Auswirkungen allgemeiner Systemeinstellungen in der ersten Testreihe wurde in der zweiten Testreihe die Indexierungsleistung der Software für die Rand- und die Kernbereiche der Literaturdatenbank miteinander verglichen. Für letztere Testreihe wurden für beide Bereiche der Datenbank spezifische Versionen der Indexierungssoftware aufgebaut, die anhand von Dokumentkorpora aus den entsprechenden Bereichen trainiert wurden. Die Ergebnisse der Evaluation, die auf der Grundlage intellektuell generierter Vergleichsdaten erfolgt, weisen auf Unterschiede in der Indexierungsleistung zwischen Rand- und Kembereichen hin, die einerseits gegen den Einsatz automatischer Indexierungsverfahren in den Randbereichen sprechen. Andererseits deutet sich an, dass sich die Indexierungsresultate durch den Aufbau fachteilgebietsspezifischer Trainingsmengen verbessern lassen. (Autorenreferat)de
dc.description.abstractThis article is based on a Master thesis with the title "Automatische Indexierung in der sozialwissenschaftlichen Fachinformation. Eine Evaluationsstudie zur maschinellen Erschließung für die Datenbank SOLIS" (Kempf 2012) written within the framework of the postgraduate study program Library and Information Science at Humboldt-Universität zu Berlin at the chair of Information Retrieval. On the basis of the so-called 'Shell Model' (Krause 1996, 2006) for domain-specific content cataloguing it presents evaluation results of an automatic indexing tool for cataloguing of social science research literature. Taking the concrete application scenario formulated by Krause, which suggests that SOLIS-data (Social Science Literature Information System) of less relevance should be indexed automatically, the software MindServer by Recommind was tested in two test series on exactly this data. While in the first test series the system's general settings were tested in the second test series the indexing performance for key and for border areas of the database were compared. For this purpose, sub-discipline-specific versions of the software were built up, which were trained on the basis of corresponding data corpora. The results, evaluated on the basis of intellectually generated comparative data, indicate differences in the quality of indexing for key and for border areas of the database which on the one hand speak against the use of automatic indexing for this area of the database. On the other hand the tests suggest that by building up sub-discipline-specific corpora of training the indexing results could be improved. (author's abstract)en
dc.languagedede
dc.subject.ddcNews media, journalism, publishingen
dc.subject.ddcPublizistische Medien, Journalismus,Verlagswesende
dc.titleAutomatische Inhaltserschließung in der Fachinformation: eine Evaluation zur maschinellen Indexierung sozialwissenschaftlicher Forschungsliteraturde
dc.title.alternativeAutomatic indexing of domain-specific information: an evaluation of automated content cataloguing of social science research literaturede
dc.description.reviewbegutachtet (peer reviewed)de
dc.description.reviewpeer revieweden
dc.source.journalInformation - Wissenschaft und Praxis
dc.source.volume64de
dc.publisher.countryDEU
dc.source.issue2-3de
dc.subject.classozInformation und Dokumentation, Bibliotheken, Archivede
dc.subject.classozInformation and Documentation, Libraries, Archivesen
dc.subject.thesozInformation und Dokumentationde
dc.subject.thesozinformation and documentationen
dc.subject.thesozIndexierungde
dc.subject.thesozindexingen
dc.subject.thesozAutomatisierungde
dc.subject.thesozautomationen
dc.subject.thesozinformation retrievalde
dc.subject.thesozinformation retrievalen
dc.subject.thesozBewertungde
dc.subject.thesozevaluationen
dc.subject.thesozThesaurusde
dc.subject.thesozthesaurusen
dc.subject.thesozFachinformationde
dc.subject.thesozspecialized informationen
dc.identifier.urnurn:nbn:de:0168-ssoar-450033
dc.rights.licenceDeposit Licence - Keine Weiterverbreitung, keine Bearbeitungde
dc.rights.licenceDeposit Licence - No Redistribution, No Modificationsen
internal.statusformal und inhaltlich fertig erschlossende
internal.identifier.thesoz10043130
internal.identifier.thesoz10047116
internal.identifier.thesoz10037519
internal.identifier.thesoz10047326
internal.identifier.thesoz10036171
internal.identifier.thesoz10060270
internal.identifier.thesoz10043129
dc.type.stockarticlede
dc.type.documentZeitschriftenartikelde
dc.type.documentjournal articleen
dc.source.pageinfo96-106de
internal.identifier.classoz1080501
internal.identifier.journal181
internal.identifier.document32
internal.identifier.ddc070
dc.identifier.doihttps://doi.org/10.1515/iwp-2013-0011de
dc.description.pubstatusVeröffentlichungsversionde
dc.description.pubstatusPublished Versionen
internal.identifier.licence3
internal.identifier.pubstatus1
internal.identifier.review1
dc.subject.classhort10800de
dc.subject.classhort30200de
ssoar.licence.dfgtruede
ssoar.wgl.collectiontruede
internal.pdf.version1.3
internal.pdf.validtrue
internal.pdf.wellformedtrue
internal.check.abstractlanguageharmonizerCERTAIN
internal.check.languageharmonizerCERTAIN_RETAINED


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record