Sonderforschungsbereich 1287 - Die Grenzen der Variabilität in der Sprache: Kognitive, komputationale und grammatische Aspekte

A03

Diskursstrategien in sozialen Medien: Sprecher-, Gruppen- und Kanalvariabilität

PI(s): Prof. Dr. Tatjana Scheffler & Prof. Dr. Manfred Stede

Die Sprache in sozialen Medien weist in verschiedenen Kontexten einen formelleren (schriftähnlichen) oder informelleren (mündlichen) Stil auf und zeigt daher eine hohe Variabilität. In diesem Projekt konzentrieren wir uns dabei auf die Sprachebene der Pragmatik. Wir untersuchen das Common-Ground-Management zwischen Autorinnen und Leserinne, und identifizieren die konsistenten Muster in den Diskursstrategien, die von Autor*innen über verschiedene Gruppen und Kanäle hinweg eingesetzt werden. Wir untersuchen drei Arten von Phänomenen des Common-Ground-Managements: Frageanhängsel, koreferenzielle Ausdrücke und Kohärenzmarker.

Frageanhängsel sind Partikeln, die typischerweise an einen Deklarativsatz angehängt werden, um eine Art Bestätigungsfrage zu erhalten. Wir führten eine umfangreiche Korpusstudie durch, in der die Kontexte und Funktionen verschiedener Frageanhängselvarianten im Deutschen verglichen wurden. Wir fanden signifikante Unterschiede zwischen den Funktionen der einzelnen Anhängsel und in der Verwendung dieser in Gesprächskorpora (Twitter und gesprochene Korpora), was zeigt, dass nur einige Verwendungen der Anhängsel in der gesprochenen Sprache auf schriftliche Konversationen übertragen werden. Wir arbeiten derzeit sowohl an computergestützten als auch an formalen linguistischen Modellen, die diese Variabilität erfassen.

Hinsichtlich der Koreferenzbeziehungen lieferte die Forschungsliteratur zum Teil widersprüchliche Ergebnisse, aber es ist allgemein anerkannt, dass sich ihr Verhalten zwischen gesprochener und geschriebener Sprache unterscheidet, z.B. in der Länge der Referenzketten und der Art des Ausdrucks (z.B. Pronomen oder vollständige Nominalphrase), der verwendet wird. Wir haben diese Untersuchung auf Social-Media-Konversationen auf Twitter ausgeweitet und gezeigt, dass die Koreferenzbeziehungen auf Twitter eher den gesprochenen als den geschriebenen Daten ähneln. Im Folgenden haben wir ein Berechnungsmodell für die automatische Koreferenzauflösung angepasst, um die Eigenheiten von Social-Media-Gesprächen besser zu erfassen.

Schließlich untersuchen wir die Realisierung von Kohärenzbeziehungen in verschiedenen sozialen Medien. In der bestehenden Forschung ist es oft unklar, ob Unterschiede zwischen Korpora auf externe Faktoren wie das Thema des Textes, die in das Korpus aufgenommenen Autorinnen, die Sprache, den Zeitpunkt der Aufnahme usw. zurückzuführen sind. Wir spezifizieren dies, indem wir Texte aus zwei sozialen Medien (Twitter und Blogs) von denselben Autorinnen und zu ähnlichen Themen untersuchen. Dies erlaubt es uns, die Wirkung einzelner Mediumsbeschränkungen wie den Modus (gesprochen oder geschrieben) oder den Texttyp (narrativ oder interaktiv) von individuellen stilistischen Variationen und Themeneffekten zu differenzieren. So identifizieren wir Faktoren, die über all diese Dimensionen hinweg stabil bleiben und die Kohärenzmarkierung bestimmen.

Publikationen

Author(s)TitleYearPublished inDOILinksTypeProject
Stede, M., Scheffler, T. & Mendes, A.Connective-Lex: A Web-Based Multilingual Lexical Resource for Connectives.2019Discourse [Online], 24.LinkPaper Data Peer-ReviewedA03
Aktaş, B. & Stede, M.Variation in Coreference Strategies across Genres and Production Media.2020D. Scott, N. Bel, & C. Zong (Eds.), Proceedings of the 28th International Conference on Computational Linguistics (COLING) (pp. 5774-5785). Barcelona, Spain: International Committee on Computational Linguistics.Paper Data CodePeer-ReviewedA03
Aktaş, B. & Kohnert, A.TwiConv: A Coreference-annotated Corpus of Twitter Conversations2020M. Ogrodniczuk, V. Ng, Y. Grishina, & S. Pradhan (eds.), Proceedings of the Third Workshop on Computational Models of Reference, Anaphora and Coreference (CRAC@COLING) (pp. 47-54). Barcelona, Spain: Association for Computational Linguistics. *Paper Data Peer-ReviewedA03
Aktaş, B., Scheffler, T. & Stede, M.Anaphora Resolution for Twitter Conversations: An Exploratory Study.2018M. Poesio, V. Ng, & M. Ogrodniczuk (eds.), Proceedings of the First Workshop on Computational Models of Reference, Anaphora, and Coreference (pp. 1-10). New Orleans: Association for Computational Linguistics. *LinkPaper Data Peer-ReviewedA03
Das, D., Scheffler, T., Bourgonje, P. & Stede, M.Constructing a Lexicon of English Discourse Connectives.2018K. Komtani, D. Litman, K. Yu, A. Papangelis, L. Cavedon, & M. Nakano (eds.), Proceedings of the 19th Annual SIGdial Meeting on Discourse and Dialogue, pp. 360-365. *Paper Data Peer-ReviewedA03
Clausen, Y. & Scheffler, T.A corpus-based analysis of meaning variations in German tag questions. Evidence from spoken and written conversational corpora.2020aCorpus Linguistics and Linguistic Theory, 1-31.LinkPaper Data Peer-ReviewedA03
Aktaş, B., Solopova, V., Kohnert, A. & Stede, M.Adapting Coreference Resolution to Twitter Conversations.2020T. Cohn, Y. He, & Y. Liu (Eds.), Findings of the Association for Computational Linguistics: EMNLP 2020 (pp. 2454-2460): Association for Computational Linguistics. *Paper Data Peer-ReviewedA03
Bevacqua, L. & Scheffler, T.Form Variation of Pronominal It-Clefts in Written English.2020Linguistic Vanguard, 6(1), 20190066.LinkPaper Data Peer-ReviewedA03
Aktaş, B., Scheffler, T. & Stede, M.Coreference in English OntoNotes: Properties and Genre Differences.2019K. Ekštein (ed.), Text, Speech, and Dialogue: Proceedings of the 22nd International Conference on Text, Speech and Dialogue (TSD 2019) (pp. 171-184): Springer International Publishing. *LinkPaper Peer-ReviewedA03
Clausen, Y. & Nastase, V.Metaphors in Text Simplification: To change or not to change, that is the question.2019H. Yannakoudakis, E. Kochmar, C. Leacock, N. Madnani, I. Pilán, & T. Zesch (eds.), Proceedings of the Fourteenth Workshop on Innovative Use of NLP for Building Educational Applications (pp. 423–434). Florence: Association for Computational Linguistics. *Paper Peer-ReviewedA03
Clausen, Y. & Scheffler, T.Commitments in German Tag Questions: An Experimental Study.2020bS. Malamud, J. Pustejovski, & J. Ginzburg (eds.), Proceedings of the Proceedings of the 24th Workshop on the Semantics and Pragmatics of Dialogue - Full Papers (SEMDIAL). *Paper Peer-ReviewedA03
Scheffler, T., Aktaş, B., Das, D. & Stede, M.Annotating Shallow Discourse Relations in Twitter Conversations.2019A. Zeldes, D. Das, E. M. Galani, J. D. Antonio, & M. Iruskieta (eds.), Proceedings of the Workshop on Discourse Relation Parsing and Treebanking 2019 (pp. 50-55). Minneapolis, MN.: Association for Computational Linguistics. *Paper Peer-ReviewedA03
Aktaş, B., Clausen, Y., Scheffler, T. & Stede, M. Diskursstrategien in Sozialen Medien.2020K. Marx, H. Lobin, & A. Schmidt (Eds.), Deutsch in Sozialen Medien.  Interaktiv - multimodal - vielfältig (pp. 369–372). Boston, Berlin: de Gruyter.OtherA03
Aktaş, B. & Kohnert, A.TwiConv: A Coreference-annotated Corpus of Twitter Conversations.2020Paper presented at the Third Workshop on Computational Models of Reference, Anaphora and Coreference (CRAC@COLING). Online. 12 Decemer.Talk or PresentationA03
Aktaş, B., Scheffler, T. & Stede, M.Anaphora Resolution for Twitter Conversations: An Exploratory Study.2018Paper presented at the CRAC: NAACL Workshop on Computational Models of Reference, Anaphora, and Coreference, New Orleans, LA, USA. 06 June.Talk or PresentationA03
Aktaş, B., Solopova, V., Kohnert, A. & Stede, M.Adapting Coreference Resolution to Twitter Conversations.2020Paper presented at the Workshop on Computational Approaches to Discourse (CODI@EMNLP). Online. 20 November.Talk or PresentationA03
Aktaş, B. & Stede, M.Variation in Coreference Strategies across Genres and Production Media.2020Paper presented at the 28th International Conference on Computational Linguistics (COLING). Online 11 December.Talk or PresentationA03
Clausen, Y.German tag questions in discourse: limits and variability.2021Paper presented at the 29th Conference of the Student Organisation of Linguistics in Europe (ConSOLE 29), Centre for Linguistics, Leiden University, Leiden, Belgium. 26 - 28 January.Talk or PresentationA03
Clausen, Y.Modelling the variability of German tag questions in discourse.2020Paper presented at the 16. Sprachwissenschaftliche Tagung für Promotionsstudierende (STaPs16), University of Vienna, Vienna, Austria. 25 - 26 September.Talk or PresentationA03
Clausen, Y. & Scheffler, T.Commitments in German Tag Questions: An Experimental Study.2020Paper presented at the Virtual SemDial 24 (WatchDial). 19 July.Talk or PresentationA03
Clausen, Y. & Scheffler, T.Eine korpusbasierte Analyse von Bedeutungsvariation in Analyse von Bedeutungsvariation in deutschen Anhängsel -Fragen.2019Poster presented at the 55. Jahrestagung des Instituts für Deutsche Sprache (IDS), Mannheim, Germany. 12 - 14 March.Paper Talk or PresentationA03
Clausen, Y., Scheffler, T. & Stede, M.Variability of German Question Tags.2018Paper presented at the Discourse-Pragmatic Variation and Change (DiPVaC4), University of Helsinki, Helsinki, Finland. 28 - 30 May.Paper Talk or PresentationA03
Malamud, S. A. & Scheffler, T.Propositions, updates, speech acts - what is involved in “won’t you?” questions tags in American English.2018Paper presented at the 40. Jahrestagung der DGfS, Stuttgart. 07 - 09 March.Talk or PresentationA03
Scheffler, T.Discourse level variability in social media.2020Invited talk at the Colloquium series “Mehrsprachigkeit, Sprachkontakt, Sprachvariation”, Humboldt-Universität zu Berlin Berlin, Germany. 25 June.Paper Talk or PresentationA03
Scheffler, T.Explicitness and implicitness of discourse relations across social media.2020Paper presented at the Workshop ''Explicit and implicit coherence relations: Different, but how exactly?'', Humboldt-Universität zu Berlin, Berlin, Germany. 17 - 18 January.Paper Talk or PresentationA03
Scheffler, T., Stede, M., Aktaş, B. & Clausen, Y. Diskursvariabilität in sozialen Medien.2019Paper presented at the 55. Jahrestagung des Instituts für Deutsche Sprache (IDS), Mannheim, Germany. 13 March.Paper Talk or PresentationA03
Stede, M.Granularity in coherence relations and in connective description: Empirical and practical considerations.2019Invited talk at the Fred Jelinek Seminar Series, Charles University, Prague, Czech Republic. 09 December.Talk or PresentationA03
Stede, M.From connectives to discourse relations - an analysis of CONTRAST.2019Invited talk at the Bucharest Discourse Workshop, University of Bucharest, Bucharest, Romania. 16 October.Talk or PresentationA03
Stede, M.Obwohl/Altough: Moving beyond concession.2019Paper presented at the XPrag Workshop “Contrasting Underspecification and Overspecification of Discourse relations”, Leibniz-Zentrum für Allgemeine Sprachwissenschaft (ZAS), Berlin, Germany. 25 - 26 September.Talk or PresentationA03
Stede, M.Automatische Textgenerierung: Ein Blick auf die Technik.2021Invited talk at the Ringvorlesung "(Un)Creative Digital Writing", Technische Universität Dresden. 25 October.Talk or PresentationA03, T01
Stede, M.Contrast in Discourse and in Argumentation.2021Invited talk at the Workshop "Integrating Perspectives on Discourse Annotation", Eberhard Karls Universität Tübingen. 04 - 05 October.Talk or PresentationA03, T01
Clausen, Y.You shall know a tag by the context it occurs in: An analysis of German tag questions and their responses in spontaneous conversations.2021Holtz, A., Kovač, I., Puggaard-Rode, R. & Wall, J. (Eds.), ConSOLE XXIX: Proceedings of the 29th Conference of the Student Organization of Linguistics in Europe (pp. 116-140). Leiden: Leiden University Centre for Linguistics. *Paper Peer-ReviewedA03