Open Access Database
"Adjective-Adverb Interfaces in Romance"
- Finanzierung: FWF
- Projektnummer: ORD 66 (Open Research Data)
- Projektdauer: 15.09.2017 bis 14.09.2020
Team:
- Projektleitung: Martin Hummel
- Datenerfassung und Annotation: Katharina Gerhalter
- Datenmodellierung: Christopher Pollin
- Datenmodellierung: Gerlinde Schneider
Das Ziel dieses Kooperationsprojektes zwischen dem Institut für Romanistik und dem ZIM (Zentrum für Informationsmodellierung in den Geisteswissenschaften / Institut für Digital Humanities) war die Erstellung der Open Access Datenbank "Adjective-Adverb Interfaces in Romance" nach den Standards von CLARIN-ERIC. Diese macht Sprachbelege zum Phänomen der Adjektiv-Adverbien in den romanischen Sprachen über ein annotiertes und lemmatisiertes online-Korpus allgemein zugängig und nutzbar. Im Sinne von Open-Access konnten somit die Sprachdaten, die wissenschaftlichen Publikationen zum Thema zugrunde liegen, nachvollziehbar gemacht werden und unterschiedliche Datensätze aus unterschiedlichen romanischen Sprachen miteinander verknüpft werden.
Derzeit umfasst die Datenbank neun Datensätze und rund 35.000 Sprachbelege. Die Suchmaske des Korpus erlaubt sprachübergreifende Suchanfragen nach den annotierten Kategorien. Die Suchergebnisse sowie die kompletten Datensätze und Annotationen können in mehreren standardisierten Formaten heruntergeladen werden (z.B. Volltexte, Metadaten und Annotationen in XML/TEI; Belegstellen und Annotationen in RDF und EXCEL) und weiterverwendet werden.
Im Zuge des Projektes wurden Daten aus dem Dictionnaire historique de l’adjectif-adverbe und dem bereits publizierten SH3-Kapitel Los adjetivos adverbiales (Hummel 2014) verfügbar gemacht. Andererseits wurden auch neue Daten vom Projektteam erfasst, unter anderem auch in Kooperation mit internationalen Projektpartnern: Adrian Chircu (Universität Cluj-Napoca, Rumänien), Adam Ledgeway (Universität Cambridge, UK - (süd)italienische Daten) und der Gruppe "Discurso & Gramática" (Universidade Federal do Rio de Janeiro, Brasilien). Die Datenbank profitiert außerdem von Synergieeffekten mit den beiden ebenfalls an der Karl-Franzens-Universität Graz ansässigen FWF-Projekten P 30751 "The Third Way" und P 37209 "The Second Way", die weiterhin neue Datensätze zur Datenbank beitragen. Aufgrund des erarbeiteten Annotationsmodells können neue Daten einheitlich klassifziert und inkorporiert werden und bleiben so der linguistischen Forschung langfristig und vergleichbar zugänglich.
Schneider, Gerlinde / Pollin, Christopher / Gerhalter, Katharina / Hummel, Martin (2020): Adjective-Adverb Interfaces in Romance. Open-Access Database (=AAIF-Database). https://gams.uni-graz.at/context:aaif
Rezension zur Datenbank:
Joan Torruella (2024), Revista Internacional de Lingüística Iberoamericana 21(42). https://doi.org/10.31819/rili-2023-214225
Veröffentlichungen zum Projekt
Gerhalter, Katharina, Gerlinde Schneider, Christopher Pollin & Martin Hummel. 2020. An annotated corpus of adjective-adverb interfaces in Romance languages. In: Nicoletta Calzolari, Frédéric Béchet, Philippe Blache, Khalid Choukri, Christopher Cieri, Thierry Declerck, Sara Goggi, Hitoshi Isahara, Bente Maegaard, Joseph Mariani, Hélène Mazo, Asuncion Moreno, Jan Odijk & Stelios Piperidis (eds.), Proceedings of the 12th Language Resources and Evaluation Conference LREC 2020, Marseille, 946–950. Paris: European Language Resources Association (ELRA). http://www.lrec-conf.org/proceedings/lrec2020/pdf/2020.lrec-1.120.pdf
Gerhalter, Katharina, Martin Hummel, Christopher Pollin & Gerlinde Schneider. 2018. Compilation and Annotation of Adjective-Adverb Interfaces in Romance. Towards a multilingual Open Access Corpus. CHIMERA: Romance corpora and Linguistic Studies 5(2), 305–311. (http://revistas.uam.es/index.php/chimera/article/view/9720)
Pollin, Christopher, Gerlinde Schneider, Katharina Gerhalter & Martin Hummel. 2018. Semantic Annotation in the Project “Open Access Database ‘Adjective-Adverb Interfaces’ in Romance”. Proceedings of the Workshop on Annotation in Digital Humanities. CEUR Workshop Proceedings. 41–46. ceur-ws.org/Vol-2155/. [pdf]
Siehe auch die mit (µ) gekennzeichneten Veröffentlichen in der Publikationliste der Forschungsgruppe (Reiter links).
Weiterentwicklung und Präsentation der Datenbank auf Kongressen
> LREC (European Language Resources Association), 11.–16.05.2020 in Marseille (Konferenz abgesagt/verschoben). Posterpräsentation.
> Colloque "Le problème de l'adverbe", 26.–27.03.2020. Paris, La Sorbonne. online.
> CLARIN Annual Conference in Leipzig, 30.09.–2.10.2019
> VI Congreso de la red CHARTA "Documentos y monumentos para la historia de la lengua española", 10-13. September 2019, Universität Sevilla
> CLARIN Annual Conference in Pisa, 8–10.10.2018
> Poster auf der 5th Conference Digital Humanities Austria, 29.11.–1.12.2018 (DHA 2018), Universität Salzburg.
> Conference on Corpus Linguistics for Spanish (CLICE 2018). Florenz, 29.–30.10.2018. Seminario de demostración de recursos.
> Summer School in Digital Humanities and IT, Borovets, Bulgaria, August 2018