Nevalainen Terttu
Γλώσσα
Αγγλική
Ημερομηνία
28/06/2013
Διάρκεια
34:37
Εκδήλωση
Ημερίδα για τη δημιουργία και ανάλυση των διαχρονικών σωμάτων κειμένων
Χώρος
Κεντρικό κτίριο Πανεπιστημίου Αθηνών
Διοργάνωση
Τομέας Γλωσσολογίας - Τμήμα Φιλολογίας - Εθνικό και Καποδιστριακό Πανεπιστήμιο Αθηνών
Κατηγορία
Γλωσσολογία / Γλωσσικά Θέματα
Ετικέτες
διαχρονικά σώματα κειμένων, ιστορικά σώματα κειμένων, Σώμα Κειμένων του Ελσίνκι
Αντιπροσωπευτικότητα και συγκρισιμότητα των ιστορικών σωμάτων κειμένων: Η εμπειρία του Σώματος Κειμένων του Ελσίνκι
Η πρόσβαση σε συγκρίσιμα δεδομένα είναι θεμελιώδης για τη μελέτη της γλωσσικής ποικιλότητας και της γλωσσικής αλλαγής στη διάρκεια του χρόνου. Ωστόσο, όσο ευρύτερη είναι η επιλογή των ιστορικών κειμένων και όσο πιο πίσω ανάγεται χρονικά, τόσο δυσκολότερο γίνεται να επιτύχουμε άμεση συγκρισιμότητα. Για να βελτιστοποιήσουν την κειμενική συνέχεια στη διάρκεια του χρόνου, οι σχεδιαστές σωμάτων κειμένων χρησιμοποιούν πλαίσια και μονάδες σταθερής δειγματοληψίας. Αυτό ήταν και ο στόχος των δημιουργών του Helsinki Corpus of English Texts (HC, 8ος-18ος αιώνας), που περιλαμβάνει πλήθος κειμενικών ειδών, καθώς και των εκδοχών του που είναι γραμματικά επισημειωμένες και της επέκτασής του στην Ύστερη Σύγχρονη Αγγλική (PPCMBE, 1700–1914). Εφόσον τα κειμενικά γένη και είδη επιδεικνύουν ποικίλους βαθμούς συγχρονικής ποικιλότητας και υφίστανται διαχρονικές αλλαγές, η απόφαση να διατηρηθούν σταθερές οι μονάδες δειγματοληψίας δεν είναι απαλλαγμένη από προβλήματα: τα κείμενα αποτελούν το προϊόν ποικίλων πρακτικών του λόγου και συνδέονται στενά με κοινωνικές πρακτικές. Αυτό είναι εμφανές και σε σώματα κειμένων ενός κειμενικού είδους, όπως το Corpus of Early English Correspondence (CEEC), που καλύπτει την περίοδο από το 1400 έως το 1800.
Χρησιμοποιώντας ως υλικό τα σώματα κειμένων HC και CEEC, στην αρχή μελετώ τα επίπεδα αφαίρεσης στα οποία μπορούν να χρησιμοποιηθούν τα διαχρονικά σώματα κειμένων για να μελετηθούν διαδικασίες γλωσσικής αλλαγής σε πραγματικό χρόνο. Για να αντιμετωπιστούν οι προκλήσεις που θέτει το «πρόβλημα των κακών δεδομένων» του ιστορικού γλωσσολόγου, στη συνέχεια συζητώ κάποιες από τις μεθόδους που ήδη υπάρχουν και που αναπτύσσονται για την ανάλυση κειμενικών ομοιοτήτων και διαφορών ανάμεσα σε σώματα κειμένων. Αναφέρομαι στην ανάγκη για επισημείωση και οπτικοποίηση των σωμάτων κειμένων και παρουσιάζω ένα εργαλείο που επιτρέπει τη διαδραστική οπτική διερεύνηση διάφορων πτυχών των δεδομένων.
Η ανακοίνωση πραγματοποιήθηκε στο πλαίσιο ημερίδας που διοργανώθηκε από το πρόγραμμα «Διαχρονικό Σώμα Ελληνικών Κειμένων του 20ού αιώνα» (Greek Corpus 20, http://greekcorpus20.phil.uoa.gr/), το οποίο συγχρηματοδοτείται από το Ευρωπαϊκό Κοινωνικό Ταμείο και την Ελλάδα (Ερευνητικό πρόγραμμα «Αριστεία»). Στόχος της ημερίδας ήταν η συζήτηση και ο προβληματισμός για τις βασικές αρχές και τις ορθές πρακτικές που αφορούν στη συγκρότηση διαχρονικών σωμάτων κειμένων με σκοπό τη γλωσσολογική έρευνα. Η εμπειρία μελετητών που έχουν εργαστεί σε σχετικά ερευνητικά προγράμματα σε άλλες γλώσσες αναμένεται να συμβάλει σημαντικά στη διαμόρφωση των στόχων και των πρακτικών του διαχρονικού σώματος κειμένων της Ελληνικής, καθώς, σε αντίθεση με άλλες γλώσσες, η Ελληνική δεν έχει επωφεληθεί έως τώρα από την ανάπτυξη της υπολογιστικής γλωσσολογίας σωμάτων κειμένων στο βαθμό που θα αναμενόταν: η έλλειψη ενός διαχρονικού σώματος κειμένων της Ελληνικής αποτελεί ένα μείζον κενό στην ελληνική γλωσσολογία και το ερευνητικό πρόγραμμα στοχεύει να καλύψει αυτό το κενό, αναπτύσσοντας ένα σώμα κειμένων 20 εκατ. λέξεων για τις πρώτες εννέα δεκαετίες του 20ου αιώνα, το οποίο θα ενσωματωθεί στο προϋπάρχον σώμα κειμένων 30εκατ. λέξεων του ΣΕΚ. Στόχος του σώματος κειμένων είναι η μελέτη περιοχών πρόσφατης γλωσσικής αλλαγής (τόσο σε γραμματικό όσο και σε λεξιλογικό επίπεδο) μέσω της ανάλυσης αυθεντικών κειμένων.
Η Terttu Nevalainen είναι Καθηγήτρια Αγγλικής Φιλολογίας στο Πανεπιστήμιο του Ελσίνκι, από το οποίο έλαβε τη διδακτορική της διατριβή το 1991. Είναι Διευθύντρια της Ερευνητικής Μονάδας για την Ποικιλότητα, τις Επαφές και την Αλλαγή στην Αγγλική (VARIENG), που αποτελεί Κέντρο Αριστείας. Τα πολλαπλά πεδία έρευνάς της περιλαμβάνουν την αγγλική γλώσσα και την ιστορία της, την ιστορική κοινωνιογλωσσολογία, τις σπουδές ποικιλότητας, τη δημιουργία και τη μεθοδολογία σωμάτων κειμένων. Είναι επιστημονική υπεύθυνη μιας σειράς σωμάτων κειμένων που αποτελούν το Corpus of Early English Correspondence (πάνω από 5 εκατομμύρια λέξεις) και συμμετέχει στο ερευνητικό πρόγραμμα Data mining tools for changing modalities of communication (DAMMOC) της Ακαδημίας της Φινλανδίας, το οποίο δημιουργεί εργαλεία και τεχνικές για τη μελέτη της γλωσσικής ποικιλότητας και της αλλαγής που λειτουργούν σε σχολιασμένα σώματα κειμένων, τόσο ιστορικά όσο και σύγχρονα. Στα βιβλία της περιλαμβάνονται: Historical Socio¬linguistics: Language Change in Tudor and Stuart England (2003, με την H. Raumolin-Brunberg), An Introduction to Early Modern English (2006), Letter Writing (2007, επιμ. με την S.-K. Tanskanen), How to Deal with Data: Problems and Approaches to the Investigation of the English Language over Time and Space (2011, επιμ. με την S. Fitzmaurice) και ο πρόσφατος τόμος The Oxford Handbook of the History of English (2012, επιμ. με την E. Traugott).