Εργαστήριο Επεξεργασίας Φυσικής Γλώσσας
Natural Language Processing Laboratory

ανακοινώσεις - announcements

μαθήματα - courses

έρευνα - research

δημοσιεύσεις - publications

συνέδρια - conferences

ενδιαφέροντες σύνδεσμοι - interesting links

Μέλη Ερευνητικής Ομάδας - επικοινωνία

Research Group Members -Contacts

έρευνα

Ερευνητικά Ενδιαφέροντα
  • Τυποποίηση Ελληνικής Γραφής (Στοιχείων, Πληκτρολογίου, Μεταγραφής / Μεταγραμματισμού) και Πολιτισμικών στοιχείων
  • Υπολογισμοί στη Φιλολογική και Γλωσσική Επεξεργασία Κειμένου (Κανονικοποίηση Κειμένου, Επισημείωση, Ταξινόμηση, Παραγωγή Λεξικών, Λέξεις στα Συμφραζόμενά τους, Λεξικές Βάσεις Δεδομένων)
  • Υπολογιστική Γραμματική (Μορφολογική και Συντακτική Ανάλυση, Σημασιολογικές ιδιότητες και Παράσταση Γλωσσικής Γνώσης)
  • Ορολογία Πληροφορικής
  • Επιδράσεις Πληροφορικής στην Κοινωνία -- ειδικότερα την Εκπαίδευση
Αναπτυξιακά Συστήματα - Πρότυπα
Συμβολή στην Τυποποίηση και ανάπτυξη Προτύπων για:
  • Σύνολα Ελληνικών Στοιχείων (Character Sets): ΕΛΟΤ 927, ISO 8859/7 (ΕΛΟΤ 928), ISO 10646 (Ελληνικά επίπεδα)
  • Ελληνο-Λατικνικό Πληκρτολόγιο: ΕΛΟΤ 1000
  • Μεταγραφή και Μεταγραμματισμός Ελληνικής Γραφής και Κειμένου: ISO 843 (ΕΛΟΤ 743)

Υπολογιστικά Εργαλεία για τη Φιλολογική και Γλωσσική Επεξργασία: Κανονικοποίηση Κειμένου, Ταξινόμηση, Επισημείωση, ημι-αυτόματη Παραγωγή Λεξικών, Εύρεση Λέξεων στα Συμφραζόμενά τους (1985)

"Συνθέτης", ο πρώτος Συντάκτης Κειμένου για την Ελληνική Γλώσσα. Αναπτύχθηκε για το MS-DOS platform (ΕΛ.ΚΕ.ΠΑ., 1986).

Μορφολογικοί Αναλυτές - Επισημειωτές (taggers) για τη Νέα Ελληνική Γλώσσα:

  • "Λεξιφάνης", ο πρώτος Μορφολογικός Αναλυτής - Επισημειωτής Μέρους Λόγου για τη Νέα Ελληνική Γλώσσα, βασισμένος στα αυτόματα (1985)
  • "Ωκυλήμμα", Επισημειωτής Μέρους Λόγου με βάση πίνακες αποφάσεων (1987)

Σύστημα Γνώσης "Κειμενοποιητής" για την παράσταση Μορφολογικών, Συντακτικών και Σημασιολογικών χαρακτηριστικών της Ελληνικής γλώσσας, με τον φορμαλισμό Ενοποιητικής Γραματικής 'PATR II' (ΕΜΠ, 1991).

Λημματογράφος "QuickLem" για την Νέα Ελληνική. ο Λημματογράφος αποδίδει το λήμμα σε ονόματα και επίθετα. Το ρήμα βρίσκεται υπό ανάπτυξη (ΕΜΠ, 2000)

Βιβλιογραφικές Βάσεις Δεδομένων

Βιβλιογραφική Βάση για την Ελληνική Γλωσσολογία.

Ελληνική Επιστημονική Βιβλιογραφία Πολυτονική Βάση Δεδομένων για τη Βιβλιοθήκη του ΕΜΠ (Καθ. Μ. Ασημακόπουλος (ΕΜΠ, 2000).

 
Χρηματοδοτούμενα Ερευνητικά Προγράμματα
EUROTRA: Μέλη της Ερευνητικής Ομάδας συμμετείχαν στο πρόγραμμα αυτό. Σχεδιασμός και υλοποποίηση εργαλείων για την κανονικοποίηση Ελληνικού Κειμένου (διαχωρισμός προτάσεων, επισημείωση σημείων στίξης), εύρεση λέξεων στα συμφραζόμενά τους. Λεξικές Βάσεις Δεδομένων (Ευρωπαϊκή Ένωση, 1985 - 1988).

Υφολογικός Ελεγκτής Ελεγχόμενης Ελληνικής Γλώσσας "Σχηματοποίηση". Ελεγκτής τεχνικών κειμένων για την Ελεγχόμενη Νέα Ελληνική Γλώσσα σε συνεργασία με το ΙΕΛ (ILSP), Τον Δημόκριτο, τη Unisoft και την ALTEC. (Γενική Γραμματεία Έρευνας και Τεχνολογίας, 1999-2001), URL: http://schema.glotta.ntua.gr.

Βασική έρευνα για το ρήμα. Βάση Δεδομένων με τις μεταφραστικές ισοδυναμίες ζευγών Ελληνο-Αγγλικών ρημάτων. Παράσταση συντακτικών και σημασιολογικών χαρακτηριστικών των Ελληνικών και Αγλλικών ρημάτων. (ΕΜΠ, 2000-2002).

ML-Images! Πρόγραμμα "e-Content" Ευρωπαϊκή Ένωση (2001-2003).
Τεχνική Αναφορά: Πολυγλωσσικό Σύστημα Δεικτοδότησης - Αναζήτησης στο διαδίκτυο

Βασική Έρευνα για τη σημασιολογία λέξεων. Σχεδιασμός Οντολογίας για το 'Αντιλεξικό' του Βοσταντζόγλου , εννοιολογικό λεξικό της νεοελληνικής γλώσσας. (ΕΜΠ, 2004-2006).

 
Βιβλιογραφία (συλλογή)