Η εφαρμογή παρουσιάστηκε στο «Athens Science Festival». Η πλατφόρμα αναπτύχθηκε στο πλαίσιο του έργου «reBook», που υλοποιείται σε συνεργασία με τον Σύλλογο Προς Διάδοσιν Ωφελίμων Βιβλίων (ΣΩΒ) και την εταιρεία Innews, στο πλαίσιο του ΕΣΠΑ 2014-2020. Στόχος του έργου είναι η ανάπτυξη νέων τεχνικών και μεθοδολογιών αναγνώρισης κειμένων, κυρίως γραμμένων σε πολυτονικό σύστημα, για την επιστημονική τεκμηρίωση της πολιτιστικής κληρονομιάς.
Με τη βοήθεια της εφαρμογής ερευνητές του Δημόκριτου ψηφιοποιούν και επανεκδίδουν ψηφιακά, περίπου 100 βιβλία από τα αρχεία του ΣΩΒ, τα οποία χρονολογούνται από τις αρχές του 20ου αιώνα και μετά. Ανάμεσα σε αυτά βρίσκονται το σύγγραμμα του Αδαμάντιου Κοραή «Επιστολαί προς τον Πρωτοψάλτην», που εκδόθηκε το 1911 και επανεκδόθηκε το 1959. Επίσης, το βιβλίο «Η ελληνικότης των νομών Προύσης και Σμύρνης» του Παντελή Κοντογιάννη, που πρωτοεκδόθηκε το 1919.
Στην εφαρμογή ανεβαίνουν εικόνες σκαναρισμένων βιβλίων και στη συνέχεια με τη βοήθεια της τεχνητής νοημοσύνης αναγνωρίζεται το κείμενο της κάθε εικόνας, ακόμα και αν είναι γραμμένο σε πολυτονικό σύστημα. Επίσης, στο στάδιο της προεπεξεργασίας της κάθε εικόνας, η εφαρμογή διορθώνει τα προβλήματα που μπορεί να έχει η εικόνα του βιβλίου, από το στραβό σκανάρισμα μέχρι τη διόρθωση ξεθωριασμένων σελίδων.
«Υπάρχει ένας τεράστιος όγκος βιβλίων που δεν είναι διαθέσιμα ψηφιακά και θέλουμε να τα κάνουμε διαθέσιμα, να βγάλουμε στην επιφάνεια τεκμήρια, τα οποία είναι στα ντουλάπια και τα ράφια βιβλιοθηκών. Οπότε ο στόχος μας είναι ιστορικά βιβλία να φτάσουν στο ευρύ κοινό και τους ερευνητές», εξηγεί στο ΑΠΕ-ΜΠΕ η Κατερίνα Χριστοπούλου, υποψήφια διδάκτορας Οικολογίας Τοπίου και επιστημονική συνεργάτιδα του «Δημόκριτου».
Εξηγώντας την αξία της εφαρμογής η κ. Χριστοπούλου επισημαίνει ότι «δεν βλέπουμε απλά ένα pdf με την εικόνα της σελίδας, αλλά η εικόνα έχει από πίσω την οπτική αναγνώριση χαρακτήρων (OCR), οπότε ο αναγνώστης μπορεί να χρησιμοποιήσει τμήματα του αρχείου ή να κάνει αναζήτηση μέσα σε αυτό». Η μεγάλη διαφορά όμως της εφαρμογής έγκειται «στην ανάγνωση του πολυτονικού συστήματος».
Δεν είναι η πρώτη φορά που το Εργαστήριο Υπολογιστικής Ευφυΐας του Ινστιτούτου Πληροφορικής και Τηλεπικοινωνιών του Δημόκριτου ασχολείται με την επεξεργασία και αναγνώριση ιστορικών εγγράφων. Σε αντίστοιχο έργο που υλοποίησε σε συνεργασία με το Πανεπιστήμιο Κύπρου προχώρησε στην ψηφιοποίηση με την ίδια μέθοδο πολυτονικών κειμένων από περίπου 150 εκδόσεις έργων του Σέξπιρ στα ελληνικά. Πρόκειται για μεταφράσεις που υπέγραψαν σπουδαίοι λογοτέχνες, όπως ο Κωνσταντίνος Καβάφης, ο Κωνσταντίνος Θεοτόκης και ο Δημήτριος Βικέλας, και οι οποίες προέρχονται μεταξύ άλλων από τις συλλογές της Βιβλιοθήκης της Βουλής, της Εθνικής Βιβλιοθήκης και του Ελληνικού Λογοτεχνικού και Ιστορικού Αρχείου.
Ένα από τα στοιχήματα που έχει βάλει το Εργαστήριο είναι η ψηφιακή απεικόνιση χειρογράφων. «Η αναγνώριση χειρογράφων στα σύγχρονα κείμενα έχει προχωρήσει πολύ. Αυτό που δεν είχε γίνει στο παρελθόν είναι κάποιο εργαλείο που να μπορεί να αναγνωρίσει τα παλιά χειρόγραφα και ιδίως τα ελληνικά πολυτονικά», εξηγεί στο ΑΠΕ-ΜΠΕ ο υπεύθυνος του Εργαστηρίου, Βασίλης Γάτος.
H EE έχει θεσπίσει τον Νόμο για την Τεχνητή Νοημοσύνη (AI Act) που αποτελεί το πρώτο νομικό πλαίσιο για την τεχνητή νοημοσύνη. Στόχος είναι να ντιμετωπίζει τους κινδύνους της τεχνητής νοημοσύνης και τοποθετεί την Ευρώπη στο να διαδραματίσει ηγετικό ρόλο παγκοσμίως.
Ο νόμος AI στοχεύει να παρέχει στους προγραμματιστές και τους προγραμματιστές τεχνητής νοημοσύνης σαφείς απαιτήσεις και υποχρεώσεις σχετικά με συγκεκριμένες χρήσεις της τεχνητής νοημοσύνης. Ταυτόχρονα, ο κανονισμός επιδιώκει να μειώσει τις διοικητικές και οικονομικές επιβαρύνσεις για τις επιχειρήσεις, ιδίως τις μικρές και μεσαίες επιχειρήσεις .
Τέλος, αποτελεί μέρος ενός ευρύτερου πακέτου μέτρων πολιτικής για την υποστήριξη της ανάπτυξης αξιόπιστης τεχνητής νοημοσύνης,
Τη συντακτική ευθύνη για τη δημοσίευση έχει το AMNA.