EditTEI

Accueil    La société    La numérisation    La technologie    Partenaires et références    Contact
Télécharger        Fonctionnalités        Copies d'écrans

Depuis quelques années, la numérisation est devenue incontournable. Cette nouvelle technique crée un besoin croissant de systèmes informatiques pour la gestion électronique des textes produits.

La société DIGISCRIB spécialisée dans la numérisation des livres et documents s'est investie, à la demande de ses partenaires Centre d'Etudes Supérieures de la Renaissance (CESR) et son équipe des Bibliothèques Virtuelles Humanistes (BVH) et Re-Transcripro, dans la recherche de solutions informatiques pour l'encodage, l'analyse, la gestion et la manipulation des textes et des documents après leur traitement OCR, ou après leur transcription.
Cette démarche va de pair avec la recherche accrue, par la société DIGISCRIB, d'outils d'océrisation et de gestion d'images sous Linux, comme Tesseract et ImageMagick, par exemple.

Basée sur la méthode d'encodage XML/TEI, compte tenu des possibilités qu'elle offre, et des réponses qu'elle apporte à une demande croissante, la société DIGISCRIB s'est engagée dans le développement d'un progiciel(1) d'encodage de texte.

« EditTEI » est le nom de ce nouvel encodeur de texte. Il est développé en Java, ce qui le rend compatible avec plusieurs plateformes : Linux, Windows, Mac, etc. Il est parfaitement trilingue : français, anglais et espagnol.

Cette première version aboutie « EditTEI 1.6.6 » propose les fonctionnalités d'édition de texte : la mise en page pour sa lecture le balisage interactif sans avoir à connaître ni à saisir les balises XML/TEI. Cette tâche est réalisée à partir d'une entête de données(2) ou d'un fichier XML/TEI existant(3), ou tout simplement à partir d'un fichier vierge(4).

Cet encodeur offre les outils d'édition habituellement utilisés, comme par exemple : ouvrir, enregistrer, imprimer un fichier, copier, couper et coller du texte, insérer ou supprimer des pages, gérer des caractères spéciaux ...

En plus des outils d'édition de base, le progiciel « EditTEI » permet l'ajout ou la suppression de balises XML/TEI existantes, d'encodage de caractères en ASCII(5), UTF-8(6), entre autres, et peut permettre sur agrément l'utilisation de dictionnaire de correction en ligne, la possibilité de « détildage » des textes ou la dissimilation des abréviations sur demande.

(1) Logiciels spécifiques développés selon les spécifications particulières d'un client.
(2) Ensemble d'information balisée concernant l'ouvrage. Information non visible dans le document.
(3) Document au format XML/TEI avec ou sans entête.
(4) Document au format texte sans entête.
(5) " Code américain normalisé pour l'échange d'information " norme de codage de caractères.
(6) Format de codage de caractères unicode.

Accueil    La société    La numérisation    La technologie    Partenaires et références    Contact