Réseau thématique en sciences humaines et sociales

CNRS | INSHS

Le site est hébergé sur la grille de services du TGIR Huma-Num.


Accueil > Actualités de l’IST > Qu’est-ce que la Text Encoding Initiative ?


Actualités de l’IST

Qu’est-ce que la Text Encoding Initiative ?

Lou Burnard Qu’est-ce que la Text Encoding Initiative ? Nouvelle édition [en ligne]. Marseille : OpenEdition Press, 2015 (généré le 18 octobre 2016). Disponible sur Internet : <http://books.openedition.org/oep/1237> . ISBN : 9782821855816. DOI : 10.4000/books.oep.1237.

« Si vous accordez plus d’importance aux mots de votre texte et à leur sens qu’à la façon dont ils sont disposés sur la page, vous rencontrerez bien vite des limites frustrantes en utilisant un traitement de texte classique. La plupart de ces logiciels trouveront facilement pour vous, parmi des centaines de pages de texte, toutes les occurrences de la chaîne de caractères Paris. Mais pour une recherche intelligente – pour laquelle Paris, nom d’une ville du Texas, est distingué de celui de la capitale française, ou du prénom d’une starlette américaine – il faut plus que cela. Comme Coombs et al. l’ont souligné dès 1987, il y a une différence significative entre la façon dont un chercheur considère des ressources textuelles et la façon dont la plupart des systèmes automatisés de préparation de documents sont conçus. Pour reprendre une expression souvent citée, si ce que vous voyez est ce que vous obtenez (« What you see is what you get », ou Wysiwyg), alors vous n’obtenez que ce que vous voyez : les systèmes qui se préoccupent essentiellement de réduire l’écart entre ce que l’on voit à l’écran et ce que l’on saisit au clavier ont tendance, pour arriver à ce résultat, à réduire l’expression et le stockage des informations sous forme numérique à l’apparence des chaînes de caractères, plutôt qu’à leurs propriétés linguistique ou leur fonction. Vous pouvez ajuster à volonté la police, la taille, l’alignement ou la couleur de chaque occurrence du mot Paris dans votre document ; mais vous ne pouvez pas utiliser un logiciel de traitement de texte pour indiquer, de manière fiable et systématique, quelles occurrences sont des noms de personne et lesquelles sont des noms de lieu. »

Actualités de l’IST - Lectures - Édition scientifique -


Mise en ligne : octobre 2015
Mise à jour : novembre 2016