XML | Métadonnées
x
Choix d'encodage
Les documents dans cette anthologie sont balisés utilisant le format P5 du Text-Encoding Initiative. Voir la page intitulée Schémas pour plus de détails. Tous les documents utilisent le même schéma, mariage.rng.

Types de documents

Les documents dans l'anthologie sont classés selon les catégories suivantes :

Images balisées

Les images sont balisées à l'aide du logiciel Image Markup Tool. A l’intérieur du <teiHeader>, les conventions normales comme décrites ci-dessous sont appliquées; le "Image Markup Tool" ajoute sa propre information automatiquement dès que les fichiers sont sauvegardés ou chargés. Ainsi les informations additionnelles apparaîtront dans le <teiHeader> de ces fichiers. À l'intérieur même de ces annotations (lesquelles sont des étiquettes <div> derrière les scènes), les éléments standards P5 du niveau bloc sont utilisés (<p>, <lg> et ainsi de suite), et en-dessous ce niveau, les descriptions sont comme suit ci-dessous.

Textes autonomes

Les textes autonomes sont des documents tel que des brochures, qui ne font pas partie d’un plus grand texte telle qu’une anthologie. Ces documents sont normalement balisés en utilisant les structures suivantes :
   <TEI>       <teiHeader></teiHeader>       <text>          <front>             <docTitle>                <titlePart type="main">[Titre du document]</titlePart>             </docTitle>          <docAuthor>                <name>[Auteur du document]</name>          </docAuthor>          </front>          <body>             <div>[Corps principal du texte]</div>          </body>          <back>[Parties complémentaires facultatives de fin de document]</back>       </text>    </TEI>

Textes tirés d’un document source plus long

Certains textes de la banque de données sont extraits d’une plus grande anthologie. Ceux-ci ont généralement la structure suivante :
   <TEI>       <teiHeader></teiHeader>       <text>          <body>             <div>             <head>[Titre du document]</head> [Corps principal du texte]             </div>          </body>       </text>    </TEI>
Dans les cas ci-dessus, l’encodage du contenu principal ("[Corps principal du texte]") suit les conventions décrites ci-dessous dans "Principes de balisage".

Le teiHeader

Pour voir des exemples des éléments d'un teiHeader, il suffit de cliquer sur le lien XML dans n'importe quel document sur le site. Pour visualiser l'information dans le teiHeader sous forme directement lisible, cliquer sur le lien Métadonnées.

Principes de balisage

Les éléments suivants sont employés couramment dans ce projet :
  • <div> : Le texte principal est entouré par un <div>, et d’autres <div> peuvent être installés à l’intérieur de celui-ci. Les éléments <div> elements peuvent avoir un attribut type les désignant comme chapitre ou toute autre division structurale.
  • <head> : Pour les textes courts extraits de documents plus longs (type 3 ci-dessus), le titre du texte est balisé avec un élément <head>. Pour les documents plus long ou des documents isolés, l’élément <head> est utilisée comme entête interne. L’attribut type peut être utilisé pour distinguer le type="main" du type="sub".
  • <p> : Elément de paragraphe normal.
  • <lg> et <l> : les groupes de lignes sont par défaut des groupes de vers en strophes, et des éléments de lignes (vers) apparaissent à l’intérieur de ceux-ci. Pour des structures poétiques plus complexes (comme des sonnets), les éléments <lg> peuvent être insérées en gigogne de façon à montrer un groupe de vers faisant partie d’un plus grand groupe de vers. Les étiquettes <l> peuvent apparaître seulement à l’intérieur des étiquettes <lg>. Les étiquettes <l> peuvent aussi porter un attribut n indiquant le numéro du vers; ceci devrait se faire seulement dans les situations où le texte complet du poème n’est pas inclu (en d’autres mots, là où seulement quelques extraits sont balisés), pour indiquer l'endroit où il manque des vers.
  • <pb> : L'élément saut de page est un jalon (sans contenu) et est habituellement doté d'un attribut n indiquant le numéro de page de la page suivante, ainsi <pb n=”22” /> apparaîtra en marge entre les pages 21 et 22.
  • <hi> : L'élément <hi> est utilisé pour indiquer un texte en caractères spécifiques tels que: italique ou gras, utilisant l'attribut rend: <hi rend="italics">, <hi rend="bold">.
  • <note> : L'étiquette <note> est utilisé de deux façons distinctes:
    • Pour de simples notes alignées. Le texte de la note est englobé par l'étiquette <note>, laquelle est insérée dans le texte à l'endroit précis où l'auteur souhaite l'ancrage. L'attribut resp peut être utilisé là où une note n'est pas fournie par les éditeurs actuels. (ex. resp="19thc editor").
    • 1.Pour les notes de liaison, dans lesquelles plusieurs liens entre les documents sont inclus avec une note explicative. Voici un exemple : <note type="link"><ref target="amant.xml#wifes_lover bosse.xml#wifes_lover sur_un_jaloux.xml fantastique_repentir.xml#strophe_dix-huit">Dans l'image "Il cherche ce qu'il ne voudroit pas trouver" et l'image "La femme battant son mari", s'agit-il d'un ami de l'époux? Ce n'est pas impossible, comme les vers "Sur un jaloux" et "Fantastique repentir" le suggèrent aussi.</ref></note> Ici l'élément <note> contient un élément <ref>; l'attribut target de l'élément <ref> a une liste délimitée par des espaces de références URI indiquant d'autres lieux, et les notes explicatives sont inclues dans l'élément <ref>. Dans cet exemple, il y a des liens à des emplacements dans quatre autres documents : l'élément avec l'attribut xml:id "wifes_lover" dans le document "amant.xml", l'élément avec le même id dans le document "bosse.xml", un lien général au document "sur_un_jaloux" (n'indiquant pas une endroit spécifique dans ce document), et l'élément avec l'attribut xml:id "strophe_dix-huit" dans le document "fantastique_repentir.xml". De cette façon, plusieurs documents peuvent être reliés ensemble autour du même commentaire ou de la même note.
  • <list> et <item> : à l'endroit où aparaissent les listes détaillées ou numérotées aparaissent dans le texte source, elles peuvent être balisées en utilisant un élément <list> (avec un attribut type de "ordered" pour des listes numérotées, ou "unordered" pour des listes à puces) contenant des éléments <item>.
x

Indice aux ressources