Allgemein
. | Joker, der genau ein Zeichen ersetzt |
* | Joker, der null bis unendlich Zeichen ersetzt |
^xxx | nicht |
xxx | xxx | entweder oder |
&cInfinitiv | alle konjugierten Formen eines Verbes |
&?xxx | fakultativ |
xx[yz]x | zwei Zeichen innerhalb eines Wortes,
von denen entweder das eine oder das andere vorkommen kann |
&q | irgendein Wort |
&q(0,2) | 0 – 2 Wörter |
xxx steht für ein graphisches Wort
Frantext catégorisé
Frantext catégorisé verfügt im Gegensatz zu Frantext intégral über eine Parts-of-Speech Annotation, d.h. den entités sind Codes grammaticaux (meist Wortarten) zugeordnet.
Daher kann hier nicht nur nach graphischen Wörtern, sondern auch nach grammatischen Kategorien gesucht werden. Die dafür in Frantext categorisé verwendete Syntax sieht folgendermaßen aus:
&e(g=Cs) | alle unterordnenden Konjunktionen (Cs hier als Beispiel für eine grammatische Kategorie) |
&e(c=XXX) | Syntax, die nach einer entité mit einem definierten graphischen Inhalt sucht |
Auch hier können mehrere Sequenzen aufeinander folgen:
&caller &e(c=q) à | eine konjugierte Form von aller + irgendein Token + à |
Soll eine entité definiert werden, die nicht vorkommt, so muss folgende Syntax verwendet werden:
&e(g!=A) | an dieser Stelle soll kein Adjektiv stehen |
Liste der codes grammaticaux