Kürzel zur Nutzung von Frantext

Allgemein

 . Joker, der genau ein Zeichen ersetzt
* Joker, der null bis unendlich  Zeichen ersetzt
 ^xxx  nicht
  xxx | xxx  entweder oder
&cInfinitiv   alle konjugierten Formen eines Verbes
  &?xxx  fakultativ
xx[yz]x zwei Zeichen innerhalb eines Wortes,

von denen entweder das eine oder das andere vorkommen kann

 &q irgendein Wort
&q(0,2) 0 – 2 Wörter

xxx steht für ein graphisches Wort

Frantext catégorisé

Frantext catégorisé verfügt im Gegensatz zu Frantext intégral über eine Parts-of-Speech Annotation, d.h. den entités sind Codes grammaticaux  (meist Wortarten) zugeordnet.

Daher kann hier nicht nur nach graphischen Wörtern, sondern auch nach grammatischen Kategorien gesucht werden. Die dafür in Frantext categorisé verwendete Syntax sieht folgendermaßen aus:

&e(g=Cs) alle unterordnenden Konjunktionen (Cs hier als Beispiel für eine grammatische Kategorie)
&e(c=XXX) Syntax, die nach einer entité mit einem definierten graphischen Inhalt sucht

Auch hier können mehrere Sequenzen aufeinander folgen:

&caller &e(c=q) à eine konjugierte Form von aller + irgendein Token + à

Soll eine entité definiert werden, die nicht vorkommt, so muss folgende Syntax verwendet werden:

&e(g!=A) an dieser Stelle soll kein Adjektiv stehen

 

 

Liste der codes grammaticaux