Comprendre Manulex Morpho
La transcription phonétique s'appuie sur un alphabet
phonétique simplifié créé pour la base de données (la
correspondance avec l'alphabet phonétique international se
trouve sur la page 'Codes phonétiques')
Informations générales
• Code orthographique du mot
• Code phonologique du mot
• Classe syntaxique (NC: nom; NP: nom propre; VER: verbe; ADJ:
adjectif; PRO: pronom; PRE: préposition; CON: conjonction; DET:
déterminant)
• Fréquence d'usage (selon Manulex ; Lété et al., 2004).
L’indice de fréquence textuelle est la fréquence du mot par
million de mots (valeurs dérivées des valeurs F de la base
Manulex)
• Structure phonologique CV1 (C=consonne, v=voyelle,
Y=semi-voyelle)
• Structure phonologique CV2 (O=occlusive, F=fricative,
N=consonne nasale, L=phonème /l/ et /R/, v=voyelle,
Y=semi-voyelle)
• Présence/absence de cluster consonantique dans le mot (colonne
'clusterCC'), et identité des clusters CC et CCC (colonne
'cluster_id')
• Segmentation du mot en graphème (le caractère '.' désigne une
frontière graphémique)
• Segmentation phonologique reflétant la segmentation
graphémique
• Associations graphème-phonème. Ce champ permet de localiser
les mots incluant une association particulière. Le caractère '-'
est utilisé pour relier graphème et phonème, et le caractère '.'
pour délimiter les associations graphème-phonème. En outre, une
parenthèse gauche '(' signale le début du mot, et une parenthèse
droite ')' sa fin : par exemple, '(ch-S.a-a.r-R)' pour le mot
'char' /SaR/). Ces caractères peuvent être utilisés afin de
faciliter la localisation de mots présentant une association
graphème-phonème particulière en début ou en fin de mot (par
exemple, la recherche de '(ch-S.' ou de '.ch-S)' fournit la
liste des mots incluant l'association 'ch-S' en début ou en fin
de mot, respectivement).
! ! A noter: dans la version 2 de Manulex-Morpho, les
segmentations grapho-phonémiques sont différentes des
segmentations phono-graphémiques afin de tenir compte
(essentiellement) de la présence de graphèmes qui sont muets à
l’oral (voir onglet 'Modifications ver.1').
Indices de longueur du mot
• Nombre de lettres, phonèmes, graphèmes, et syllabes
Fréquence et consistance des associations Graphème-Phonème
(G-Ph) et Phonème-Graphème (Ph-G) pour l'ensemble du mot et en
fonction de la position dans le mot (initiale, finale,
interne)
(Notes. Estimations réalisées par type et par token. L’indice
de fréquence textuelle est la fréquence du mot par million de
mots. Depuis la ver.2.4, les valeurs par token sont calculées
en utilisant une transformation logarithmique de la fréquence
des mots, log10(frequence+1). Dans la version 2 de
Manulex-Morpho, plusieurs graphèmes peuvent être codés comme
graphèmes finaux. Par exemple, le ‘d’ du mot ‘foulard’ est
considéré comme graphème final dans 'foulards", devant la
flexion nominale du nombre. Voir onglet "modifications ver.1".
• Fréquence moyenne des associations G-Ph et Ph-G
• Fréquence de l'association G-Ph et Ph-G initiale
• Fréquence moyenne des associations G-Ph et Ph-G internes
(non-initiale et non-finale)
• Fréquence de(s) association(s) G-Ph et Ph-G finale(s).
• Consistance moyenne des associations G-Ph
• A l'initiale du mot
• En position interne (non-initiale et non-finale)
• En fin de mot.
• Consistance moyenne des associations Ph-G
• A l'initiale du mot
• En position interne (non-initiale et non-finale)
• En fin de mot.