Description
La base de données Eqol_infra a été développée à
partir du corpus EQOL (Stanké et al., 2019) qui fournit les
fréquences d’occurrence de 14.800 formes orthographiques
apparaissant dans du matériel écrit destiné aux enfants
Québécois du primaire (12 manuels de mathématiques, 12 manuels
de français, 4 manuels d’univers social, 24 livrets de
littérature jeunesse, 90 extraits de littérature jeunesse) ainsi
qu'une échelle d'acquisition de l'orthographe lexicale. Les
estimations statistiques des caractéristiques orthographiques et
grapho-phonologiques des mots qui sont présentées dans Eqol_infra
sont similaires à celles de Manulex_infra: fréquence et
consistance des relations graphie-phonie (graphème-phonème,
phonème-graphème, rime phonologique), longueur orthographique,
phonologique, graphémique et syllabique des mots, complexité
graphémique ainsi que le voisinage orthographique des mots
(distance Levenshtein). Les entrées lexicales correspondant à
des noms propres, des onomatopées, et des interjections sont
exclues des analyses. A l'exception des points suivants, les
principes de codage et d’analyse sont identiques à ceux adoptés
pour Manulex_infra (détaillés sur les pages de Manulex_Infra):
• réintroduction de la différence entre les deux 'a' (/a/ vs.
/ɑ/ ), importante dans le français québécois
• adaptation à la prononciation usuelle québécoise pour les
contrastes /a/ vs. /ɑ/ et /o/ vs. /ɔ/
• le schwa en final des mots est soit optionnel, soit effacé.
La version actuelle est associée à la publication suivante: Stanké, B., Le Mené, M., Rezzonico, S., Moreau, A. C., Dumais, C., Robidoux, J., Dault, C. et Royle, P. (2019). ÉQOL : Une nouvelle base de données québécoise du lexique du primaire comportant une échelle d’acquisition de l’orthographe lexicale. CORPUS, 19. doi.org/10.4000/corpus.3818 Merci de la mentionner pour toute utilisation dans vos travaux. Merci également de mentionner la version de la base utilisée et l'adresse du site web.