Le projet Pomme: une base de données interactive de grammaire française

Martin Beaudoin (Faculté Saint-Jean, University of Alberta)

Résumé

Le projet Pomme est un projet collaboratif qui vise à mettre toute la grammaire française en ligne sous forme d'une base de données interactive. Celle-ci sera constituée d'environ 450 règles grammaticales accompagnées d'exercices (textes lacunaires, choix multiple et identification) avec correction automatique. Les textes servant d'exercices sont généralement de type informatif et ont pour thème général le Canada. La plupart des aspects grammaticaux sont en cours de production. Le projet devrait se terminer en décembre 2000. La session inclura une présentation générale du projet, une visite guidée, une discussion de notre méthodologie de conception et un résumé des écueils rencontrés.

Introduction

Le projet Pomme est né de deux désirs: rendre l'ensemble de la grammaire française sur le Web pour nos étudiants et tenter d'uniformiser le contenu grammatical des cours de français dans les institutions post-secondaires en Alberta. Sept chercheurs provenant de quatre institutions participent présentement au projet (University of Alberta, dont la Faculté Saint-Jean, University of Calgary, Athabasca University et Augustana University College). Le projet consiste donc à développer un site Web qui donne accès à l'ensemble de la grammaire ainsi qu'à des exercices corrigés automatiquement. Le projet vise les apprenants anglophones et francophones de niveau débutant, faux débutant, intermédiaire, avancé ou supérieur. Le projet a été rendu possible grâce à une généreuse subvention du gouvernement de l'Alberta sous le chapeau de Learning Enhancement Envelope 3. Le projet a débuté en novembre 1998 et se terminera en décembre 2000 (du moins les fonds échoiront à ce moment).

Plutôt que d'écrire une grammaire à partir de rien, nous avons dès le début tenté d'aller chercher les droits pour reproduire une grammaire déjà éditée et reconnue. Nous avons donc contacté les éditeurs de La grammaire française de Jacqueline Ollivier. Nous avons obtenu gratuitement les droits de reproduire sur le Web et de modifier sans limite cette grammaire. En revanche, l'éditeur peut demander une licence pour intégrer le matériel que nous produisons à partir de Ollivier pour la troisième édition de l'ouvrage imprimé. Ainsi, nous avons dans un premier temps numérisé le texte, puis nous avons effectué une première révision des règles tout en les morcelant. Nous les avons ensuite webifiées. Un nom a été donné à chacune de ces règles, ce qui a permis de construire la base de données principale (nous décrirons plus loin les sept parties de la base de données utilisées dans le projet). Presque toutes les règles ont été modifiées, plusieurs règles ont été ajoutées, quelques unes des règles originales ont été retranchées. Il reste entre vingt et cent règles à ajouter, selon ce qu'il nous sera possible d'accomplir avant décembre. À ce jour, la base de données comporte trois cent quarante règles divisées en une quarantaine d'aspects grammaticaux (voir liste complète en appendice).

Parallèlement au développement de la grammaire, nous avons constitué une équipe d'auteurs pour écrire des textes qui serviront de base aux exercices. La plupart de ces textes ont pour thème le Canada. Nous abordons ainsi des thèmes très variés, de la vie de Louise Arbour à la dispersion géographique du macareux moine en passant par les débats constitutionnels de 1971 et la vie de Billy Barker. Ces textes sont ensuite transformés en textes lacunaires (exercices de clozure), en exercices à choix multiple ou en exercices d'identification.

Visite guidée

En entrant dans le site (http://www.pomme.ualberta.ca), l'usager fait d'abord face à un dessin de pomme et à des champs où il doit donner son nom d'usager et un mot de passe. Le nouvel usager pourra aussi s'inscrire (pas encore disponible) ou accéder à un site de démonstration. Les usagers inscrits à une institution post-secondaire de l'Alberta auront droit d'accès gratuit. Les personnes achetant la troisième édition de La grammaire française se verront données les mêmes droits d'accès. Pour les autres usagers potentiels, les avocats de la University of Alberta cherchent une procédé simple et efficace. Pour l'instant, les autres usagers ont accès au site de démonstration qui inclut la plupart des fonctions mais les liens menant aux règles et aux exercices ne sont pas actifs. Une fois cette étape passée, l'usager verra un dessin de pomme coupée donnant accès aux composantes du site: présentation du site, plans de cours, index, recherche, verbes et aide. Nous présenterons séparément ces composantes.

Image de la page d'accueil:

Image de la page principale:

Présentation du site

Cette page fournit des informations de base sur le projet. Elle présente notamment la liste des collaborateurs.

Plans de cours

Cette page dynamique présente les règles grammaticales suggérées aux apprenants de divers niveaux. L'ordre des règles est fixe et tente de suivre l'ordre suivi dans les cours de français. L'usager a accès à tous les plans de cours, mais la base de données affichera initialement le plan du niveau sélectionné lors de l'inscription. Seule une ébauche du niveau intermédiaire est disponible car ces plans seront élaborés à l'automne 2000 en consultation avec plusieurs institutions de l'Alberta (nous tenterons alors d'établir un standard provincial de plans de cours).

Image de la page de plans de cours:

Règles

L'usager peut avoir accès aux règles listées par un simple clique. Il revient au plan de cours en cliquant sur le bouton de retour du navigateur. Les règles comportent des liens vers d'autres règles dans le texte même. Les règles comportent aussi des renvois vers d'autres règles qui pourraient intéresser l'usager. L'usager a finalement accès aux exercices attachés à la règle (s'il y en a) par le biais de la fenêtre verticale à la gauche de l'écran. Ces exercices sont ordonnés selon leur niveau de difficulté (du niveau 1 pour les débutants au niveau 5 pour les avancés).

Image d'une page de règle:

Exercices

Les exercices relèvent de trois types: des textes lacunaires, des exercices à choix multiple et des exercices d'identification. Les textes lacunaires consistent en des textes desquels certains mots spécifiques ont été effacés. L'usager doit donc fournir ces mots à l'ordinateur. La correction se fait dès que l'usager passe au mot suivant, présentant la bonne réponse s'il y a une erreur (la réponse de l'usager se trouve alors entre astérisques). Le score est compilé au bas de l'écran et l'usager peut enregistrer ses résultats dans une base de données en cliquant sur le bouton "à enregistrer". Les exercices à choix multiple sont des textes similaires aux premiers mais pour lesquels deux ou trois choix sont donnés au lieu d'un blanc. Ce type d'exercice est corrigé à la fin de l'exercice; les réponses erronées sont alors indiquées par un crochet ou un "x" dans les cases précédant chaque choix. L'usager peut enregistrer ses résultats comme pour les textes lacunaires. Les exercices d'identification sont des cartes-images de textes. L'usager doit cliquer sur la partie du discours approprié dans le texte. L'ordinateur lui donne alors de la rétroaction selon sa réponse. Aucun score n'est consigné pour ce type d'exercice.

Index

L'index présente une liste de toutes les règles regroupées par aspect grammatical. Les aspects sont ordonnés alphabétiquement et les règles à l'intérieur de chaque aspect sont ordonnées pédagogiquement. L'usager peut donc obtenir chacune de ces règles en cliquant sur son titre. L'usager a aussi accès à une table des matières par un lien se trouvant au coin supérieur droit de l'écran. Cette table des matières dynamique inclut toutes les règles mais les présente avec une nomenclature et dans un ordre semblables à ceux du manuel de Ollivier.

Image de la page d'index:

Image de la page de la table des matières à la Ollivier:

Recherche

Un usager peut rechercher de l'information dans la base de données grammaticale. Toutes les règles sont indexées par mots clés et par contenu grammatical. Ainsi, on retrouverait les règles sur les déterminants définis en recherchant un des termes suivants: "article", "déterminant", "articles", "déterminants", "défini", "définis", "le", "la", "l'" ou "les". L'outil de recherche permet la troncation et l'utilisation de symboles (tel que le montre la page de recherche). Le résultat des recherches est ordonné alphabétiquement selon le titre de la règle.

Image de la page de recherche:

Verbes

Le site donne accès à une base de données interactive de conjugaison complète (Le devoir conjugal: http://www.pomme.ualberta.ca/devoir). Elle inclut près de 7200 verbes (c'est-à-dire à peu près l'ensemble des verbes du Robert et du Bescherelle). Cette base et l'interface sont présentement en cours de révision finale. Bien qu'elle ait été conçue et construite par l'auteur, cette base de données ne fait pas partie intégrante du site de Pomme et est d'accès public.

Image de la page de conjugaison:

Aide

De l'aide est disponible une fois que l'usager dépasse la fenêtre d'accueil avec la pomme coupée. Cette page donne des directives spécifiques et permet à l'usager de modifier les informations qu'il a données lors de l'inscription au site (pas encore disponible).

Processus de conception et production

Le site de Pomme fonctionne grâce à un ensemble de 8 bases de données relationnelles. Le logiciel de gestion des bases de données utilisé est FileMaker Pro 4.1. Ce logiciel a été retenu pour sa simplicité et son efficacité à gérer de petites bases de données. L'interface Web est programmée en HTML, en CDML et en JavaScript. Les fichiers HTML qui contiennent les règles et les exercices sont des fichiers autonomes. Les règles sont modifiées à l'aide de BBEdit. La plupart des exercices sont écrits par les auteurs puis envoyés par courriel en format Word via Hotmail. Ils sont ensuite webifiés par des scripts PERL écrits expressément pour le projet par l'auteur. La production se fait sur Macintosh et les fichiers sont finalement transférés sur un serveur Windows NT.

Écueils rencontrés

Quatre écueils majeurs ont été rencontrés: la difficulté à trouver des auteurs qualifiés et disponibles, la difficulté à trouver des programmeurs qualifiés, le temps et l'effort nécessaires à la négociation des droits d'auteurs et le manque de temps pour effectuer la recherche.

Trouver des auteurs francophones qualifiés et disponibles en Alberta n'est pas une tâche facile. Ceux qui sont les plus qualifiés sont très occupés et demandent des salaires élevés. Les auteurs en formation sont souvent disponibles mais manquent de discipline et leur textes exigent habituellement des révisions en profondeur. Nous avons donc dû faire appel à des auteurs d'ailleurs. L'équipe actuelle est formée de six auteurs. La plupart de ces auteurs ont de l'expérience en enseignement du français et en rédaction. La correspondance et les textes sont transmis par courriel.

La difficulté à trouver des programmeurs qualifiés a grandement retardé le début du projet. Peu de programmeurs connaissent CDML, le langage propre à FileMaker. Un programmeur initialement engagé a construit une structure presque fonctionnelle. L'auteur a donc dû apprendre CDML et parfaire ses connaissances en gestion de bases de données et en JavaScript pour la rendre fonctionnelle et l'adapter aux besoins changeants du projet.

Il aura fallu une année complète pour négocier les droits d'auteurs. Les droits avait initialement été cédés par l'éditeur retenant alors les droits d'auteurs. Cependant, les droits ont été vendus à Harcourt Canada avant que nous puissions ratifier l'entente finale avec l'éditeur original. Il a donc fallu recommencer à zéro les négociations. La gentillesse et la patience de Larry Guillevet puis de Brad Lambertus ont fait contrepoids à la lenteur associée à la taille importante de Harcourt Canada. L'entente finale nous permet de rendre disponible à l'Internet l'ensemble de La grammaire française de Jacqueline Ollivier et d'adapter au besoin le contenu. Cette flexibilité est fort appréciable car plusieurs règles manquent de clarté et certaines sont erronées. De plus, les exemples donnés par Ollivier sont tirés de la vie en France. Nous avons adapté ces exemples de façon à les internationaliser. Les négociations avec la maison d'édition continuent car le projet évolue et nous découvrons des facettes auxquelles personne n'avait songé.

Finalement, l'auteur a manqué de temps pour effectuer la recherche comme il l'aurait désiré. Outre l'addition de tâches administratives imposées par son institution, l'ajout de composantes nouvelles au projet a ralenti considérablement la production. Une demi-sabbatique qui prend fin présentement a permis de rattraper une partie du chemin perdu.

Conclusion

Pomme est un projet de grande envergure tant d'un point de vue technique que d'un point de vu didactique du français. Il implique la révision d'un ouvrage publié de grammaire, la numérisation de cet ouvrage, la rédaction d'un grand nombre d'exercices, la conceptualisation et la construction d'une interface interactive faisant appel à des bases de données relationnelles puis l'évaluation du produit en cours de route et à la fin du projet. Une trentaine de personnes ont été impliquées de proche ou de loin.

Nous entrons dans la dernière phase intensive de travail du projet. Bien que le site soit présentement fonctionnel, plusieurs aspects sont encore en développement, notamment la révision de la grammaire et l'intégration des exercices. Nous planifions une évaluation formative cet été, une mise à l'essai auprès d'usagers réels à l'automne 2000 et une évaluation sommative par une collègue à la fin de l'automne 2000.