Tous ceux qui ont essayé de taper un SMS en occitan avec un clavier prédictif français vous le diront : le résultat n'est pas probant. C'est pourquoi le Congrès a réalisé des claviers prédictifs pour les mobiles et les tablettes Android, en occitan gascon et languedocien.
La possibilité d'être utilisée sur mobile est un enjeu primordial pour une langue minorisée. Ces claviers sont des outils très importants pour la socialisation de l'occitan.
Ils ont été réalisés dans le cadre du projet ROLF (Ressources Outils Langues de France : alsacien, occitan, picard).
Il s'agit de deux paquets de langue pour l'application Anysoftkeyboard, un clavier gratuit sous licence libre.
Il est particulièrement soigné en termes de cohérence linguistique et de la richesse lexicale : il contient 931 000 formes fléchies pour le gascon et 708 000 pour le languedocien, avec des noms propres et des noms de marque.
ROLF est un partenariat entre le Congrès permanent de la langue occitane, CLLE-ERSS (CNRS/Université Toulouse Jean-Jaurès), Habiter le monde (Université d'Amiens) et LiLPa (Université de Strasbourg) soutenu dans le cadre de l'appel à projets 2017 « Langues et numérique » de la Délégation générale à la langue française et aux langues de France-ministère de la Culture et la Communication.
Ce projet s'inscrit dans la continuité du projet ANR RESTAURE (RESsources informatisées et Traitement AUtomatique pour les langues REgionales) dans le cadre duquel plusieurs ressources et outils de TAL (Traitement automatique du langage) sont développées pour trois langues de France : alsacien, occitan et picard. Les réalisations des objectifs de RESTAURE (1) sont en bonne voie. Cela étant les développements ont été réalisés de manière concertée mais indépendante pour les trois langues. L'idée qui sous-tend la présente proposition est de définir pour les ressources lexicales un format unique qui permettrait de créer le même type de ressource pour les trois langues, de proposer des ressources dont le format et les annotations seraient identiques (avec par exemple les mêmes jeux d'étiquettes pour les catégories similaires dans les différentes langues) et d'avoir des outils d'aide à la création de ces ressources qui seraient partagés pour les trois langues.
Dans ce cadre, des claviers prédictifs pour le picard et l'alsacien ont également été développés. Les développements pour chaque langue se sont faits de manière indépendante mais concertée.
Pour toute information, contacter Le Congrès.