Jeudi et vendredi prochains, un colloque intitulé « Développement des technologies pour les langues régionales de France » est organisé par l’IMMI-CNRS, la DGLFLF, le LIMSI-CNRS et ELDA à Meudon, en région parisienne. Parmi la soixantaine de participants, les membres du Congrès – institution qui développe des outils numériques pour la langue occitane – interviendront pour exposer la situation de l’occitan.
Benaset Dazéas, directeur du Congrès, nous aide à faire le point
Comment le Congrès a-t-il travaillé sur ces questions de langues et de nouvelles technologies ?
Nous avons réalisé un travail de 8 mois, une « étude-action », avec le soutien de l’ADEPFO (l’Association de Développement des Pyrénées par la Formation) autour justement de la stratégie numérique pour l’occitan. Une vingtaine de personnes telles que des enseignants, des formateurs, des représentants d’institutions ou d’universités ont participé à cette étude en faisant notamment appel à l’aide de spécialistes des technologies du langage pour le catalan, le breton, le basque et le gallois. Ils ont aussi travaillé en collaboration avec deux organismes basques : Media.kom, société de formation, et la fondation Elhuyar. En novembre dernier au Château d’Este de Billère, nous avons présenté le résultat de ces travaux de la formation ADEPFO : « Diagnostic et développement numérique de l’occitan – feuille de route 2015-2019 ».
Quelle est donc la situation de l’occitan ?
Il y a quelques ressources qui existent mais elles sont peu nombreuses. On manque de corpus, on manque de grammatique et de modèle de langage. La situation de l’occitan est équivalente à celle du breton donc pas catastrophique non plus. L’occitan profite notamment de sa proximité linguistique avec le catalan, une langue qui a énormément de ressources numériques. Il existe par exemple un dictionnaire catalan-languedocien de bonne qualité.
Mais l’occitan connaît encore de gros retards, surtout au niveau des logiciels grand public, des réseaux sociaux, des jeux vidéos ou des Smartphones, essentiels de nos jours à la transmission de la langue.
Comment améliorer la situation ?
Suite à notre étude, nous avons produit un document technique de 40 pages. Dans un premier temps, il fait un diagnostic de l’état des ressources existantes (dictionnaires en ligne, correcteurs orthographiques, etc.). Mais il fait aussi des propositions concrètes. Il est surtout urgent de développer des outils technologiques de base : traitements de texte, correcteurs orthographiques, analyses sémantiques, traducteurs automatiques, reconnaissance vocale….
Ces besoins sont répertoriés dans une feuille de route 2015-2019 avec un calendrier de réalisation. Une étude-action qui sera remise aux collectivités-partenaires pour qu’elle soit intégrée dans le cadre des politiques linguistiques publiques. Mais il faudra aller aussi chercher du côté de l’Europe.
Sirine Tijani