TALAf 2016 : Traitement automatique des langues africaines (écrit et parole)

Atelier JEP-TALN-RECITAL 2016 - Paris le 4 juillet 2016

ENGLISH VERSION HERE

1 Motivations et objectifs

Les ateliers TALAf ont lieu tous les deux ans. Le premier atelier a eu lieu lors de la conférence JEP-TALN-RÉCITAL 2012 le 8 juin 2012 à Grenoble (voir les actes : /2012/). Le second a eu lieu lors de la conférence TALN 2014 le premier juillet 2014 à Marseille (voir les actes : /2014/Actes/).

La troisième édition de TALAf aura lieu lors de la conférence JEP-TALN-RECITAL, le 4 juillet 2016 dans les locaux de l'INALCO, 65 Rue des Grands Moulins, 75013 Paris. Pour vous inscrire, rendez-vous sur le site de la conférence JEP-TALN-RECITAL 2016.

Le traitement automatique des langues est en plein essor en Afrique. En effet, dans de nombreux pays, nous assistons à une reconnaissance officielle des langues nationales :

Par ailleurs, un certain nombre de collègues / universitaires africains formés dans les pays du Nord reviennent dans leur pays avec la volonté de continuer leur travail sur les langues locales. Il y a également des diaspora disposant de moyens technologiques leur permettant de contribuer directement en ligne et de manière bénévole.

À cela s'ajoute le développement de programmes d'enseignement bilingues (langue officielle / langue nationale) dans les écoles primaires de nombreux pays. La langue officielle restant pour la plupart celle de l'ancien colonisateur (français, anglais, portugais...).

D'autre part, le téléphone mobile se répand à grande vitesse : avec 650 millions d'unités, l'Afrique a dépassé les États-Unis et l'Europe. Dans de nombreuses régions, il est plus facile d'installer une antenne de téléphonie mobile que d'installer des lignes fixes. De ce fait, les personnes qui s'équipent pour la première fois d'un téléphone le font avec un terminal mobile. Des applications se développent comme le transfert d'argent ou la diffusion de bulletins météo.

Le financement de projets de recherche portant sur ces langues peut être obtenu depuis de nombreuses années auprès de l'Organisation Internationale de la Francophonie avec ses appels à projets du fonds francophone des inforoutes (voir par exemple les projets DiLAF ou flore) ou de l'Agence Universitaire de la Francophonie. La France, également, finance des projets sur ces langues à travers l'Agence Nationale pour la Recherche (voir par exemple le projet ALFFA).

Les conditions sont donc réunies pour l'essor du traitement automatique des langues en Afrique, pour l'écrit comme pour la parole.

Dans ce contexte, les rôles de l'atelier TALAf sont les suivants :

Les ateliers TALAf sont soutenus par l'association Lexicologie Terminologie Traduction : http://www.ltt.auf.org/index.php

2 Présentation des articles

L'atelier a reçu 12 soumission. 8 articles ont été rédigés en français et 4 en anglais. Pour mémoire, l'édition 2012 de TALAf avait reçu 12 soumissions et l'édition 2014 en avait reçu 13.

Parmi ces articles, 10 ont été acceptés et 2 rejetés. Tous les articles ont été relus par au moins deux relecteurs.

La diversité linguistique est présente puisque huit langues figurent dans les articles acceptés : amazighe, bambara, comorien, igbo, maninka, peul, swahili, wolof. Nous remarquons l'arrivée de langues d'Afrique de l'Est comme le swahili et le comorien. La langue la plus traitée reste le wolof avec 4 articles.

8 articles portent sur le traitement de l'écrit et 2 articles sur le traitement de l'oral.

Les articles sont visibles en PDF en ligne. Ils peuvent être téléchargés dans une seule archive (6,3 Mo).

3 Programme de l'atelier

 Président de séance : Mathieu Mangeot
09h30-10h00Valentin Vydrin, Andrij Rovenchak & Kirill Maslinsky Maninka Reference Corpus: A Presentation. [PDF], [Présentation PPTX]
10h00-10h30Ikechukwu Onyenwe, Mark Hepple & Uchechukwu Chinedu Improving Accuracy of Igbo Corpus Annotation Using Morphological Reconstruction and Transformation-Based Learning. [PDF], [Présentation PDF]
10h30-11h00Pause café
 Président de séance : El Hadj Mamadou Nguer
11h00-11h30Moneim Abdourahamane, Christian Boitet, Valérie Bellynck, Lingxiao Wang & Hervé BlanchonConstruction d’un corpus parallèle français-comorien en utilisant de la TA français-swahili. [PDF]
11h30-12h00David Blachon, Elodie Gauthier, Laurent Besacier, Guy-Noël Kouarata, Martine Adda-Decker & Annie RiallandCollecte de parole pour l'étude des langues peu dotées ou en danger avec l'application mobile Lig-Aikuma. [PDF], [Présentation PDF]
12h00-14h00Pause repas
 Président de séance : Christian Boitet
14h00-14h30Michael Melese Woldeyohannis, Laurent Besacier & Meshesha MillionAmharic Speech Recognition for Speech Translation. [PDF], [Présentation PDF]
14h30-15h00El Hadji Malick Fall, El Hadji Mamadou Nguer, Sokhna Bao Diop, Mouhamadou Khoulé, Mathieu Mangeot & Mame Thierno CisséDigraphie des langues ouest africaines : Latin2Ajami : un algorithme de translittération automatique. [PDF], [Présentation PPTX]
 Présidente de séance : Chantal Enguehard
15h00-15h30Fatimazahra Nejme, Siham Boulaknadel & Driss AboutajdineDéveloppement de ressources pour la langue amazighe : Le Lexique Morphologique El-AmaLex. [PDF]
15h30-16h00Alla Lo, Elhadji Mamadou Nguer, Abdoulaye Youssoupha Ndiaye, Cheikh Bamba Dione, Mathieu Mangeot, Mouhamadou Khoule, Sokhna Bao Diop & Mame Thierno CisseCorrection orthographique pour la langue wolof : état de l'art et perspectives. [PDF], [Présentation PPTX]
16h00-16h30Pause café
 Président de séance : Laurent Besacier
16h30-17h00Mouhamdou Khoule, Mathieu Mangeot, El Hadji Mamadou Nguer & Mame Thierno CisseiBaatukaay : un projet de base lexicale multilingue contributive sur le web à structure pivot pour les langues africaines notamment sénégalaises. [PDF], [Présentation PPS]
17h00-17h30Chérif Mbodj & Chantal EnguehardProduction et mise en ligne d’un dictionnaire électronique du wolof. [PDF], [Présentation PDF]

4 Comité de programme

5 Calendrier

- Date limite de soumission : 24 avril8 mai 2016

- Notification aux auteurs : 23 mai 2016

- Date limite de soumission des versions définitives : 3 juin 2016

- Atelier : 4 juillet 2016

6 Contact

Pour toute question, contactez Mathieu.Mangeot_AT_imag.fr