Les ateliers TALAf ont lieu tous les deux ans. Le premier atelier a eu lieu lors de la conférence JEP-TALN-RÉCITAL 2012 le 8 juin 2012 à Grenoble (voir les actes : /2012/Actes/). Le second a eu lieu lors de la conférence TALN 2014 le premier juillet 2014 à Marseille (voir les actes : /2014/Actes/).
La troisième édition de TALAf aura lieu lors de la conférence JEP-TALN-RECITAL, le 4 juillet 2016 dans les locaux de l'INALCO, 65 Rue des Grands Moulins, 75013 Paris. Pour vous inscrire, rendez-vous sur le site de la conférence JEP-TALN-RECITAL 2016.
Le traitement automatique des langues est en plein essor en Afrique. En effet, dans de nombreux pays, nous assistons à une reconnaissance officielle des langues nationales :
Au Niger, les arrêtés définissant les alphabets haoussa, kanouri, tamajaq et zarma ont été publiés en 1999. Depuis, l'Assemblée Nationale a mis en place des traductions simultanées des débats en trois langues : français, haoussa et zarma;
Par ailleurs, un certain nombre de collègues / universitaires africains formés dans les pays du Nord reviennent dans leur pays avec la volonté de continuer leur travail sur les langues locales. Il y a également des diaspora disposant de moyens technologiques leur permettant de contribuer directement en ligne et de manière bénévole.
À cela s'ajoute le développement de programmes d'enseignement bilingues (langue officielle / langue nationale) dans les écoles primaires de nombreux pays. La langue officielle restant pour la plupart celle de l'ancien colonisateur (français, anglais, portugais...).
D'autre part, le téléphone mobile se répand à grande vitesse : avec 650 millions d'unités, l'Afrique a dépassé les États-Unis et l'Europe. Dans de nombreuses régions, il est plus facile d'installer une antenne de téléphonie mobile que d'installer des lignes fixes. De ce fait, les personnes qui s'équipent pour la première fois d'un téléphone le font avec un terminal mobile. Des applications se développent comme le transfert d'argent ou la diffusion de bulletins météo.
Le financement de projets de recherche portant sur ces langues peut être obtenu depuis de nombreuses années auprès de l'Organisation Internationale de la Francophonie avec ses appels à projets du fonds francophone des inforoutes (voir par exemple les projets DiLAF ou flore) ou de l'Agence Universitaire de la Francophonie. La France, également, finance des projets sur ces langues à travers l'Agence Nationale pour la Recherche (voir par exemple le projet ALFFA).
Les conditions sont donc réunies pour l'essor du traitement automatique des langues en Afrique, pour l'écrit comme pour la parole.
Dans ce contexte, les rôles de l'atelier TALAf sont les suivants :
Les ateliers TALAf sont soutenus par l'association Lexicologie Terminologie Traduction : http://www.ltt.auf.org/index.php
L'atelier a reçu 12 soumission. 8 articles ont été rédigés en français et 4 en anglais. Pour mémoire, l'édition 2012 de TALAf avait reçu 12 soumissions et l'édition 2014 en avait reçu 13.
Parmi ces articles, 10 ont été acceptés et 2 rejetés. Tous les articles ont été relus par au moins deux relecteurs.
La diversité linguistique est présente puisque huit langues figurent dans les articles acceptés : amazighe, bambara, comorien, igbo, maninka, peul, swahili, wolof. Nous remarquons l'arrivée de langues d'Afrique de l'Est comme le swahili et le comorien. La langue la plus traitée reste le wolof avec 4 articles.
8 articles portent sur le traitement de l'écrit et 2 articles sur le traitement de l'oral.
Les articles sont visibles en PDF en ligne. Ils peuvent être téléchargés dans une seule archive (6,3 Mo).
Président de séance : Mathieu Mangeot | |
09h30-10h00 | Valentin Vydrin, Andrij Rovenchak & Kirill Maslinsky Maninka Reference Corpus: A Presentation. [PDF], [Présentation PPTX] |
10h00-10h30 | Ikechukwu Onyenwe, Mark Hepple & Uchechukwu Chinedu Improving Accuracy of Igbo Corpus Annotation Using Morphological Reconstruction and Transformation-Based Learning. [PDF], [Présentation PDF] |
10h30-11h00 | Pause café |
Président de séance : El Hadj Mamadou Nguer | |
11h00-11h30 | Moneim Abdourahamane, Christian Boitet, Valérie Bellynck, Lingxiao Wang & Hervé BlanchonConstruction d’un corpus parallèle français-comorien en utilisant de la TA français-swahili. [PDF] |
11h30-12h00 | David Blachon, Elodie Gauthier, Laurent Besacier, Guy-Noël Kouarata, Martine Adda-Decker & Annie RiallandCollecte de parole pour l'étude des langues peu dotées ou en danger avec l'application mobile Lig-Aikuma. [PDF], [Présentation PDF] |
12h00-14h00 | Pause repas |
Président de séance : Christian Boitet | |
14h00-14h30 | Michael Melese Woldeyohannis, Laurent Besacier & Meshesha MillionAmharic Speech Recognition for Speech Translation. [PDF], [Présentation PDF] |
14h30-15h00 | El Hadji Malick Fall, El Hadji Mamadou Nguer, Sokhna Bao Diop, Mouhamadou Khoulé, Mathieu Mangeot & Mame Thierno CisséDigraphie des langues ouest africaines : Latin2Ajami : un algorithme de translittération automatique. [PDF], [Présentation PPTX] |
Présidente de séance : Chantal Enguehard | |
15h00-15h30 | Fatimazahra Nejme, Siham Boulaknadel & Driss AboutajdineDéveloppement de ressources pour la langue amazighe : Le Lexique Morphologique El-AmaLex. [PDF] |
15h30-16h00 | Alla Lo, Elhadji Mamadou Nguer, Abdoulaye Youssoupha Ndiaye, Cheikh Bamba Dione, Mathieu Mangeot, Mouhamadou Khoule, Sokhna Bao Diop & Mame Thierno CisseCorrection orthographique pour la langue wolof : état de l'art et perspectives. [PDF], [Présentation PPTX] |
16h00-16h30 | Pause café |
Président de séance : Laurent Besacier | |
16h30-17h00 | Mouhamdou Khoule, Mathieu Mangeot, El Hadji Mamadou Nguer & Mame Thierno CisseiBaatukaay : un projet de base lexicale multilingue contributive sur le web à structure pivot pour les langues africaines notamment sénégalaises. [PDF], [Présentation PPS] |
17h00-17h30 | Chérif Mbodj & Chantal EnguehardProduction et mise en ligne d’un dictionnaire électronique du wolof. [PDF], [Présentation PDF] |
- Date limite de soumission : 24 avril8 mai 2016
- Notification aux auteurs : 23 mai 2016
- Date limite de soumission des versions définitives : 3 juin 2016
- Atelier : 4 juillet 2016
Pour toute question, contactez Mathieu.Mangeot_AT_imag.fr