TALAf 2018 : Traitement automatique des langues africaines (écrit et parole)

Atelier LTT 2018 - Grenoble le 26 septembre 2018

Version PDF, version TXT

1 Présentation

Les ateliers TALAf ont lieu tous les deux ans (voir /2012/, /2014/ et /2016/).

Cette année, il sera organisé le 26 septembre 2018 à Grenoble en lien avec les 11èmes journées du réseau LTT.

Le traitement automatique des langues est en plein essor en Afrique. En effet, dans de nombreux pays, nous assistons à une reconnaissance officielle des langues nationales (Niger, Sénégal, Maroc parmi d'autres).

Même si la langue officielle reste pour la plupart des pays celle de l'ancien colonisateur (français, anglais, portugais...), on voit émerger une volonté (étatique ou non) d'utiliser les langues locales. Comme conférencier invité de LTT, Évariste Ntakirutimana, Professeur à l’Université du Rwanda, évoquera ces questions.

Par ailleurs, les nouvelles technologies ont une influence sur les langues, leur place et leur dynamique. Le téléphone mobile se répand à grande vitesse : Avec 650 millions d'unités, l'Afrique a dépassé les Etats-Unis et l'Europe. Dans de nombreuses régions, il est plus facile d'installer une antenne de téléphonie mobile que d'installer des lignes fixes. De ce fait, les personnes qui s'équipent pour la première fois d'un téléphone le font avec un terminal mobile. Des applications se développent comme le transfert d'argent ou la diffusion de bulletins météo. L'utilisation des langues locales sur Twitter et Facebook est répandue. Dans ce contexte, les contacts de langues se manifestent à différents niveaux (interférences, alternance codique, variétés non-standard marquées par les processus d'acquisition, etc.). Cette diversité des usages se trouve en tension avec les volontés de standardisation. La prise en compte de la variation est une question majeure lorsqu'il s'agit de traiter des langues telles que le kriyol (Guinée-Bissau) qui se trouve sous l'influence de plusieurs langues (français, portugais, balante, pulaar, mandinka, etc.).

Dans ce contexte, les rôles de l'atelier TALAf sont les suivants :

Les ateliers TALAf sont soutenus par l'association Lexicologie Terminologie Traduction : http://reseau-ltt.net

2 Présentation des articles

L’atelier a reçu 14 soumissions toutes rédigées en français. Les éditions précédentes ont reçu 12, 13 puis 12 soumissions. Parmis ces articles, 2 ont déjà été acceptés à la conférence LTT et 6 ont été rejetés car seul un résumé a été soumis alors que l’article complet avait été demandé. Il se peut que les modalités de la conférence LTT ait influencé les auteurs. Tous les articles ont été relus par au moins 2 relecteurs. Finalement, 6 articles ont été acceptés.

Les langues traitées concernent le Sénégal (sérère et autres langues nationales avec 2 articles), l’arable dialectal tunisien (2 articles), le berbère et l’arabe dialectal algérien (1 article) et le kriol de Guinée Bissau (1 article).

Les articles sont visibles en PDF en ligne. Ils peuvent être téléchargés dans une seule archive (3,1 Mo).

3 Programme de l'atelier

13h30-14h00

Jean-Louis Rougé, Emmanuel Schang, Ana Luís, Flora Badin et Eugène Tavares.

Un corpus oral transcrit de kriol [PDF] [Présentation PPTX]

14h-14h30

Slimane Abdellaoui, Valérie Bellynck, Mathieu Mangeot et Christian Boitet

Outillage de l’accès aux textes par la lecture active étymologique multilingue pour apprenants berbérophones et arabophones. [PDF] [Présentation PDF]

14h30-14h40

Pause

14h40-15h10

Fatma Ben Barka

Sur les enjeux méthodologiques de la construction d’un corpus d’arabe tunisien. [PDF] [Présentation PDF]

15h10-15h40

Yossra Ben Ahmed, Flora Badin et Linda Hriba

Constitution d’un corpus oral de l’arabe tunisien : une ressource essentielle pour l’étiquetage morphosyntaxique. [PDF] [Présentation PDF]

15h40-15h50

Pause

15h50-16h20

Mouhamadou Khoule, Mathieu Mangeot et El Hadji Mamadou Nguer

Manipulation de dictionnaires d’origines diverses pour des langues peu dotées : la méthodologie iBaatukaay. [PDF] [Présentation PPS]

16h20-16h50

Floriane Brennus, Laurent Besacier et Sylvie Voisin.

Collecte de données pour la langue sereer. [PDF] [Présentation PDF]

16h50-17h

Emmanuel Schang et Mathieu Mangeot

Clôture de l’atelier

4 Comité de programme

7 Dates importantes

- 30 avril : Date limite de soumission

- 15 juin : Notification d'acceptation

- 30 juin : version définitive des articles acceptés

- 26 septembre : atelier TALAf 2018

8 Contact

Pour toute question, contactez Emmanuel.Schang_AT_univ-orleans.fr ou Mathieu.Mangeot_AT_imag.fr