Projet franco-russe « Groundwork for a corpus-based dictionary of Old Babylonian »

Le projet franco-russe intitulé « Laying the groundwork for a corpus-based dictionary of Old Babylonian » est financé par la MSH (Maison des Sciences de l’Homme) et la RFBR (Russian Foundation for Basic Research) du 1er janvier 2020 au 30 septembre 2023.
Le projet est porté en France par Nele Ziegler, assistée par Marine Béranger (Postdoc, CdF, France). La partie russe est portée par Ilya Arkhipov (Université Nationale de Recherche École Supérieure d’Économie, Moscou).
Le projet a pour but de réfléchir sur la création d’un outil informatique donnant accès au lexique paléo-babylonien, mais aussi sur la vaste bibliographie dispersée produite dans ce domaine.
Deux grands projets lexicographiques ont été développés autour de la langue akkadienne : le CAD (Chicago Assyrian Dictionary, 20 volumes publiés entre 1956 et 2010) et le AHw (Akkadisches Handwörterbuch, 3 volumes publiés entre 1958 et 1981). C’est sur ces dictionnaires que se fondent aujourd’hui les recherches en assyriologie. Les deux premiers volumes du CAD (H et G) sont datés de 1956, et le dernier volume (U/W) est sorti en 2010. Or, des dizaines de milliers de textes ont été publiés depuis 1956, et notre connaissance de la langue akkadienne a elle aussi considérablement évolué, rendant certaines entrées du dictionnaire complètement obsolètes. Depuis 2013, le projet SAD (Supplement to the Akkadian Dictionaries) vise à proposer une mise à jour de ces dictionnaires. Par ailleurs, les dictionnaires ici cités traitent de tous les dialectes de la langue akkadienne (soit une période de plus de 2 000 ans), et il n’existe pas de dictionnaire consacré uniquement au “paléo-babylonien”, un dialecte de l’akkadien attesté aux XXe-XVIIe s. av. J.-C.
Notre projet franco-russe vise à remédier à cette situation en posant les bases d’un futur outil numérique donnant accès au lexique paléo-babylonien. C’est donc un projet de « brain storming », de réflexion, de préparation et le financement MSH/RFBR permet de nous réunir pour des tables rondes de travail et de discussion.
Nous souhaitons nous appuyer sur la base de données ARCHIBAB, développée par D. Charpin et son équipe à Paris (www.archibab.fr). Cette base de données recense tous les documents d’archives paléo-babyloniens (contrats, lettres, documents comptables, rapports variés), et fournit pour chaque texte une édition, une traduction, un commentaire et des références bibliographiques. Chaque texte est en outre lemmatisé : c’est-à-dire que chaque mot du texte est associé à un lemme (= forme de dictionnaire), à une catégorie grammaticale et à une traduction en français.
20356 textes ont été entrés dans ARCHIBAB à ce jour, et environ 11000 textes ont été lemmatisés. Lorsque l’ensemble des documents d’archives paléo-babyloniens auront été entrés dans ARCHIBAB (soit 33470 textes), celle-ci contiendra environ 1300000 occurrences de mots (extrapolation de D. Charpin). Mais pour que la masse des mots entrés dans ARCHIBAB puisse être utilisée dans le cadre d’un travail lexicographique, il y a plusieurs préalables. C’est précisément sur ces préalables que nous travaillerons dans le cadre du projet franco-russe.