Le temps long : l'évolution du français dans un corpus textuel calibré

Le témoignage de la coutume de Normandie

The long time: the evolution of French in a calibrated textual corpus

The testimony of Norman customary law

Mathieu Goux

Université de Caen Normandie (Caen, France)

mathieu.goux@unicaen.fr

https://orcid.org/0000-0003-4211-8309

Reçu le 7/07/2021, accepté le 26/12/2021, publié le 7/10/2022 selon les termes de la licence Creative Commons Attribution 4.0 International (CC BY 4.0)

Pour citer cet article

Goux, Mathieu 2022. Le temps long : l'évolution du français dans un corpus textuel calibré. Le témoignage de la coutume de Normandie. Studia linguistica romanica 2022.8, 1-9. https://doi.org/10.25364/19.2022.8.1.

Résumé

Le projet RIN ConDÉ (Constitution d'un droit européen : six siècles de coutumiers normands), financé par la région Normandie, propose la numérisation et l'outillage de dix coutumiers normands, du 13e au 19e siècle. Ce corpus de textes juridiques jette une nouvelle lumière sur l'évolution de la langue française en diachronie longue. Les contributions de ce numéro thématique reconsidèrent ainsi différents phénomènes linguistiques, de l'emploi des pronoms clitiques aux phénomènes d'organisation textuelle, pour affiner la chronologie du changement. Ce numéro est également le lieu d'une réflexion sur la place des très grands corpus outillés en linguistique, leurs forces et leurs limites.

Abstract

The RIN ConDÉ (Constitution d'un droit européen : six siècles de coutumiers normands) project, financed by the Normandy region, proposes the digitization and enrichment of ten Norman customary law texts, from between the 13th and the 19th century. Thus, this diachronic study promises to shed new light on the long-term evolution of the French language. The contributions in this thematic issue reconsider various linguistic phenomena, such as the use of clitic pronouns and textual organization, in order to refine the chronology of change. The issue also reflects on the role of very large corpora in linguistics, their strengths as well as their limitations.

[1] L'évolution sur le temps long de la langue française a toujours fait l'objet, depuis les débuts de la romanistique, d'un nombre impressionnant de travaux compte tenu des bouleversements importants, voire inédits, que cette langue a connus au regard des autres langues romanes1. Ces bouleversements étonnent tant du point de vue qualitatif, par la recherche des causes les produisant – que ces causes soient à trouver dans l'histoire interne ou dans l'histoire externe de la langue française –, que du point de vue quantitatif, par l'estimation des fréquences d'apparition ou de disparition de tel ou tel phénomène sur le plan morphosyntaxique, sémantique ou textuel.

[2] Depuis quelques décennies maintenant, les outils que nous offrent les humanités numériques, en termes de constitution de corpus ou d'annotation automatique, permettent d'infirmer ou de confirmer de nombreuses hypothèses empiriques sur la chronologie du changement et de mieux saisir les particularités de la langue française au long de son histoire. Nous pensons, pour ne citer que quelques travaux récents, aux analyses concernant l'expression du sujet (Prévost 2015), aux publications issues du projet PRESTO sur le système prépositionnel (Blumenthal & Vigier 2017, 2018 ; Vigier 2017), aux travaux portant sur la périodisation du français (pré)classique (Amatuzzi et al. 2020) ainsi qu'à la récente Grande grammaire historique du français (GGHF) qui s'appuie sur un riche corpus outillé. Ces travaux mettent à profit de très grands corpus comptant des millions de mots, et ils ont produit des données détaillées permettant de calculer au mieux les fréquences d'évolution de tel ou tel phénomène. Ces études ciblent alors, avec une précision inédite jusques là, le moment où les bascules chronolectales (pour reprendre le terme de Caron 2002) déterminent de nouveaux usages.

[3] Ces différentes analyses, cependant, nous semblent avoir un angle aveugle que nous retrouvions déjà dans les études antérieures portant sur l'histoire de la langue française, réalisées sur des corpus plus petits et/ou annotés manuellement : la primauté accordée aux textes littéraires, considérés comme représentatifs de l'évolution linguistique en général, et le peu d'intérêt offert aux textes dits 'de spécialité', qu'ils soient médicaux, juridiques, religieux, ou issus d'autres disciplines scientifiques. N'en témoigne, ne serait-ce, que la base de données Frantext, sans doute l'une des plus riches et des plus consultées aujourd'hui, ne compte que 10% de textes ne relevant pas d'un genre associé traditionnellement à la fiction ou à la philosophie, des dires des concepteurs de la base et ce malgré sa volonté d'offrir un panorama complet de l'histoire de la langue française. On peut adresser la même critique à la GGHF. Son corpus se fonde un grand nombre de textes littéraires (ils représentent 68 des 147 textes du corpus, soit environ 46%), même si les textes juridiques et scientifiques sont évoqués dans l'étude de l'évolution des genres de l'écrit (GGHF : I.121-134) et même si les auteurs ont veillé à échantillonner du mieux possible les données textuelles et à inclure, davantage que les initiatives antérieures, des textes de spécialité.

[4] Néanmoins, et quand bien même ces textes de spécialité seraient considérés, et ce depuis plusieurs siècles, comme relevant d'un registre particulier dont les propriétés ne sauraient être généralisables à la langue commune2, nous savons aujourd'hui que tout également, la langue littéraire est elle-même située au regard de l'usage. Notamment, des analyses récentes ont montré que ces textes présentaient des traits archaïques ou archaïsants, et offraient ce faisant une vision incomplète, sinon déformée, de la chronologie du changement (Grübl 2015 ; Balon & Larrivée 2016 ; Larrivée & Capin 2018)3.

[5] La variation générique et/ou diastratique doit donc nécessairement être prise en compte dans les études en diachronie longue, surtout que le sentiment linguistique du chercheur ne peut l'aider, pour les états anciens de la langue, à orienter ses analyses. Afin d'avoir la représentation la plus complète de l'évolution, des corpus non-littéraires, outillés et calibrés, se doivent d'être accessibles à la communauté des chercheurs, condition sine qua non pour améliorer notre connaissance collective de l'ancienne langue et évaluer le poids respectif des différents facteurs de variation. Différents projets ont déjà rendu public ce type de ressources : évoquons par exemple le Corpus juris civilis sous la direction de Frédéric Duval, Li livres de jostice et de plet sous celle de Graziella Pastore ou la base De minute en minute 2.0 de la ville de Tours4.

[6] Initié en décembre 2018 et achevé en décembre 2021, le projet RIN ConDÉ5 contribue à cette mouvance en proposant un corpus outillé et annoté morpho-syntaxiquement, grâce au jeu d'étiquettes PRESTO et au logiciel d'annotation collaborative AnaLog, de textes juridiques du Moyen Âge à la période moderne. Les témoins sélectionnés pour ce projet permettent d'avoir un accès privilégié à un corpus génériquement homogène – il s'agit de coutumiers normands, du Très Ancien Coutumier de Normandie (TAC), daté du milieu du 13e siècle, aux Ruines de la coutume de Normandie de Victor Pannier, imprimé en 1856 –, constitué de textes similaires dans leur contenu et dans leur vocabulaire, et émanant de la même zone géographique. Le contrôle de ces facteurs de variation permet d'observer avec une précision nouvelle l'évolution de divers phénomènes linguistiques, jusqu'à présent surtout considérés et analysés au sein de textes littéraires, de préciser la chronologie du changement et de faire émerger des phénomènes peu étudiés en diachronie longue.

[7] Particulièrement, la coutume de Normandie se prête plus que d'aucune à ce type de travaux. Son histoire rédactionnelle et éditoriale est connue de longue date des historiens du droit6. De plus, elle se caractérise, au regard des autres traditions coutumières du temps, par une abondante tradition de glose et une riche arrestographie (Cazals 2014) qui permettent, au sein du même texte souvent, de faire se confronter différents registres d'écriture, entre le commentaire docte du juriste, le style curial des décisions de justice, la transcription des édits et des témoignages, et la transcription d'anciens textes français, anglo-normands ou latins. C'est une œuvre qui, en ce sens, va au-delà du champ du droit. Sa dimension patrimoniale importante, ne serait-ce que dans le cadre de l'histoire du duché de Normandie, en fait un document d'exception pour nombre de disciplines des sciences humaines et particulièrement ici, pour les sciences du langage et l'histoire de la langue française.

[8] Ce numéro thématique de Studia linguistica romanica est l'occasion d'explorer cet abondant corpus sous des angles multiples et complémentaires, d'affiner notre connaissance de l'évolution de la langue française sous les angles morphologique, syntaxique, sémantique ou textuel, et d'analyser la façon dont l'encodage codicologique et l'établissement des bases de données influencent notre rapport aux textes. Les contributions de ce numéro explorent ainsi différents grands domaines des sciences de langage et montrent à quel point ce type de base de données textuelles, portant sur des textes de spécialité, est crucial pour la recherche contemporaine.

[9] Du point de vue morphosyntaxique tout d'abord, ces textes juridiques nous permettent d'analyser particulièrement l'expression des pronoms clitiques. Dans la continuité des études de Berrendonner (2014) et d'Iglesias (2015), la contribution de Marc Olivier (Ulster University) explore la position du clitique objet d'un verbe à l'infinitif et son évolution d'enclise à proclise du verbe du point de vue quantitatif, du 12e au 15e siècle. L'auteur compare en cela plusieurs textes juridiques normands, dont les Établissements et Coutumes (1207-1270) et le Grand Coutumier de Normandie (GC) (1300), à d'autres textes juridiques du Poitou ou de Lorraine (¶ 24) et établit l'importance de la période transitoire du 14e siècle comme marquant la réorganisation des pronoms clitiques antéposés aux infinitifs (¶ 47).

[10] La syntaxe de l'ancienne langue française est également au cœur de la contribution de Daniéla Capin (Université de Strasbourg). Elle analyse les phénomènes de parataxe et d'hypotaxe en ancien français par l'étude de la conjonction et (Badiou-Monferran & Capin 2020), de la conjonction que/ce que en introduction de subordonnées complétives et de la non-expression du sujet pronominal. Ces trois phénomènes relèvent de la complexité quantitative (Miestamo 2009) mais aussi syntaxique, perceptive, et cognitive. Ils démontrent le caractère précurseur des textes juridiques quant à la chronologie du changement au regard des ressources littéraires (¶ 53).

[11] Dans sa contribution, Pierre Larrivée (Université de Caen Normandie) explore quant à lui la thématique de l'inversion sujet-verbe dans ce corpus, en analysant tant les sujets pronominaux (Prevost 2010) que lexicaux (Balon & Larrivée 2016). Il identifie ce faisant les variables pertinentes quant à cet ordre de plus en plus marqué dans la langue française. Les courbes de fréquence obtenues (¶ 13 et 18) mettent en avant tant une évolution anticipée au regard des données accessibles dans les textes littéraires, que le conservatisme et le caractère formulaire de ces textes qui peuvent ralentir ou perturber la régularité du changement (¶ 15). Ces paramètres influencent, en retour, la disponibilité des options productives dans l'usage.

[12] Du point de vue sémantique et terminologique, Christine Paasch-Kaiser (Universität Leipzig) explore la question de la phraséologie dans les textes coutumiers, au-delà de la question des adages et des maximes, dans la continuité des travaux de Tabares Plasencia (2020). Par une analyse poussée de l'emploi du terme technique recort au sein des unités phraséologiques et plurilexicales, elle a repéré des constructions verbo-nominales spécifiques aux coutumiers normands (¶ 18ss.). Leur évolution en diachronie longue établit leur caractère prototypique, en relation avec les mutations du droit normand au long de la période moderne (¶ 28). Ces résultats déterminent des critères d'identification des unités phraséologiques du droit dans l'histoire de la langue française.

[13] Mathieu Goux (Université de Caen Normandie) s'est intéressé quant à lui à la conduite de l'énoncé dans une perspective textuelle. Il étudie la stabilisation des cadratifs spatio-temporels et leur rôle dans l'indexation sémantico-référentielle des énoncés (Combettes 2005). Cette étude fait suite à celle consacrée à la polyphonie dans la coutume de Normandie (Goux 2022). Elle établit que l'évolution de ces phénomènes textuels est en lien avec leur lectorat et avec l'évolution de la typo-disposition générale des coutumiers (¶ 28). Les conclusions vont dans le sens d'une meilleure prise en compte de la médialité et de l'histoire des supports dans l'analyse de la textualité.

[14] Enfin et dans le cadre de la linguistique de corpus et des humanités numériques, Morgane Pica (École supérieure normale de Lyon) présente, en qualité d'ingénieure de recherche du projet ConDÉ, les problématiques codicologiques et philologiques concernant la chaîne de traitement du corpus. Elle présente le codage homogène choisi pour l'ensemble des documents

[s]ans trahir les sources, car nous basant sur leur format, nous pouvons donc « dépasser » […] la forme pour créer une nouvelle structure propre à transmettre le sens de chaque témoin. (¶ 11)

[15] Ces six contributions témoignent de la vitalité des études sur la diachronie du français et de l'intérêt des textes de spécialité pour le domaine. Le sujet est vaste, puisque tous les paramètres traditionnellement considérés par la romanistique, de l'agencement des constituants nucléaires aux unités phrastiques en passant par les phénomènes de parataxe ou d'hypotaxe, de la dynamique informationnelle ou de la graphie, doivent être réévalués au regard des modèles admis et établis par l'étude des textes littéraires. Cette approche ne peut être que stimulante pour la recherche, et ne peut que nous inviter à interroger nos pratiques scientifiques. Ces nouveaux corpus, à l'instar de celui proposé par le projet ConDÉ à l'honneur dans ce numéro thématique, nous permettent d'observer au plus près les spécificités de la langue française, si atypique dans le riche continuum des langues romanes.

Abréviations et références bibliographiques

Amatuzzi et al. 2020 = Antonella Amatuzzi et al. 2020. Changement linguistique et périodisation du français (pré)classique : deux études de cas à partir des corpus du RCFC. Journal of French Language Studies 30, 301-326.

AnaLog = Marie-Hélène Lay 2008. Logiciel AnaLog.

Badiou-Monferran & Capin 2020 = Claire Badiou-Monferran, Daniéla Capin 2020. Comment identifier le et « de relance » en diachronie longue ? Marta Saiz-Sánchez, Amalia Rodríguez Somolinos, Sonia Gómez-Jordana Ferary (éds.). Marques d'oralité et représentation de l'oral en français. Chambéry : Presses universitaires Savoie Mont Blanc, 367-390.

Balon & Larrivée 2016 = Laurent Balon, Pierre Larrivée 2016. L'ancien français n'est déjà plus une langue à sujet nul – nouveau témoignage des textes légaux. Journal of French Language Studies 26, 221-237.

Berrendonner 2014 = Alain Berrendonner 2014. Réanalyse et attractions analogiques : l'exemple des constructions infinitives du français. Langages 196, 69-87. https://www.cairn.info/revue-langages-2014-4-page-69.htm.

Blumenthal & Vigier 2017 = Peter Blumenthal, Denis Vigier (éds.) 2017. Du quantitatif au qualitatif en diachronie : prépositions françaises. Langages 206. https://www.cairn.info/revue-langages-2017-2.htm.

Blumenthal & Vigier 2018 = Peter Blumenthal, Denis Vigier (éds.) 2018. Études diachroniques du français et perspectives sociétales. Bern : Lang.

Buridant 2000 = Claude Buridant 2000. Grammaire nouvelle de l'ancien français. Paris : SEDES.

Caron 2002 = Philippe Caron 2002. Vers la notion de chronolecte ? Quelques jalons à propos du français préclassique. Rodney Sampson, Wendy Ayres-Bennett (eds.). Interpreting the history of French. A festschrift for Peter Rickard on the occasion of his eightieth birthday. Amsterdam : Rodopi, 329-352.

Cazals 2014 = Géraldine Cazals 2014. Les arrêts notables et la pensée juridique de la Renaissance. Géraldine Cazals, Stéphan Geonget (éds.). « Des arrests parlans ». Les arrêts notables à la Renaissance entre droit et littérature. Genève : Droz, 203-224.

Combettes 2005 = Bernard Combettes 2005. Les constructions détachées comme cadres de discours. Langue française 148, 31-44. https://www.persee.fr/doc/lfr_0023-8368_2005_num_148_4_6605.

ConDÉ = Pierre Larrivée, Mathieu Goux (éds.) 2022. Projet Constitution d'un droit européen : six siècles de coutumiers normands. https://www.unicaen.fr/coutumiers/conde/accueil.html.

Corpus juris civilis = Frédéric Duval (éd.) 2007-2022. Miroir des classiques. Corpus juris civilis. http://elec.enc.sorbonne.fr/miroir_des_classiques/index.html.

De minute en minute 2.0 = Ressources numériques pour l'édition des archives de la Renaissance (RENUMAR) (éd.) 2007-2022. De minute en minute 2.0. http://renumar.univ-tours.fr/base.

Frantext = Laboratoire Analyse et traitement informatique de la langue française (ATILF) (éd.) 1998-2022. Base textuelle Frantext. http://www.frantext.fr.

GC = Grand Coutumier de Normandie (Harvard Law School Library, ms 91, env. 1300). https://iiif.lib.harvard.edu/manifests/view/drs:11589675$1i.

GGHF = Christiane Marchello-Nizia et al. 2020. Grande grammaire historique du français (GGHF). Berlin : De Gruyter Mouton.

Goux 2019 = Mathieu Goux 2019. Le pronom-déterminant rélatif lequel en français préclassique et classique (1580-1720). Paris : Classiques Garnier.

Goux 2022 = Mathieu Goux 2022. Dire le droit et dire le vrai. La polyphonie dans la coutume de Normandie. Studia linguistica romanica 2022.7, 1-20. https://doi.org/10.25364/19.2022.7.1.

Goux & Larrivée 2020 = Mathieu Goux, Pierre Larrivée 2020. Expression et position du sujet en ancien français : le rôle de la personne pronominale. Franck Neveu et al. (éds.). CMLF 2020 - 7e Congrès mondial de linguistique française, Université de Montpellier 3, France, 6-10 juillet 2020. https://doi.org/10.1051/shsconf/20207803002.

Goux & Rossi-Gensane 2019 = Mathieu Goux, Nathalie Rossi-Gensane 2019. Référents évolutifs, anaphores et constructions détachées : étude diachronique de recettes de cuisine. Les cahiers de praxématique 72. https://journals.openedition.org/praxematique/5424.

Grinberg 2006 = Martine Grinberg 2006. Écrire les coutumes. Les droits seigneuriaux en France. XVIe - XVIIIe siècle. Paris : Presses universitaires de France.

Grübl 2015 = Klaus Grübl 2015. Ce que les chartes nous apprennent sur la variation et le changement linguistique au Moyen Âge : l'exemple de la déclinaison bicasuelle de l'ancien français. Revue de linguistique romane 79, 5-83. https://www.eliphi.fr/#/eliphi-numerique/rlir/journals.

Iglesias 2015 = Olivier Iglesias 2015. Le placement des pronoms clitiques dans les complexes verbaux en français au xviie siècle : une approche idiolectale. Travaux de linguistique 70, 91-120.

Larrivée 2019 = Pierre Larrivée 2019. Corpus de textes légaux : entre histoire, histoire du droit et histoire de la langue. Caen : Projet ConDÉ. https://conde.hypotheses.org/139.

Larrivée & Capin 2018 = Pierre Larrivée, Daniéla Capin 2018. Types de textes et changement syntaxique. Franck Neveu et al. (éds.). 6e Congrès mondial de linguistique française, Université de Mons, Belgique, 9-13 juillet 2018. https://doi.org/10.1051/shsconf/20184603004.

Li livres de jostice et de plet = Graziella Pastore (éd.) 2022. Li livres de jostice et de plet. http://elec.enc.sorbonne.fr/josticeetplet.

Miestamo 2009 = Matti Miestamo 2009. Implicational hierarchies and grammatical complexity. Geoffrey Sampson, David Gil, Peter Trudgill (éds.). Language complexity as an evolving variable. Oxford : Oxford University Press, 80-97.

Neveux 2011 = François Neveux 2011. Le contexte historique de la rédaction des coutumiers normands. Annales de Normandie 61.2, 11-22. https://www.cairn.info/article.php?ID_ARTICLE=ANNOR_612_0011.

Pannier 1856 = Victor Pannier 1856. Les ruines de la coutume de Normandie, ou Petit dictionnaire du droit normand restant en vigueur pour les droits acquis. 2e édition. Rouen : Le Brument.

PRESTO = Denis Vigier, Peter Blumenthal (éds.) 2013-2017. Projet Évolution du système prépositionnel du français. http://presto.ens-lyon.fr.

Prévost 2010 = Sophie Prévost 2010. Évolution de la position du sujet pronominal en français médiéval : une approche sémantico-pragmatique. Franck Neveu et al. (éds.). CMLF 2010 - 2e Congrès mondial de linguistique française, La Nouvelle-Orléans, États-Unis, 12-15 juillet 2010. https://doi.org/10.1051/cmlf/2010106.

Prévost 2015 = Sophie Prévost 2015. Diachronie du français et linguistique de corpus : une approche quantitative renouvelée. Langages 197, 23-45. https://doi.org/10.3917/lang.197.0023.

Riegel, Pellat & Rioul 2014 = Martin Riegel, Jean-Christophe Pellat, René Rioul 2014. Grammaire méthodique du français. 5e édition. Paris : Presses universitaires de France.

RIN = Réseau d'intérêts normands.

Tabares Plasencia 2020 = Encarnación Tabares Plasencia 2020. Fraseología jurídica en un corpus diacrónico de textos literarios españoles y su representación fraseográfica. Círculo de lingüística aplicada a la comunicación 82, 69-92. https://revistas.ucm.es/index.php/CLAC/article/view/68964.

TAC = Très Ancien Coutumier de Normandie (Bibliothèque Sainte-Geneviève, ms 1743, env. 1250). Retranscrit dans Ange-Ignace Marnier 1839. Établissements et coutumes, assises et arrêts de l'échiquier de Normandie (de 1207 à 1245). Paris : De Stahl. https://droit-normand.nakalona.fr/items/show/319.

Vaugelas 1934 [1647] = Claude Favre de Vaugelas 1934 [1647]. Remarques sur la langue françoise. Fac-similé de l'édition originale. Genève : Droz.

Vigier 2017 = Denis Vigier 2017. L'évolution des usages des prépositions en, dans, dedans entre le xvie siècle et le xxe siècle : approche distributionnelle sur corpus outillé. Discours 21. https://journals.openedition.org/discours/9373.

Wolfe & Maiden 2020 = Sam Wolfe, Martin Maiden (éds.) 2020. Variation and change in Gallo-Romance grammar. Oxford : Oxford University Press.

Woods & Wolfe 2020 = Rebecca Woods, Sam Wolfe (éds.) 2020. Rethinking verb second. Oxford : Oxford University Press.

Yver 1986 = Jean Yver 1986. La rédaction officielle de la coutume de Normandie (Rouen, 1583). Son esprit. Annales de Normandie 36, 3-36. https://www.persee.fr/doc/annor_0003-4134_1986_num_36_1_1716.

1 Voir le volume collectif de Wolfe & Maiden (2020). Chaque contribution évoque, directement ou indirectement, 'l'étrangeté' que constitue la langue française, notamment qu'elle ne soit pas une langue pro-drop (Goux & Larrivée 2020) ou le statut discuté de langue V2 de l'ancien français (Balon & Larrivée 2016 ; Woods & Wolfe 2020).

2 Nous pouvons évoquer ce que Vaugelas appelait la « langue du palais [le Parlement de Paris] » (par exemple, 1934 [1647] : 25, entre autres) mais aujourd'hui encore, certaines grammaires d'usage et certains auteurs associent l'emploi de tel ou tel marqueur grammatical à une écriture dite non-littéraire. Par exemple, le pronom-déterminant relatif lequel est dit comme « propre au style juridique » dès la langue médiévale pour Buridant (2000 : 588), et Riegel, Pellet & Rioul (2014 : 798) confirment cette association pour la langue contemporaine. Les études récentes établissent pourtant le contraire (Goux 2019).

3 Nous renvoyons également à Goux & Rossi-Gensane (2019) pour une discussion sur l'importance des sources non-littéraires pour l'étude des états anciens de la langue française.

4 Voir aussi Larrivée (2019).

5 Le projet a été financé par la région Normandie et porté par le Centre de recherches inter-langues sur la signification en contexte (CRISCO, EA 4255) de l'Université de Caen et le Centre universitaire rouennais d'études juridiques (CUREJ, EA 4703) de l'Université de Rouen.

6 Sur l'histoire de la coutume de Normandie, nous renvoyons à Yver (1986), Grinberg (2006) et Neveux (2011).