La diachronie longue dans un corpus homogène

Le cas des constructions V2

Long-term diachrony in a homogeneous corpus

The case of V2 constructions

Pierre Larrivée

Université de Caen Normandie (Caen, France)

pierre.larrivee@unicaen.fr

https://orcid.org/0000-0001-8447-7102

Reçu le 24/08/2020, accepté le 24/03/2021, publié le 7/10/2022 selon les termes de la licence Creative Commons Attribution 4.0 International (CC BY 4.0)

Pour citer cet article

Larrivée, Pierre. 2022. La diachronie longue dans un corpus homogène. Le cas des constructions V2. Studia linguistica romanica 2022.7, 71-86. https://doi.org/10.25364/19.2022.8.4.

Résumé

Ce travail étudie le devenir sur le temps long des constructions à sujet postposé caractéristiques du français ancien. Les constructions à verbe en deuxième position (V2) sont celles où le verbe est précédé d'un syntagme, et suivi dans les structures non-ambiguës du sujet exprimé. Ces constructions sont suivies dans le corpus ConDÉ, corpus calibré de coutumiers normands allant de 1250 à 1771. Une courbe déclinante régulière de 5% à 0,3% y est documentée, et les divergences de certains témoins par rapport à cette courbe sont expliquées en termes de registre. Les constructions sont typiquement motivées dans la première période par un syntagme initial topique (pour ce doit-il le faire), puis par un coordonnant (et doit-on le faire), qui laisse la place aux adverbiaux à valeur souvent concessive qui subsistent aujourd'hui (encore faudrait-il le faire). Le passage de la deuxième à la troisième période est préfiguré par l'emploi important de toutefois au 16e siècle. Une compréhension fine d'un changement syntaxique est ainsi promue par son étude sur le temps long.

Abstract

This work examines the long-term evolution of V2 constructions in French. Unambiguous V2 constructions feature a verb in high sentential position, preceded by an initial phrase and followed by the expressed subject. The evolution of these constructions is analyzed in the ConDÉ corpus, a calibrated corpus of Norman custom law texts covering the period between 1250 and 1771. A regular downward curve from 5% to 0,3% is established, and deviations from the curve are explained in terms of register. The constructions are typically motivated by an initial topical projection in the first period (pour ce doit-il le faire 'for this must he do so'), then by a coordinator (et doit-on le faire 'and must one do so'), and finally by adverbials with a concessive value still found today (encore faudrait-il le faire 'yet should one still do so'). The transition from the second to the third period is foreshadowed by the prominent use of toutefois 'however' as initial element in the 16th century. A deeper understanding of a syntactic change is thus promoted by its study over a long period of time.

Sommaire

1 Introduction
2 Contexte de la recherche
3 Objet, méthode et données
4 Résultats
5 Conclusion
Abréviations et références bibliographiques

1 Introduction

[1] L'objectif de cet article est double. Il veut montrer l'intérêt pour la recherche diachronique de la calibration des textes sources selon leur type d'une part, et de leur examen sur une période temporelle significative d'autre part. Cette démonstration est ici faite à travers l'étude de l'évolution d'une construction du français ancien. La construction à verbe en deuxième position (V2, Wolfe 2018 et références y incluses) est caractérisée par la position syntaxique haute du verbe (Skårup 1975). Le verbe est précédé par un syntagme, qui peut être le sujet exprimé. Quand c'est un autre syntagme que le sujet qui précède, ce sujet, s'il est exprimé, suit le verbe, comme l'illustre l'exemple prototypique suivant :

(1)

Por ceapert il que … (GC, ≃ 1300)

'À cause de cela il semble que ...'

[2] La disparition de cette construction est généralement suivie dans des corpus de textes hétérogènes par la région1 et limités à la période ancienne2. Or, cette approche ne permet pas de se faire une idée de la courbe régulière de l'évolution effective, puisqu'elle ne contrôle pas les facteurs non-structuraux comme le type de texte, la région ou la dimension stylistique des textes littéraires. De même, la considération d'avant une diachronie moins étendue, bien qu'en elle-même intéressante, ne peut identifier les étapes du parcours par lequel on va de (1) aux manifestations actuelles de la construction (2).

(2)

Encore le faudrait-il.

[3] L'étude panoramique de l'évolution de V2 est faite à travers le corpus ConDÉ. Ce corpus, constitué dans le cadre du projet RIN éponyme soutenu par la Région Normandie, présente 15 textes distribués à travers 6 siècles traitant tous du droit coutumier normand. Cet ensemble de près de 6 millions de mots permet ainsi de suivre l'évolution d'un phénomène grammatical comme le déclin de V2 en contrôlant les facteurs non-structuraux de variation et en permettant de suivre la courbe jusqu'à son asymptote. C'est ce qui est réalisé par le biais de sondages quantitatifs et d'études qualitatives des occurrences, comme on l'explicite dans § 3. Ouvrant sur le contexte de la recherche (§ 2), l'article présente les méthodes retenues pour accomplir l'étude panoramique de l'inversion V2 en français (§ 3), avant de décrire les résultats quantitatifs et qualitatifs (§ 4). Les conséquences en sont tirées dans la discussion conclusive.

2 Contexte de la recherche

[4] L'ordre des mots est une propriété centrale par laquelle se caractérisent les langues. Le français actuel est connu pour son ordre des mots strict. Cela peut s'illustrer par la comparaison avec les autres langues romanes actuelles, et avec le français ancien. La comparaison romane est faite par exemple dans l'étude de Leonetti (2017)3, dont est reproduit le tableau de synthèse suivant :

SOV

SVO

VOS

VSO

OVS

Français

*

Très contraint

*

Presque exclu

Italien

*

contraint

*

Très contraint

Portugais

*

✓ (contraint)

Espagnol

*

Tableau 1 : Panorama des agencements possibles dans quatre langues romanes

[5] Le tableau montre que toutes les dimensions répertoriées attestent du caractère contraint de l'ordre des mots du français4. C'est pourquoi les éléments de flexibilité ont par la force du contraste retenu l'attention. En particulier, l'inversion du sujet dans les propositions assertives a été l'objet de nombreuses études descriptives (Blinkenberg 1928 ; Le Bidois 1952 ; Spang-Hanssen 1971 ; Togeby 1971 ; Jonare 1976 ; Korzen 1987 ; Wind 1995 ; Friedemann 1997 ; Muller 1997 ; Fuchs 1997, 2009 ; Hulk & Pollock 2001 ; Prevost 2001 ; Lahousse 2003, 2006, 2011 ; Gerdes & Muller 2006 ; Copy & Gournay 2007). Celles-ci mènent à identifier diverses sous-catégories, dont Bonami & Godard (2001) donnent la synthèse suivante de laquelle je reprends les exemples (voir aussi Cappeau & Lahousse 2015) :

-

les contextes d'extraction (relatives, interrogatives partielles, clivées, topicalisation, etc.) :

(3)

L'enfant auquel parlera Paul

-

l'inversion locative (voir Cornish 2001) :

(4)

Sur la place se dresse la cathédrale.

-

l'inversion d'un GN lourd :

(5)

Se présenteront à cinq heures tous les étudiants qui ont échoué à l'examen.

-

les incises de citation :

(6)

« J'arrive ! », cria Jean.

-

l'inversion inaccusative :

(7)

Entra Paul.

-

à quoi s'ajoutent (suivant la typologie de Fuchs 2009) les inversions modales :

(8)

Serait-il là, je ne le croirais pas.

(9)

Semble-t-il qu'il serait là5.

-

et les constructions à adverbiaux initiaux (par exemple Lahousse 2015) :

(10)

Encore le faudrait-il.

[6] Cette dernière construction illustre la divergence entre le français actuel et l'état plus libéral du français ancien. Alors qu'elle semble rare et apparaît liée à des collocations assez particulières concernant les adverbiaux initiaux et le sujet clitique en français actuel, la construction V2 était plus productive et plus fréquente en français ancien (Buridant 2019 : 1088). C'est pourquoi les études sur le développement de V2 (Zimmerman 2014 ; Prévost 2011, 2015a, 2015b ; Marchello-Nizia 2018 ; Larrivée 2019) se concentrent sur la période ancienne. Ce qui manque dans la littérature scientifique est une étude du parcours historique qui fait passer de cas comme (1) en français ancien à (10) en français actuel. On voudrait idéalement suivre ce parcours dans un type de texte comparable à travers l'histoire, afin d'exclure des facteurs de variation sans rapport direct avec le devenir de la construction elle-même. Ce desideratum pourra apparaître comme une coquetterie. Ce serait méconnaître la forme des courbes livrées par l'étude de textes hétérogènes. Les courbes dessinées par les chiffres fournis dans les études de Zimmerman (2014), Prévost (2015a, 2015b) et Marchello-Nizia (2018) sur l'expression et la position du sujet sont irrégulières, contrairement à celles livrées par l'étude de textes strictement comparables à travers le temps (Goux & Larrivée 2020). Une meilleure image du changement en cours est donc fournie par la calibration des textes. La méthode pour une étude calibrée sur le temps long est décrite dans la section suivante.

3 Objet, méthode et données

[7] Le but de ce travail est de contribuer à la compréhension du changement majeur dans l'histoire du français qu'est la perte graduelle de la construction V2 à sujet exprimé postposé. La perte de V2 est intéressante, car cette configuration absente du latin (mais voir Ledgeway 2017) est manifeste dans les premiers états écrits d'au moins certaines langues romanes, pour ensuite disparaître. L'analyse du parcours historique est effectuée grâce à des données quantitatives et qualitatives. D'une part, d'un point de vue quantitatif, il s'agit d'établir la courbe d'évolution de V2, pour voir si elle correspond aux attentes d'une courbe déclinante régulière. D'autre part, il est question de cerner les conditions par lesquelles on passe d'une configuration prototypiquement représentée par un complément initial topique en ancien français :

(11)

Por ce apert il que … (GC, ≃ 1300)

'À cause de cela il semble que ...'

puis par coordonnant en moyen français :

(12)

et perdra ledict seigneur la court/iurisdiction & cõgnoissance ẽ ladicte matiere (Le Rouillé 1539)

'Et ledit seigneur perdra le procès, le droit et la connaissance en cette matière'

puis par certains adverbiaux à valeur concessive en français actuel :

(13)

Il est vrai qu'il a la contrainte par corps contr'eux, mais encore faudroit-il qu'il y intervint une Sentence ou Ordonnance de condamnation pour pouvoir mettre ces coupables en prison (Merville 1731)

[8] Ces questions sont investiguées dans le corpus ConDÉ. Ce corpus est constitué de coutumiers normands en prose distribués sur 6 siècles. L'intérêt de se fonder sur un corpus calibré pour le style, le genre, le sujet et la région est qu'il permet d'écarter les facteurs de variation autres que temporel. On peut ainsi s'approcher de la courbe régulière du changement effectif dans la compétence des générations successives de locuteurs.

[9] La démarche quantitative prend son point de départ dans l'annotation manuelle d'une séquence continue d'au moins 300 propositions dans le sous-ensemble de coutumiers retenus à travers la période. Les constructions à sujet postposé sont ensuite relevées, et catégorisées. Les cas de V2 sont répertoriés, et on prend soin d'exclure du compte les emplois formulaires, qui représentent des emplois non-productifs, dans des séquences qui se répètent à l'identique et ne reflètent donc pas la compétence immédiate des locuteurs d'une époque donnée. La proportion des V2 productifs est calculée par rapport à toutes les propositions annotées.

[10] La baisse du nombre d'occurrences de la construction pour la période tardive engage à utiliser une méthode complémentaire. La difficulté à surmonter est qu'en l'absence regrettable de modalités librement accessibles d'annotation syntaxique robuste pour le français ancien, la recherche des sujets postposés est laborieuse, d'autant plus avec des textes d'une étendue parfois considérable6. Cette recherche doit donc s'appuyer sur des formes facilement identifiables, dont on pourra évaluer rapidement la position par rapport au verbe et la présence ou non d'un syntagme initial. Pour ce faire, nous nous référons au nominatif il. Les occurrences non-formulaires sont classées en fonction de propriétés formelles (le type morphosyntaxique du syntagme initial par exemple) et interprétatives. On espère en arriver à observer des contextes où le V2 productif se manifesterait plus typiquement à une époque particulière, et à discerner les conditions qui font passer d'un type d'emploi à l'autre. Les résultats de la démarche sont exposés dans la section suivante.

4 Résultats

[11] Cette section présente les résultats obtenus à partir du protocole exposé dans la section précédente. Les résultats quantitatifs sont présentés avant que ne soient décrits les résultats qualitatifs. Dans un premier temps, nous avons fait l'analyse de l'expression et de la position du sujet dans une séquence d'au moins 300 propositions dans chacun des 6 coutumiers allant du 13e au 18e siècle. Les textes sélectionnés du corpus, auxquels nous avons rajouté Charte (1398-1409) ne figurant pas initialement dans le corpus, sont présentés ci-après.

Texte

Nombre de mots (env.)

TAC (≃ 1250)

10000

GC (≃ 1300)

63000

Charte (1398-1409)

80500

Le Rouillé (1539)

331000

Bérault (1614)

637000

Merville (1731)

566500

Tableau 2 : Textes utilisés pour l'analyse quantitative de l'évolution de V2

Les chiffres émanant de cette analyse sont fournis dans le tableau suivant.

Texte

Nombre des propositions analysées

Nombre de sujets postposés

Nombre de sujets postposés V2

Nombre de sujets postposés V2 productifs

TAC (≃ 1250)

405

20

19

19

GC (≃ 1300)

301

35

34

22

Charte (1398-1409)

300

9

6

6

Le Rouillé (1539)

307

28

20

10

Bérault (1614)

310

17

7

7

Merville (1731)

308

8

1

1

Tableau 3 : Sondage quantitatif des V2 dans 6 coutumiers normands

[12] D'une part, la comparaison du nombre de sujets postposés et du nombre de sujets V2 montre une intervention à des taux variables d'autres types de postposition. On en retrouve 1 en 1250 (1 inaccusatif, (14)), 1 en 1300 (1 en comparatif, (15)), 3 en 1409 (1 en comparatif, 1 en relatif (16), 1 conditionnel (17)), 8 en 1539 (2 comparatives, 4 relatives, 2 conditionnels), 10 en 1614 (4 comparatives et 6 relatives) et 7 en 1731 (2 comparatives, 4 relatives, 1 conditionnel). Des illustrations de chaque cas sont données ci-dessous.

(14)

et au povre home remaint sa terre (inaccusatif, TAC, ≃ 1250)

'et sa terre restera au pauvre homme'

(15)

si cõme sunt les mestres de leschequier & les baillis (comparatif, GC, ≃ 1300)

'comme sont les maîtres du parlement et les baillis'

(16)

sur les molins de Periers, un septier de fourment et un septier de grosse moulture chacun an, que prennent les prévosts de Lions. (relatif, Charte, 1398-1409)

'sur les moulins de Periers, une mesure de froment et une mesure de grosse mouture chaque année, que prennent les prévôts de Lion-sur-Mer'

(17)

Enquel buisson nul n'a coustume en pasturage ou autrement, soit la forest vendue ou non, excepté lesdis bourgois, reservé la guarenne du roy. (conditionnel, Charte, 1398-1409)

'Dans ce bosquet, nul n'a de droit de pâturage ou autre, que la forêt soit vendue ou non, excepté lesdits bourgeois, et sauf pour les droits de chasse du roi'

Ces exemples montrent par contraste que tous les sujets postposés ne relèvent pas de la construction V2. Par exemple, le comparatif en (15) a bien un sujet postposé, mais n'a pas de syntagme initial, et rien ne montre que le verbe soit en position syntaxiquement haute.

[13] Le parcours dessiné par les chiffres de V2 productif est rendu visible par la figure suivante :

Figure 1 : Pourcentage de V2 productifs dans six coutumiers normands

[14] Cette figure établit d'une part que la construction V2 à sujet exprimé a toujours été minoritaire. D'autre part, cette construction est sur une nette tendance baissière. Pour autant, elle ne disparaît jamais complètement, puisque le dernier témoin donne encore un exemple, représentant 0,3% des propositions7.

[15] La courbe de changement n'est cependant pas aussi régulière que ce qu'on aurait pu attendre. On constate un pic relatif de V2 dans le témoin de 1300. Le GC en comporte en effet 22 occurrences productives, soit plus de 7,3 % des propositions de l'échantillon. De même, une autre remontée par rapport aux chiffres des témoins précédant et suivant est fournie par Le Rouillé (1539), qui livre 10 occurrences, pour 3,3% des propositions. Même s'il ne s'agit que de quelques points de pourcentage, ces décalages demandent à être expliqués. Une cause envisageable est celle du caractère conservateur de la langue utilisée. On pourrait penser que le GC, et le premier commentateur de ce GC, utilisaient une langue conservatrice pour consacrer la solennité d'un texte écrit en français. Cette idée est soutenue par une observation fournie dans le tableau 3 ci-dessus. En comparant le nombre de sujets postposés et le nombre de sujets postposés productifs, on constate que ce sont ces textes de 1300 et de 1539 qui ont des emplois formulaires. Le fait d'avoir des emplois formulaires de V2 (par exemple la séquence déictique + peut len + infinitif dans Le Rouillé 1539) va dans le sens d'une langue plus conservatrice, et ayant donc des taux plus élevés d'une construction déclinante que l'attendu de l'époque8.

[16] Il n'en demeure pas moins que le sujet postposé suit une courbe de déclin globalement régulière. Le sondage d'une construction déclinante opéré sur 300 propositions a pour conséquence de ne permettre de recueillir que peu d'occurrences, particulièrement pour la période tardive. Ce fait rend difficile l'évaluation qualitative du changement de distribution ou des collocations typiques de la configuration. C'est la raison pour laquelle nous avons utilisé une méthode complémentaire de recherche se concentrant sur une forme de sujet réalisé pouvant être extraite et évaluée rapidement.

[17] Afin de trouver un nombre suffisant d'occurrences après 1500 pour identifier les éventuels changements qualitatifs dans la construction V2 à travers le temps, nous nous sommes concentré sur les occurrences du nominatif de troisième personne masculin singulier il. Les 500 premières occurrences du clitique il (précédé et suivi d'un espace) ont été extraites dans chacun des cinq textes grâce au logiciel AntConc. Elles ont été examinées dans le but d'identifier les il postposés apparaissant dans une construction V2. Les résultats sont donnés dans le tableau suivant.

Texte

V2 dans les 500 premières occurrences de il

Nombre de il dans le texte

Nombre de mots (env.)

Le Rouillé (1539)

21

1358

331000

Terrien (1578)

10

4569

540000

Bérault (1614)

11

5336

637000

Basnage (1678), t.1

0

2940

750000

Merville (1731)

4

5907

566500

Tableau 4 : Sondage quantitatif des V2 productifs avec il dans 5 coutumiers normands après 1500

[18] Ces chiffres sont donc établis par une mesure différente de celle utilisée précédemment. Ils confirment néanmoins le caractère minoritaire de la construction, et la tendance déclinante. Le parcours est donc en cohérence avec celui dessiné dans la figure 1. En enlevant du compte les trois emplois formulaires (par ce appert il) de Le Rouillé (1539), et les 3 autres (encore faut-il) de Terrien (1578), les proportions d'emplois productifs ont le devenir représenté dans la figure suivante (en orangé), qui fournit (en bleu) la courbe de la figure 1 pour comparaison.

Figure 2 : Pourcentage de V2 productif après 1500

[19] Un examen de chaque occurrence productive de chaque texte amène à identifier trois emplois principaux selon la nature de l'élément initial de la construction. Persiste le complément à valeur topique (18), souvent associé à un élément déictique, qui caractérise la construction dans la période ancienne (voir Larrivée 2019). L'emploi avec une particule9 en (19) qui subsiste encore aujourd'hui se perpétue. Se manifeste un élément à valeur concessive (20). Chaque cas est illustré ci-dessous.

(18)

Et pour ce est il expressement mis en la fin des causes a la iurisdictiõ royale (topique, Le Rouillé 1539)

(19)

Encore y auoit-il beaucoup d'obscurité (particule, Bérault 1614)

(20)

Ce qui a esté suyui par celuy qui a recueilli & redigé par escrit nostre Coustume, quiconque fut-il. (concession, Terrien 1578)

Ceux-ci se distribuent de la façon suivante :

Texte

topique

particules

concessif

autres

Le Rouillé (1539)

3

6

6 (toutefois)

3

Terrien (1578)

4

4

1

1

Bérault (1614)

-

8

-

3 corrélatifs

Basnage (1678)

-

-

-

-

Merville (1731)

-

-

1

Totaux

7

18

7

8

Tableau 5 : Sondage quantitatif des V2 productifs avec il dans 6 coutumiers normands après 1500

[20] La distribution des emplois montre que le point de passage entre la construction V2 à topique initial, qui a aujourd'hui disparu, et l'emploi avec particule qui subsiste aujourd'hui, est l'emploi d'un élément initial à valeur concessive. En particulier, le connecteur toutefois apparaît 6 fois dans Le Rouillé (1539).

(21)

a. Toutesfois se peut il bien faire/quil soit aulcunesfois profitable de muer aulcune loy ou couſtume:

b. toutesfois eſt il souuẽt prins plus largement comme a ce propos ... de faire droict

c. toutesfoys sentent il que le default ... /doibt estre amende

d. Toutesfoys nentent il pas que ...

e. toutesfoys ne veult il pas innuer quõ ...

f. Toutesfoys nest il pas ainsi.

[21] En outre, cette observation attire l'attention sur les données actuelles. Les configurations V2 qui subsistent aujourd'hui, avec certaines particules comme encore illustrée en (2), ou toujours dans le formulaire toujours est-il, ont souvent une valeur concessive.

5 Conclusion

[22] Cet article entend montrer le profit qu'on peut tirer d'un corpus strictement calibré pour l'analyse de la diachronie. L'usage du corpus ConDÉ qui réunit des textes en prose du même genre, sur le même sujet et de la même région pour 6 siècles permet de dégager la courbe d'évolution d'une construction caractéristique du français ancien. L'étude du parcours de la construction avec verbe en seconde position (V2) permet les trois observations suivantes :

1.

Le caractère toujours minoritaire de la construction V2, qui ne dépasse jamais 7,3% des propositions ;

2.

son long déclin suivant une courbe relativement régulière ;

3.

sa subsistance, même à des taux très faible.

[23] L'analyse qualitative des occurrences montre que les constructions prototypiques vont d'un topique initial dans la période ancienne, à des particules dans la période tardive. Entre les deux se manifeste l'emploi de connecteurs à valeur concessive, qui semble faire le pont entre les compléments de type pour ce, qui ont souvent une valeur de cause ou de but, et les particules de type encore et toujours, qui entrent souvent dans des propositions à valeur concessive. Bien sûr, le passage de la cause à la concession est une évolution régulière à travers les langues (par exemple, Combettes & Dargnat 2016).

[24] Les résultats ne demandent évidemment qu'à être confirmés. Le fait de travailler sur une construction déclinante signifie nécessairement qu'on dispose d'un nombre d'occurrences restreint pour ses développements tardifs. Il faudra attendre des dispositifs d'annotation syntaxique robustes pour repérer rapidement les configurations V2 avec inversion du sujet. Cela permettrait en outre d'évaluer le nature du sujet, nominal ou pronominal, à travers l'histoire.

[25] Le parcours dessiné permet néanmoins de proposer deux généralités :

1.

L'évolution suit une courbe régulière, et la difficulté pour certaines études à dégager une telle courbe peut être due à l'usage de données hétérogènes.

2.

Les constructions ne meurent jamais totalement. Notons que pour la période actuelle, le CFPP2000 par exemple, qui atteste de 17329 il, donne encore 26 -il, postposés donc, dont 16 en assertives (11 paraît-il et semble-t-il), et 2 V2 représentés par toujours est-il. À cet égard, l'évolution apparaît non pas comme le passage du tout au rien, mais comme un changement de fréquence de différentes options résiduelles et disponibles, et dont la valeur peut varier selon le degré de disponibilité. On peut spéculer que la disponibilité de ces options, même à des taux très faibles, peut servir de modèle à de futures évolutions.

Abréviations et références bibliographiques

AntConc = Laurence Anthony 2022. Logiciel AntConc. http://www.laurenceanthony.net/software/antconc.

Basnage 1678 = Henri Basnage 1678. La coutume reformée du païs et duché de Normandie, anciens ressorts et enclaves d'iceluy. Rouen : C. et J. Lucas. https://numelyo.bm-lyon.fr/f_view/BML:BML_00GOO0100137001101309818/IMG00000005, https://books.google.fr/books?id=nyiX4EyFTJkC.

Bérault 1614 = Josias Bérault 1614. La coustume reformée du pays et duché de Normandie, anciens ressorts et enclaves d'iceluy. 2e édition. Rouen : Raphaël du Petit Val. https://gallica.bnf.fr/ark:/12148/bpt6k3043196v.

Blinkenberg 1928 = Andreas Blinkenberg 1928. L'ordre des mots en français moderne. København : Høst & Søn.

Bonami & Godard 2001 = Olivier Bonami, Danièle Godard 2001. Inversion du sujet, constituance et ordre des mots. Jean-Marie Marandin (éd.). Cahier Jean-Claude Milner. Lagrasse : Verdier, 117-174.

Buridant 2019 = Claude Buridant 2019. Grammaire du français médiéval (XIe-XIVe siècles). Strasbourg : ÉLIPHI.

Cappeau & Lahousse 2015 = Paul Cappeau, Karen Lahousse 2015. Le sujet postposé. Denis Apothéloz et al. (éds.). Encyclopédie grammaticale du français. http://encyclogram.fr/notx/005/005_Notice.php.

CFPP2000 = Sonia Branca-Rosoff et al. (éds.) 2022. Discours sur la ville. Corpus de français parlé parisien des années 2000 (CFPP2000). http://cfpp2000.univ-paris3.fr.

Charte 1398-1409 = Hector de Charte 1398-1409. Coutumier des forêts. Alain Roquelet (éd.) 1984. Rouen : Société de l'Histoire de Normandie. http://txm.ish-lyon.cnrs.fr/bfm/catalog/CoutHector1.

Clifford 1973 = Paula M. Clifford 1973. Inversion of the subject in French narrative prose from 1500 to the present day. Oxford : Blackwell.

Combettes & Dargnat 2016 = Bernard Combettes, Mathilde Dargnat 2016. Grammaire de constructions et diachronie : Intensivité et concession. Frank Neveu et al. (éds.). 5e Congrès mondial de linguistique française, Tours, France, 4-8 juillet 2016. https://doi.org/10.1051/shsconf/20162704001.

ConDÉ = Pierre Larrivée, Mathieu Goux (éds.) 2022. Projet Constitution d'un droit européen : six siècles de coutumiers normands. https://www.unicaen.fr/coutumiers/conde/accueil.html.

Copy & Gournay 2007 = Christine Copy, Lucie Gournay (éds.) 2007. Points de vue sur l'inversion. Paris : Ophrys.

Cornish 2001 = Francis Cornish 2001. L'inversion « locative » en français, italien et anglais : propriétés syntaxiques, sémantiques et discursives. Cahiers de grammaire 26, 101-123. http://w3.erss.univ-tlse2.fr/textes/publications/CDG/26/CG26-6-Cornish.pdf.

Frantext = Laboratoire Analyse et traitement informatique de la langue française (ATILF) (éd.) 2022. Base textuelle Frantext. http://www.frantext.fr.

Friedemann 1997 = Marc-Ariel Friedemann 1997. Sujets syntaxiques. Positions, inversions et pro. Bern : Lang.

Fuchs 1997 = Catherine Fuchs (éd.) 1997. La place du sujet en français contemporain. Louvain-la-Neuve : Duculot.

Fuchs 2009 = Catherine Fuchs 2009. La postposition du sujet nominal : paramètres linguistiques et effets stylistiques. Agnès Fontvieille-Cordani, Stéphanie Thonnérieux (éds.). L'ordre des mots à la lecture des textes. Lyon : Presses universaires de Lyon, 27-44.

GC = Grand Coutumier de Normandie (Harvard Law School Library, ms 91, env. 1300). https://iiif.lib.harvard.edu/manifests/view/drs:11589675$1i.

Gerdes & Muller 2006 = Kim Gerdes, Claude Muller (éds.) 2006. Ordre des mots et topologie de la phrase française. Lingvisticae Investigationes 29.

GN = Groupe nominal.

Goux & Larrivée 2020 = Mathieu Goux, Pierre Larrivée 2020. Expression et position du sujet en ancien français : le rôle de la personne pronominale. 7e Congrès mondial de linguistique française. Université de Montpellier 3, France, 6-10 juillet 2020. https://doi.org/10.1051/shsconf/20207803002.

Hulk & Pollock 2001 = Aafke Hulk, Jean-Yves Pollock (éds.) 2001. Subject inversion in Romance and the theory of universal grammar. Oxford : Oxford University Press.

Jonare 1976 = Brigitta Jonare 1976. L'inversion dans la principale non-interrogative en français contemporain. Uppsala : Almqvist & Wiksell.

Korzen 1987 = Hanne Korzen 1987. Final inversion og elementærsætningens struktur. En studie over subjektets plads i to-og treledskonstruktioner på moderne fransk. København : Handelshøjskolen.

Korzen 2014 = Hanne Korzen 2014. Réflexions sur l'inversion du sujet non clitique. Hans P. Helland, Christine M. Salvesen (éds). Affaire(s) de grammaire : mélanges offerts à Marianne Hobæk Haff à l'occasion de ses soixante-cinq ans. Oslo : Novus, 1-28.

Lahousse 2003 = Karen Lahousse 2003. La distribution de l'inversion nominale en français dans les principales non interrogatives et les subordonnées circonstancielles. Lingvisticae Investigationes 26, 123-158.

Lahousse 2006 = Karen Lahousse 2006. L'assertion et l'inversion du sujet nominal dans les subordonnées adverbiales. Lingvisticae Investigationes 29, 113-124.

Lahousse 2011 = Karen Lahousse 2011. Quand passent les cigognes. Le sujet nominal postverbal en français moderne. Paris : Presses universitaires Vincennes.

Lahousse 2015 = Karen Lahousse 2015. A case of focal adverb preposing in French. Elisa Di Domenico, Cornelia Hamann, Simona Matteini (éds). Structures, strategies and beyond. Studies in honor of Adriana Belletti. Amsterdam : Benjamins, 209-236.

Lahousse 2020 = Karen Lahousse 2020. Word order in French, Spanish and Italian. Syntax, information structure and grammaticalisation. Abralin ao Vivo - Linguists Online. 21 juin 2020. https://aovivo.abralin.org/en/lives/karen-lahousse-2.

Lahousse & Lamiroy 2012 = Karen Lahousse, Béatrice Lamiroy 2012. Word order in French, Spanish and Italian: a grammaticalization account. Folia Linguistica 46, 387-416.

Larrivée 2019 = Pierre Larrivée 2019. To be or not to be informational: Preverbal complements in Medieval French V2 configurations. Glossa 4, 85. https://doi.org/10.5334/gjgl.851.

Le Bidois 1952 = Robert Le Bidois 1952. L'inversion du sujet dans la prose contemporaine (1900-1950), étudiée spécialement dans l'oeuvre de Marcel Proust. Paris : d'Artrey.

Ledgeway 2017 = Adam Ledgeway 2017. Late Latin verb second: The sentential word order of the Itinerarium Egeriae. Catalan Journal of Linguistics 16, 163-216. https://raco.cat/index.php/CatalanJournal/article/view/v16-ledgeway/422169.

Leonetti 2017 = Manuel Leonetti 2017. Basic constituent orders. Andreas Dufter, Elisabeth Stark (éds.). Manual of Romance morphosyntax and syntax. Berlin : De Gruyter, 887-932.

Le Rouillé 1539 = Guillaume Le Rouillé 1539. Le grand coustumier du pays et duché de Normendie. Rouen : Le Roux. https://gallica.bnf.fr/ark:/12148/bpt6k117438n.

Marandin 2010 = Jean-Marie Marandin 2010. Subject inversion and discourse in Romance. Danièle Godard (éd.). Fundamental issues in the Romance languages. Stanford : CSLI, 319-367.

Marchello-Nizia 2018 = Christiane Marchello-Nizia 2018. De S0 à SV : Vers le sujet obligatoire et antéposé en français, les dernières phases d'un changement. Journal of French Language Studies 28, 1-19.

Merville 1731 = Pierre Biarnoy de Merville 1731. Décisions sur chaque article de la coutume de Normandie. Paris : Valleyre. https://droit-normand.nakalona.fr/items/show/221.

Pannier 1856 = Victor Pannier 1856. Les ruines de la coutume de Normandie, ou Petit dictionnaire du droit normand restant en vigueur pour les droits acquis. 2e édition. Rouen : Le Brument.

Muller 1997 = Claude Muller 1997. L'inversion du sujet clitique en français : Hypothèse V dans C et diachronie. Lingvisticae Investigationes 21, 75-96.

Prévost 2001 = Sophie Prévost 2001. La postposition du sujet en français aux XVe et XVIe siècles. Analyse sémantico-pragmatique. Paris : CNRS Éditions.

Prévost 2011 = Sophie Prévost 2011. Expression et position du sujet pronominal : évolution en français. Mémoires de la Société de Linguistique de Paris 19, 13-34.

Prévost 2015a = Sophie Prévost. 2015a. Recul de la non-expression et de l'inversion du sujet pronominal du 12e au 14e siècle : une approche quantitative et qualitative. Anne Carlier, Michèle Goyens, Béatrice Lamiroy (éds.). Le français en diachronie. Nouveaux objets et méthodes. Bern : Lang, 431-460.

Prévost 2015b = Sophie Prévost. 2015b. Diachronie du français et linguistique de corpus : une approche quantitative renouvelée. Langages 197, 23-45.

RIN = Réseau d'intérêts normands.

Skårup 1975 = Povl Skårup 1975. Les premières zones de la proposition en ancien français. Essai de syntaxe de position. København : Akademisk Forlag.

Spang-Hanssen 1971 = Ebbe Spang-Hanssen 1971. Le classement des formes de l'inversion du sujet en français moderne. Revue romane 6, 63-73. https://tidsskrift.dk/revue_romane/article/view/28933.

TAC = Très Ancien Coutumier de Normandie (Bibliothèque Sainte-Geneviève, ms 1743, env. 1250). Retranscrit dans Ange-Ignace Marnier 1839. Établissements et coutumes, assises et arrêts de l'échiquier de Normandie (de 1207 à 1245). Paris : De Stahl. https://droit-normand.nakalona.fr/items/show/319.

Terrien 1578 = Guillaume Terrien 1578. Commentaires du droict civil tant public que privé observé au pays et duché de Normandie. Paris : Du Puys. https://gallica.bnf.fr/ark:/12148/bpt6k9107304x.

TLFi = Laboratoire Analyse et traitement informatique de la langue française (ATILF) (éd.) 2013-2022. Trésor de la langue française informatisé. http://atilf.atilf.fr.

Togeby 1971 = Knut Togeby 1971. Le mécanisme de l'inversion du sujet. Revue romane 6, 253-258. https://tidsskrift.dk/revue_romane/article/view/28955.

V2 = Construction à verbe en deuxième position.

Wind 1995 = Maarten de Wind 1995. Inversion in French. Groningen : University of Groningen.

Wolfe 2018 = Sam Wolfe 2018. Verb second in Medieval Romance. Oxford : Oxford University Press.

Zimmermann 2014 = Michael Zimmermann 2014. Expletive and referential subject pronouns in Medieval French. Berlin : De Gruyter.

1 Pour le français, voir les études quantitatives récentes de Zimmermann (2014), Prévost (2011, 2015a, 2015b), Marchello-Nizia (2018) et les références citées.

2 Bien que Marchello-Nizia (2018) inclue dans son vaste panorama des origines à 1637 des textes du vingtième siècle ; voir aussi Clifford (1973).

3 Voir encore par exemple Marandin (2010), Lahousse & Lamiroy (2012) et Lahousse (2020).

4 Il faudrait encore, comme le souligne un évaluateur, noter les restrictions du type de sujet, nominal ou pronominal (par exemple Korzen 2014), avec certaines constructions à inversion, illustrant à nouveau le caractère contraint de la configuration en français.

5 Un relecteur trouve cette structure curieuse. Si elle n'est pas attestée dans Frantext pour le 20e siècle, elle l'est dans le TLFi, mais en incise il est vrai.

6 Le coutumier commenté de Basnage (1678) fait deux tomes dont le premier compte environ 750000 mots.

7 Pannier (1856) ne contient aucune occurrence de -il en assertive, et une seule en interrogative, mais on sait que des constructions comme (2) sont attestées à cette époque.

8 Sur le conservatisme des textes légaux normands autour de 1300 voir Larrivée (2019).

9 Il s'agit d'adverbiaux courts, représentés par si, or, (a)lors, aussi, ainsi, encore, qui ont une valeur abstraite et un fonctionnement de connecteur anaphorique.