Langues romanes

Les langues romanes, aussi appelées langues latines[1],[2] ou, plus rarement, langues néo-latines[3],[4],[5], sont un groupe de langues issues du latin vulgaire, plus précisément du latin véhiculaire[6]. D'abord utilisées pour la communication sur toute l'étendue de l'Empire romain, les langues romanes ont connu une expansion mondiale à partir du XVe siècle.

Pour les articles homonymes, voir Roman.

Ne doit pas être confondu avec Gallo-roman (langue).

Langues romanes, langues latines
Région jusqu'au XVe siècle : Péninsule Ibérique, France, Suisse, Italie, Balkans, actuelles Roumanie et Moldavie ; expansion mondiale par la suite
Classification par famille
Codes de langue
ISO 639-2 roa
ISO 639-5 roa
IETF roa
Linguasphere 51
Carte

Pays européens où une ou plusieurs langues romanes sont officielles.

Nom

Roman est un nom masculin issu de l'ancien français romanz (v. 1135), lui-même issu du bas latin romanice à la façon des Romains », par opposition à celle des Barbares), et désignant dès le XIe siècle la langue vernaculaire parlée dans le Nord de la France, par opposition au latin (langue écrite et savante) et au germanique des Francs. La forme adjectivale du substantif roman est relevée au XVIe siècle pour qualifier une langue vernaculaire parlée en Romania, et apparaît en linguistique dans le courant du XVIIIe siècle pour qualifier les langues romanes[7].

Description générale

Ces langues ont été parlées ou le sont encore dans un ensemble géographique désigné par le terme de Romania[8], désignant la partie européenne de l'ancien Empire romain d'Occident et l'Empire Romain d'Orient, où les Valaques parlaient une forme de latin vulgaire (mais où la langue grecque est rapidement devenue officielle en Europe et en Anatolie, tandis que la Syrie, la Palestine et l'Égypte sont passées à l'arabe après la conquête musulmane). Les mots roman(e) et Romania remontent à des dérivés de l'adjectif latin romanus : l'on considérait en effet que leurs locuteurs utilisaient une langue issue de celle des Romains, par opposition à d'autres introduites ultérieurement dans les territoires de l'Empire, comme le francique au nord de la France, langue tudesque des Francs appartenant à la branche des langues germaniques. La première attestation du terme roman remonte au concile de Tours, qui se tient en 813. Lors de ce concile, l'un des cinq réunis cette même année à l'initiative de Charlemagne, il est recommandé aux prêtres de s’adresser à leurs ouailles « in rusticam romanam linguam », le roman. Il s'agit d'une forme vernaculaire, évoluée et corrompue, du bas latin, ancêtre des langues gallo-romanes. Ce texte[Lequel ?], encore largement latinisé, est, dans l'état actuel des connaissances, la première source écrite romane attestée.

Classification des langues romanes[9].

Le premier ouvrage mentionnant plusieurs langues romanes est le De Vulgari Eloquentia De l'éloquence vulgaire ») de Dante (XIIIe siècle), où l'on trouve les dénominations de langue d'oïl, langue d'oc et de langue de si. Il s'agit pour Dante de proposer, pour remplacer le latin comme langue littéraire, l'une de ces trois langues, la langue d'oïl des chansons de geste, la langue d'oc des troubadours, ou un parler local, le toscan florentin, qui sera finalement à l'origine de l'italien littéraire[10].

On date à peu près l'évolution du latin vulgaire vers les langues romanes de la manière suivante[11] :

  1. entre −200 et 400 environ : différentes formes de latin vulgaire ;
  2. entre 500 et 600 : ces formes commencent à se différencier plus ou moins nettement ;
  3. en 813, au concile de Tours, l'existence d'une langue romane est reconnue, puisque le concile demande que désormais les sermons soient prononcés en « rusticam Romanam linguam » (langue romane rurale) et non plus en latin afin d'être compris par tous ;
  4. après 842 : premier texte complet rédigé dans une langue romane (sans doute les prémices de la langue d'oïl), les Serments de Strasbourg.

Les langues romanes partagent un ensemble de traits communs donnant une bonne cohérence à cette famille de langues, parmi lesquels les plus importants sont :

Extension approximative maximale présumée des langues romanes au début du Moyen Âge comprenant les langues éteintes (zones en noir). Les aires romanes occidentales et orientales sont séparées par la ligne La Spezia–Rimini.

Les langues romanes sont habituellement séparées selon la ligne La Spezia–Rimini en

Liste des langues romanes

Langues romanes.

Les langues romanes sont classées en plusieurs groupes, chacun pouvant comprendre plusieurs « dialectes » ; le choix d'un de ces dialectes comme langue officielle est purement politique et surtout, relativement récent dans de nombreux pays (sauf en France, où les premiers jalons sont posés dès le XVIe siècle par l'édit de Villers-Cotterêts). Quoi qu'il en soit, les langues romanes forment un continuum de langues entre lesquelles les différences sont parfois minimes ; il est toujours possible de distinguer au sein d'un ensemble ce que l'on nommera un ou plusieurs « dialectes ». La liste suivante présente entre parenthèses : nom dans la langue envisagée, date de la première attestation connue.

Exemples

Les similarités lexicales et grammaticales des langues romanes et ses dialectes, ainsi que le latin et chacune d'entre elles, peuvent être mises en évidence à l'aide des exemples suivants:

Langue Exemple
Latin (Illa) claudit semper fenestram antequam cenat.
Latin vulgaire (Ea) claudit semper illa fenestra antequam de cenare.
Aragonais Ella tranca siempre la finestra antes de cenar.
Aroumain Ea încl’idi totâna firida nãinti di ținã.
Asturien Ella pieslla siempre la ventana/feniestra primero de cenar.
Barese (Jèdde) akjude sèmbe la fenèstre prime de mangè.
Bergamasque (Lombard de l'Est) (Lé) la sèra sèmper sö la finèstra prima de senà.
Bolonais (Lî) la sèra sänper la fnèstra prémma ed dsnèr.
Bourbonnais Alle farme terjous la croisée devant de souper.
Bourguignon-morvandiau Ale clôt teujors lai fenétre aivant de dîgnai.
Calabrais Idda sempi chiudi a finestra ant'a cina.
Catalan (Ella) tanca sempre la finestra abans de sopar.
Corse septentrional (Ella) chjode sempre u purtellu/a finestra avanti/nanzu di cenà.
Corse meridional (Edda/Idda) sarra sempri u purteddu/a finestra nanzu/prima di cinà.
Dalmate (Jala) inseruo siampro la finiastra prein de cenur.
Émilien (Lē) la sèra sèmpar sù la fnèstra prima ad snàr.
Espagnol (Ella) siempre cierra la ventana antes de cenar.
Estrémègne Ella afecha siempri la ventana endantis e recenal.
Français Elle ferme toujours la fenêtre avant de dîner/souper.
Franc-comtois Lèe çhioûe toûedge lai f'nétre d'vaïnt loù dénaie.
Francoprovençal valaisan (Ye) hlou totin a fenetre deant que de cena.
Frioulan Jê e siare simpri la feneste prime di cenâ.
Gallo Ol farme terjous la crouésée avant qe de dîner.
Galicien (Ela) pecha/fecha sempre a xanela/fiestra antes de cear.
Gallurais Idda chjudi sempri lu balconi prima di cinà.
Guadeloupéen I toujou ka fenmé finèt-la avan i manjé.
Guyanais Li ka toujou franmen finèt avan li manjé
Haïtien Li toujou fèmen fenèt la avan li manje.
Istriote Gila insiera senpro lo balcon preîma da senà.
Italien (Lei) chiude sempre la finestra prima di cenare.
Judéo-espagnol Eya serra syempre la ventana antes de senar.
Léonais Eilla pecha siempres la ventana primeiru de cenare.
Ligurien (Le) a saera sempre u barcun primma de cenà.
Martiniquais I toujou fèmen fénet-la avan i manjé.
Magoua (Elle) à fàrm toujour là fnèt àvan k'à manj.
Marchois (Basse-Marche) Ale fèrme totjorn la fenétre avant de sopar.
Mauricien Li touzour ferm la fenet avan li manze.
Milanais (Lombard de l'Ouest) Lee la sara semper su la fenestra innanz de disnà.
Mirandais Eilha cerra siempre la bentana/jinela atrás de jantar.
Mozarabe Ella cloudet sempre la fainestra abante da cenare.
Napolitain Chella chiude sempe 'a fenesta primma 'e mangià.
Niçois (norme classique) Barra sempre/totjorn la fenèstra denant de sopar.
Nònes (lmo) (ladin ou lombard alpin) Ela la sera semper la fenestra inant zenar.
Normand Ol froume tréjouos la crouésie dévaunt qùé dînaer.
Occitan Barra totjorn la fenèstra (la croseia) abans de sopar.
Ombrien Essa chjude sempre la finestra prima de cena'.
Papiamento E sera semper e bentana promé/pa kome.
Provençal (norme mistralienne) Barro sèmpre / toujour la fenèstro avans de soupa/cena.
Picard A frunme toudis l’croésèe dvant qu'ed souper.

Ale freume toudis l’croisée dvaint qu'ed souper.

Piémontais Chila a sara sèmper la fnestra dnans ëd fé sin-a.
Portugais (Ela) fecha sempre a janela antes de jantar.
Réunionnais Li ferme touzour la fenèt avan manzé./Elle i ferme toujour la fenèt avan d'mangé.
Romagnol (Lia) la ciud sëmpra la fnèstra prëma ad magnè.
Romanche Ella clauda/serra adina la fanestra avant ch'ella tschainia.
Romanesco (Quella) chiude sempre 'a finestra prima de magnà.
Roumain Ea închide totdeauna fereastra înainte de cină.
Salentin Edda chiuti sempri la fineštra mprima cu cena.
Sarde méridional Issa serrat semp(i)ri sa bentana in antis de cenai.
Sarde septentrional Issa serrat semper sa bentana in antis de chenare.
Sassarais Edda sarra sempri lu balchoni primma di zinà.
Savoyard Lyé clyeu adé la fenétra dvan que gôtâ.
Sicilien Idda chiudi sempri a finestra avanti ca pistìa.
Solandro (it) (ladin) La sèra sempro/sèmper la fenèstra prima/danànt da cenàr.
Toscan Ella la hiude sèmpre la finèstra pria ddi scenà.
Tourangeau A farmĕt terjos la crouezaiyĕ davant que de sopair.
Trentin (it) Èla la sera sèmpre la finèstra prima de zenàr.
Végliote (Jala) siara siampre la puniastra praima de ćenur.
Vénitien Eła ła sara senpre la fanestra vanti de disnàr.
Wallon Ele sere todi li finiesse divant di soper.
Ancien espagnol (Ella) siempre çierra la finiestra antes de cenar/yantar.
Français médiéval (XIIe s.) Ele clot sempres la fenestre ainçois que cener
Francoprovençal lyonnais ancien (XIIIe s.) Elli cloit sempres la fenestra ancis que cenar
Ancien portugais (Ela) serra sempre a fẽestra antes de cẽar/jantar.

Groupe gallo-roman

Cette section ne cite pas suffisamment ses sources (mars 2011). 
Pour l'améliorer, ajoutez des références vérifiables [comment faire ?] ou le modèle {{Référence nécessaire}} sur les passages nécessitant une source.
  1. La langue d'oïl est considérée, selon la vision traditionnelle de la linguistique romane, comme une seule et même langue, qui correspond principalement à un ensemble de dialectes d'oïl répartis historiquement autour de Paris (dans les faits, la langue française actuelle est très composite et doit beaucoup à une langue littéraire interrégionale). Les langues d'oïl (au pluriel) sont au contraire considérées, selon une autre vision, comme un groupe de langues et le français (au sens restreint) n'est que l'une de ces langues (venue du francien), parmi d'autres. Les langues d'oïl regroupent :
  2. Le francoprovençal (XIIIe siècle : Méditations de Marguerite d'Oingt) est répartie entre l'Italie (Vallée d'Aoste, Piémont et les petites colonies de Celle di San Vito et de Faeto en Pouilles), la SuisseFribourg et en Valais principalement), la France (Dauphinois, Lyonnais, Savoie) ; le francoprovençal regroupe différents dialectes plus ou moins proches les uns des autres, les principaux étant :
    • le savoyard (savoyâ), qui s'éloigne des autres dialectes francoprovençaux et du français par des différences de vocabulaire, de morphologie, et manifeste donc des différences d’étymologie[19] ; qui parfois sont endémiques au Savoyard ou que l'on retrouve uniquement dans le Valdôtain et Valaisan (et dialectes de Vaud) qui partagent de nombreuses similitudes (du fait d'une histoire assez similaire, voire identique) ;
    • le valdôtain (valdôtèn), qui est très similaire au savoyard, mais présente des différences notables, tel le h aspiré dans la variante de la basse vallée et les apports de l'Italien durant le XXe siècle ;
    • le valaisan, principal dialecte francoprovençal de Suisse.
  3. L'occitan ou la langue d'oc est tantôt compris dans ce groupe, tantôt inclus dans le groupe occitano-roman.

Le francoprovençal a des similitudes avec la langue d'oc et la langue d'oïl plus ou moins marquées en fonction de leur situation géographique. Cette langue est menacée d'extinction (plus ou moins en fonction des dialectes) mais reste défendue, notamment en Vallée d'Aoste et Savoie. La Vallée d'Aoste demeure cependant à ce jour la seule région de l'espace francoprovençal où cette langue est encore largement utilisée dans la vie quotidienne et comme langue maternelle.

Groupe occitano-roman

Occitan

Carte dialectale de l'occitan.

L'occitan ou langue d'oc (en occitan occitan, lenga d'òc ; IXe siècle : traces de vulgarismes occitans dans des textes latins ; fin du Xe siècle : documents juridiques ; 1102 : premier texte complet) est constitué de différents dialectes :

L'occitan, sous le nom de limousin ou de provençal à l'époque, a été la langue utilisée dans la littérature et les poésies des troubadours de toute l'Europe. Il a ensuite connu deux renaissances littéraires, l'une avec le Félibrige et Frédéric Mistral au milieu du XIXe siècle, l'autre avec l'occitanisme dans la seconde moitié du XXe siècle.

L'unité de l'occitan comme langue est discutée par des linguistes y compris occitanistes (comme Pierre Bec), notamment à propos du catalan (qui en est aujourd'hui séparé) et du gascon-béarnais, mais aussi à propos du provençal et de l'auvergnat[21].

Catalan

Carte dialectale du catalan.

Le catalan (en catalan català; fin du IXe siècle), très proche de l'occitan, est généralement rattaché au même groupe. Celui-ci, très compact[22], est, selon le linguiste Pierre Bec, intermédiaire entre le groupe gallo-roman incluant l’occitan, le français, le francoprovençal et le romanche, et le groupe ibéro-roman incluant l'aragonais, le castillan (espagnol), l'asturo-léonais, le galicien et le portugais (ensemble galaïco-portugais), mais il possède aussi des caractères propres. Certains linguistes considèrent l'occitan et le catalan comme une seule langue (autrement dit des éléments d'un même diasystème)[22], dont le catalan serait issu « par élaboration »[23].

Des traces de vulgarismes catalans ont été conservées dans des textes latins ; entre 1080 et 1095, les Homilies d'Organyà, l'un des documents littéraires les plus anciens du catalan ; fin du XIIe siècle : premier texte complet dans un document juridique ; XIIIe siècle : sous l'égide de Ramon Llull, le catalan accède au statut de langue littéraire et de pensée reconnue) : l'une des langues officielles de la Catalogne (Espagne) ; il est parlé principalement dans cette Communauté autonome et dans une frange de l'Aragon, ainsi que dans celle méridionale de Valence (où il est aussi appelé valencien), ainsi qu'aux Îles Baléares (où les variantes locales s'appellent mallorquí, menorquí ou eivissenc), en Andorre (où il est la seule langue officielle), dans le Roussillon (France), aussi connu sous le nom de Catalogne Nord (en catalan Catalunya del Nord), ainsi que dans la ville de l'Alguer (en Sardaigne). L'usage du catalan, et d'autres langues régionales, a été sévèrement contrôlé et réprimé durant plusieurs périodes, notamment sous le règne de Philippe V et le franquisme.

Groupe ibéro-roman

Carte des langues parlées en Espagne, au Portugal et dans le sud de la France.
  • Castillan
  • Portugais
  • Galicien
  • Astur-léonais
  • Basque
  • Aragonais
  • Catalan
  • Occitan
Ce groupe inclut parfois le catalan.
  • L'aragonais (aragonés) est parlé dans certaines zones de l'Aragon, sans reconnaissance officielle. L'aragonais est de plus en plus vu comme un pont entre l'occitano-roman et l'ibéro-roman puisque cette langue a une tradition littéraire très ancienne, indépendante de l'espagnol, avec quelques caractéristiques originales et d'autres partagées avec le catalan et l'occitan[24],[25]. Le même terme est utilisé pour se référer au dialecte « castillanisant » parlé aussi dans cette région. L'aragonais est parfois considéré comme intermédiaire entre l'occitano-catalan et l'ibéro-roman stricto sensu[réf. nécessaire].
  • L'asturien (asturianu en asturien, connu sous les noms d'asturo-léonais, astur-léonais ou bable), est parlé aux Asturies, ainsi que dans certaines parties des provinces de León, Zamora et Salamanque (où on l'appelle le léonais). Par le passé l'asturo-léonais était la langue d'un territoire beaucoup plus important s'étendant au sud de la péninsule Ibérique. Aux Asturies, bien que non reconnu comme langue coofficielle par le statut de la principauté, il est protégé par des textes de loi. Dans la région portugaise de Miranda do Douro, on parle le mirandais, variante de l'asturien ; le mirandais possède le statut de seconde langue officielle du Portugal depuis 1999 pour la partie du territoire où elle est parlée.
  • L'espagnol ou castillan (castellano ou español) : langue officielle en Espagne, dans vingt et un pays d'Amérique latine[26] et en Guinée équatoriale.
  • Le galaïco-portugais est la langue mère écrite du portugais et du galicien. C'est la langue littéraire de toute la côte ouest de la péninsule ibérique jusqu'au XIIe siècle et début du XIVe siècle, période au cours de laquelle le portugais s'est différencié du galicien[27]. Langue de culture pendant sept siècles, y compris en dehors de la Galice et du Portugal ; ainsi le roi de Castille Alphonse X le Sage aurait rédigé, ses Cantigas de Santa Maria dans cette langue. Langue de troubadours elle compte des poètes illustres, tel Martin Codax, Bernal de Bonaval, Arias Nunes, etc.

Groupe italo-roman

Italien (italiano ; Xe siècle : documents juridiques ; XIe siècle : texte complet) ; très nombreux dialectes (plus de deux cents). On distingue deux groupes clairement différenciés, séparés par un grand faisceau d'isoglosses, la ligne Massa-Senigallia (dite de manière moins exacte « ligne La Spezia-Rimini »), qui correspond à la coupure des langues romanes en deux grands groupes : la Romania occidentale (incluant l'italien septentrional) et la Romania orientale (incluant l'italien centro-méridional et de l'extrême-sud)[28]. Cette séparation assez nette entre Romania occidentale et orientale remet, pour certains linguistes, en cause la pertinence de ce groupement, qui ne serait plus lié qu'à l'appartenance à un même ensemble politique, récemment unifié, l'Italie.

  1. L'italien septentrional (ou plus rarement et récemment padan, terme proposé par le linguiste Geoffrey Hull depuis 1982[29],[30]), parfois nord-italien[31], groupe de dialectes parlés dans le nord mais aussi dans le sud de l'Italie :
  2. L'italien centro-méridional :
  3. L'italien de l'extrême-sud :
    • le sicilien de Sicile, ancré sur l'île aux trois pointes et divisé en une multitude de dialectes et de sous-dialectes régionaux voire communaux. Pour exemple, le parler d'Agrigente est un sous-dialecte du sicilien occidental, lui-même un dialecte du sicilien de Sicile ;
    • le calabrais centro-méridional, parlé en Calabre citérieure et lui aussi divisé en plusieurs dialectes ;
    • le salentin usité dans la région du Salento, dans le sud des Pouilles. Les dialectes apuliens à transition salentine sont parlés, quant à eux, dans les parties méridionales des provinces de Brindisi et de Tarente.

Cette dialectologie est toutefois sommaire et ne décrit pas avec précision l'extraordinaire diversité, largement conservée, des parlers italiens à proprement parler.

Sarde

La carte des langues de Sardaigne.

Le sarde (sardu, limba sarda ; XIe siècle) est parlé en Sardaigne. C'est une des langues romanes les plus conservatrices, ce qui s’explique par sa situation insulaire[34] ; il a néanmoins connu de nombreuses influences, parmi lesquelles celles du catalan, du castillan puis de l'italien sont les plus notables.

Au sein du sarde peuvent être distingués plusieurs dialectes, représentés par deux orthographes principales[35]:

  • le campidanien (région de Cagliari) ;
  • le logudorien (Logudoro), qui constitue la langue considérée classique, dont la variété du nuorais (Nuoro); ce dernière dialecte est plus archaïsant que le premier.

Une tentative de normalisation d'une langue sarde unifiée (Limba Sarda Comuna) est appuyée par la région autonome.

Selon les répertoires Ethnologue[36] et Glottolog[37], le corse, dans une forme ancienne et hypothétique, et le sarde auraient formé une branche distincte, appelée « langues romanes méridionales » ou « langues romanes insulaires » ; selon d'autres linguistes, comme Heinrich Lausberg ou Yuri Koryakov, le sarde tel qu’il est parlé au centre et au sud de l’île, est désormais la seule langue vivante de ce groupe, comme il n’existe plus de vieux corse (Old Corsican), entièrement remplacé par la toscanisation, ni de langue romane d'Afrique du Nord, qui sont tous deux éteints.

Groupe rhéto-roman

Ce groupe comprend :

  • le romanche (rumantsch) : le sursilvan (haute vallée du Rhin), le sutsilvan et le surmiran (centre du canton des Grisons), le puter et le vallader (Engadine) forment les cinq dialectes écrits ; ils sont parlés en Suisse (dans les Grisons) par environ 45 000 personnes. Le premier texte en puter a été écrit en 1527 à Zuoz (La chanzun da la guerra dal chasté da Müsch), le premier en vallader en 1560 à Susch. Le rumantsch grischun est la variété standard du romanche utilisée en Suisse pour unifier les cinq groupes dialectaux ; il s'appuie en grande partie sur le sursilvan, le vallader et le surmiran ; c'est une des 4 langues nationales de Suisse et une langue officielle dans le canton des Grisons ;
  • le ladin dolomitique (ladin) : utilisé dans les Dolomites italiennes (dans la Région Autonome du Trentin-Haut-Adige et en Vénétie, province de Belluno, vers Cortina d'Ampezzo et dans le Cadore, ainsi que dans un îlot linguistique très minoritaire à Erto e Casso, dans les Dolomites frioulanes, province de Pordenone, en Région Autonome du Frioul-Vénétie Julienne) ;
  • le frioulan (furlan, ou marilenghe) : parlé dans les 3 provinces italiennes d'Udine, de Pordenone et de Gorizia, et très minoritairement dans celle de Trieste, dans la Région Autonome du Frioul-Vénétie Julienne, et aussi à Sappada et à Portogruaro, en Vénétie. Deuxième langue minoritaire en Italie, il serait parlé par un million de personnes dans le monde, à la suite de la forte émigration dans d'autres régions d'Italie et à l'étranger aux XIXe et XXe siècles.

Frioulan et ladin n'ont qu'un statut de langue régionale, mais sont reconnus par la Constitution italienne. Certains linguistes, minoritaires, y rattachent l'istriote. Toutes ces langues, morcelées en de multiples dialectes, sont en régression constante.

Groupe thraco-roman

Ce groupe également appelé diasystème roman de l'Est ou ensemble roman oriental comprend quatre langues vivantes et trois éteintes :

  • le daco-roumain ou daco-roman, nommé officiellement roumain en Roumanie (română, limba română) et au choix moldave ou roumain en Moldavie (limba moldovenească selon l'article 13 de la Constitution adoptée en 1992, limba română selon l'arrêt no  36 du de la Cour constitutionnelle) ; partiellement attesté au XIIe siècle, complètement attesté au XVe siècle, le roumain est la langue des anciennes provinces romaines de Dacie, Mésie et Dacie aurélienne, coupées du reste de la Romania ; en tant que langue romane, le roumain s'avère assez conservateur mais le superstrat slave y est important et c'est en cela qu'il est relativement différent des autres langues romanes, et dissymétrique par rapport à elles (il est beaucoup plus facile à un roumanophone de comprendre l'italien ou le français, que l'inverse). Il est langue coofficielle en Voïvodine serbe, mais est également parlé en Serbie (Portes de Fer et vallée du Timoc). Des minorités roumanophones vivent également en Ukraine, et une importante diaspora vit depuis les années 2000-2005 en Espagne et en Italie ;
  • l'aroumain ou aroman, appelé macédo-roumain en Roumanie, parlé principalement en Grèce septentrionale, en Albanie, en Serbie, en Macédoine et en Roumanie ;
  • le mégléno-roumain, mégléno-roman ou mégléniote, jadis parlé en Macédoine et aujourd'hui par la diaspora en Roumanie ou en Turquie ;
  • l'istro-roumain, istro-roman ou istrien, encore parlé par quelques dizaines ou peut-être centaines de locuteurs en Istrie orientale (Croatie), à ne pas confondre avec l'istriote, une langue italo-romane encore parlée dans l'ouest et le sud de l'Istrie.

Ces quatre langues vivantes sont issues de l'évolution de trois langues éteintes :

En aroumain et en méglénite, le superstrat slave est moins fort qu'en roumain et istrien, alors que l'influence du grec et de l'albanais est prépondérante.

Certains linguistes incluent également dans ce groupe le dalmate.

Ce groupe éteint au XIXe siècle également appelé illyro-roman est parfois inclus dans le diasystème roman de l'Est avec les langues romanes orientales. Il présente des caractères intermédiaires entre le groupe rhéto-roman et le groupe roman oriental.

Connu au Moyen Âge (fin XIIIe siècle) sous les noms de mavro-valaque ou morlaque, attesté directement vers 1840, le dalmate est éteint. Parlé autrefois dans les îles et les régions côtières de Croatie et du Monténégro, il comprenait deux dialectes recensés : le végliote (veklisuṅ, au nord, dans l'île de Krk ou Veglia, dont le dernier locuteur s'est éteint en 1898) et le ragusain (au sud, dans l'actuelle Dubrovnik, éteint dès le XVe siècle).

Classification cladistique

Une classification différente basée sur le vocabulaire permet une comparaison systématique (Projet ASJP). On mesure la similarité lexicale telle que la distance de Levenshtein pour une liste de mots apparentés. Dans ce cas les langues regroupées sous l'appellation gallo-romane par Ethnologue.com[38] apparaissent dans des branches différentes de l'arbre cladistique des langues romanes[39] :





créoles à base romane



français





francoprovençal





divers créoles à base romane







aragonais



galicien





judéo-espagnol



espagnol





divers créoles à base romane






romanche (sursilvan)





divers créoles à base romane



portugais







catalan



frioulan







italien



sicilien





roumain



aroumain










Ce qui précède indique que d'un point de vue lexical, français et franco-provençal, constituent l'une des branches les plus dissemblables des langues romanes. Cela est dû à la forte incidence de la phonologie et du lexique en contact avec les langues germaniques au cours du Bas-Empire romain et le début du Moyen Âge.

Peut-être encore plus étonnant en comparaison avec les classifications conventionnelles (historiquement fortement basées sur la géographie, voire influencées la division politique, au-delà des traits proprement linguistiques), l'occitan et le catalan, sont plus à rapprocher du point de vue du lexique de l'italien et du roumain que des langues ibériques (espagnol, galicien, aragonais).

Du latin classique au latin vulgaire

Quelques modifications phonétiques propres au latin vulgaire

Note : les transcriptions phonétiques sont en alphabet phonétique international.

À propos du latin vulgaire, il convient de noter que les Romains, comme les Grecs, vivaient en situation de diglossie : la langue de tous les jours n'était pas le latin classique (celui des textes littéraires ou sermo urbanus, « langue de la ville », c'est-à-dire une langue figée par la grammaire comme l'a été le sanskrit), mais une forme distincte bien que très proche, au développement plus libre (le sermo plebeius, « langue vulgaire »). Il semble acquis que le latin classique ne se limitait pas à un emploi livresque, mais qu'il était couramment parlé par les catégories sociales élevées, bien que ces dernières aient trouvé plus raffiné encore de s'exprimer en grec (et il semble que César n'ait pas dit à Brutus Tu quoque, fili mais Kaì sù, téknon), tandis que le sermo plebeius était la langue des soldats, des commerçants, du petit peuple ; n'ayant jamais accédé au statut de langue littéraire, le latin vulgaire nous est surtout connu par la linguistique historique, des citations et des critiques prononcées par les tenants d'un latin littéraire ainsi que de nombreuses inscriptions, des registres, comptes et autres textes courants. D'autre part, le Satyricon de Pétrone, sorte de « roman » écrit vraisemblablement au Ier siècle et se passant dans les milieux interlopes de la société romaine, est un témoignage important de cette diglossie : selon leur catégorie sociale, les personnages s'y expriment dans une langue plus ou moins proche de l'archétype classique.

Parmi les textes qui ont blâmé les formes jugées décadentes et fautives, il faut retenir l’Appendix Probi[40], sorte de compilation d'« erreurs » fréquentes relevées par un certain Probus et datant du IIIe siècle.

Ce sont bien ces formes, et non leur équivalent en latin classique, qui sont à l'origine des mots utilisés dans les langues romanes. Voici quelques exemples de « fautes » citées par Probus (selon le modèle A non B, « [dites] A et non B »), classées ici par type d'évolution phonétique et assorties de commentaires permettant de signaler les principales différences phonologiques entre le latin classique et le latin vulgaire ; il n'est bien sûr pas possible d'être exhaustif en la matière et de référencer toutes les différences entre le latin classique et le latin vulgaire, mais l’Appendix Probi peut constituer une introduction pertinente sur le sujet.

Calida non calda

Calida non calda, masculus non masclus, tabula non tabla, oculus non oclus, etc. : ces exemples montrent l'amuïssement des voyelles post-toniques (et aussi prétoniques) brèves ; les mots latins sont en effet accentués cálida, másculus, tábula et óculus, la voyelle suivante étant brève. Cet amuïssement prouve aussi que l'accent de hauteur du latin classique est devenu un accent d'intensité en latin vulgaire (en effet, un accent de hauteur n'a pas d'influence sur les voyelles atones environnantes). L'on reconnaît dans cette liste les ancêtres de chaude (ancien français chalt), mâle (ancien français masle), table et œil ; ce processus a donné naissance à des transformations importantes des consonnes entrées en contact après la chute de la voyelle les séparant : ainsi, un /l/ devant consonne est passé à l vélaire (soit /ɫ/) puis à /u/ en français (vocalisation), d'où chaud ; de même, /kl/ a pu donner un l palatalisé (voir au paragraphe suivant).

Vinea non vinia

Vinea non vinia, solea non solia, lancea non lancia, etc. : l'on voit là le passage en latin vulgaire de /e/ bref devant voyelle à /j/ (son initial de yacht ; le phénomène est nommé consonification) qui, après consonne, la palatalise ; ces consonnes palatalisées (qui peuvent provenir d'autres sources), sont importantes dans l'évolution des langues romanes. Cette transformation explique pourquoi l'on obtient, par exemple, vigne (avec /nj/ devenant /ɲ/, noté dans les langues romanes par le digramme gn en français et italien, ñ en espagnol, ny en catalan, nh en portugais et occitan, etc.), seuil (avec anciennement un l palatal, soit /ʎ/, noté par ill/il en français, devenu ensuite un simple /j/, conservé en italien, où il est noté gli et toujours prononcé comme une double consonne, en espagnol, où il est noté ll, « double l » [sauf quand il provient de /lj/, où il passe à /x/, phonème dit jota], comme en catalan, en portugais et occitan, écrit lh, etc.), et lance (avec le son /s/ issu de /t͡s/, forme palatalisée de /k/, que notait bien la lettre c latine ; de même en italien lancia /lantʃa/, espagnol lanza /lanθa/, anciennement lança /lantsa/, ou en roumain lance /lantʃe/, etc.).

Auris non oricla

Probus note dans cet exemple plusieurs phénomènes : premièrement la réduction des anciennes diphtongues (ici /au/ devenant /ɔ/, soit o ouvert ; l'on a aussi en latin vulgaire /ae/ donnant /ɛ/, e ouvert, ainsi que /oe/ passant à /e/, e fermé), puis l'utilisation d'une forme de diminutif au lieu de la forme simple (auris « oreille », auricula « petite oreille »). L'utilisation des diminutifs en latin vulgaire est fréquente : ainsi soleil provient de soliculum et non de sol, ou encore genou, primitivement anc. fr. genoil, de genuculum et non de genu. Enfin, on note l'amuïssement du /u/ bref après une voyelle accentuée : on attendrait oricula. Comme on l'a dit au premier paragraphe, la rencontre de c et l, /kl/, causée par la chute de la voyelle les séparant, donne naissance à une nouvelle consonne, ici un l palatal, conservé en catalan dans orella, devenu /j/ en français mais /x/ en espagnol, dans oreja /ɔrexa/).

Auctor non autor

On remarque aussi des réductions de groupes de consonnes ; ainsi, /kt/ passe à /t/, donnant en français auteur, ou autor en espagnol, portugais et catalan ; de même, /pt/ passe à /t/. C'est le cas dans dom(i)tare devenu domtar puis domptar et enfin dontar. L'insertion d'un /p/ entre /m/ et une occlusive est normale : on parle d'une épenthèse, donnant en français dompter que l'on prononçait /dõte/ avant que l'orthographe n'influence la prononciation, devenant parfois /dõpte/. Autre simplification : /pt/ donne /t/, comme dans comp(u)tare devenu comptare puis compter et conter /kõte/ en français, contar en espagnol, etc.

Rivus non rius

Rivus non rius, sibilus non sifilus : le son /w/ du latin, noté par la lettre u (ou v dans les éditions modernes) a évolué de manières diverses, soit en s'amuïssant entre voyelles (ri(v)us donnant rio en espagnol, pa(v)or donnant peur, italien paura), en devenant une spirante bilabiale sonore (/β̞/, en espagnol et catalan) puis se renforçant en /v/ (dans la majorité des langues romanes) ; /p/ et /b/ entre voyelles connaissent le même sort, ce qui explique que sibilus donne sifilus, sachant que /f/ n'est que la variante sourde de /v/ ; ainsi explique-t-on siffler (de sibilare, devenant sifilare puis siflare) ou savoir (de sapere, puis sabere, savere ; le espagnol saber montre, par son orthographe, qu'il en est resté au stade /β̞/), etc.

Pridem non pride

Dernier exemple, montrant que le /m/ en fin de mots n'est plus prononcé (ce qui est déjà le cas en latin classique : la scansion du vers latin le prouve facilement). Cet amuïssement est, entre autres, à l'origine de la disparition du mécanisme des flexions : les langues romanes, en effet, n'utilisent plus la déclinaison.

Cette liste n'est bien sûr pas exhaustive ; il faudrait aussi aborder la question de la diphtongaison « panromane » (que toutes les langues romanes ont connue) et signaler que nombre de voyelles ont subi par la suite des diphtongaisons secondaires.

Transformations en profondeur du système morpho-syntaxique

Système nominal

La chute du /m/ final, consonne que l'on rencontre souvent dans la flexion, crée donc une ambiguïté : Romam se prononçant comme Roma, l'on ne peut savoir si le mot est au nominatif, à l'accusatif ou à l'ablatif. Ainsi, les langues romanes ont dû utiliser des prépositions pour lever l'ambiguïté. Plutôt que dire Roma sum (classique Romæ sum avec un locatif que n'a pas gardé le latin vulgaire) pour « je suis à Rome » ou Roma(m) eo pour je vais à Rome, il a fallu exprimer ces deux phrases par sum in Roma et eo ad Roma. À cet égard, il convient de rappeler que si en latin classique déjà, dès l'époque impériale, le /m/ en fin de mots s'amuïssait, Roma sum et Roma(m) eo ne pouvaient être confondus : à l'ablatif (Roma sum), le /a/ final est long ; il est cependant bref à l'accusatif : ainsi l'on prononçait /rōmā/ pour le premier, /rōmă/ pour le second. Le latin vulgaire, toutefois, n'utilise plus le système de quantité vocalique : les deux formes sont d'autant plus ambiguës.

Dans un même mouvement, les adverbes et les prépositions simples sont parfois renforcées : ante, « avant », ne suffit plus ; il faut remonter à ab + ante en vulgaire pour expliquer le français avant, le portugais et espagnol antes et l'occitan avans, ou bien in ante pour le roumain înainte, etc. ; de même avec provient de apud + hoc, dans de de intus, etc. Le cas limite semble être atteint avec le français aujourd'hui, notion qui se disait simplement hodie en latin classique. Le terme français s'analyse en en + le + jour + de + hui, où hui vient de hodie (qui a donné hoy en espagnol, "hoje" en portugais, oggi en italien, azi en roumain, uèi en occitan, avui en catalan, hoz en romanche, oûy en wallon, etc.). Le composé agglutiné résultant est donc redondant, puisqu'il signifie mot à mot : « au jour d'aujourd'hui » (qu'on trouve en français familier). Certaines langues conservatrices ont cependant gardé des adverbes et prépositions simples : le espagnol et l'italien con, le portugais com et le roumain cu viennent bien de cum « avec », de même que en espagnol ou în roumain sont hérités de in. L'on constate le même phénomène avec les mots simples hérités de hodie.

De langue flexionnelle à la syntaxe souple (l'ordre des mots comptant moins pour le sens que pour le style et la mise en relief), le latin vulgaire est devenu un ensemble de langues utilisant nombre de prépositions, dans lesquelles l'ordre des mots est fixe. S'il est théoriquement possible de dire en latin Petrus Paulum amat, amat Petrus Paulum, Paulum Petrus amat ou encore amat Paulum Petrus pour signifier que « Pierre aime Paul », ce n'est plus possible dans les langues romanes, qui ont plus ou moins rapidement abandonné les déclinaisons ; ainsi, en espagnol Pedro ama a Pablo et Pablo ama a Pedro ont un sens opposé, seul l'ordre des mots indiquant qui est sujet et qui est objet. Lorsque les langues romanes ont gardé un système de déclinaisons, celui-ci est simplifié et se limite à quelques cas (à l'exception du roumain) : c'est ce qui arrive en ancien français, qui n'en possède que deux, le cas sujet (hérité du nominatif) et le cas régime (venant de l'accusatif), pour tout ce qui n'est pas sujet. En français, toujours, le cas sujet a disparu ; les noms actuels hérités de l'ancien français sont donc presque tous d'anciens cas régime (il y a quelques exceptions, comme ancêtre, peintre, traître, anciens cas sujets, et chandeleur, provenant d'un génitif pluriel latin candelorum) et, partant, d'anciens accusatifs ; on peut le constater avec un exemple simple :

Latin classique
Singulier Pluriel
Nominatif murus muri
Accusatif murum muros
Ancien français
Singulier Pluriel
Cas sujet murs mur
Cas régime mur murs
Français
Singulier Pluriel
mur murs

Le roumain, toutefois, conserve un système flexionnel fonctionnant avec trois cas syncrétiques : cas direct (nominatif + accusatif), cas oblique (génitif + datif) et vocatif. Ces cas se distinguent principalement si le nom est marqué par l'article défini. Dans le cas contraire, ils ont tendance à être confondus.

D'autres points méritent d'être signalés. Tout d'abord, à l'exclusion du roumain, les trois genres, masculin, féminin et neutre, sont réduits à deux par l'élimination du neutre possiblement sous l'effet d'un substrat non indo-européen. Ainsi le mot latin folia, nominatif/accusatif neutre pluriel de folium « feuille », est réinterprété comme un féminin : c'est le cas, par exemple, en français, où il devient feuille, mais aussi en espagnol (hoja), en italien (foglia), en romanche (föglia), en wallon (fouye), en portugais (folha), en catalan (fulla), en occitan (fuèlha), etc., tous mots féminins. De plus les langues romanes ont développé un système d'articles définis inconnu du latin classique, peut-être également sous l'influence d'un substrat résiduel. Ainsi, en français, le et la proviennent respectivement des pronoms/adjectifs démonstratifs ille et illa ; l'évolution est la même en espagnol pour el et la (plus un neutre lo < illud), en italien pour il et la (ainsi que lo, neutre, < illud), etc. Le roumain se distingue en étant la seule langue romane dans laquelle l'article est enclitique : om « un homme », om-ul « l'homme », ce qui s'explique par le fait qu'en latin, l'adjectif démonstratif pouvait précéder ou suivre le substantif (ille homo/homo ille). Les articles indéfinis, pour leur part, proviennent simplement du numéral unus, una (et unum au neutre). Enfin le système de l'adjectif est modifié. Alors que les degrés de l'adjectif étaient marqués par des suffixes, les langues romanes ne se servent plus que d'un adverbe devant l'adjectif simple. Cet adverbe continue soit magis (devenu más en espagnol, mai en occitan et en roumain, mais en portugais, més en catalan, etc.), soit plus (più en italien, plus en français et en occitan, pus en wallon et en catalan ancien ou dialectal, plu en romanche, etc.). Par exemple, plus clair (comparatif de supériorité) se disait en latin classique clarior (dérivé de clarus). En revanche l'espagnol emploie más claro, l'italien più chiaro, l'occitan plus clar ou mai clar, etc. De même le superlatif le plus clair se disait clarissimus en latin classique, mais el más claro en espagnol et il più chiaro en italien. On trouve cependant quelques archaïsmes : le portugais a conservé des mots différents pour le plus grand, o maior, et le plus petit, o menor, comme le castillan avec mayor et menor, comparables, bien que d'emploi très différent, aux majeur et mineur du français.

Système verbal

En outre, les conjugaisons sont profondément modifiées, notamment par la création de temps composés : ainsi notre j'ai chanté, espagnol he cantado, italien ho cantato ou encore catalan he cantat, occitan ai cantat, roumain am cântat, viennent d'un habeo cantatu(m) vulgaire, qui n'existe pas en latin classique. L'utilisation de verbes auxiliaires, être et avoir, est notable : le latin utilisait déjà, d'une manière différente, être dans sa conjugaison, mais pas d'une manière aussi systématique que dans les langues romanes, qui ont généralisé leur emploi afin de créer un jeu complet de formes composées répondant aux formes simples. Généralement, les formes composées marquent l'aspect accompli.

Un mode nouveau apparaît, le conditionnel (attesté pour la première fois dans une langue romane dans la Séquence de sainte Eulalie), construit à partir de l'infinitif (parfois modifié) suivi des désinences d'imparfait : vivr(e) + -ais donne vivrais en français, et, mutatis mutandis , viviría en espagnol, viuria en catalan, viuriá en occitan. Certaines modifications du radical sont à noter : devoir + ais > devrais et non *devoirais, ou bien haber + ía > habría et non *habería. De la même manière, le futur classique est abandonné au profit d'une formation comparable à celle du conditionnel, c'est-à-dire l'infinitif suivi du verbe avoir (ou précédé en sarde) : ainsi cantare habeo j'ai à chanter ») donne chanterai, italien canterò, espagnol cantaré, catalan cantaré, occitan cantarai, etc.

Le passif est évacué au profit du système composé qui préexistait en latin (cantatur, « il est chanté », classique devient le vulgaire est cantatus, qui, en classique signifiait « il a été chanté »). Enfin, certaines conjugaisons irrégulières (comme celle de velle, « vouloir ») sont rectifiées (mais restent souvent irrégulières dans les langues romanes) et les verbes déponents cessent d'être utilisés.

Le lexique du latin vulgaire

Le latin vulgaire et le latin classique ne diffèrent pas seulement par des aspects phonologiques et phonétiques, mais aussi par le lexique ; les langues romanes, en effet, n'utilisent que dans des proportions variables le vocabulaire classique. Souvent, des termes populaires ont été retenus, évinçant ceux propres à la langue plus soutenue.

Certains termes latins ont disparu et ont été remplacés par leur équivalent populaire ; c'est le cas de celui qui désigne le cheval, equus en latin classique, mais caballus canasson » ; le mot est peut-être d'origine gauloise) en latin vulgaire, que l'on retrouve dans toutes les langues romanes : caballo en castillan, cavall en catalan, caval en occitan, cheval en français, cal en roumain, cavallo en italien, dj'vå en wallon, chavagl en romanche, etc. Mais la jument est appelée iapa en roumain, yegua en castillan, égua en portugais, egua en catalan, et èga en occitan, du latin equa (l'italien emploie aussi giumenta ou cavalla).

D'autre part, certains termes classiques disparus n'ont pas forcément été remplacés par le même mot vulgaire dans toute la Romania : le terme soutenu pour « parler » est loqui en latin classique, gardé en roumain (a locui mais avec le sens d'habiter), remplacé par :

  • parabolare (terme emprunté à la liturgie chrétienne et d'origine grecque ; proprement : « parler par parabole ») : français parler, italien parlare, catalan et occitan parlar, etc. ;
  • fabulare (proprement : « affabuler ») : castillan hablar, portugais falar, sarde faeddare, etc.
  • verba (verbe, parole): roumain a vorbi

Enfin, certaines langues romanes continuent d'utiliser la forme classique, tandis que d'autres, que l'on dit moins « conservatrices », se servent d'une forme vulgaire ; l'exemple donné traditionnellement est celui du verbe « manger » :

  • latin classique edere : se retrouve (sous la forme préverbée comedere, qui est cependant sentie moins « noble » que le classique puriste edere) dans le castillan et le portugais comer ;
  • latin vulgaire manducare (proprement « mâcher ») : français manger, italien mangiare, catalan menjar, occitan manjar, ou encore roumain mânca, par exemple.

Raisons de la diversité des langues romanes

Géographie des langues romanes en Europe.

L'évolution phonétique naturelle des langues, à laquelle le latin n'a pas échappé, explique en grande partie les différences importantes entre certaines des langues romanes. À ce processus s'est aussi ajouté la non-unicité lexicale de ce que l'on désigne sous le terme de latin vulgaire : la taille de l'Empire romain et l'absence d'une norme littéraire et grammaticale ont permis à cette langue vernaculaire de ne pas être figée. Ainsi, chaque zone de la Romania a utilisé une saveur particulière du latin vulgaire (il vaudrait même mieux dire « des latins vulgaires »), comme on l'a vu plus haut, telle langue préférant tel terme pour signifier « maison » (latin casa en espagnol, catalan, italien, portugais, roumain), telle autre un terme différent (mansio pour le même sens en français), par exemple.

S'est greffée à ces deux données la présence de substrats, langues parlées initialement dans une zone et recouvertes par une autre, ne laissant que des traces éparses, tant lexicales ou grammaticales que phonologiques, dans la langue d'arrivée. Ainsi, le substrat gaulois en français lui laisse quelque cent quatre-vingts mots comme braies, char ou bec, et serait à l'origine du passage du /u/ (de loup) latin à /y/ (de lune). Cette hypothèse ne fait cependant pas l'unanimité. Bien entendu, l'influence du gaulois ne s'est pas limitée à la langue française : les dialectes de l'Italie du Nord, par exemple, en possèdent quelques termes, et on a ainsi en italien standard braghe pour braies (qui a donné plus tard les mots français braguette et bretelle), carro pour char, ou becco pour bec. De même le basque pour les langues ibérico-romanes (où le mot pour « gauche », soit sinistra en latin classique, est remplacé par des dérivés du basque ezker, soient esquerra en catalan, izquierda en espagnol et esquerda en portugais)[41] et en particulier l'espagnol.

Enfin, les superstrats ont aussi joué un rôle prépondérant dans la différenciation des langues romanes : ce sont les langues de peuples s'étant installés dans un territoire sans réussir à imposer leur langue. Cette dernière a cependant laissé des traces importantes. Le superstrat francique (donc germanique) en France est important ; le vocabulaire médiéval en est émaillé, surtout dans le domaine de la guerre et de la vie rurale (ainsi heaume, adouber, flèche, hache, etc., mais aussi framboise, blé, saule, etc., ou encore garder, guerre et, plus surprenant, trop), et le français actuel compte plusieurs centaines de mots ainsi hérités du francique. C'est un superstrat arabe que l'on remarque le plus en espagnol et en portugais : plus de quatre mille termes, parmi lesquels des toponymes et des composés, viennent de cette langue. Le trait le plus remarquable est le maintien quasi systématique de l'article arabe dans le mot, alors que les autres langues romanes ayant aussi emprunté le même terme s'en sont souvent débarrassées : ainsi les gloses espagnoles algodón (contre le français coton), de l'arabe أَلْقُطْن, ʾal-quṭn, algarroba (français caroube), de ʾal-harūbah ou encore aduana (français douane), de أَلدِّيوَان, ʾad-dīwān (qui donne aussi divan). Enfin, dernier superstrat remarquable, le slave, dont l'influence en roumain est notable. Le roumain devrait aux langues slaves alentour son vocatif, 20 % de termes du lexique ainsi que des processus de palatalisation différents de ceux des autres langues romanes.

L'influence des langues romanes les unes sur les autres est par ailleurs considérable. À tel point qu'un courant du mouvement interlingua, dit « latin moderne », préconise d'utiliser dès à présent cette langue comprise sans étude (cinquante mots à apprendre sur un vocabulaire basique de cinq mille termes) par tous les locuteurs romans (qui sont environ neuf cents millions dans le monde), après remplacement des mots antiques sans postérité gardés par l'interlingua, modernisation de ses formes lexicales et phonétisation de son orthographe.

On peut donner ici les résultats d'une étude menée par Mario Pei en 1949, qui a comparé le degré d'évolution de diverses langues par rapport à leur langue-mère ; pour les langues romanes les plus importantes, si l'on ne considère que les voyelles toniques, l'on obtient, par rapport au latin, les coefficients d'évolution suivants :

On voit ainsi facilement le degré variable de conservatisme des langues romanes, la plus proche du latin phonétiquement (si l'on ne considère que les voyelles toniques) étant le sarde, la plus éloignée le français.

Comparaison lexicale

LatinSardeCorseItalienEspagnolPortugaisFrançaisOccitanCatalanRomancheLombardRoumain
acquam àcua/abba acqua acqua agua agua eau aiga aigua aua aqua/egua/eua apă
acutus agúdu acutu acuto agudo agudo aigu agut agut aguz aguzz acut
adiutare agiudare aiutà aiutare ayudar ajudar aider ajudar ajudar agidar judà ajuta
apis/apicula àbe ape ape abeja abelha abeille abelha abella avieul ava albina
sapone sabone sapone sapone jabón sabão savon sabon sabó savun savon săpun
carricare carrigare carricà caricare cargar carregar charger cargar/chargar carregar chargar carregà încărca
caballum c(u)addu cavallu cavallo caballo cavalo cheval caval/chaval cavall cheval cavâl calu
cantare cantare cantà cantare cantar cantar chanter cantar/chantar cantar chantar cantà a cantâ
clave crae/crave chjave chiave llave / clave chave clef / clé clau clau clav ciav cheie
ferrum ferru ferru ferro hierro ferro fer fer ferro fier fèr fier
ventum bentu ventu vento viento vento vent vent vent vent vent vânt
rota roda rota ruota rueda roda roue roda roda roda rœda roată
aurum oru oru oro oro ouro or aur or aur òr aur
pax pache pacz pace paz paz paix patz pau pasc paas pace
sol sole sole sole sol sol soleil sol sol solegl sol soare
noctem note/noti notte notte noche noite nuit nuéit / nuèch nit notg nott noapte
pontis ponte/ponti ponte ponte puente ponte pont pònt pont pont punt punte
nōvum no(b)u novu nuovo nuevo novo nouveau nòu nou nov noeuv nou
hospitalis ispidale ospidale ospedale hospital hospital hôpital espitau hospital hospital ospedaa spital
ego ego eiu io yo eu je jo/ieu jo jau mi/me eu
filium fillu/fizu figliolu figlio hijo filho fils filh fill figl fioeu fiu
facere fàchere fare hacer fazer faire far / faire fer far face
lingua lìngua/limba lingua lingua lengua lingua langue lenga llengua lingua lengua limbă
terram terra terra terra tierra terra terre terra terra terra terra ţara
pluviam pròida piuvita pioggia lluvia chuva pluie pluéja / pluèia pluja plievgia pieuva plioaie
ārbore àrbure arburu albero árbol árvore arbre arbre / aubre arbre arbre alber arbore/pom
hominem/hōmo òmine omu uomo hombre homem homme òme home um ómm om
iucare giugare ghjucà giocare jugar jogar jouer jugar jugar giugar giugà juca
oculus ogru occhiu occhio ojo olho œil uelh ull ögl œugg ochi
flama fiama fiamma fiamma llama chama flamme flamba flama flama fiama flamă
cælum chelu celu cielo cielo céu ciel cèl / ciel cel chiel cel cer
digitus didu ditu dito dedo dedo doigt det dit digt did deget
manum manu manu mano mano mão main man maun man mână

Degré de similitude du lexique entre les langues romanes

  • Selon Ethnologue[42].
% Français Catalan Italien Portugais Romanche Roumain Espagnol Sarde
Français85897578757580
Catalan85878576738575
Italien89878078778285
Portugais75858074728976
Romanche78767874727474
Roumain75737772727174
Espagnol75858289747176
Sarde80758576747476

Diffusion mondiale des langues romanes

Diffusion mondiale des langues romanes
français espagnol italien portugais roumain catalan
Nombre de locuteurs de chaque langue romane en tant que pourcentage du total.

Du fait de la colonisation, l'aire géographique des locuteurs de langues romanes s'étend largement au-delà de l'Europe. Les plus largement diffusées sont l'espagnol (Mexique, Amérique centrale et Amérique du Sud, Philippines, etc.), le portugais (Brésil, Angola, Mozambique, etc.) et le français (Canada, Afrique, etc.).

L'espagnol et le français figurent parmi les langues officielles de l'ONU.

Les langues romanes parlées par plus de 10 millions de personnes sont l'espagnol, le français, le portugais, l'italien, et le roumain (98 % des locuteurs).

Il est à noter que l'étendue géographique de l'espagnol, le français et le portugais sont en grande partie le résultat du passé colonial. Dans la plupart des anciennes colonies, le français est la seconde langue, au contraire de l'espagnol et du portugais. Il en résulte que le français est la seconde langue romane en nombre de locuteurs, mais la troisième, derrière le portugais, en locuteurs qui l'ont pour première langue.

Le catalan est un cas particulier, puisqu'il n'est pas la langue principale d'un État-nation (il l'est seulement en Andorre), mais il a tout de même été capable de soutenir la concurrence de l'espagnol, et même de gagner des locuteurs, bien que celui-ci soit non seulement la langue de l'État mais aussi l'une des plus importantes du monde. En fait, le catalan est la seule langue minoritaire d'Europe dont la survie à long terme n'est probablement[43] pas en danger. Au contraire de la plupart des langues minoritaires, le catalan n'est pas resté lié à la culture traditionnelle rurale. En effet, la société catalane a été, depuis le Moyen Âge et jusqu'à nos jours, plus dynamique et orientée vers l'Europe et la modernité que celle de Castille, et donc que celle de l'État dominant. D'autre part, une culture de haut niveau, bien qu'ayant abandonné généralement le catalan au XVIIe siècle, ne s'est pas interrompue et a pu reprendre la langue du pays vers la fin du XIXe siècle. En plus, elle a été toujours doublée d'une culture populaire (musique, théâtre, vaudeville, littérature de consommation ou pratique, presse) vivante, qui a suivi l'évolution des temps et s'est toujours produite en catalan. En conséquence, une conscience « nationale » a survécu à l'union des royaumes, accompagnée du sentiment que la langue est une partie fondamentale de l'identité des catalans[44],[43]. Cela a permis au catalan de résister d'une part aux périodes de répression et aux importants flux immigratoires qui ont eu lieu tout au long de l'histoire, et d'autre part aux processus assimilationnistes qui sont en voie de faire disparaître la plupart des langues minoritaires, même lorsqu'elles ont un fort soutien gouvernemental (par exemple l'irlandais).

Le reste des langues romanes, avec moins de locuteurs, subsistent principalement pour les rapports informels. Historiquement, les gouvernements ont perçu (voire perçoivent encore) la diversité linguistique comme un obstacle au niveau économique, administratif ou militaire, de même qu'une source potentielle de mouvements séparatistes; ils se sont donc généralement efforcés de les combattre, moyennant la promotion de la langue officielle, des restrictions quant à leur utilisation au sein des médias, leur caractérisation comme dialectes ou patois (mots devenus péjoratifs), ou même la persécution. En fait, il s'agit plus proprement de langues minorisées que de langues minoritaires. En conséquence, toutes ces langues sont considérées par l'Atlas UNESCO des langues en danger[45] comme menacées à divers degrés allant de « vulnérable » (par exemple le sicilien ou le basque) à « sérieusement en danger » (p.ex. toutes celles parlées en France sauf le basque et le catalan).

Dès la fin du XXe siècle, une plus grande sensibilité aux droits des minorités a permis à ces langues d'amorcer une lente récupération de leur prestige et de leurs droits perdus. Cependant, il n'est pas clair que ces processus politiques soient capables d'inverser le déclin des langues romanes minorisées.

Rang Langue Parlée (Langue maternelle) dans Nombre de locuteurs selon ethnologue.com (2009[réf. obsolète]) Gentilé
1 Espagnol Andorre, Argentine, Belize, Bolivie, Chili, Colombie, Costa Rica, Cuba, Équateur, Espagne, États-Unis (Nouveau-Mexique), Guinée équatoriale, Guatemala, Honduras, Mexique, Nicaragua, Panama, Paraguay, Pérou, Porto Rico, République dominicaine, Salvador, Uruguay, Venezuela 480 millions[46] Hispanophone
2 Français Belgique, Bénin, Burundi, Burkina Faso, Canada, Cameroun, Congo, Côte d'Ivoire, Djibouti, Dominique, États-Unis (en Louisiane et en Nouvelle-Angleterre), France, Gabon, Guinée, Haïti, Italie (en Vallée d'Aoste), Luxembourg, Madagascar, Île Maurice, Monaco, République démocratique du Congo, République centrafricaine, Sénégal, Seychelles, Suisse, Tchad, Togo, Vanuatu. 300 millions (langue première et seconde)[47] Francophone
3 Portugais Portugal, Brésil, Angola, Mozambique, Guinée-Bissau, Guinée équatoriale, Cap-Vert, Sao Tomé-et-Principe, Timor oriental. 234 millions[48] Lusophone
4 Italien ArgentineBuenos Aires), BrésilSanta Teresa et Vila Velha), Italie, France (département des Alpes-Maritimes et Corse), Saint-Marin, Suisse (notamment Tessin et partie des Grisons), Vatican, Érythrée, Éthiopie, Libye, Slovénie (dans les villes de Koper, Izola et Piran), Croatie (dans le Comitat d'Istrie et en Dalmatie), Malte, Monténégro (sur la côte), TunisieTunis, Sousse, Hammamet et autres agglomérations côtières) 61,7 millions Italophone
5 Roumain Roumanie, République de Moldavie, Ukraine, Hongrie, Serbie, Bulgarie 26 millions Roumanophone
6 Catalan Andorre, Espagne, France, Italie 11,5 millions Catalanophone
7 Créole haïtien Haïti 7,4 millions
8 Napolitain Italie 5 700 000
9 Lombard Italie, Suisse 3 500 000[49]
10 Galicien Espagne 3,2 millions Galiçophone
11 Occitan Espagne, France, Italie, Monaco 2,05 millions Occitanophone
12 Ligure France, Italie, Monaco 1,93 million
13 Sarde Italie 1,5 million Sardophone
14 Wallon Belgique, France (botte de Givet), États-unis (Green Bay) 600 000 (2007) Wallophone
15 Frioulan Italie 600 000 Frioulophone
16 Gallo Bretagne (Haute-Bretagne) 191 000[50] Galophone
17 Corse France, Italie 100 000 Corsophone
18 Aroumain Albanie, Bulgarie, Grèce, République de Macédoine, Roumanie, Serbie 150 000 - 300 000 ? Aroumanophone
19 Francoprovençal France, Italie, Suisse 113 000
20 Judéo-espagnol Israël, Turquie, Maroc 109 000 Ladino
21 Romanche Suisse 60 000 Romanchophone
22 Astur-léonais Espagne, Portugal 55 000
23 Ladin Italie 30 000 Ladinophone
24 Llanito Espagne, Royaume-Uni 30 000 Llanitophone
25 Mirandais Portugal 15 000 Mirandophone
26 Aragonais Espagne 10 000 Aragonophone
27 Méglénite Grèce, République de Macédoine, Roumanie, Turquie 10 000 ? Méglénophone
28 Istrien Istrie orientale, en Croatie  ? moins d'une centaine Istrianophone

Notes et références

    1. latin, 9e dictionnaire de l'Académie française : « Qui est issu de la Rome antique, qui porte l'empreinte de sa culture, de sa langue. Les pays latins. La civilisation latine. Le français, l'italien, l'espagnol, le portugais, le roumain sont des langues latines. Le génie latin. Le tempérament latin. »
    2. latin, TLFi, « − En partic. [En parlant d'une lang. ou d'un pays considéré du point de vue de sa lang.] Qui a pour origine le latin; dont la langue a pour origine le latin. [...] « les langues latines »
    3. Langues romanes, thèmes data.bnf.fr
    4. néolatin, Larousse : « Se dit parfois des langues romanes. »
    5. néolatin, 9e Dictionnaire de l'Académie française, « (on dit plus souvent des langues romanes). »
    6. L’Europe Et Ses Populations, J.A. Miroglio, 2012, Springer, p. 22, « L’Europe Linguistique », Aldo Dami, (ISBN 9789400997318 et 9400997310), « Les langues romanes sont au nombre de neuf. On les appelle égales langues latines, ou encore néo-latines ».
    7. Alain Rey, « Origine et emplois du mot roman en art », Société des amis des arts et des sciences de Tournus, t. LXXXVII, , p. 322
    8. Encyclopædia Universalis, article « Empire byzantin » et chroniques de Geoffroy de Villehardouin.
    9. Koryakov Y.B. Atlas of Romance languages. Moscou, 2001
    10. Charles Camproux, Les Langues romanes, PUF, Paris, 1979, (ISBN 2-13-035916-7)
    11. Michel Banniard, "Délimitation temporelle entre le latin et les langues romanes"', in H. M. GLESSGEN (dir.), Handbuch der Romanische Sprachgeschichte, Berlin/New York, p. 544-555.
    12. André-Louis Terracher, Université de Liverpool puis de Strasbourg, La rencontre des langues entre Loire et Dordogne, dans : Le Centre-Ouest de la France, encyclopédie régionale illustrée, 1926 : « Il suffit de parcourir les cent premières cartes de l’Atlas linguistique de la France de MM. Gilliéron et Edmont pour s’apercevoir que les parlers du Centre-Ouest (Poitou, Aunis, Saintonge et Angoumois) gardent, aujourd’hui encore et à les prendre d’ensemble, une indéniable originalité. »
    13. Jacques Pignon, Université de Poitiers, L’évolution phonétique des parlers du Poitou, 1960 : « Il est évident que l’évolution phonétique des parlers poitevins et celle des parlers saintongeais est à peu près parallèle. Ils constituent, à l’ouest du domaine gallo-roman, une aire originale où se rencontrent, d’une part, traits d’oc et traits d’oïl, de l’autre quelques développements particuliers, inconnus dans les provinces limitrophes situées au Nord et au Sud. ».
    14. Liliane Jagueneau, Univdersité de Poitiers, Les Traits linguistiques du poitevin-saintongeais, dans : La langue poitevine-saintongeaise : identité et ouverture, 1994 : « les points du domaine poitevin-saintongeais sont suffisamment proches dans l’analyse (distance linguistique faible) pour être considérés comme formant un ensemble cohérent. »
    15. Brigitte Horiot, CNRS et université Lyon-III, Les Parlers du Sud-Ouest, dans : Français de France et Français du Canada : Les parlers de l’Ouest de la France, du Québec et de l’Acadie, 1995 : «  La description linguistique du domaine de l’ALO met en évidence l’existence entre Loire et Gironde d’un domaine linguistique important, forgé par sa situation géographique et par son histoire, et dont la particularité est d’être une marche entre le Nord et le Midi, entre les pays bretons et la région du Centre. »
    16. Pierre Bonnaud, La langue régionale, dans « Esquisse géohistorique du Poitou médioroman », 2006 : « Il est impossible de traiter séparément poitevin et saintongeais, mais ils sont à la fois solidaires et un peu distincts, tant dans leurs origines que dans leur évolution.. »
    17. Hans Goebl, université de Salzbourg, Regards dialectométriques sur les données de l'Atlas linguistique de la France (ALF): relations quantitatives et structures de profondeur, in: Estudis Romànics XXV, 2003, pages 59-121. Lire en ligne: : Dans cette étude le poitevin-saintongeais apparaît comme une unité aussi bien au niveau de l'analyse supradialectale (carte 20) que de l'analyse dialectale (carte 22).
    18. Le poitevin-saintongeais est dans la liste des langues de France, langues d'oïl, depuis début 2010, sur le site de la Délégation générale à la langue française et aux langues de France (DGLFLF), service du Ministère de la Culture, sous le libellé suivant : « poitevin-saintongeais [dans ses deux variétés : poitevin et saintongeais] ». Voir site de la DGLFLF :DGLF - Ministère de la Culture
    19. « Site de la langue savoyarde », sur www.langue-savoyarde.com (consulté le )
    20. article « Gascon » rédigé par Peter V. Davies, Encyclopedia of the Languages of Europe, éd. Glanville Price, Oxford, 1998, p. 190-191.
    21. (en) BLANCHET, Ph. et SCHIFFMAN, H. (eds), The Sociolinguistics of Southern « Occitan » France, Revisited, International Journal of the Sociology of Language n° 169, 2004, Berlin/New-York, Mouton de Gruyter, (ISSN 0165-2516)
    22. Bec Pierre (1995) La Langue occitane, coll. Que sais-je? n° 1059, Paris: Presses Universitaires de France, p. 6.
    23. Domergue Sumien (Université de Toulouse-2), « La classificacion dei dialèctes occitans », Linguistica occitana 7 (2009) pp. 1-55 « en ligne »(ArchiveWikiwixArchive.isGoogle • Que faire ?)
    24. Présentation de la Sociedat de Lingüistica Aragonesa: "Les principaux objectifs de la SLA sont de contribuer à une meilleure connaissance de l'aire de l'aragonais, dans une étroite interaction historique avec le catalan et le gascon." ["Son finalidaz principals de la SLA contribuir a un millor conoiximiento de l'espácio aragonés, en estreita interaccion historica con los ambitos catalan i gascon."]
    25. (es) Metzeltin Miguel (2004) Las lenguas románicas estándar: historia de su formación y de su uso, Oviedo/Uviéu - Academia de la Llingua Asturiana.
    26. Henriette Walter, L'Aventure des langues en Occident, Éditions Robert Laffont, 1994 (ISBN 2-221-05918-2)
    27. Henriette Walter, L'Aventure des langues en Occident, Éditions Robert Laffont, 1994 (ISBN 2-221-05918-2), pages 206 à 208
    28. Pellegrini G. B., Carte des dialectes d'Italie, édition Pacini, Pisa, 1977.
    29. Geoffrey Hull, The Linguistic Unity of Northern Italy and Rhaetia, 1982. Hull va plus loin en incluant le rhéto-roman dans le même ensemble.
    30. Sergio Salvi, La lingua padana e i suoi dialetti, Libera Compania Padana
    31. Heinrich Lausberg, Romanische Sprachwissenschaft, Berlin 1969
    32. À titre d'exemples : le florentin, le siennois ou le lucquois ; respectivement parlés à Florence et le long du fleuve Arno (jusqu'à Fucecchio), à Sienne et dans sa province, et dans la Lucchesia (Lucques et ses alentours).
    33. Pellegrini G. B, Carta dei dialetti d'Italia, Pacini ed., Pisa 1977
    34. Eduardo Blasco Ferrer, Linguistica sarda : Storia, metodi, problemi, édition Condaghes, 2003.
    35. Francesco Mameli, Il logudorese e il gallurese, Villanova Monteleone (SS): Soter, 1998.
    36. (en) https://www.ethnologue.com/subgroups/southern-12
    37. (en) http://glottolog.org/resource/languoid/id/sout3158
    38. Ethnologue.com
    39. ASJP - World Language Tree 03 « Copie archivée » (version du 27 novembre 2013 sur l'Internet Archive)
    40. Une version intégrale en latin de ce texte est disponible sur Wikisource : s:la:Appendix Probi.
    41. On avance parfois qu'un substrat étrusque aurait influencé le dialecte toscan, qui lui devrait entre autres sa gorgia toscana, c'est-à-dire la prononciation des /k/ comme des /h/ (anglais home) ou des /χ/ (allemand Bach). Cette influence de l'étrusque sur le toscan est au XXIe siècle considérée comme un mythe sans fondements : en effet, le phénomène n'est pas limité à la Toscane ; il n'est pas présent dans toutes les zones à dominante linguistique toscane (la Corse, par exemple qui ─ bien qu'éloignée ─ a été fortement toscanisée) ; il n'est pas attesté avant le XVIe siècle et ne correspond pas réellement à des caractéristiques phonétiques étrusques. Enfin et surtout, l'on s'explique mal comment une langue morte bien avant l'apparition des dialectes italiens aurait pu transmettre ce seul trait sans avoir laissé ni vocabulaire ni même coutumes.
    42. Ethnologue, Languages of the World, 15.ta edition, SIL International, 2005.
    43. (ca) Patricia Gabancho, El preu de ser catalans. : Una cultura mil•lenària en vies d'extinció, Barcelone, Editorial Meteora, (ISBN 978-84-95623-53-9)
    44. Pierre Vilar, La Catalogne dans l'Espagne moderne : Recherches sur les fondements économiques des structures nationales, vol. 1, Paris, Flammarion, (1re éd. 1962), 473 p. (ISBN 978-2-08-210649-8), chap. II
    45. Atlas UNESCO des langues en danger
    46. (es) Instidudo Cervantes, « El español: una lengua viva – Informe 2018 », (consulté le )
    47. « International Organisation of La Francophonie (OIF) », sur dx.doi.org, (consulté le )
    48. (en) Portuguese, Ethnologue (22e édition, 2019), consulté le 1er juin 2019.
    49. « La lingua italiana, i dialetti e le lingue straniere », sur http://www.istat.it/, (consulté le )
    50. TMO régions, « langues de Bretagne »

    Voir aussi

    Histoire et aspects généraux

    • M. Banniard, Du latin aux langues romanes, Nathan, 1997 ;
    • (de) Gerhard Ernst et al. (dirs.), Romanische Sprachgeschichte : Ein internationales Handbuch zur Geschichte der romanischen Sprachen, Berlin, Mouton de Gruyter, 2003-2006, 3 volumes ;
    • Jean-Marie Klinkenberg, Des langues romanes, 2e éd., Louvain-la-Neuve, Duculot, 1994 ;
    • (en) Marten Maiden, John Charles Smith et Adam Ledgeway (dirs.), History of the Romance Languages, t. I : Structures, Cambridge, Cambridge University Press, 2011 ; t. II : Contexts, 2013 ;
    • (es) Michael Metzeltin, Las lenguas románicas estándar : Historia de su formación y de su uso, Uviéu, Academia de la Llingua Asturiana, 2004.
    • Wilfried Stroh, Le latin est mort, vive le latin ! Petite histoire d'une grande langue, traduit de l'allemand, Paris, Les Belles Lettres, 2008, 302 p. ;
    • Paul Teyssier, Comprendre les langues romanes, du français à l'espagnol, au portugais, à l'italien & au roumain, méthode d'intercompréhension, Paris, Chandeigne, 2004 ;

    Monographies, manuels universitaires

    • Pierre Bec, Manuel pratique de philologie romane, Paris, Éditions Picard, 1970-1971, deux tomes ;
    • Édouard Bourciez, Éléments de linguistique romane, Paris, 1967 pour la 5e édition ;
    • (es) José Enrique Gargalla Gil et Maria Reina Bastardas (dirs.), Manual de lingüística románica, Barcelone, Ariel, 2007.
    • Martin-Dietrich Glessgen, Linguistique romane : domaines et méthodes de la linguistique romane, Zürich, RoSe, 2004-2005, 2 vol. ; 2e éd., Armand Colin, 2012 ;
    • (de) Günter Holtus, Michael Metzeltin et Christian Schmitt (dirs.), Lexikon der Romanistischen Linguistik (LRL), Tübingen, Niemeyer, 1988-2005, 12 vol. ;
    • Mireille Huchon, Histoire de la langue française, Paris, 2002 ;
    • Andre Klump, Johannes Kramer et Aline Willems (dirs.), Manuel des langues romanes, Berlin-Boston, Walter de Gruyter, 2014 ;
    • (de) Petrea Lindenbauer, Michael Metzeltin et Margit Thir (dirs.), Die romanischen Sprachen : Eine einführende Übersicht, Wilhelmsfeld, G. Egert, 1995.
    • Max Niedermann, Phonétique historique du latin, Paris, 1953 pour la 3e édition ;
    • Michèle Perret, Introduction à l'histoire de la langue française, Paris, Armand Colin, 1998 (2008, 3e édition) ;
    • Eugeen Roegiest, Vers les sources des langues romanes : Un itinéraire linguistique à travers la Romania, Leuven, Acco, 2006.

    Articles connexes

    Liens externes

    • Portail des langues
    Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.