• Augmenter
  • Diminuer
  • Normal

Current Size: 100%

Entropie

               L’entropie est une fonction qui permet de quantifier le "désordre". Elle a été utilisée à l’origine en thermodynamique, puis a trouvé des applications en théorie de l’information et plus récemment en linguistique1. Nous l’utilisons ici pour différencier une langue parlée dans un seul pays d’une langue parlée dans plusieurs pays. Nous appellerons pi la proportion des locuteurs d’une langue donnée vivant dans chacun des pays concernés.

Classiquement l’expression mathématique de l’entropie est la suivante :

Entropie = -Σ(pi x Log(pi))

dans laquelle pi est la probabilité pour un système de se trouver dans un état donné et Log(pi) le logarithme naturel de cette probabilité, le symbole Σ indique que l’on fait la somme de tous les états pi possibles. Dans notre cas nous utilisons évidemment pi ainsi que défini plus haut, la proportion des locuteurs de la langue considérée dans chacun des pays où elle est parlée. La valeur minimale de cette fonction est zéro et il n’existe pas de valeur maximale définie.

Considérons une langue parlée très majoritairement (98%) dans un pays et dont quelques locuteurs vivent dans un second, l’entropie:
 

(0,98 x Log(0,98) +0,02 x Log(0,02)) = 0,098

Une langue dont les locuteurs sont répartis de manière égale sur trois pays aura une entropie de :
 

(0,33 x Log(0,33) + 0,33 x Log(0,33) + 0,34 x Log(0,34)) = 1,099

Voyons à présent quelques exemples réels, ceux du français, du peul, du mandingue, de l’amharique, et de l’arabe égyptien (regroupé ici avec l'arabe saïdi) :

 

Langue

Français

Peul

Mandingue

Amharique

Arabe Égyptien

Entropie

2.386

1.675

0.982

0

0

Locuteurs

350000

17500000

4500000

17400000

72000000

 

Entropie de quelques langues d'Afrique

 

Le français est parlé dans de nombreux pays d'Afrique a une entropie élevée, le nombre de ses locuteurs est cependant peu élevé. Les différentes variétés de peul sont parlées dans plus de quinze pays de la Mauritanie au Soudan et au Cameroun. Son entropie est assez élevée ainsi que le nombre de ses locuteurs. Les langues du groupe mandingue parlées dans cinq pays mais principalement dans deux, le Mali et le Burkina Faso ont une entropie relativement élevée. L'amharique dont le nombre de locuteurs est du même ordre que le peul n'est parlé qu'en Éthiopie (les locuteurs d'Israël ne sont pas ici pris en compte), son entropie est nulle. L'arabe dialectal égyptien n'est parlé qu'en Égypte son entropie est nulle, cependant c'est la langue d'Afrique ayant le nombre de locuteurs le plus élevé.

L’entropie n’a donc rien à voir avec le nombre global de locuteurs d’une langue, mais bien avec la façon dont ces locuteurs sont répartis dans l’aire ou les aires dans lesquelles cette langue est parlée. Elle est calculée à partir des données de population décrites.