Internation wikipédia
L’encyclopédie Wikipédia vient de fêter ses 15 ans d’existence avec un site internet et un compte Twitter dédiés. Retour sur cette aventure qui, du point de vue de la représentation des langues sur la Toile, est tout à fait exemplaire et présente bien des surprises.

Multilingue dès l’origine

A bien des égards, Wikipédia peut être citée en exemple. L’encyclopédie en ligne est notamment précurseur du Web multilingue puisque, dès sa création en 2001, elle s’envisageait conjointement dans plusieurs langues. Rien de plus logique quelque part : le principe de l’encyclopédie, c’est qu’elle est ce que les utilisateurs et contributeurs bénévoles voudront bien en faire. Sa logique échappe donc à bien des critères qui empêchent ordinairement une plus grande diversité linguistique dans le cyberespace.
C’est l’informaticien Ward Cunningham qui a créé le premier « wiki » et l’ensemble du concept en choisissant ce mot hawaïen qui signifie « vite ». Pour un de ses sites web, il utilisait même une répétition de ce mot « wiki wiki » (très vite) pour accentuer la notion de vitesse (cette forme d’intensification est d’usage dans différentes langues, l’indonésien par exemple). Sur la genèse de l’utilisation du mot wiki par Ward Cunningham, on peut lire la correspondance entre celui-ci et des éditeurs.

280 langues différentes

Les six premières langues au lancement du site étaient l’anglais, l’allemand, le français, l’espagnol, le catalan, le russe et le suédois. A l’heure où Wikipédia souffle ses 15 bougies, l’encyclopédie propose plus de 29 millions d’articles (plus de 25000 écrits chaque jour) dans 280 langues différentes. C’est une statistique remarquable puisque le nombre de langues naturelles écrites se situe vraisemblablement entre 200 et 300. Signalons cependant que dans cette listes d’articles en 280 langues, on trouve également des articles dans des langues anciennes (latin,  dans des langues artificielles ou imaginaires (espéranto, volapük, igbo, etc.). Si on s’en tient à l’usage des langues écrites, on a donc affaire au site le plus multilingue du monde, très proche de la représentation la plus complète de la diversité linguistique. Pour voir une liste des langues et du nombre d’articles publiés dans chacune d’elles, il suffit de consulter cet article Wikipédia. Il est certain qu’à terme, Wikipédia réussira à proposer des contenus dans l’intégralité des langues naturelles écrites. Si certaines ne sont pas au menu aujourd’hui, c’est tout simplement parce qu’elles n’ont pas été développées par le consortium UNICODE.

Aux Philippines, la wikimania

Ainsi, certaines langues qui ne figurent pas dans le haut des classements des contenus en ligne (voir par exemple L’Internet World Stats et le classement du consortium W3C) tous sites confondus jouent les premiers rôles sur Wikipédia. On ne peut que s’en réjouir. Les contributeurs pour le catalan par exemple, sont extraordinairement performants avec un rapport nombre de locuteurs /nombre d’articles wikipédia en catalan très élevé. On peut légitimement imaginer que Wikipédia est un relais important pour l’identité catalane et les revendications récentes de la Catalogne en Espagne. D’une manière générale, Wikipédia fournit une tribune gratuite et importante à des minorités (dans l’acception la plus large de ce mot).
Aux Philippines, il n’est pas exagéré d’affirmer qu’on adore Wikipédia : dans le club très fermé des langues à plus d’1 million d’articles (13 langues) se trouvent le cebuano (20 millions de locuteurs) et le waray-waray (seulement 3 millions de locuteurs), deux langues non officielles de l’archipel qui dament le pion au tagalog (seulement 64 000 articles pour cette langue). Statistique incroyable, le cebuano se classe même 3e au nombre d’articles publiés, devant l’allemand, avec 5% des contenus de l’ensemble de l’encyclopédie…
Du côté de l’Europe, les Néerlandophones sont également très wikiphiles puisqu’ils affichent un très bon rapport nombre de locuteurs/nombre d’articles wikipédia, de même que les Islandais.

Quand on observe ces chiffres, on voit immédiatement que la Chine est sous-représentée. La faute à la censure évidemment, puisque la Chine entretient un rapport assez tendu avec l’idée d’un accès au Web libre et universel. L’arabe (unifié, certes) est aussi très discret sur Wikipédia. Ces deux exemples montrent également que Wikipédia est un indicateur de liberté d’expression très intéressant.

Les langues africaines quasi invisibles

Les contenus en langues africaines demeurent très peu nombreux. Rappelons cependant que seule 30% de l’Afrique subsaharienne est électrifiée et que l’accès à l’Internet est souvent cantonné au smartphone. Pas simple dans ces conditions de pouvoir créer ou modifier des articles.
Mais des spécialistes ont observé que, dès que quelques locuteurs africains commençaient à publier des contenus dans leur langue, d’autres contributeurs suivaient rapidement. Ce fut par exemple le cas pour le yoruba. Mais trop souvent, même de bons connaisseurs des TIC en Afrique ont du mal à créer des contenus sur Wikipédia car ils ne savent pas trop comment s’y prendre. Le développement rapide de Wikipédia en Afrique passe sans doute par une interface un peu plus intuitive.

Les Tops 10 2015

Le Pew Research Center, un « fact tank » américain impartial vient de publier le classement des 10 articles les plus consultés pour 10 langues sur l’année 2015. Vous ne serez pas étonné d’apprendre que les Japonais sont fous de pop culture (7 résultats sur 10 concernent des groupes pop, des BD et des films), que les Portugais et les Brésiliens apprécient le Coca-Cola, que la France adore Naruto ou que l’article Etat islamique a été un des plus lus dans la plupart des langues. En polonais, l’article consacré à l’hyperpolyglotte Jean-Paul II fait recette, de même que Victor Hugo ou Molière cartonnent en français (ces recherches ressemblent beaucoup à des préparations d’exposés ou de devoir).

Et, au fait… Assimil fait évidemment l’objet d’un article Wikipédia, bien documenté !