É difícil definir o que constitui uma língua e não somente um dialeto. Algumas línguas, como o chinês e o árabe, cobrem diversas variações mutualmente ininteligíveis e são às vezes consideradas uma única língua e outras vezes famílias linguísticas. Por outro lado, registros coloquiais do hindi e do urdu têm inteligibilidade mútua quase completa, e são às vezes classificados como um único idioma, o hindustâni, em vez de dois idiomas separados. Tais decisões devem ser feitas com cuidado, pois não é possível desenvolver um conjunto coerente de critérios linguísticos para distinguir idiomas em um continuum dialetal.
Não existe um único critério de quanto conhecimento é suficiente para ser contado como um falante de segunda língua. Por exemplo, o inglês tem aproximadamente 400 milhões de falantes nativos, mas, dependendo do critério escolhido, pode ser dito como tendo até 2 bilhões de falantes.
Há também dificuldades em obter contagens confiáveis de falantes, que variam com o tempo devido a mudanças de população e substituições de idioma. Em algumas áreas, não há dados de censo confiáveis, os dados não são atuais, ou o censo pode não registrar línguas faladas, ou registrá-las ambiguamente. Às vezes populações de falantes são exageradas por razões políticas, ou falantes de línguas minoritárias podem ser sub-relatados em favor de uma língua nacional.
Os idiomas a seguir estão listados como tendo 45 milhões ou mais de falantes totais na edição de 2021 do Ethnologue:
Posição | Língua | Família | Total de falantes |
---|---|---|---|
1 | Inglês | Indo-Europeia | 1,348 bilhão |
2 | Mandarim – Chinês | Sino-Tibetano | 1,120 bilhão |
3 | Hindi | Indo-Europeia | 600 milhões |
4 | Espanhol | Indo-Europeia | 543 milhões |
5 | Português | Indo-Europeia | 293 milhões |
6 | Árabe padrão | Afro-Asiática | 274 milhões |
7 | Bengali | Indo-Europeia | 268 milhões |
8 | Francês | Indo-Europeia | 267 milhões |
9 | Russo | Indo-Europeia | 258 milhões |
10 | Urdu | Indo-Europeia | 230 milhões |
11 | Indonésio | Austronésia | 199 milhões |
12 | Alemão padrão | Indo-Europeia | 135 milhões |
13 | Japonês | Japônica | 126 milhões |
14 | Marata | Indo-Europeia | 99 milhões |
15 | Telugo | Dravídica | 96 milhões |
16 | Turco | Túrquica | 88 milhões |
17 | Tâmil | Dravídica | 85 milhões |
18 | Chinês yue | Sino-Tibetano | 85 milhões |
19 | Chinês wu | Sino-Tibetano | 82 milhões |
20 | Coreano | Coreânica | 82 milhões |
21 | Vietnamita | Austro-Asiática | 77 milhões |
22 | Hauçá | Afro-Asiática | 75 milhões |
23 | Persa iraniano | Indo-Europeia | 74 milhões |
24 | Árabe coloquial egípcio | Afro-Asiática | 70 milhões |
25 | Suaíli | Nigero-Congolesa | 69 milhões |
26 | Javanês | Austronésia | 68 milhões |
27 | Italiano | Indo-Europeia | 68 milhões |
28 | Punjabi ocidental | Indo-Europeia | 65 milhões |
29 | Guzerate | Indo-Europeia | 62 milhões |
30 | Tailandês | Kra-Dai | 61 milhões |
31 | Canarim | Dravídica | 59 milhões |
32 | Amárico | Afro-Asiática | 57 milhões |
33 | Boiapuri | Indo-Europeia | 52 milhões |
34 | Punjabi oriental | Indo-Europeia | 52 milhões |