昨今、OpenAI社のChatGPTをはじめとしたLLM(Large Language Model:大規模言語モデル)とその応用である生成系AIがより身近な存在として、世界中で活用されている。使ってみた人の中には、自分の質問に自然に答え、かつ翻訳、要約とさまざまな処理を瞬時に行えるAIサービスに衝撃を受けた人も多いのではないだろうか。

AIサービスを便利に使うことができるのは、そのサービスがあらかじめ我々が使う言語や理解できる言語をサポートしていたからだろう。たとえば、筆者が2024年3月19日に、ChatGPT4に対して「専門分野で自信を持ってサポートできる言語の数は?」と質問をしたところ、次のような返答があった。

User
Could you please count the number of languages you can confidently support in professional areas ?

ChatGPT
For professional or technical content, I’m most confident in supporting a smaller set of languages due to the availability of training data and the frequency of use in professional contexts. These languages include:

1. English
2. Spanish
3. French
4. German
5. Chinese (Simplified)
6. Japanese
7. Korean
8. Russian
9. Italian
10. Portuguese (primarily Brazilian Portuguese)
11. Dutch
12. Arabic

それでは、上記の言語を使わない、他の国の言葉を使用している人はどうすればこれらのサービスを利用できるようになるだろうか。

アメリカで使用されている多数の言語と日本語

まず、世界でいくつの言語が存在し、そのうちのいくつがアフリカで使用されているかをおさらいしたい。

少数言語の研究団体SILによると、2023年時点で世界には7168の言語があるという。またハーバード大学によれば、世界に存在する言語の約1/3にあたる1000~2000の言語がアフリカで使用されており、そのうち100万人以上の話者がいる言語は少なくとも75あるそうだ。

ちなみにこうした言語の多様性を見るに、日本人は言語という意味で恵まれた地位にあるというのが筆者の考えである。人口減少問題が叫ばれているため意外に聞こえるかもしれないが、厚生労働省によれば日本の人口は2020年に1億2615万人、2040年に1億1284万人、2070年には8700万人に減少すると予測されているものの、日本語という同じ言語を使う人口として上記の100万人と比べてみると、圧倒的に多いように見えてくる。

ちなみに、先にChatGPTが上げた言語のなかで、たとえばDutch(オランダ語)の現在の使用者の数はWorld Population Reviewによると推定2800万人程度である。

そのため、ChatGPTのような最新技術において、日本語が全くサポートされないという未来は心配しなくていいというのが筆者の見解である。一方、アフリカには自分たちの言語が最新技術でサポートされない状況と、それでも最新技術を利用してサービスを生み出したいという確かなニーズが存在することがみえてくる。