世界最大の人口を誇るインドは、“IT大国”として近年著しい経済成長を見せている。2015年、同国では行政サービスをデジタル化するという国家ICT政策「デジタル・インディア」がスタート。ICT関連のベンチャー企業が増加するなかで、翌年の2016年にベンチャー企業育成政策「スタートアップ・インディア」が始動した。

昨今はAIブームにより、インドではAIスタートアップが増加しており、2024年上半期時点で同国におけるAIスタートアップの資金調達額は7億6,000万米ドルにのぼるという。

インドのAI市場が急成長をみせるなか、アラブ首長国連邦を拠点とするテクノロジーグループのG42はヒンディー語大規模言語モデル(LLM)「NANDA」をまもなくリリースすると発表した。NANDAを通じて、インドのAIに対する野心を支援していく方針だ。

アブダビで設立されたAI開発グループG42

Image Credits:G42

G42は2018年にアブダビで設立されたAI開発グループ。クラウドコンピューティング、ヘルスケア・ライフサイエンス、交通・モビリティ、公共事業など幅広い業界でサービスを展開している。

30人のチームでスタートしたという同社は現在、85を超える国籍を持つ2万人以上のAI専門家やエンジニアなどを抱える大きなコミュニティへと成長。これまでAstraZeneca、AWS、Cisco、IBM、Illumina、Nvidia、Oracle、Schlumbergerなどの世界有数の企業と提携してきた。今年4月には、Microsoftから15億ドルを調達したと発表している。

そんな同社は昨年8月、子会社のInceptionがオープンソースのアラビア語LLMである「JAIS」を開発したと発表。

JAISは5億9,000万から700億のパラメータを持つモデルで、最大1.6兆トークンのアラビア語、英語、コードデータでトレーニングされている。同モデルにより、世界4億人以上のアラビア語話者が母国語の生成AIにアクセスできるようになった。NANDAの開発は、この成功に基づくものだという。

130億ものパラメータを持つヒンディー語LLM