TOPICS

トピックス

多言語国家インドに挑む音声・会話AIの動向

2022.04.04 / TRENDS

(文責:田中啓介・山本久留美)

多言語国家インドに挑む音声・会話AIの動向

インドは世界最大の多民族・多言語国家です。国民の半数以上が、公用語であるヒンディー語・英語を理解しないインドでは、情報の遮断やコミュニケーション上の障壁が長らく存在しています。多言語であるがゆえに生じるコミュニケーション上の課題を解決すべく、注目されているのが音声・会話AIです。今回はスタートアップも続々と参入しており、また、政府も腰を上げて、幅広く取り組まれている注目の分野を取り上げます。

1. 他民族国家が抱える「多言語」の壁

(出所:reddit “First Language/Mother Tongue reported in 2011 Census by District”)

インドの公用語はヒンディー語と英語です。加えて、州レベルで運用されている主要言語は22語もあり、2001年にはメジャー言語として122語、マイナー言語は1599語も確認されています。

インドで話されている言語は以下の表の通りです。(i)10位のマラヤラム語でさえ、第二言語としての話者数を含めると1億人以上に話されています。

逆に、もっとも話されているヒンディー語でも国内話者の割合は41%しかありません。そのため、地域間のコミュニケーションに問題が生じることもめずらしくなく、インド映画でも「インド国内でも出身地や民族が異なるため、言葉が通じない」というシーンがよく登場するほどです。

インドが「多様」「多様性国家」と表現されるのは、この言語数の多さにも起因していると言えるでしょう。

※2011年時点

順位言語インド国内の話者の割合(%)第一言語としての話者数 (人)
1ヒンディー語41.10%  528,347,193
2ベンガル語8.11%    97,237,669
3マラティー語6.99%    83,026,680
4テルグ語7.19%    81,127,740
5タミル語5.91%    69,026,881
6グジャラート語4.48%    55,492,554
7ウルドゥー語5.01%    50,772,631
8カンナダ語3.69% 43,706,512
9オリアー語3.21%    37,521,324
10マラヤラム語3.21%    34,838,819
11パンジャブ語2.83%    33,124,726
12アッサム語1.28%    15,311,351
13マイティリー語1.18%    13,583,464

2. 言語の統一は難しく非現実的

「多言語が問題なら、ヒンディー語を国語として統一すればよい」と思うかもしれません。しかし、そう簡単にことが進まないのが他民族国家の宿命です。ヒンディー語を他の言語よりも優先させる動きはこれまでもありましたが、その度に別言語の話者からの反対にあっています。

例えば、2014年に第1次モディ政権が樹立した時、「政府関係者はSNSではヒンディー語を使う」旨を通達しました。モディ首相率いるBJPはヒンドゥー至上主義であり、ヒンディー語への使用へのこだわりも強いのが特徴です。しかし、地方政府や市民から大きな反発が起こり、結果、その通達は「ヒンディー語話者の多い北インドのみの適用とする」と訂正されたほどです。

この言語統一はインドの独立時からたびたび問題となっています。

イギリス植民地時代には英語が公用語として定められていました。インド独立時、主権を取り戻した証としてガンディーをはじめとする当時の政治家はヒンディー語を唯一の公用語に定めようとします。しかし、タミル語話者を筆頭に別言語を母国語とする政治家から強い反対が起こりました。

ヒンディー語を強いられることに対して、特にタミル語話者からの反発が大きく、独立時から現在までその流れは続いています。タミル語は南インドで話されており、インドでも五番目に話者が多い言語です。サンスクリット語に並ぶ「古語」としても有名で、古くから伝わる言語を話しているというプライドがタミル語話者にはあります。

「反ヒンディー語運動(anti-Hindi agitation)」を牽引するのも、主にタミル語圏の政党です。特に1986年に発表された「National Education Policy(地域語、英語、ヒンディー語の「3言語フォーミュラ」を制定)」に対する反対は非常に激しく、タミル語圏政党員(DMK)は20,000人以上が逮捕され、20人が自殺に至るほどの騒動に発展しました。(ii)現在も、SNSなどでヒンディー語に対する反発を見せるタミル語話者は少なくありません。

このような問題は独立時から議論されているからでしょうか、インドの憲法は「National Language(国語)」を定めていません。

言語に関する問題は根深く、1つの言語で多民族・多言語国家をまとめあげるのは不可能だと言えるでしょう。

3. 言語の障壁を取り除く!AI音声システムの登場

そんな、言語の統一は不可能とも言えるインドで、新たな希望として注目されているのがAI音声システムです。AppleのSiriやGoogleアシスタントによって一気に普及したAI音声システムですが、インド国内でも言語の壁を取り除く存在として政府や大学などの研究機関、民間企業で開発が進んでいます。

例えば、2021年10月に電子工学・通信技術省(Ministry of Electronics and Information Technology)によって、「The National Language Translation Mission (NLTM)」というプロジェクトが発足しました。(iii)これは、ローカル言語でオンラインにアクセスしたいという需要を受けたもので、2021-2022年に予算を確保しています。

National Language Translation Missionは「National Public Platform」となりえる、マルチ言語対応のAIプラットフォームの設計をしました。ハッカソンも実施し、スタートアップ企業の協力も募りました。本プロジェクトはBHASHINIとも呼ばれ、パンジャビ大学やIIT各校も参画して開発された光学式文字認識(OCR)システムは、政府関連サービスや銀行、NGO、学生や研究者などに提供される予定です。(iv)

また、IIM Bombayはマイナー言語話者の生徒に配慮し、科学技術分野の言葉を英語・ヒンディー語からマイナー言語に翻訳するAIソフトウェアを立ち上げました。「Project Udaan」と呼ばれる本ソフトウェアの開発は、募金によって運営されています。(v)

さらに、市民と政府をつなぐデジタル・プラットフォーム「Mygov」ではパーソナライズ機能も備えたAIであるAmplify.aiが利用されています。(vi)

現在、政府はデリバリーサービス用の音声AIの開発を進めており、またコロナ関連の通達の円滑化をはかってwhatsappにAI音声ガイドを取り入れたりする動きも見られました。

4. 日本とインド、音声AIシステムの比較

日本とインドの音声AIシステムにはどんな違いがあるのでしょうか。日本発の「ObotAI」とインドのスタートアップ「Reverie Language Technologies」を簡単に比較してみましょう。

ObotAIは以下のようなソリューションを提供しています。

・多言語チャットボット(8か国語に対応)

・スマートフォン用翻訳AI

・Web会議用自動翻訳(100か国語以上に対応)

・自治体向け問い合わせ対応用チャットボット

・Microsoft365の使い方をサポートするチャットボット(8か国語に対応)

・VR向けサービス(VR・AIチャットボット・Shopify連携でリアルなショッピング体験の提供など)

ObotAIをはじめとする日本のサービスは、基本的に海外からの観光客やグローバルなビジネスシーンを前提とした、国際的なインタラクションが想定されているため、メジャーな外国語に対応しているかどうかがポイントとなります。例えば、Web会議用自動翻訳サービス「Minutz(ミニッツ)」では海外との会議に最低の音声文字起こしと自動翻訳を同時に行い、そのデータを議事録としてダウンロードすることができるなど、想定されるシーンにピンポイントでソリューションを提供するスタイルでのサービス提供を展開しています。

また、ObotAIはWebやモバイルに限らず、デジタルサイネージにも対応しており、外国人とのタッチポイントが意識されていることがわかります。

一方、インドのスタートアップのReverie Language Technologiesのソリューションは以下の通りです。

・クラウドベースのAI翻訳マネジメントシステム

・Webサイト翻訳システム

・音声翻訳

・機械翻訳

・インドローカル言語用キーボード

・インドローカル言語用フォント(テキスト・ディスプレイ・スイート)

Reverie Language Technologiesはインド国内の言語の翻訳・通訳にフォーカスしており、外国語には対応していません。この点はインド独自だと言えるでしょう。

また、インドローカル言語話者向けのキーボードやフォントを提供しており、Webやモバイル上でローカル言語話者たちのストレス軽減に貢献しています。

Reverie Language Technologiesの各ソリューションはソフトウェア開発キット(SDK)として提供されており、自社のサービスを他社が開発するソフトウェアに活用してもらうことで、ローカル言語話者にとって快適な環境を広げようという努力が見られます。ソリューションの提供方法の違いも、注目すべきだと言えるでしょう。

5. 音声AIを扱うインドのスタートアップ企業

続いては、音声AIシステムを扱うインドのスタートアップ企業を3つ紹介します。

(1)「Language as a Service」を提供するReverie Language Technologies

企業名   :Reverie Language Technologies Limited

本拠地   :ベンガルール

創業年   :2009年

CEO        :Arvind Pani

公式HP  :https://reverieinc.com/

Reverie Language Technologiesは上記でも紹介したように、「Language as a Service」プラットフォームを提供し、モバイルアプリやポータルサイトのコンテンツをリアルタイムに多言語で配信することを可能としています。対応言語数はサービスによって差があるものの、メジャーな22言語に対応済みです。

チップセットメーカー、EC、モバイルブランド、銀行、金融機関、政府、教育、エンターテイメントなどさまざまな業界にサービスを提供しており、ローカル言語話者がアクセスしやすい環境作りに貢献しています。さらにはマルチモードキーボード(Swalekh)、電話帳、カレンダー、言語のロックなど、言語が関係するさまざまな製品づくりにも尽力しています。

ReverieはReliance Industries Investments & Holdings (RIIHL)からも資金提供を受けており、言語分野を扱うスタートアップの中でも注目を集めています。

(2)音声AIシステムに注力するGnai.ai

企業名   :Gnani Innovations Private Limited

本拠地   :ベンガルール

創業年   :2016年

CEO        :Ganesh Gopalan

公式HP  :https://www.gnani.ai/

Gnani.aiは言語分野の中でも特に音声に焦点を当てAIや機械学習によるNLP(自然言語理解)に注力しています。

インドの識字率は約70%程度ですが、農村部の女性となるとその比率は格段に下がります。また、QWERTY配列キーボードはインド言語への対応に時間がかかるため、「音声で理解したい」というニーズが日本よりもずっと高くなっています。

現在、インド英語、ヒンディー語、カンナダ語、タミル語、テルグ語、マラティ語、ベンガル語、マラヤラム語、パンジャビ語などの言語を提供しており、Gnani.aiは主にカスタマーサポートやチャットボット、予約システムやアンケートの回収などで導入されています。

中でもコールセンターで導入が進んでいるのは顧客の問い合わせに自発的に回答するGnani Call Automation Assistantで、音声ベースのテキストエディターなど開発しています。

Samsungベンチャーからも資金提供を受けている、急成長企業でもあります。

(3)インド市場に可能性を見出すDhee Yantra

企業名   :Dhee Yantra Research Labs Private Limited

本拠地   :コルカタ

創業年   :2017年

CEO        :Vidhu Vennie Tholath

公式HP  :https://www.dhee.ai/

「15分で自社ビジネスの会話AIを始められる」AIアシスタントを提供しているのがDhee Yantraです。

Dhee Yantraはインド市場にフォーカスしており、外国語の翻訳・通訳には参入しないことを表明しています。NASSCOMのThe Pitchで、CEOのVidhu氏は以下のように語っています。

「インドがこれまでに経験したデジタル化の成功は、インド人口の12%(約1億5千万人)の英語を話せる人たちによるものです。 13億人の88%という巨大な市場が未開拓のままそこに待っているのです。(中略)DheeYantraは、すべてのインド人が話す言語に関係なく必要な情報にアクセスでき、IoT製品などの最新テクノロジーを利用できるインドを思い描いています。」

同社は、上記の通りインドローカル言語の会話型AIに焦点を当てており、インド国内ユーザーが母語でデジタルサービスにアクセスできるようになることを目指しています。

また、現在市場に溢れる「決まった質問や製品リンクをクリックさせるためだけ」のチャットボットではなく、会話の内容を理解する本当の意味でのチャットボットの開発にも注力しています。高度な会話理解能力を持つチャットボットの多くは、英語にしか対応していません。DheeYantraの会話型エージェント「dhee.ai」は、カスタマーサポート、セールスやマーケティングなどの高度な会話をローカル言語で行うことを目指し、日々進化し続けています。

まとめ:さらなる発展が期待される音声AI

発展の余地が大きくあり、需要も高いインドの音声AIシステム。多民族国家ならではと言える課題が音声AIプラットフォームの開発を加速させ、また、インド国内のニーズに応えていくことこそがサービスの世界展開にもつながり得る可能性に満ちています。多民族・多言語の社会がAI音声システムによってどのように発展していくのでしょうか。また、インドの音声・会話AI技術が世界にどのようなインパクトを持たらすのでしょうか。今後の音声・会話AIのさらなる進化が期待されます。

参照元

(i) https://www.worldatlas.com/articles/the-most-widely-spoken-languages-in-india.html

(ii) https://www.indiatoday.in/magazine/indiascope/story/19861015-anti-hindi-sentiment-in-tamil-nadu-still-very-strong-801345-1986-10-15

(iii) https://www.meity.gov.in/national-language-translation-mission

(iv) https://www.shiksha.com/news/punjabi-university-to-come-up-with-ocr-system-for-indian-languages-blogId-82719

(v) https://www.hindustantimes.com/cities/mumbai-news/iit-bombay-designs-ai-based-translation-app-to-help-students-from-linguistic-minorities-101631632296794.html

(vi)https://analyticsindiamag.com/how-government-of-india-used-conversational-ai-during-covid-19-a-case-study/ (vii) https://jp.knoema.com/atlas/%E3%82%A4%E3%83%B3%E3%83%89/topics/%E6%95%99%E8%82%B2/%E8%AD%98%E5%AD%97%E8%83%BD%E5%8A%9B/%E6%88%90%E4%BA%BA%E3%81%AE%E8%AD%98%E5%AD%97%E7%8E%87

EN