2024/08/21

iKala、繁体字中国語LLM検証セット「TMMLU+」発表｜台湾特有の言語・文化をカバー

近年は生成AIテクノロジーの台頭により、さまざまな国が自国の言語に対応する大規模言語モデル（LLM）の開発に取り組んでいる。

今年7月には、タイの多角経営グループであるDTGOが香港のAIソフトウエア企業SenseTimeと提携し、タイ語、中国語、英語の3か国語に対応するLLM「DTLM（DTGO Large Language Model）」の開発を発表した。

アジア圏でのLLM開発が盛り上がりを見せるなか、台湾でも多くの企業が繁体字中国語LLMの開発を進めている。こうした背景を受け、台湾発のAIソリューションプロバイダーであるiKalaは、新たな繁体字中国語検証セット「TMMLU+」を発表した。

LLMの精度とローカリゼーションを向上させる「TMMLU+」

中国語の字体には「簡体字」と「繁体字」の2種類がある。

簡体字は、従来の複雑な漢字を簡略化した字体。中国本土、シンガポール、マレーシアなどで使用されている。いっぽう繁体字は従来、漢字文化圏で使用されてきた伝統的な字体だ。台湾のほか香港、マカオなどでも用いられている。

台湾市場ではこの繁体字に対応した言語モデルの需要が高まっており、さまざまな企業が同モデルの開発に着手しているという。

しかし、台湾には「8+9（不良を意味するスラング）」や「北車（台北駅の略称）」などの単語や、独自の文化が存在する。AIによる生成結果をより正確なものにするためには、LLMの構築プロセス中に検証セットで調整する必要がある。

そこで昨年10月、iKalaは繁体字中国語検証セットであるTMMLU+の開発を開始した。

台湾の言語・文化をカバーする設計

TMMLU+は、MediaTekが発表したフレームワーク「TMMLU」をベースに作られている。iKalaのAIチームはソーシャルメディア上のデータを活用してフレームワークを拡張し、よりローカルな台湾の言語と文化の背景をカバーするように設計した。

関連タグ

関連記事（提供・）

今、読まれている記事

大谷翔平、2打席連続ホームランで“異次元記録”更新　日本人対決にファン熱狂「SHOTIMEは止まることを知らない！！！！」

友人から貰った和菓子、パッケージ表記に目を疑う…　衝撃の「6文字」にネット民驚愕

「俺の免許の数字は…」運転免許証の数字は“学科試験の点数”って本当？意外と知らないあの数字の意味

致死率97%の「脳食いアメーバ」が水道水から発見される

金髪店員の「大きい50円で良い？」発言に耳を疑うが…　お釣りの正体にネット民驚愕

小泉進次郎氏が40人以上の支持を集め総裁選出馬へ

【117歳】世界最高年齢だった女性の研究から「100歳以上生きる秘訣」が明らかに

発症から48時間以内で死に至る… 原因不明の謎の病が拡大、WHOが調査中＝コンゴ

カレー箱の捨て方に「知らなかった」「気を付けます」　じつは意外な“盲点”が…

元フジアナ、先輩アナに「そういうもんだから」と言われ…　自身が経験した“上納文化”を回顧

小さな砂の孤島に60人が遭難！15年後に生存者が発見された【トロムラン島の謎】

自宅に“あのスペース”があるほど、じつは危険？　意外な事実にスタジオでも「衝撃」の声

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた　宮内庁「そのような表現は無い」

露呈した北朝鮮兵士の戦いぶりが揺さぶる影響：落とし穴になりかねないプーチン氏との連携

追い越し車線でトラックが「右ウインカーつけっぱなし」…消し忘れではない驚きの理由

1万2000年前、超古代文明は「彗星衝突」で滅んだのか？考古学最大の謎“ヤンガードリアス期”の真相とは

新幹線、隣に座った「女子たちの行動」に大迷惑…　五輪メダリストの訴えに約5割が共感

フライパンから剥がれる真っ黒な物体、もしも食べてしまったら…　6割の人が「勘違い」していた

「謎の生物が木の上に！」という通報を受け駆けつけてみると！正体は意外なモノでした！！あなたはこれの正体がわかりますか？

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

大谷翔平、2打席連続ホームランで“異次元記録”更新　日本人対決にファン熱狂「SHOTIMEは止まることを知らない！！！！」

友人から貰った和菓子、パッケージ表記に目を疑う…　衝撃の「6文字」にネット民驚愕

最強のブタ！？巨体を誇るクマがブタに襲いかかった！！と思ったら、まったく怯まないブタに返り討ちに！

卵を週2回以上食べると「ある病気」の発症リスクが低下

「腕がとれ体が溶ける病気」で数十億のヒトデが死亡。犯人がついに判明

ハードオフで4千円のPS4、中から出た物体にギョッとした　「羨ましすぎる」とネット民驚愕

小泉進次郎氏が40人以上の支持を集め総裁選出馬へ

「悠仁さまより愛子さまが天皇にふさわしい」という勘違い

「俺の免許の数字は…」運転免許証の数字は“学科試験の点数”って本当？意外と知らないあの数字の意味

ふざけるな石破、ボロが出た小泉進次郎

50代におすすめのゴールドカード13選【最新2025年版】メリット・審査・プラチナ比較まで解説

「相変わらず太郎は悪い奴」高嶋ちさ子、ダウン症の姉と兄が“対戦”も…　「最後のアングル」に反響

薨去された三笠宮妃百合子妃殿下の生涯を振り返る

露呈した北朝鮮兵士の戦いぶりが揺さぶる影響：落とし穴になりかねないプーチン氏との連携

試合中、席を立った大谷翔平が向かった先は…　“とっさの行動”が反響呼ぶ「人類の模範」

美智子さま・雅子さまなどの愛用ブランドは？

石破茂氏と高市早苗氏：「裏切り者」の失われた31年

金髪店員の「大きい50円で良い？」発言に耳を疑うが…　お釣りの正体にネット民驚愕

日本ハム・新庄監督、ピッチャー降板後に“とった行動”が話題　「温かいチーム」

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

コンビニ駐車場の救急車に張り紙、その内容に目を疑う　「世の中間違ってる」と怒りの声も…

友人から貰った和菓子、パッケージ表記に目を疑う…　衝撃の「6文字」にネット民驚愕

『あんぱん』“ラスト2分”に絶句…　視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

玉木雄一郎　役職停止のご報告

水卜麻美アナ、じつは取得していた“資格”　説得力に多くの反響「すごい…」

いとうあさこ、貯金額を聞かれ「返した言葉」に反響　約6割が続かず挫折していた

再び「1世帯10万円」の給付金、対象外の世帯やマイナンバーカードなど注意点も

住民税非課税世帯に3万円給付に現役世代は怒り心頭

大谷翔平、2打席連続ホームランで“異次元記録”更新　日本人対決にファン熱狂「SHOTIMEは止まることを知らない！！！！」

ふざけるな石破、ボロが出た小泉進次郎

コンセント穴に挿さった謎の物体、恐ろしい正体に目を疑う　「死にかけた」という経験者も…

最強のブタ！？巨体を誇るクマがブタに襲いかかった！！と思ったら、まったく怯まないブタに返り討ちに！

卵を週2回以上食べると「ある病気」の発症リスクが低下

「悠仁さまより愛子さまが天皇にふさわしい」という勘違い

10km/hオーバーまでは捕まらない？なぜ法定速度を超えても捕まらないのか？

エアコンを使うとき4割以上が損してる？　“ある設定”をすると電気代がお得に…

4個に減った薄皮パン、衝撃の事実明らかに…　「これぞ神対応」とユーザー大歓喜

偏差値67超え…芦田愛菜が進学「国内最難関」慶應大学法学部の凄さ、懸念材料も

中居正広氏と一緒にいた“人物”が再注目　アルファベット「U」に広がる憶測「別の方向でヤバすぎ…」

もっと見る