写真を見ずに幾何学図形で学習できる画像認識AIを開発！　人間の手間が大幅に減る？

画像認識AIというとどんなイメージが浮かぶでしょうか？

身近な例では、スマホの顔認証や、画像の文字をテキスト化する文字認識などに使われるAI技術が挙げられます。

画像認識AIが世に出されるには、開発段階で使用されるデータセットに大量の写真が必要です。

しかし、データセットの作成は、従来のやり方では人間の作業量が膨大になるほか、画像収集自体が困難な場合もあります。

そこで最新技術により、写真が含まれないデータセットからなる高精度な画像認識AIモデルが開発されました。

なんと、写真の代わりに、数式によって生成された画像を使用したそうです。

この技術はFormula-driven Supervised Learning（FDSL）と称され、2022年6月に産業技術総合研究所の片岡主任研究員のグループにより発表されました。

FDSL(Formula-Driven Supervised Learning)とは？

Fractal Database — Credit: Pre-training without Natural Images (IJCV / ACCV 2020 Best Paper Honorable Mention Award)

今まで画像認識AIの開発には、大量の写真によるデータセットが不可欠でした。

しかし本研究では、数式から幾何画像によるデータセットの自動生成が可能になり、事前学習を行ったところ、従来のデータセットと同等以上の精度が実現できたということです。

この技術をFDSL(Formula-Driven Supervised Learning)といいます。

いったいなぜ、数式から画像データセットを作るというユニークな手法が必要だったのでしょうか。

少なくとも、人の手で数千枚、数万枚といった大量の写真を準備する大変さはイメージできると思います。

その労力が大幅に軽減されるだけでも大きな成果なのですが、それと同時に、従来の画像認識AI開発では生じやすい問題を回避できる技術としても期待されています。

従来の方法による問題点とは具体的にどのようなものがあり、FDSLにするとどのようなメリットがあるのでしょうか。

膨大な作業コストを超削減！

画像認識AIは基本的に、あらかじめ大量の画像をインプットし、画像認識を学習させておくことで機能しています。

こうした作業は「事前学習」と呼ばれ、人間でいえば試験勉強のようなものです。

例えば、英語の試験なら「単語の暗記」や「文法問題を解く」といった勉強を経て、私たちは最終的に試験で高い点数を取ることができます。

それと同様で、画像認識AIも予測タスクを行う前に、事前学習として様々な写真を大量にインプットし、何が写っているのかを答えるという訓練を繰り返します。

なお、そのAIの答えが合っているかどうかは、予め人間がその写真に付けている「教師ラベル」によって判別されます。この学習の手法を「教師あり学習」といいます。

この教師あり学習を行うには、データセットに使用する写真を大量に収集するばかりでなく、収集したすべての写真に対し、人間が一枚ずつラベリングする作業を行わなければなりません。

100万枚以上ある写真の一枚一枚に対し「犬」「猫」など写っているもののカテゴリを人が判断し、付与する作業を想像してみてください。

実際のラベリング作業は、もちろん少数で行うわけではありません。

例えば、現在よく使われる1400万枚以上の写真によるデータセット「ImageNet」の作成時には、クラウドソーシングから結果的に5万人ほどが作業に参加しましたが、それでも完成までに3年かかりました。

そして、仮に数万人がラベリング作業に参加できたとして、全員が正しい知識をもってカテゴライズできているとも限りません。

そのため、誤ったラベル付けを修正するためのダブルチェックや、段階に応じたデータの管理などが必要となり、時間がかかるうえに、人件費がかさみます。

そして、データセットは完璧な状態には至らず、数％は次のようなラベルの付け間違いが起こっているのも事実です。

ImageNetに含まれる誤りラベルの例 — Credit: ImageNet, ささはら千鶴

このような明らかなミスがありえるのか？と言いたくなるのもわかります。

ですが実際、ウォーリーを探せのごとく、大量のデータに目を通して間違い探しを行うため、見逃しも起こり得るのでしょう。

大量の写真に対して人間が一枚ずつ手を加えるという条件では、正確性の面でも限界があるようです。

大規模な研究をしたいという気持ちがあっても、以上のような障壁があるとわかれば、研究者も簡単に手を出しづらいでしょう。

そこで、数式から画像データセットを自動生成できるFDSLの出番です。

本研究では、主に次のようなフラクタル幾何の画像が使われました。

数式から生成されるフラクタル幾何画像の例 — Credit: FractalDB, ささはら千鶴

片岡研究員は、植物などフラクタルの特徴をもつ本物の自然物から着想を得たそうです。

また、幾何学的構造のなかでも、フラクタル幾何は比較的単純な数式で作れるということでした。

そして、FDSLは画像の自動生成だけでなく、同時に教師ラベルを付ける作業も自動で行ってくれます。

教師ラベルは「124」「258」などの数字として、図形のカテゴリごと自動で割り当てられます。

こうして、人間の作業コストは大幅に削減され、ラベルの誤りについても心配無用となりました。

人工の幾何学的な画像が、現実世界の画像認識に役立つなんて不思議ですよね。

AIはこの幾何画像をたくさん見て、どのようなことを理解するのでしょうか。

産業技術総合研究所の公式Twitterで、片岡主任研究員は次のようにコメントしています（一部抜粋）。

初見でイヌとネコを識別するのは難しいので、まずはイヌネコに限らず「あらゆるモノを見分けるコツ」を教え込むわけです。
モノの見方を教えるだけなら、実物ではなくモノの特徴をもった図形でもよさそうな気がしますよね？こうして研究がスタートしました。

奇想天外な発想にも思えますが、これを実行に移したのはすごいですよね。

この技術によって、作業コストのほかにも、データセットにありがちな諸問題が防げるといいます。

いったい他にどういった問題があったのか、次に見ていきましょう。

写真を見ずに幾何学図形で学習できる画像認識AIを開発！ 人間の手間が大幅に減る？

FDSL(Formula-Driven Supervised Learning)とは？

膨大な作業コストを超削減！

大谷翔平、2打席連続ホームランで“異次元記録”更新 日本人対決にファン熱狂「SHOTIMEは止まることを知らない！！！！」

友人から貰った和菓子、パッケージ表記に目を疑う… 衝撃の「6文字」にネット民驚愕

「俺の免許の数字は…」運転免許証の数字は“学科試験の点数”って本当？意外と知らないあの数字の意味

致死率97%の「脳食いアメーバ」が水道水から発見される

金髪店員の「大きい50円で良い？」発言に耳を疑うが… お釣りの正体にネット民驚愕

小泉進次郎氏が40人以上の支持を集め総裁選出馬へ

【117歳】世界最高年齢だった女性の研究から「100歳以上生きる秘訣」が明らかに

発症から48時間以内で死に至る… 原因不明の謎の病が拡大、WHOが調査中＝コンゴ

カレー箱の捨て方に「知らなかった」「気を付けます」 じつは意外な“盲点”が…

元フジアナ、先輩アナに「そういうもんだから」と言われ… 自身が経験した“上納文化”を回顧

小さな砂の孤島に60人が遭難！15年後に生存者が発見された【トロムラン島の謎】

自宅に“あのスペース”があるほど、じつは危険？ 意外な事実にスタジオでも「衝撃」の声

“アレのやりすぎ”が認知症をグッと進行させる？ 日常に潜むリスクに「心配」「気を付けなきゃ」の声

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた 宮内庁「そのような表現は無い」

露呈した北朝鮮兵士の戦いぶりが揺さぶる影響：落とし穴になりかねないプーチン氏との連携

追い越し車線でトラックが「右ウインカーつけっぱなし」…消し忘れではない驚きの理由

1万2000年前、超古代文明は「彗星衝突」で滅んだのか？ 考古学最大の謎“ヤンガードリアス期”の真相とは

新幹線、隣に座った「女子たちの行動」に大迷惑… 五輪メダリストの訴えに約5割が共感

フライパンから剥がれる真っ黒な物体、もしも食べてしまったら… 6割の人が「勘違い」していた

「謎の生物が木の上に！」という通報を受け駆けつけてみると！正体は意外なモノでした！！あなたはこれの正体がわかりますか？

“アレのやりすぎ”が認知症をグッと進行させる？ 日常に潜むリスクに「心配」「気を付けなきゃ」の声

大谷翔平、2打席連続ホームランで“異次元記録”更新 日本人対決にファン熱狂「SHOTIMEは止まることを知らない！！！！」

友人から貰った和菓子、パッケージ表記に目を疑う… 衝撃の「6文字」にネット民驚愕

最強のブタ！？巨体を誇るクマがブタに襲いかかった！！と思ったら、まったく怯まないブタに返り討ちに！

卵を週2回以上食べると「ある病気」の発症リスクが低下

「腕がとれ体が溶ける病気」で数十億のヒトデが死亡。犯人がついに判明

ハードオフで4千円のPS4、中から出た物体にギョッとした 「羨ましすぎる」とネット民驚愕

小泉進次郎氏が40人以上の支持を集め総裁選出馬へ

「悠仁さまより愛子さまが天皇にふさわしい」という勘違い

「俺の免許の数字は…」運転免許証の数字は“学科試験の点数”って本当？意外と知らないあの数字の意味

ふざけるな石破、ボロが出た小泉進次郎

50代におすすめのゴールドカード13選【最新2025年版】メリット・審査・プラチナ比較まで解説

「相変わらず太郎は悪い奴」高嶋ちさ子、ダウン症の姉と兄が“対戦”も… 「最後のアングル」に反響

薨去された三笠宮妃百合子妃殿下の生涯を振り返る

露呈した北朝鮮兵士の戦いぶりが揺さぶる影響：落とし穴になりかねないプーチン氏との連携

試合中、席を立った大谷翔平が向かった先は… “とっさの行動”が反響呼ぶ「人類の模範」

美智子さま・雅子さまなどの愛用ブランドは？

石破茂氏と高市早苗氏：「裏切り者」の失われた31年

金髪店員の「大きい50円で良い？」発言に耳を疑うが… お釣りの正体にネット民驚愕

日本ハム・新庄監督、ピッチャー降板後に“とった行動”が話題 「温かいチーム」

“アレのやりすぎ”が認知症をグッと進行させる？ 日常に潜むリスクに「心配」「気を付けなきゃ」の声

コンビニ駐車場の救急車に張り紙、その内容に目を疑う 「世の中間違ってる」と怒りの声も…

友人から貰った和菓子、パッケージ表記に目を疑う… 衝撃の「6文字」にネット民驚愕

『あんぱん』“ラスト2分”に絶句… 視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

玉木雄一郎 役職停止のご報告

水卜麻美アナ、じつは取得していた“資格” 説得力に多くの反響「すごい…」

いとうあさこ、貯金額を聞かれ「返した言葉」に反響 約6割が続かず挫折していた

再び「1世帯10万円」の給付金、対象外の世帯やマイナンバーカードなど注意点も

住民税非課税世帯に3万円給付に現役世代は怒り心頭

大谷翔平、2打席連続ホームランで“異次元記録”更新 日本人対決にファン熱狂「SHOTIMEは止まることを知らない！！！！」

ふざけるな石破、ボロが出た小泉進次郎

コンセント穴に挿さった謎の物体、恐ろしい正体に目を疑う 「死にかけた」という経験者も…

最強のブタ！？巨体を誇るクマがブタに襲いかかった！！と思ったら、まったく怯まないブタに返り討ちに！

卵を週2回以上食べると「ある病気」の発症リスクが低下

「悠仁さまより愛子さまが天皇にふさわしい」という勘違い

10km/hオーバーまでは捕まらない？なぜ法定速度を超えても捕まらないのか？

エアコンを使うとき4割以上が損してる？ “ある設定”をすると電気代がお得に…

4個に減った薄皮パン、衝撃の事実明らかに… 「これぞ神対応」とユーザー大歓喜

偏差値67超え…芦田愛菜が進学「国内最難関」慶應大学法学部の凄さ、懸念材料も

中居正広氏と一緒にいた“人物”が再注目 アルファベット「U」に広がる憶測「別の方向でヤバすぎ…」

写真を見ずに幾何学図形で学習できる画像認識AIを開発！　人間の手間が大幅に減る？

大谷翔平、2打席連続ホームランで“異次元記録”更新　日本人対決にファン熱狂「SHOTIMEは止まることを知らない！！！！」

友人から貰った和菓子、パッケージ表記に目を疑う…　衝撃の「6文字」にネット民驚愕

金髪店員の「大きい50円で良い？」発言に耳を疑うが…　お釣りの正体にネット民驚愕

カレー箱の捨て方に「知らなかった」「気を付けます」　じつは意外な“盲点”が…

元フジアナ、先輩アナに「そういうもんだから」と言われ…　自身が経験した“上納文化”を回顧

自宅に“あのスペース”があるほど、じつは危険？　意外な事実にスタジオでも「衝撃」の声

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

現在の天皇の呼び方、2割超が「不敬すぎる表現」していた　宮内庁「そのような表現は無い」

1万2000年前、超古代文明は「彗星衝突」で滅んだのか？考古学最大の謎“ヤンガードリアス期”の真相とは

新幹線、隣に座った「女子たちの行動」に大迷惑…　五輪メダリストの訴えに約5割が共感

フライパンから剥がれる真っ黒な物体、もしも食べてしまったら…　6割の人が「勘違い」していた

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

大谷翔平、2打席連続ホームランで“異次元記録”更新　日本人対決にファン熱狂「SHOTIMEは止まることを知らない！！！！」

友人から貰った和菓子、パッケージ表記に目を疑う…　衝撃の「6文字」にネット民驚愕

ハードオフで4千円のPS4、中から出た物体にギョッとした　「羨ましすぎる」とネット民驚愕

「相変わらず太郎は悪い奴」高嶋ちさ子、ダウン症の姉と兄が“対戦”も…　「最後のアングル」に反響

試合中、席を立った大谷翔平が向かった先は…　“とっさの行動”が反響呼ぶ「人類の模範」

金髪店員の「大きい50円で良い？」発言に耳を疑うが…　お釣りの正体にネット民驚愕

日本ハム・新庄監督、ピッチャー降板後に“とった行動”が話題　「温かいチーム」

“アレのやりすぎ”が認知症をグッと進行させる？　日常に潜むリスクに「心配」「気を付けなきゃ」の声

コンビニ駐車場の救急車に張り紙、その内容に目を疑う　「世の中間違ってる」と怒りの声も…

友人から貰った和菓子、パッケージ表記に目を疑う…　衝撃の「6文字」にネット民驚愕

『あんぱん』“ラスト2分”に絶句…　視聴者、崩れ落ちる「嘘だと言って」「涙止まらん」

玉木雄一郎　役職停止のご報告

水卜麻美アナ、じつは取得していた“資格”　説得力に多くの反響「すごい…」

いとうあさこ、貯金額を聞かれ「返した言葉」に反響　約6割が続かず挫折していた

大谷翔平、2打席連続ホームランで“異次元記録”更新　日本人対決にファン熱狂「SHOTIMEは止まることを知らない！！！！」

コンセント穴に挿さった謎の物体、恐ろしい正体に目を疑う　「死にかけた」という経験者も…

エアコンを使うとき4割以上が損してる？　“ある設定”をすると電気代がお得に…

4個に減った薄皮パン、衝撃の事実明らかに…　「これぞ神対応」とユーザー大歓喜

中居正広氏と一緒にいた“人物”が再注目　アルファベット「U」に広がる憶測「別の方向でヤバすぎ…」