ディープフェイクのビジネス応用の可能性！ AIでの加工を実現するGANとは？

近年のAIの発展は著しく、これまでできなかったことでもテクノロジーの活用で容易に、スピーディーな実現を可能にしています。ChatGPTに代表される生成型AIの発展は、特に顕著と言えるでしょう。しかし、AIが自動で生成できるのは、何も文章に限ったことではありません。十分な質と量のデータを学習させれば、AIによって精度の高い画像認識や画像生成に関しても可能です。つまり、コンテンツだけでなく、ビジュアル面や意匠性を踏まえたクリエイティブにおいても、AIで十分に生成できるレベルと言えます。

しかし、そうしたAI技術を悪用する事態も発生しています。その最たる例が現代に横行するフェイクニュースです。中でもMetaのザッカーバーグCEOやアメリカ前大統領のトランプ氏を題材とした、まるで本物かのような映像や画像は多くの人々を驚かせました。AI機械学習のアルゴリズムであるディープラーニング（深層学習）を用いて、フェイク（偽物）の加工を仕立て上げる技術を「ディープフェイク」と呼びます。これからの時代において、ディープフェイクの技術はどんな活用法があるのでしょうか。

SNS上のフェイクニュースなどによって知れ渡ったディープフェイク
ディープフェイクという言葉は元々存在しておらず、ディープラーニングとフェイクを組み合わせることで誕生した造語です。主にAIのディープラーニングによって2つの画像や動画の一部を結合させ、元とは異なるクリエイティブを生み出す技術として活用されています。元々は映画やゲームといった映像やグラフィックの分野での専門技術と考えられていました。しかし、近年ではスマートフォンアプリなどでも簡単にディープフェイクを作成できるようになるなど、一般への普及・浸透が進んでいます。

先端技術が広がりを見せること自体は非常に有益ではあるものの、ディープフェイクが広く活用されることについては懸念の声もあります。もっとも深刻なのがフェイクニュースなどへの悪用です。偽動画、偽画像を作り出してSNSに投稿し、世間を混乱に陥れることを楽しんでいる層が残念ながら一定数存在します。特にそうした被害は有名人ほど気をつける必要があり、偽動画、偽画像によるフェイクニュース対策はこれからの超スマート社会（Society 5.0）において急務と言えるでしょう。

ディープフェイクの技術が注目されている要因には、画像編集ソフトを使用した顔を差し替えや合成などの従来の加工の領域をはるかに凌駕している点が挙げられます。画像や動画の中の顔を別の人物に差し替えることはもちろん、発している言葉に合わせた自然な口の動きや表情の変化まで再現することを可能にしています。本人が話す様子とまるで区別ができないレベルの偽動画を制作できる技術が、すでに存在しているのです。

そのため、これからの社会で横行することが予想されるフェイクニュースは、より巧妙に、よりリアリティのある偽動画、偽画像が出回る危険があります。情報を発信する側はもちろん、メディアやSNSなどを通じて享受する側もきちんとその内容を精査することが重要です。フェイクを作り出す精度が高まってきているだけに、それに踊らされないように情報感度や知見を高める必要があるでしょう。悪用を断絶するためには、利用する1人ひとりのリテラシーが鍵になるはずです。

ディープフェイクのメカニズム「GAN（敵対的生成ネットワーク）」とは

ディープフェイクをより深く理解するうえでは、そのメカニズムを知ることが大切です。ディープラーニングの技術の中でも「敵対的生成ネットワーク」と呼ばれるGANを活用しています。GANはGenerative Adversarial Networksの略であり、生成モデルの一種とされています。GANの活用によって具体的には、実在しないデータの生成や既存のデータに沿った変換、元データの特徴を踏まえた新しいデータの生成など多岐にわたる対応が可能です。GANの技術を用いれば、ぼやけた解像度の低い画像をキレイに復元することもできます。

GANの生成の仕組みとしては、「Generator（生成ネットワーク）」と「Discriminator（識別ネットワーク）」の主に2つのネットワークに分かれている点が特徴です。Generatorはデータの偽物を作り出す役割があります。しかし、単にフェイクを生成するだけでは精度や品質を担保できません。そこで活躍するのがもう1つのDiscriminatorです。Discriminatorはフェイクの精査を担当しています。生成するGeneratorと精査するDiscriminatorが互いの役割を遂行することで、データにより近いフェイクに仕上がる仕組みです。

GANの優れているところとしては、データのラベリングが不要な点が挙げられます。従来のディープラーニングでは、モデル開発の際の前処理段階であるデータラベリングが重要でした。アルゴリズムに画像、テキストファイル、ビデオなどのローデータを学習させる際に、個別のデータにタグやラベルづけを行う必要性がありました。しかし、GANはラベリングもないため、下準備の手間も省けます。一方でラベリング不要がゆえに動作の不具合が生じたり、学習が不安定になったりする場合もあります。

そうしたエラーが発生しないようにするにも、GeneratorとDiscriminatorが性能のバランスを保つことが重要であり、両者を高レベルで競わせる（つまり、「敵対」させる）ことが精巧なフェイクを生成するうえでの秘訣です。GANのネットワーク構造は、生成と構造の2つのネットワークが切磋琢磨することで成り立っています。

ディープフェイクによるビジネス活用の可能性

今後はよりGANがより一般的になることで、ディープフェイクに関しても日常にもっと馴染みあるようになることが想定されます。実際にIT関連の企業を筆頭にすでにディープフェイクの技術をビジネス活用している企業もあるほどです。たとえば、オンラインでのプレゼンテーションや会議などにおいて、登壇している人物がディープフェイクによる合成映像であり、本人とはまったく見た目の異なるいわば分身が画面上で躍動することも技術的に簡単に行えます。

また、AI音声プラットフォーム「CoeFont（コエフォント）」では、実業家のひろゆき氏を起用した「おしゃべりひろゆきメーカー」をリリースしています。これは「ディープフェイクボイス」と呼ばれるもので、ディープフェイクと同じ仕組みで音声をAIで生成する仕組みです。こうした技術を活用すれば、商談の機会などをより親しみやすくバラエティ豊かに展開することも可能であり、ディープフェイクをいかに活用するかは、今後の社会における重要なデジタル戦略の1つになるかもしれません。

実際に映画などの現場では、他言語吹き替えがディープフェイクによって違和感ない仕上がりになるなどの活用が期待されています。特に日本語は他の言語と用法や仕組みが大きく異なるので、洋画の吹き替えには大きな違和感がありました。しかし、ディープフェイクの技術を活用すれば、話されている言語と唇の動きが合わない現象もなくなり、より自然な吹き替え映像も制作が可能です。

現時点では、VTuberなどAIアバターの活用範囲は、一般的にはまだまだ広いとは言えないでしょう。しかし、AIアバターを利用してヴァーチャル対応が当たり前になる未来はそう遠くはないはずです。まずはエンタメの世界からより広範囲に浸透・普及をし始めて、合成映像のAIアバターがビジネスシーンにも多く顔を出すことが現実的な施策として定着していくことでしょう。

現状では、ディープフェイクという言葉を聞くと、「フェイクニュース」や「偽動画」「偽画像」というネガティブなイメージを持つ方も多いかもしれません。ただし、ディープフェイクが当たり前の技術として社会で使われ出す時が訪れる前に、新しい技術や知識を積極的に取り入れてみることをおすすめします。そうすることで、時代の一歩先を行く提案や企画につながるアイデアが創出できるかもしれません。

トレードシフトブログ

業界リーダー達の情報サイト

ディープフェイクのビジネス応用の可能性！ AIでの加工を実現するGANとは？