執筆: Y・I

はじめに

以前の執筆から約2年ほどの紆余曲折を経て今回寄稿することとなりました。

改めての自己紹介となりますが、弊社ORENDA WORLDでは主に映像・デザインの業務を担当しております。

今回は『お絵描きAI』というトピックの概要とご紹介、最後の方で枝葉のお話をさせていただきます。本題にすすむ前に、筆者はあくまでデザイナー業務がメインでありAI・機械学習についての具体的な構築についての知見はほとんど有しておりませんのでご承知おきください。

尚、当記事のサムネイルのイラストはお絵描きAIで生成しています。

お絵描きAIの概要

お絵描きAIの仕組みのあらまし

お絵描きAIはインターネットなどアーカイブされている膨大な絵の特徴を機械学習を用いて分析し、その分析を下敷きにゼロから新規で絵を生成することができます。この分析は絵に関わる要素である構図や彩色、またピカソや歌川広重といった文化的背景を超えた画風も学習領域にふくまれています。したがって『〜のような〜な絵』といった現実としてこれまでに存在したことのなかったような絵も生成することが可能となります。お絵描きAIの各種性格ごとに違いはありますが、基本的な概念は上述となります。

お絵描きAIにはどんなものがあるのか?

2022年7月一般公開としてDiscord上で運用されたお絵描きAI『Midjourney』を起点に数多くの同様なサービスが展開されました。厳密にいうと高度な描画のアシスタントとしてのAIは2022年以前より存在していたのですが、上述のMidjourneyは文章のみで絵の生成すべてを完結するという部分が革新的です。翌月に無料一般公開された『Stable Difufuision』は、Google サーバーを用いた自由度の高いお絵描きAIが登場しました。専門性の高いお絵描きAIも後発に開発され、現在も表現の自由度は加速度的に高まっています。

お絵描きAIがユーザーに求めること

2022年11月現在で様々なお絵描きAIがインターネット上で提供されていますが、どのお絵描きAIも基本的な取り扱い方法としては一様であり、そしてそれはシンプルです。

『欲しい絵のテーマを文章(または画像)に載せ、それをもとにAIに絵を生成させる』

お絵描きAIを扱うにあたってユーザーに必要な技能の中に絵を描く要素は一つとしてありません。あくまでどういう絵が欲しいかを伝える文章や画像で指し示すだけです。次の章では『Stable Diffusion』を例とし、実際に絵をAIに描かせてみます。

Stable Diffusionの使い方

Stable Diffusionの特徴

具体的な実例としてご紹介するお絵描きAIとして『Stable Diffusion』について説明します。

前章の説明にもありましたがこちらのAIも同様に文章(プロンプト)に応じた描画をさせるAIです。利用については準備と運用を含めて無料となります。

Stable Diffusionを始める

今回使うお絵描きAI、Stable Diffusion(以降SD)のバージョンは1.5を利用し、GoogleColabを生成に用います。また、仕様デバイスはPCを想定しています。

①Stable Diffusionの中身(HuggingFace Diffusers)を用意する

(1)HuggingFaceってそもそも何?

SDを用いる上で中身であるAIを用意します。SD単体ではお絵描きAIとして機能しません。あくまで絵を生成させるための道筋を作っています。メインであるAIはHuggingFace Diffusers(以降HFD)を用います。HFDは人工知能のライブラリ・モデル・データセットの共有サイトHuggingFaceにパッケージされています

(2)HuggingFaceにログイン登録する

Hugging Face – The AI community building the future.

『Log in』→『Don’t have an account? Sign Up』→以降各種登録→アカウント準備完了

②Stable Diffusion1.5のライセンスを確認する

(1)『Stable Diffusion1.5』のモデルページにアクセス(下記リンク参照)

runwayml/stable-diffusion-v1-5 · Hugging Face

(2)SD1.5のライセンスを確認し、『Agree and access responsitory』(添付画像内赤枠)をクリックして同意する。

③Google Colabで実行

(1)Google Colabを開く

Colaboratory へようこそ – Colaboratory (google.com)

(2)編集→ノートブック設定→ハードウェアアクセラレータ→GPU(添付赤枠参照)

(3)パッケージをインストール

次のコードを実行します。(コピーアンドペースト推奨)

# パッケージのインストール
!pip install diffusers[torch]==0.7.2 transformers

※Colab上では下記のようにコードを記述して進行します。実行する際は左端の三角マークを押します。コードを追加する場合『+コード』を押します。

(4) HuggingFaceにログイン

# HuggingFaceにログイン
from huggingface_hub import notebook_login
notebook_login()

『your HuggingFace tokens pages』をクリック、New tokenでトークンを生成しトークンページのテキストフィールドにコピーアンドペーストしたのちログインします。

(5)パイプラインの準備

from diffusers import StableDiffusionPipeline
import torch
# パイプラインの準備
pipe = StableDiffusionPipeline.from_pretrained(
    "runwayml/stable-diffusion-v1-5", 
    torch_dtype=torch.float16, 
    revision="fp16"
).to("cuda")

(6)推論の実行

promptの項目にAIに描かせたい絵の文章を英文で記載します。

(今回”cat dance”に設定)

# 推論の実行
prompt = "cat dance"
image = pipe(prompt).images[0] 
# 画像の保存と表示 
image.save("output.png")
image

実行すると絵が出力されます。出力された絵は左側のツリーにアップされています。(添付赤線参照)

基本の生成操作手順は以上となります。

お絵描きAIをどのようにとらえるか

活用において考慮する点

お絵描きAIの代表例であるStable Diffusionの紹介と操作について説明いたしました。2022年のIT分野と表現手段に大きな衝撃を与えたトピックであることは明白だと考えています。様々な表現方法や創作活動の障壁がさがり、参加するプレーヤーが一層増えることもまた自明とも考えております。しかし、法律や他整備が追いついていないこともまた現状です。これについては今後整備と議論を重ねていくことと同様に起きていくと考えています。

お絵描きAIから考える可能性

いわゆる『画力』といわれる絵を描くことについての敷居がソフトの技術面によって低くなり多種多様な個人・団体が主体的に関わっていくことが予想できます。お絵描きAIの向上がすさまじく、今後効率よくまた質と精度の高い描画を可能とするお絵描きAIは今後も開発され続けているのが現代の潮流です。こういった背景のなかビジネスへの転用は、より一層の法令倫理の遵守が求められるとともに一層の表現への付加価値創出と未開拓の市場の可能性は大いにあるものと考えます。

まとめ

お絵描きAIが2022年を起点に大幅な成長をはじめ、今後ますます表現と付加価値への可能性が広がるとともに、それに伴う法令倫理についても同じように注視されていくと予想できます。しかし、未開拓の市場を内包していることが今後明らかになりお絵描きAIの需要は増大する可能性があるのではないのかと考え、今後も研究を進めていきたいと考えています。