Creative Reality Studio/HeyGen比較! 無料で“日本語を喋るAIアバター”を作ってみました

｜ 1402 PV ｜ 2025.10.29

favorite_border

今だけ無料でAIチューター（先生）付きレッスンを提供しています。
AI先生があなたの学習をやさしくサポートします。今までは有料ユーザーにのみ開放していましたが、今なら無料でWeb/AI制作7講座が受講できます。この機会にAIつきの学習を体験してみてください。
（無料、限定100名、11月2日まで）

» 今すぐ無料講座をチェックする

動画生成AIプラットフォームのCreative Reality StudioとHeyGenを比較します。それぞれ生成された“喋るAIアバター”の映像だけではなく、無料で両サービスを試す方法から、動画生成までの手順も紹介していきます。

試してみること
Creative Reality Studio

無料サインアップ
Create video / 作る映像を設定する
Generate video / 動画を生成する
生成された映像

HeyGen

無料サインアップ
AI Outfit / FaceSwapでのアバターカスタマイズ
Create video / 作る映像を設定する
Generate video / 動画を生成する
生成された映像

まとめ

試してみること

動画生成AIの中でも人気がある、Creative Reality StudioとHeyGen。この２サービスを使って、以下の動画を音声で解説してくれるアバターを作成ます。

ビジネスシーン（日本語）での活用を想定した場合、現状どのくらいのクオリティでできるかを比較することが目的です。

合わせて、以下の内容についても紹介していきます。

各サービスの無料登録方法（本当に無料で試せるか？）
基本的な使い方（台本からアバターが喋る映像を作るまで）
生成された映像のクオリティ
生成された映像のダウンロード方法

なお、読み上げてもらう台本（テキスト）は同じものを使います。どちらも無料で使える範囲内で行えるよう、テキストは動画通りではなく編集しています。

文字の上を、光の筋が通過していくアニメーションを作成します。

使用するエフェクトは1つだけです。ビデオエフェクトの色調補正にある、プロセスアンプを適用します。

クリップに追加しただけだと変化はないので、明度を上げて発光したような効果を表現します。

マスクを使って、この効果が文字の一部分にだけ適用されるようにします。

光の筋に見えるように、マスクの形を整えます。
表示を確認しながら、マスクの境界のぼかしや明るさも調整してください。

“マスクパス”でキーフレームを設定して、マスクの位置を動かしていきます。
始点は左端、終点は右端に設定。

プレビュー再生で表示を確認し、キーフレームの間隔・アニメーション速度を調節してください。

速度は対象・お好みに合わせて調整してください。
イージングを設定しても良いですね。

Creative Reality Studio

無料サインアップ

Creative Reality Studioを開きます。

URL：https://www.d-id.com/creative-reality-studio/

右上の「Start Free Trial」か画面中央にある「Start now — it’s free」をクリック。

いきなりStudioのホーム画面が開きます。ゲストモード、Creative Reality Studioの基本機能が試せる状態です。 file 日本語読み上げのクオリティや、アバターはどんな感じか、という点だけの確認であれば、このまま右上のCreate videoからお試しが出来ます。

映像生成（アバターと音声との連動）はサインアップが必要なので、登録します。最上部のオレンジ色の部分、もしくは左下のGuestから「Sign Up」を選択。 file

サインアップ画面が開きます。 Googleアカウント等と連携するか、Eメールアドレスを入力して登録してください。 file

画面表示に従って進めると、D-IDのアンケートが出てきます。全6ページくらいあるので、回答していきます。 file file Doneを押すと、自分のアカウントに変わったStudioホームが表示されます。 file

Create video / 作る映像を設定する

では、本題の“喋るAIアバター”の生成をやってみましょう。右上にあるCreate videoから、作成画面に進みます。 file

画面中央がAIアバター（プレゼンター）の設定、右側が喋らせる内容・音声の設定です。 Choose a presenterのタブでは、Creative Reality Studioが用意したアバターの選択、ADDをクリックしてオリジナルアバター用の画像アップロードができます。 file

Generate AI presenterのタブは、AIが生成した画像をアバターとして使う場合に使用します。上部のA portrait ofの後ろに、プロンプト（欲しいアバターのビジュアル）を入力して「Generate」を押すと、その場でAIによる画像生成も行えます。 file

今回はCreative Reality Studioが用意してくれているアバターを使ってみます。

画面右側、上部のテキストエリアに読み上げて欲しいテキストを入力。その下にあるLanguageのプルダウンで、日本語のJapaneseを選択します。 file 声の種類を切り替えつつ、Listenのアイコンをクリックして聴き比べてみます。結構、当たり外れがある印象でした。イメージに合うものを探して下さい。

ちなみに、音声によっては右下にあるStylesで話し方を設定することが出来ます。日本語音声はプルダウンがない、選択不能なものが多いですね。 file

読み上げて欲しいテキストを、全て貼り付けてみます。以下のように表示されていたら文字数がオーバーしているので、テキスト量を調整。もしくは、２つに分割して生成しても良さそうですね。 file

ストップウォッチのアイコンを使うと、アバターが喋らない“間”を追加できます。ストップウォッチアイコン1つにつき、0.5秒ず間が追加されます。 file 調整したら、最初から最後まで通して音声読み上げを確認。入力ミスや、誤読が無いかチェックします。読み方を細かく指示はできないので、漢字や略語を誤読されている箇所があれば、ひらがな・カタカナに直しましょう。

なお、アバターの背景色を変更することも出来ます。合成して使いたい場合は、グリーンバックにしておくと良いでしょう。 file

Audioから音声ファイルのアップロードも可能

今回はテキストからの音声読み上げを行いましたが、お手持ちの音声ファイルを使用することも可能。画面右側ブロックの上部で、Audioの方を選択するとアップロードできます。 file

Generate video / 動画を生成する

アバターと音声に問題なければ、右上の「Generate video」ボタンで動画を生成します。

このGenerate video、音声+音声に従って動くアバターを映像として書き出すタイミングで、クレジットが使用されます。見直しをして、気になるところは直しておきましょう。

服装が下着っぽく思えたので、カッチリした服に変えました。下着っぽい長袖Tシャツと、赤いジャケット……なかなか究極的な選択です。 file

「Generate video」ボタンを押すと、確認画面画面が表示されます。消費するクレジット数を確認して「Generate」を選ぶと、生成が開始します。 file file 生成完了まで少し時間がかかるので、待ちましょう。

生成が完了すると、クリック/タップで映像が見られます。 file file 右下のDownloadから、動画ファイルのダウンロードも可能です。

生成された映像

ダウンロードしたファイルがこちらです。

音声はそこまで悪くないですね。文字を入れて、アバターを選ぶだけで、こんな泳動が出来てしまうのはスゴイ。手が動いているので、口だけ動く一般的なトーキングフォト式よりは良いように思います。

ただ、手を動かすタイミングと、話している内容が合うかと言えば微妙。リアルな人間っぽい分、眉・目が動かず無感情なのが不気味に見えてしまうようにも感じています。