完璧なVeo 3.1プロンプトの書き方:初心者向けガイド

ホーム » ブログ » 完璧なVeo 3.1プロンプトの書き方:初心者向けガイド

あなたはすでに動画のアイデアをしっかり持っています。しかし一つの課題があります:自分の想像通りの動画を正確に作り出すVeo 3.1のプロンプトの書き方がわからないのです。

これが多くのクリエイターがつまずくポイントです。創造性が不足しているわけではありません。アイデアをAIに伝える方法を知らないのです。「人が歩いている」などの単純なプロンプトでは平凡で忘れられやすい映像になります。明確で詳細なプロンプトは、リアルで洗練されたシネマティックな瞬間を生み出します。

実のところ:AIと動画の品質は80%はプロンプト次第、20%はモデル次第です。最先端の技術を使っても、プロンプトが弱いと映像も同じです。

Veo 3.1は二つの異なる制作方法を提供します。テキストから動画への生成はゼロからすべてを構築します。画像から動画への変換は、すでに持っている素材をアニメーション化します。

それぞれに適したプロンプトのスタイルがあります。混ぜると結果に一貫性がなくなることもあります。
このガイドは、両方の方法でVeo 3.1のプロンプトを書きやすくするために、シンプルでわかりやすい構造を提供します。例を見て、その構造の論理を学び、すぐに使えるテンプレートも手に入ります。

では始めましょう。

Veo 3.1 プロンプトの違いは何ですか?

もしVeo 3を以前使ったことがあれば、Veo 3.1では新しい書き方が必要なのか疑問に思うかもしれません。

短い答え:必ずしもそうではありません。

構造は変わりませんが、モデルはより賢く、より正確で、より多くのことができるようになっています。変更点は以下の通りです。

あなたをよりよく理解する

Veo 3.1は詳細についてより正確に理解します。例えば、「ゆっくりと寄っていく」や「キャラクターの顔にズームする」といった具体的なカメラの動きを説明すると、それに忠実に従います。Veo 3は近似しますが、Veo 3.1は常に的確に映像を作ります。

よりクリアで自然な音声

Veo 3もVeo 3.1も音声に対応しています。ただし、Veo 3.1はより鮮明なセリフや自然な周囲音を生成します。声は生き生きとし、雨や足音などの効果音もリアルに感じられます。

もっとできる

Veo 3.1は複数シーンのシーケンス構築、角度切り替え、キャラクターの一貫性維持も可能です。また、動画の始まりと終わり方もコントロールできます。つまり、より自由度が高く、プロフェッショナルな結果を得られます。

要約:AIに何を作らせたいかを教えるのです。Veo 3は良い生徒、Veo 3.1は優秀な生徒です。同じ方法で教えますが、Veo 3.1はより良く学び、多くの詳細を記憶します。

テキストビデオ Veo 3.1 プロンプト

Veo 3.1のプロンプトを書くときは、シンプルな5要素の構造に従う必要があります。この順番は、映画制作者がショットを計画する流れと一致し、カメラから感情までの流れを重視しています。
5つの要素は次の通りです:

  • シネマトグラフィー – カメラの構図と動き
  • 被写体 – 何を見るか
  • アクション – 画面上で何が起きているか
  • コンテキスト – 場所と時間
  • スタイルと雰囲気 – 見た目、色調、音

最初にカメラについて考え、その中に何を含めるかを記述します。この順番により、Veo 3.1はただ何を見るかだけでなく、それをどう本物らしくシネマティックに見せるかも理解します。

1. 撮影 – カメラ

カメラは良い動画の出発点です。観客にどう伝えるかをコントロールします。

最初にショットタイプを選びます。空間を見せたいならワイド、会話ならミディアム、感情を伝えたいならクローズアップです。次にカメラの動きを説明します。ゆっくり寄ることで親密さを増し、スムーズな追跡は動きとエネルギーを生み出します。落ち着いた構図なら静止したショットを選びます。

最後にフォーカスを記述します。浅い被写界深度は被写体を際立たせ、深い焦点は全体をシャープに見せ、ドキュメンタリー風に仕上げます。

プロンプト例:

  • 広角の設定ショット、三脚固定、微妙な被写界深さ
  • 4秒かけてワイドからミディアムへのスローディリー、浅い被写界深度で被写体を鮮明に、親密さを演出
  • ゆっくり寄って、柔らかい逆光でシルエットを形作り、雨に濡れる窓辺の若者の親密なクローズアップ

2. 主語 – 誰または何

被写体はフレームの中心です。Veo 3.1に正確に何が見えているか伝えましょう。

人物は年齢範囲、髪型、衣装、雰囲気などの少しの特徴だけで表現します。オブジェクトや商品については、質感、素材、色に焦点を当てるとよいです。これらの細部は、AIが様々なクリップ間で一貫した映像を作るのに役立ちます。

プロンプト例:

  • 弱い例: 男性
  • 良い例: 明るいスタジオにいるフレンドリーな創設者、ソフトなキーライト、プロフェッショナルな服装
  • 専門的: 30代後半の男性、肩長のアラバン髪、堂々とした姿勢、知的な濃い瞳、ヴィンテージのデニムジャケットを着て興奮した表情

3. 行動 – 何が起こっているか

動作は何をどうするか、意図を伝えるために動詞を用います。「彼女は歩く」だけでも良いですが、「彼女は落ち着いた歩みで意図的に歩く」の方がVeo 3.1にムードを伝えやすいです。台詞を入れる場合も、簡潔で自然にします。トーンを示唆するだけの短い表現が効果的です。

明確なアクションは静止したフレームに生命を吹き込み、生命感をもたらします。

プロンプト例:

  • 一般例: 探索している人
  • 良い例: 街の市場を探索しながらさまざまな料理を試し、会話し、たまにカメラを見る
  • プロフェッショナル例: 彼女はさまざまな屋台の料理を試しながら話し、時々カメラを見てから興味深い店を指差しながら、歓声を上げて発見の喜びを伝える

4. コンテキスト – 場所と時間

同じポーズでも、贅沢なペントハウスや居心地の良いコーヒーショップ、賑やかな市場では大きく印象が変わります。具体的な場面を詳細に記述しましょう:場所の種類、見えるもの、時間帯、照明の方向、季節や天気までも伝えるとよいです。

強いコンテキストの描写は、観る人がすぐにイメージできる生き生きとした世界にシーンを根付かせ、共感を呼びます。

プロンプト例:

  • 曖昧な例: 外、昼間
  • 良い例: vendor stallsと賑やかな東京の市場、午後の日差しでスタンドの間に美しい影を作る
  • 専門的例: 露出されたレンガ壁と立ち仕事デスク、多台のモニター、植物、そして黄金時代の都市景観が見える大きな窓、暖かい日差しが床に長い影を落とす現代のテックスタートアップオフィス

5. スタイルと雰囲気 – 雰囲気とオーディオ

スタイルと雰囲気は、映像の見た目と音に影響します。感情的なトーンを設定し、全体を統一します。

まず視覚的なスタイルを決めます。シネマティック、ドキュメンタリー、コマーシャルのいずれにしたいかを選び、次に色のパレットを描写します。暖色系は親しみやすさを感じさせ、クールな色調は落ち着きと清潔感を与えます。最後に音声の指示を追加します。音楽、環境音、台詞を明確にします。「バックグラウンドミュージック」ではなく、その感じを伝える表現を使います — ソフトなピアノ、アップビートなリズム、雨の環境音など。

プロンプト例:

  • 弱い例: プロフェッショナルなスタイル、良い照明、良い音
  • 良い例: 温かみのあるカラーグレーディングのシネマティックドキュメンタリースタイル。音:静かなオフィスの雰囲気と控えめなキーボード打鍵、「プロトタイプ準備完了」と彼女が言う
  • 専門的例: 高級でシネマティックなコマーシャルスタイル、暖色のシャンパンカラーとクールなグレイのトーン、4K品質。音:控えめな足音、遠くのオフィスの環境音(コンピュータのハム音やかすかな電話のベル)、穏やかなピアノ伴奏を非常に控えめにミックスし、浅い被写界深度で全体を包む

プロンプトテンプレート

  • 撮影: [ショットの種類]、[カメラの動き]、[レンズの特性]
  • 件名: [フレーム内に写っている人物/物の詳細な説明]
  • アクション: [何が起こっているのか、どのように動いているのか、意図は何か]
  • コンテキスト: [場所、時間、天候、照明の方向、時間帯]
  • スタイルと雰囲気: [ビジュアルスタイル、ムード、カラーパレット]、オーディオ: [セリフ/SFX/アンビエント/音楽]

完全な例

  • 撮影:ミニマルなリビングルームをゆっくりとドリーで撮影、ワイドショットからミディアムショットへ移行、浅い被写界深度、透明な白い背景
  • 対象者: 30代半ばのプロフェッショナルな女性、洗練された容姿、仕立ての良いブレザー、自信に満ちた姿勢、知的な目
  • アクション:彼女は目的を持って部屋に入り、大きな窓の前で立ち止まり、下の街を物思いにふけりながら眺め、それからカメラの方を向く
  • 背景:床から天井まで届く窓のあるモダンでミニマルなリビングルーム。オーク材の床に長く柔らかな影を落とす朝日。清潔な白い壁。現代的な家具。ゴールデンアワーには窓から街並みが見える。
  • スタイルと雰囲気:映画のようなラグジュアリーなドキュメンタリースタイル、温かく魅力的な雰囲気、プロ仕様の4K。音声:かすかな足音、遠くの街のかすかな雰囲気、柔らかなピアノの音、セリフなし、字幕なし

画像からビデオへの Veo 3.1 プロンプト

画像から動画へのプロンプトが異なる理由

画像から動画への変換は仕組みが異なります。シーン全体を描写する必要はなくなり、被写体、照明、環境が画像に既に反映されます。

あなたの仕事は、単にそれをアニメーション化することだけです。

つまり、プロンプトが短くなります。通常は50~100語ですが、テキスト変換ビデオの場合は100~180語になります

CCADフレームワーク

CCAD フレームワークを使用して、画像からビデオへのプロンプトを表示できます。

  • [カメラ] – カメラはどのように動くべきでしょうか?
  • [C]人物– 画像に写っている人物または物(簡単に言えば、画像に写っている人物または物)
  • [A]ction – どのようなアクションを実行する必要がありますか?
  • [対話] – 彼らは何を言うべきでしょうか?

毎回4つの要素をすべて盛り込む必要はありません。多くの優れたクリップではセリフが完全に省略されており、中には登場人物のセリフが省略されているものもあります。重要なのは、何を動かし、何を聞かせる必要があるのか​​を具体的に伝えることです。

完全な例

1. プロフェッショナルポートレートからアニメーションへ

参考画像: デスクにいるプロの女性とノートパソコン


プロンプト:

  • カメラ: 3秒かけてワイドからミディアムクローズアップへゆっくりプッシュイン
  • キャラクター: デスクに座る女性プロフェッショナル
  • アクション: 彼女はノートパソコンにタイピングし、一時停止して、知ったような笑顔でカメラを見上げ、再び下を見る
  • 対話: 「これで大丈夫」
  • 音声: 微かなキーボードの音と柔らかなオフィスのざわめき


2. 商品アニメーション(高級時計)

参考画像: 大理石の上に置かれた高級時計



プロンプト:

  • カメラ: 時計の周囲をゆっくり360度ジンバル回転させ、中央にフレームを収める
  • アクション: 時計がゆっくり回転し、全角度を見せ、光が磨かれた表面に反射する
  • 音声: 機械式時計の秒針のリアルな音、リズミカルで静か、対話はなし

3. 旅行写真から動画へ

参考画像: 夕暮れ時の運河の写真



プロンプト:

  • カメラ: カメラはゆっくり前方に30%進み、微細なパララックス効果を付与
  • アクション: 元のフレームと色調を維持しつつ、水面にさざ波を作り、流れる雲を動かす
  • 音声: ソフトな都市のアンビエントサウンドと水のさざ波の音

タイムスタンプを使ったプロンプト:複数シーン動画作成方法

Veo 3.1 では、タイムスタンプ プロンプトという強力な新機能が追加されました。

一つの8秒動画内にシーケンス全体を作成できます。クリップを短い時間単位に分割します。例:

  • [00:00–00:02]
  • [00:02–00:04]
  • [00:04–00:06]

各ブロックはVeo 3.1に、その時点でのカメラ動作、アクション、対話を伝えます。

これにより可能になるのは:

  • アングルの切り替え
  • 新アクションの導入
  • ロケーションの切り替え
  • キャラクターの一貫性維持

すべて一つのプロンプトで完結します。

マルチショットシーン例

[00:00-00:02] 若い女性探検家が背負ったレザーサッチェルと乱れた茶髪のポニーテールで中距離ショット。彼女はジャングルの大きなツタを押しのけて隠れ道を見つける。

[00:02-00:04] 探検家のそばかすの多い顔の逆ショット。古代の苔むした遺跡を背景に驚きの表情。効果音:葉のざわめき、遠くの鳥のさえずり。

[00:04-00:06] 追従ショット。探検家が空き地に入り、壊れかけた石壁の彫刻に手を触れる。感情:驚きと畏怖。

[00:06-00:08] 高角の広角クレーンショット。巨大なジャングルに半飲み込まれた、忘れられた寺院の中心に立つ孤高の探検家。効果音:穏やかなオーケストラの高まり。

1000以上のアカウントに動画を投稿する方法

こうすれば、あなたのVeo 3.1動画は映画のように見え、プロフェッショナルな仕上がりになります。ただ、作成だけでなく公開も必要です。

手動で10、50、100アカウントにアップロードするのは時間がかかりますし、同じデバイスから投稿するのはリスクです。プラットフォームはIPやデバイスの指紋を検知し、シャドウバンやアカウント停止を引き起こすことがあります。

GeeLarkとは何ですか?

GeeLarkはクラウドフォンと偽装ブラウザの二つの強力なツールを一つのプラットフォームに統合しています。これにより、多数のアカウントを安全に操作し、一つのダッシュボードから管理できます。物理的な端末や複数のデバイスは不要です。それぞれのクラウドフォンやブラウザプロフィールは独立した環境で完全に自己完結して動作します。

数十、または数百のアカウントを管理しても、検出や凍結の心配はありません。

AIビデオ作成の自動化:GeeLarkワークフロー

あなたはAI動画を作成し、すぐにアカウントへ公開できるシンプルなワークフローを手にします。すべて同一場所で完結し、手順も簡単です。以下の4ステップで完了します。

ステップ1:動画を生成しよう

GeeLarkのAIセクション(ライブラリー → AI)を開きます。




「テキストから動画」または「画像から動画」を選択し、プロンプトを記入、モデルを選び、フォーマット設定、サウンド生成の有無を選択し、「送信」をクリックします。



生成された動画は自動で「ライブラリー」に保存されます。

ステップ2: 自動化テンプレートを選択する

次に、「自動化 → マーケットプレイス」から、「TikTok動画投稿」のテンプレートを選びます。これにより、ライブラリーの動画を複数のTikTokアカウントに自動投稿可能となります。

ステップ3:「TikTok動画投稿」を設定する

投稿する動画とターゲットアカウント(10、50、またはそれ以上)、スケジュール設定、タイトル、キャプション、AIタグのカスタマイズを行い、「公開を確定」をクリック。あとはGeeLarkにお任せです。

ステップ4:クラウドでタスクを自動化する

スケジュールを設定すると、GeeLarkが選択した時間に自動的にTikTokに動画を投稿します。クラウド上で動作しているため、GeeLarkを閉じたりPCをシャットダウンしても動き続けます。24時間365日、常に正確に投稿します。