これまでX(旧Twitter)のAI「Grok(グロック)」のことを馬鹿にしていましたが…アプリ内で使えるGrokではなく、ブラウザなどからアクセスできる「Grok.com」を使ったら、基本は無料だし動画生成の精度も高いし、日本語、英語などのセリフも使えて便利だったので簡単に紹介します。
実際に「Grok(グロック)」で作った動画
- アカウントがあれば無料で始められる(回数制限はあるけど十分使えるレベル)
- 動画のクオリティが高く、動きが自然
- 日本語・英語のセリフにも対応
- 生成速度も速くてサクサク
まずはベースになる画像を作る

Grok.comにアクセスすると、左側にいくつかアイコンが表示されています。ここから「Imagine」と書いてあるアイコンを選びます。これが画像と動画を生成するAIになっています。Grok Imagineのすごいところは、プロンプトを入れた瞬間、爆速で画像が次々と生成されることです。

画像のアスペクト比も選べます。今回は最終的にSNSなどで使うショート動画を作りたいので、縦長の9:16を選びました。プロンプトは「写真を撮る女の子 ジブリ風のイラスト」と入れ画像を生成します。

これだけで次々と画像が生成されます。下にスクロールしていけば延々と生成されてマジで凄い。まずは、この中から好きなイラストを選びます。

まずは、この画像を保存して、それから画像右上に表示されている「画像を編集」をクリックします。そうすると、この画像をさらに編集することができます。今回は「この女の子の全身 カメラは首から下げる 背景は白」と入れてみました。

こうすることで、女の子だけのイラストが完成します。あとは、この子をどういうシーンで使いたいのか考えて、同じように画像を編集します。今回は「この子が街で写真を撮っているシーン カメラは1台」と入れました。

「この子が街で写真を撮っているシーン」と入れただけだと、カメラが2台になったりしたので「カメラは1台」と追記しました。最初のイラストより子供っぽくなったり、AIなので完璧ではありませんが、なんとなくイメージしていたイラストが完成しました。
画像からセリフ付きの動画を生成する

次はプロンプト入力欄の右側から動画のアイコンを選び、キャラクターに話してもらいたいセリフなどを含めたプロンプトを決めます。今回は「この子が街で写真を撮っているシーン「今日は写真を撮るわよー」と言う ASMR。BGMはなし」としました。
個人的に気に入っているのは「ASMR」と「BGMはなし」と入れることです。こうすると、足音や街の音がリアルに再現されつつ、邪魔なBGMも入らないので動画の素材として使いやすくなります。
Grokで作る動画は6秒と制限があるので、複数の動画を作ってから編集ソフトで繋げるのがおすすめです。
動画生成AIだと「Sora 2」や「Veo 3.1」なども人気ですが、Grokはある程度の数だったら無料で動画を作ることができるので、しばらく動画生成のメインとして使ってみます。気になった方はお試しを。それじゃ!また!




