超時短AI自動字幕付けソフト「Vrew」

f:id:asobigurashi:20211221133040j:plain

youtube等で動画を投稿したり、結婚式のメッセージビデオ、

企業説明会の説明映像等、今や個人で気軽に映像を制作出来るというのがもう当たり前の様な時代になってきた。

PCでの本格的なソフトはもちろん、スマホでも便利な無料ソフトはいくつもあり、それにすぐに順応する若者は凄いなと思わされる。

スマホゲームなどの録画をそのままスマホでスイスイっと編集してyoutubeに投稿する子もいるくらいだから。

 

■忙しい現代人にこそ字幕が必要!?

動画投稿をかじり出すと一つの考えに必ず至る。

「字幕ってつけた方がいいのかな...?」と。

そして「そりゃあつけた方が見易いよな」と大多数が思うはずだが、

「字幕付け作業しんどい...」

と、これまた大多数の方が思う事だろう。

そうして、字幕の量を極力減らさざるを得なかったり、つけなかったりするようになっていく...。

 

ただまず安心してほしいのが、必ずしも字幕が付いているからといってそれだけで動画の再生数は伸びるわけではない。

動画が伸びるかどうかの要因とは別の所にある「字幕」は、

動画の、つまり視聴維持率(見続けてくれるかどうかの指標)やリピーターになってくれるかどうかという方面の意味合いが強いと私は考える。

 

動画を視聴するシチュエーションも千差万別だが、

通勤・通学途中、会社等でのハウツー系動画の確認、友達とカフェでお喋りしている時...など、音を出すのが余り好ましくない場面現代社会にも多い。

イヤホンをすれば...という意見もあるとは思うが、イヤホンを常備していない方もいるだろうし、そもそもめんどくさくて外でイヤホンを使う習慣が無いという方もいるだろう。

防犯・安全面の観点から電車内であろうと耳は塞がってないほうが良いという考え方もある。

そこまで来たら「その状況で動画見るなよ...」と思われるかもしれないが、それをクリエイター側の人間が言ってしまうとおしまいである。

 

やはり、どんな人でもどんな時でも手軽に動画を楽しめるように、を追求すべきだと思う。

 

アクション要素やビジュアル要素の強い動画等は少なめの字幕・テロップで十分であろうが、解説・攻略・連載系の動画はとにかく字幕を入れていく方針が望ましいと私は考えている。

 

■超時短!AIによる自動字幕付けソフト「Vrew」

字幕を付ける必要性を感じて頂いたところで、私も実際に使っている超便利ソフトを紹介しておく。

 

vrew.voyagerx.com

こちらがその「Vrew(ブリュー)」というソフト。

ややこしい英語のページでもないので、上記の公式HPよりすぐダウンロードして簡単に始められると思う。

 

そして、こちらのソフトは基本的な機能に限れば無料で使用でき日数制限等は存在しない。(高機能な有料版もあり)

基本的な機能だけでyoutube動画を作成するには十分すぎるくらい。

※制限無しで使用するにはメールアドレスでの無料会員登録は必要

 

■無料で高性能!他ソフトとの互換性も

一度使用してみて頂ければ分かるが、このソフトは字幕付けという機能がメインではあるが、「字幕自動付け機能が凄い動画編集ソフト」と言えるほど、このソフトで切り貼りなど動画編集する事も可能になっている。

 

f:id:asobigurashi:20211221152316p:plain

実際の編集画面がこちら。

上記はサンプル動画だが、イメージはこれですぐ捉えられるだろう。

左にプレビュー画面があり、右にタイムラインに沿って発言ごとの字幕文字が羅列されている。

AIの精度が滑舌等によって残念な部分はたまにあるものの、おおよそ9割ぐらいは自動変換をしてくれているイメージだ。

自分が録画した動画をいつものソフトでざっくりとトリミングしてから、その動画データをVrewに読み込んでも良いし、録画データそのまま(2時間まで)放り込んでも大丈夫だ。

 

10分も無い動画ならPCスペックにもよるが変換に1分もかからない。

一瞬で字幕付けが9割がた完成する。

後はAI変換の残念な部分を修正してやればいい。

 

もくもくと作業していて無音な部分等は字幕が基本的には入らないし、

無音部分をVrew上でカットして動画を短くトリミングする事も出来る

トリミングの仕方も、まるでメモ帳で文字を消すかの如く簡単に、

上記画面の右側で「該当の字幕部分を消すだけで良い」のだ。

 

もちろん皆様お持ちのフリーフォントなども使用可能だし、文節ごとに字幕の大きさ・カラー変更も簡単だ。

 

■最大にして最高のメリット

Vrewを使用する意味が全てここに集約されていると言っても良い。

「言葉の喋り出しタイミングは認識バッチリ」という点だ。

 

例えば動画冒頭で「どうもこんにちは」と挨拶したとして、

その「どうも」の「ど」のタイミングで画面下にパッと「どうもこんにちは」という字幕を表示するのがセオリーだろう。

(意図的な演出で出すテロップとは別として)

 

このVrew、仮に滑舌がダメダメで文字が変になっていたとしても、

その喋り出しのタイミングは99%以上の精度でバッチリ合わせてくれている。

 

字幕付けの作業が大変なのは、皆ここなのでは?

動画編集の画面で、動画音声を聞きながら言葉のタイミングを確認タイミングを合わせて文字テキストを挿入...編集...。

そこが一番時間が掛かるところでもあるため、これだけで価値のあるソフトだと言っても過言ではない。

 

■ここが欠点

AIの認識精度については、私は概ね気にならないぐらい良い感じだと思っているので今の所欠点とは感じていないが、強いて挙げるならこうだ。

  1. コラボ配信などで複数人で喋ると字幕がぐちゃぐちゃになる
  2. ゲーム内の音声も拾って字幕にするため話し声と被る

ゲーム音声も拾うのは認識精度が強いが故の悲しい事故みたいなものだ。

これはどちらも録画時に映像データ音声データ分けて保存する形式にしてさえいれば回避できる。

2人以上で一緒にゲームしている動画の字幕付けをしたことがある人なら分かって頂けると思うが、そのひと手間を加えたとしてもVrewを活用した方が圧倒的に作業が速い

 

■ おわり

Vrewの細かい説明等はまた後日。

永久保存版の取扱説明書の様な記事でも時間を見つけて作ることとしよう。

とは言え、編集画面も全て日本語なので、概ね操作で迷う事は無いのではなかろうか。色々と試してみてほしい。

字幕付け、あなたも作業時間を短縮したいなら「Vrew」、是非お試しあれ。

 

vrew.voyagerx.com