もっと速く! AviUtl 用自動文字起こしプラグイン「Subtitler」で large-v3-turbo を使う

oov
·

2024年9月8日に、Subtitler というプラグインをリリースしました。これは Whisper というプログラムを利用して AviUtl + 拡張編集の環境で音声から文字起こしを行い、テキストオブジェクトを生成するプラグインです。

その後、2024年10月2日に Whisper の開発元から large-v3-turbo というモデルが公開されました。これは簡単に言えば、ほんの少しだけ精度を犠牲にして高速に処理ができるモデルです。

この large-v3-turbo を Subtitler で使えるようにする方法を紹介します。

作業を始める前に

今回の説明は、紹介動画に従って既に環境を準備済みの人を想定しています。

Subtitler を未導入の方は紹介動画を見て導入してから、異なる環境を準備している方は適宜自分の環境に合わせて読み替えてください。

モデルのダウンロード

Faster-Whisper 用のモデルを配布されている方がいらっしゃるので、こちらから以下のファイルをダウンロードします。

config.json, model.bin, preprocessor_config.json, tokenizer.json, vocabulary.json

右側にある [↓] アイコンを押すとダウンロードできます。

ダウンロードしたファイルは、Faster-Whisper のプログラムがある場所にある _models フォルダーを開き、

Faster-Whisper と同じ場所にある _models フォルダー

その中に「faster-whisper-large-v3-turbo」というフォルダーを作成して、

「faster-whisper-large-v3-turbo」というフォルダーを作成

そのフォルダー内に配置してください。

これでファイルの準備は完了です。

large-v3-turbo の使い方

Subtitler でダウンロードした large-v3-turbo を使うには、モデルの入力欄に直接「large-v3-turbo」と書くだけです。

これでいつも通りに使えば、large-v3-turbo が使用できます。

よくある質問

  • なぜ large-v3-turbo だけは面倒な準備が必要なの?

    • モデルがリリースされたばかりで、まだ Faster-Whisper での自動ダウンロードに対応してないからです。