■ HOME

Whisper faster-whisper 字幕作成の導入方法(備忘録)[2026-03-30]

whisper(音声認識システム) OpenAI社
2022年9月21日リリース(オープンソース)無料
2024年10月1日最新版

faster-whisper(音声認識システム)Speech Recognition System
2023年3月23日リリースver.0.2.0(オープンソース)無料
OpenAIのWhisperモデルを再実装し高速に動作
2025年10月31日最新版

faster-whisper がリリースされる前の whisper から使っているが、
導入がやや面倒なので備忘録として残しておく。
検索すれば他のサイトで丁寧に画像付きなどで掲載されている。。。

--------------------------------------------------------------------

A. 環境構築

※重要:CUDA バージョン と Pytorch バージョン が合わないと動かない
CUDA バージョンはインストールできるグラボによる
CUDA バージョンに合った Pytorch を入れる
CPU 用の Pytorch もある

--------------------------------------------------------------------

1. Python のインストール

コマンド

      python --version

なければダウンロードしてインストール

https://www.python.org/downloads/
https://www.python.org/ftp/python/3.14.3/python-3.14.3-amd64.exe

コマンド cmd から python に切り替え

      python
終了は
      exit()
コマンド終了は
      exit

--------------------------------------------------------------------

2. pip のインストール(pip はPythonのパッケージ管理ツール)

Python 3.4以降をインストールすると標準で付属

確認コマンド

     pip

「pipコマンドが見つかりません」>コマンドで
      where python
C:\Users\username\AppData\Local\Programs\Python\Python310\python.exe
Programsの方のPythonのパスをコピー
Windowsのスタートボタンを押し、「環境変数」と入力 >「システム環境変数の編集」
>「環境変数」ボタン
ユーザ環境変数の中から「Path」を選択 >編集ボタン
C:\Users\username\AppData\Local\Programs\Python\Python310\Scripts\
C:\Users\username\AppData\Local\Programs\Python\Python310\
を編集または新規で作る。またはディレクトリ指定

Python 3.4より前

ダウンロード先:https://bootstrap.pypa.io/get-pip.py
pythonのファイルを任意のディレクトリに保存
保存ディレクトリでコマンド
(フォルダのアドレスバーに「cmd」& Enterキーでそのディレクトリで立ち上がる)
      python get-pip.py

バージョン確認コマンド -V (大文字のV)

      pip -V

pipを最新にアップデート

  python -m pip install --upgrade pip

パッケージの確認コマンド

  pip list

または

  pip3 list

--------------------------------------------------------------------

3. Cuda Toolkit のインストール

バージョンは手持ちのグラフィックボードによる

コマンド

CUDAの確認コマンド
      nvcc --version

Cuda Toolkit (CUDA と Pytorch のバージョンをそろえる)

ダウンロード例 cuda 12.1.0

Windows11
https://developer.nvidia.com/cuda-12-1-0-download-archive?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_local

Windows10
https://developer.nvidia.com/cuda-12-1-0-download-archive?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exe_local

--------------------------------------------------------------------

4. Pytorch のインストール(Python必要)

(例)
CUDA 12.1に対応するPyTorchの主なバージョン
2.1.0、2.1.1、2.1.2、2.2.x、2.3.x、2.4.x、2.5.x、および最新の2.6.x
( torchバージョン+cu121 )というCUDAバージョンの接尾辞が付いたビルドで提供

pip パッケージのリスト確認コマンド torch があるか

  pip3 list

または

コマンドからPythonに切り替え、python コマンドを実行して、現在のPyTorchバージョンを確認

      python
      import torch
      print(torch.__version__)
なければ終了し
      exit()
コマンドに戻ってインストール

適切なバージョンを pipコマンドでインストール

CPUの場合
    pip3 install torch torchvision

CUDA 12.6 最新だが
    pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu126

CUDA 12.1 なので
    pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu121

CUDAとバージョンが合わなければアンインストールしてやり直す
    pip3 uninstall torch torchvision torchaudio

確認 python コマンドから(PyTorch + CUDA のバージョン)

C:\Users\..........>python
Python 3.10.9 ....
>>> import torch
>>> print(torch.__version__)
2.5.0+cu121

または pip のリストコマンドで確認

  pip3 list

--------------------------------------------------------------------

5. ffmpeg のインストール

https://github.com/BtbN/FFmpeg-Builds/releases

ダウンロードして任意の場所に解凍
Auto-Build 2026-03-27 13:10(ビルドが自動なんだね。。。)
ffmpeg-N-123627-g5dfe661f03-win64-gpl.zip
https://github.com/BtbN/FFmpeg-Builds/releases/download/autobuild-2026-03-27-13-10/ffmpeg-N-123627-g5dfe661f03-win64-gpl.zip

FFmpeg の Pathを通す

Windowsの検索欄に「システム環境変数の編集」と入力してエンターキーか、リストアップからクリック。
または デスクトップのPCアイコンを右クリック >プロパティ >システムの詳細設定。

>「環境変数」ボタン

ユーザー環境変数
「Path」
「新規作成」
FFmpeg.exe までのPathを通す

C:\ffmpeg\ffmpeg.exe
なら
C:\ffmpeg\
または「ディレクトリの参照」で指定

--------------------------------------------------------------------

6. Gitのインストール(Whisperのインストールに必要)

https://gitforwindows.org/
https://github.com/git-for-windows/git/releases/tag/v2.53.0.windows.2

Git-2.53.0.2-64-bit.exe
または
Git-2.53.0.2-arm64.exe
ダウンロードしてインストール

確認コマンド

  git --version

Git のアンインストール

  Windowsの「設定」>「アプリ」>「インストールされているアプリ」から Git を見つけ
      右の「...」ポップアップメニューをクリック >アンインストール

--------------------------------------------------------------------

7. Whisperのインストール

  pip install git+https://github.com/openai/whisper.git

  Whisperの再インストール オプション: -U (最新版にアップグレード)

  pip install -U openai-whisper

  ヘルプ whisper
  whisper -h

または(または両方)

7. faster-whisperのインストール

    pip install git+https://github.com/guillaumekln/faster-whisper.git

    faster-whisper の再インストール オプション: -U (最新版にアップグレード)
   
    pip install -U faster-whisper

    [notice] A new release of pip is available: 24.3.1 -> 26.0.1

    <faster-whisper>オプション
    model_size : 使用するモデルのサイズを指定
    device="cuda" : モデルをGPUで実行
    compute_type="float16" : 計算に半精度浮動小数点を使用>高速化とメモリ使用量の削減
    beam_size=5 : ビームサーチデコーディングのビームサイズを指定(候補数だけ考慮)
       >大きいほど正確な文字起こし
    など。。。

Whisper faster-whisper のアンインストール コマンド

    pip uninstall whisper openai-whisper faster-whisper

Whisperも初期と比べて速くなったようだが私の低いVRAMではfaster-whisperに軍配が上がる
   基本どちらも大きいモデルほど精度は高い
Whisper (model VRAM) 目安
   tiny 1GB : base 1GB : small 2GB : medium 5GB : large 10GB : turbo 6GB

   今は英語のみ日本語のみなど言語特化したモデルもでているみたい。

--------------------------------------------------------------------
B. 使用 faster-whisper-xxl
--------------------------------------------------------------------

(コマンド例)

  whisper video.mkv

  だけでも自動で言語を判別してやってくれる。
      日本語と分かっているなら

      whisper video.mkv --language ja

     と指定すると開始が少しだけ早くなる。
     出力は指定なしでもソースと同じ場所

<指定モデル と GPUメモリサイズ の目安>

Whisper Large v3 (高精度): 10GB〜12GB+
Whisper Turbo (高速・高精度): 6GB〜8GB程度
Medium: 4GB〜6GB程度
Small / Base: 2GB〜4GB程度

高速化とメモリ使用量の削減オプションだが、指定しなくてもそれなりにやってくれる
(例)--compute_type int8_float16
[--compute_type {default,auto,int8,int8_float16,int8_float32,
int8_bfloat16,int16,float16,float32,bfloat16}]

(コマンド例)

日本語会話の動画「video.mkv」を指定。
モデルは GPUが4GBなので「medium」を指定。
出力はソースと同じ場所(指定しないとFaster-Whisperのディレクトリに保存される)。

日本語を字幕にして出力(自動判定)。
      faster-whisper-xxl video.mkv --model medium --output_dir source

日本語を英語に翻訳して出力。
      faster-whisper-xxl video.mkv --language English --model medium --output_dir source

翻訳言語指定省略(大文字小文字を区別するので注意 X english > 〇 English)
    --language en
    --language ja

ヘルプ
      faster-whisper-xxl -h

cayonzen [2026-03-30]

--------------------------------------------------------------------
<おまけ>
--------------------------------------------------------------------

ffmpegを入れたのでffprobeにファイル情報を調べてもらう
メモ帳で作って拡張子を.batに変更

バッチファイル「mp4_info_D&D .bat」

echo off
setlocal disabledelayedexpansion

echo ドラッグ&ドロップ >ファイル情報 Drag and drop > File information

for %%f in (%*) do (
set fpass=%%f
set fn=%%~nf
set fnx=%%~nxf
set fx=%%~xf

call :sub
)

endlocal

pause
exit

:sub

echo ---------------------------------------------------------------
echo ファイル情報 File information
echo ------------
ffprobe -hide_banner -i "%fnx%"

exit /b

--------------------------------------------------------------------