■ HOME
Whisper faster-whisper 字幕作成の導入方法(備忘録)[2026-03-30]
whisper(音声認識システム) OpenAI社
2022年9月21日リリース(オープンソース)無料
2024年10月1日最新版
faster-whisper(音声認識システム)Speech Recognition System
2023年3月23日リリースver.0.2.0(オープンソース)無料
OpenAIのWhisperモデルを再実装し高速に動作
2025年10月31日最新版
faster-whisper がリリースされる前の whisper から使っているが、
導入がやや面倒なので備忘録として残しておく。
検索すれば他のサイトで丁寧に画像付きなどで掲載されている。。。
--------------------------------------------------------------------
A. 環境構築
※重要:CUDA バージョン と Pytorch バージョン が合わないと動かない
CUDA バージョンはインストールできるグラボによる
CUDA バージョンに合った Pytorch を入れる
CPU 用の Pytorch もある
--------------------------------------------------------------------
1. Python のインストール
コマンド
python --version
なければダウンロードしてインストール
https://www.python.org/downloads/
https://www.python.org/ftp/python/3.14.3/python-3.14.3-amd64.exe
コマンド cmd から python に切り替え
python
終了は
exit()
コマンド終了は
exit
--------------------------------------------------------------------
2. pip のインストール(pip はPythonのパッケージ管理ツール)
Python 3.4以降をインストールすると標準で付属
確認コマンド
pip
「pipコマンドが見つかりません」>コマンドで
where python
C:\Users\username\AppData\Local\Programs\Python\Python310\python.exe
Programsの方のPythonのパスをコピー
Windowsのスタートボタンを押し、「環境変数」と入力 >「システム環境変数の編集」
>「環境変数」ボタン
ユーザ環境変数の中から「Path」を選択 >編集ボタン
C:\Users\username\AppData\Local\Programs\Python\Python310\Scripts\
C:\Users\username\AppData\Local\Programs\Python\Python310\
を編集または新規で作る。またはディレクトリ指定
Python 3.4より前
ダウンロード先:https://bootstrap.pypa.io/get-pip.py
pythonのファイルを任意のディレクトリに保存
保存ディレクトリでコマンド
(フォルダのアドレスバーに「cmd」& Enterキーでそのディレクトリで立ち上がる)
python get-pip.py
バージョン確認コマンド -V (大文字のV)
pip -V
pipを最新にアップデート
python -m pip install --upgrade pip
パッケージの確認コマンド
pip list
または
pip3 list
--------------------------------------------------------------------
3. Cuda Toolkit のインストール
バージョンは手持ちのグラフィックボードによる
コマンド
CUDAの確認コマンド
nvcc --version
Cuda Toolkit (CUDA と Pytorch のバージョンをそろえる)
ダウンロード例 cuda 12.1.0
Windows11
https://developer.nvidia.com/cuda-12-1-0-download-archive?target_os=Windows&target_arch=x86_64&target_version=11&target_type=exe_local
Windows10
https://developer.nvidia.com/cuda-12-1-0-download-archive?target_os=Windows&target_arch=x86_64&target_version=10&target_type=exe_local
--------------------------------------------------------------------
4. Pytorch のインストール(Python必要)
(例)
CUDA 12.1に対応するPyTorchの主なバージョン
2.1.0、2.1.1、2.1.2、2.2.x、2.3.x、2.4.x、2.5.x、および最新の2.6.x
( torchバージョン+cu121 )というCUDAバージョンの接尾辞が付いたビルドで提供
pip パッケージのリスト確認コマンド torch があるか
pip3 list
または
コマンドからPythonに切り替え、python コマンドを実行して、現在のPyTorchバージョンを確認
python
import torch
print(torch.__version__)
なければ終了し
exit()
コマンドに戻ってインストール
適切なバージョンを pipコマンドでインストール
CPUの場合
pip3 install torch torchvision
CUDA 12.6 最新だが
pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu126
CUDA 12.1 なので
pip3 install torch torchvision --index-url https://download.pytorch.org/whl/cu121
CUDAとバージョンが合わなければアンインストールしてやり直す
pip3 uninstall torch torchvision torchaudio
確認 python コマンドから(PyTorch + CUDA のバージョン)
C:\Users\..........>python
Python 3.10.9 ....
>>> import torch
>>> print(torch.__version__)
2.5.0+cu121
または pip のリストコマンドで確認
pip3 list
--------------------------------------------------------------------
5. ffmpeg のインストール
https://github.com/BtbN/FFmpeg-Builds/releases
ダウンロードして任意の場所に解凍
Auto-Build 2026-03-27 13:10(ビルドが自動なんだね。。。)
ffmpeg-N-123627-g5dfe661f03-win64-gpl.zip
https://github.com/BtbN/FFmpeg-Builds/releases/download/autobuild-2026-03-27-13-10/ffmpeg-N-123627-g5dfe661f03-win64-gpl.zip
FFmpeg の Pathを通す
Windowsの検索欄に「システム環境変数の編集」と入力してエンターキーか、リストアップからクリック。
または デスクトップのPCアイコンを右クリック >プロパティ >システムの詳細設定。
>「環境変数」ボタン
ユーザー環境変数
「Path」
「新規作成」
FFmpeg.exe までのPathを通す
C:\ffmpeg\ffmpeg.exe
なら
C:\ffmpeg\
または「ディレクトリの参照」で指定
--------------------------------------------------------------------
6. Gitのインストール(Whisperのインストールに必要)
https://gitforwindows.org/
https://github.com/git-for-windows/git/releases/tag/v2.53.0.windows.2
Git-2.53.0.2-64-bit.exe
または
Git-2.53.0.2-arm64.exe
ダウンロードしてインストール
確認コマンド
git --version
Git のアンインストール
Windowsの「設定」>「アプリ」>「インストールされているアプリ」から Git を見つけ
右の「...」ポップアップメニューをクリック >アンインストール
--------------------------------------------------------------------
7. Whisperのインストール
pip install git+https://github.com/openai/whisper.git
Whisperの再インストール オプション: -U (最新版にアップグレード)
pip install -U openai-whisper
ヘルプ whisper
whisper -h
または(または両方)
7. faster-whisperのインストール
pip install git+https://github.com/guillaumekln/faster-whisper.git
faster-whisper の再インストール オプション: -U (最新版にアップグレード)
pip install -U faster-whisper
[notice] A new release of pip is available: 24.3.1 -> 26.0.1
<faster-whisper>オプション
model_size : 使用するモデルのサイズを指定
device="cuda" : モデルをGPUで実行
compute_type="float16" : 計算に半精度浮動小数点を使用>高速化とメモリ使用量の削減
beam_size=5 : ビームサーチデコーディングのビームサイズを指定(候補数だけ考慮)
>大きいほど正確な文字起こし
など。。。
Whisper faster-whisper のアンインストール コマンド
pip uninstall whisper openai-whisper faster-whisper
Whisperも初期と比べて速くなったようだが私の低いVRAMではfaster-whisperに軍配が上がる
基本どちらも大きいモデルほど精度は高い
Whisper (model VRAM) 目安
tiny 1GB : base 1GB : small 2GB : medium 5GB : large 10GB : turbo 6GB
今は英語のみ日本語のみなど言語特化したモデルもでているみたい。
--------------------------------------------------------------------
B. 使用 faster-whisper-xxl
--------------------------------------------------------------------
(コマンド例)
whisper video.mkv
だけでも自動で言語を判別してやってくれる。
日本語と分かっているなら
whisper video.mkv --language
ja
と指定すると開始が少しだけ早くなる。
出力は指定なしでもソースと同じ場所
<指定モデル と GPUメモリサイズ の目安>
Whisper Large v3 (高精度): 10GB〜12GB+
Whisper Turbo (高速・高精度): 6GB〜8GB程度
Medium: 4GB〜6GB程度
Small / Base: 2GB〜4GB程度
高速化とメモリ使用量の削減オプションだが、指定しなくてもそれなりにやってくれる
(例)--compute_type int8_float16
[--compute_type {default,auto,int8,int8_float16,int8_float32,
int8_bfloat16,int16,float16,float32,bfloat16}]
(コマンド例)
日本語会話の動画「video.mkv」を指定。
モデルは GPUが4GBなので「medium」を指定。
出力はソースと同じ場所(指定しないとFaster-Whisperのディレクトリに保存される)。
日本語を字幕にして出力(自動判定)。
faster-whisper-xxl video.mkv --model medium --output_dir source
日本語を英語に翻訳して出力。
faster-whisper-xxl video.mkv --language English --model medium --output_dir source
翻訳言語指定省略(大文字小文字を区別するので注意
X english > 〇 English)
--language en
--language ja
ヘルプ
faster-whisper-xxl -h
cayonzen [2026-03-30]
--------------------------------------------------------------------
<おまけ>
--------------------------------------------------------------------
ffmpegを入れたのでffprobeにファイル情報を調べてもらう
メモ帳で作って拡張子を.batに変更
バッチファイル「mp4_info_D&D .bat」
echo off
setlocal disabledelayedexpansion
echo ドラッグ&ドロップ >ファイル情報 Drag and drop > File information
for %%f in (%*) do (
set fpass=%%f
set fn=%%~nf
set fnx=%%~nxf
set fx=%%~xf
call :sub
)
endlocal
pause
exit
:sub
echo ---------------------------------------------------------------
echo ファイル情報 File information
echo ------------
ffprobe -hide_banner -i "%fnx%"
exit /b
--------------------------------------------------------------------