Whisper Desktop | 一鍵影片字幕生成(免費、開源、支持多國語言)

許多經營自媒體的朋友們可能會遇到一個困擾,那就是如何為自己的影片建立字幕檔。在最早期,有的朋友會透過聽打的方式來建立字幕,後來Open AI 開源了它們的Whisper語言模型,雖然執行的效率很高,但是會需要懂一些python的指令,這對一些朋友來說可能會是一個不小的學習障礙。

所以,有熱心的工程師(Konstantin)另外建立了一個新的開源項目-Whisper Desktop。透過Whisper Desktop,使用者不再需要去了解python的指令,而是可以直接透過友善的GUI介面,輕鬆的一鍵輸出影片的字幕檔囉!


Whisper Desktop 小簡介

項目名稱Whisper Desktop
用途一鍵自動將影片輸出字幕檔
費用免費
項目網址https://github.com/Const-me/Whisper
軟體下載地址https://github.com/Const-me/Whisper/releases
語言模型下載地址https://huggingface.co/ggerganov/whisper.cpp/tree/main

Whisper Desktop 安裝教學

步驟1 | 下載WhisperDesktop軟體壓縮包

1.首先,讓我們打開軟體發佈頁面。在這裡,我們會看到軟體各個發佈版本的下載資源。通常我們會直接選擇最新的版本來下載。找到最新的版本後,我們點擊【WhisperDesktop.zip】下載。

whisperDesktop-export-subtitle-from-video-1

2.下載完畢之後,我們將它解壓縮,會看到以下的內容。

whisperDesktop-export-subtitle-from-video-2

步驟2 | 下載Whisper語言模型

1.首先我們先到Whisper開發網頁了解哪一種規格的模型最適合我們使用。在這個頁面,我們可以找到這樣的表格。

whisperDesktop-export-subtitle-from-video-3

Booster重新將這個表格整理如下,讓我們能更好的理解我們需要的模型規格:

尺寸訓練參數只支持英文的模型支持多語言的模型必要的顯示卡記憶體容量字幕檔輸出速度
tiny(迷你)3900萬tiny.entiny約1GB超級快
base(基本)7400萬base.enbase約1GB
small(小規模)2億440萬small.ensmall約2GB還可以
medium(中規模)7億690萬medium.enmedium約5GB
large(大規模)15億550萬不提供large約10GB超級慢

在這裡,Booster會建議各位依照【必要的顯示卡記憶體容量】來做選擇。例如,如果我們的電腦顯卡記憶體有8GB,那麼我們就可以選擇medium。如果是16GB,那我們就可以選擇large。

2.決定好規格之後,我們就可以到模型下載頁面下載模型。例如:我想要使用medium並且支持多語言的模型,我就找到【ggml-medium.bin】並且點擊【右方的圖示】下載。

whisperDesktop-export-subtitle-from-video-4

3.下載完成之後,為了使用上的方便,我們可以將這個模型檔案放到WhisperDesktop的資料夾之中。如下圖:

whisperDesktop-export-subtitle-from-video-5

步驟3 | 打開WhisperDesktop並載入語言模型

1.使用【滑鼠左鍵雙擊WhisperDesktop】啟動程式。

whisperDesktop-export-subtitle-from-video-6

2.第一次啟動時,程式會要求我們提供語言模型的路徑,這時,我們直接在【Model Path】選擇剛剛下載來的模型檔案就可以了。在【Model Implementation】的部份,我們直接使用預設的【GPU】即可。完成後,按下【OK】按鈕。到這裡我們就完成了所有的安裝設定囉!

whisperDesktop-export-subtitle-from-video-7

Whisper Desktop 操作教學

操作實例1 | 一般影片字幕生成

1.在完成了上一節安裝設定後,我們會看到以下的畫面。我們依序選擇影片語言【Language】、需要輸出字幕的影片檔【Transcribe File】及輸出的字幕檔格式【Output Format】。在字幕檔格式的部份,建議可以選擇【SubRip subtitle】,因為這是一個標準的字幕檔格式,可以相容於各種影片軟體及Youtube。接著我們將【Place that file to the input folder】這個選項打勾,這樣字幕檔就會直接放置於影片檔的相同資料夾下了。最後,我們按下【Transcribe】按鈕。

whisperDesktop-export-subtitle-from-video-8

2.按下Transcribe按鈕後,我們會看到這個介面出現了一個進度條。讓我們稍等片刻…。

whisperDesktop-export-subtitle-from-video-9

3.當進度條跑完之後,會彈出一個【Transcribe Completed】視窗。這就表示我們的字幕檔已經輸出完成了。

whisperDesktop-export-subtitle-from-video-10

4.實際將輸出的字幕檔打開,可以看到幾乎是沒有轉譯錯誤的,是不是很棒呢?!

whisperDesktop-export-subtitle-from-video-11

操作實例2 | 將影片先翻譯成英文字幕再生成

事實上,Whisper Desktop除了支持一般的字幕檔輸出外,還支援將影片翻譯成英文字幕再輸出。讓我們來試試看吧!

1.在程式介面的右上方,我們可以看到【Translate】選項。我們先將它打勾。接著,再按下【Transcribe】按鈕

whisperDesktop-export-subtitle-from-video-12

2.等待輸出完成之後,我們再將字幕檔打開。Booster這邊同時將原本的字幕和翻譯成英文的字幕同時打開。如何?翻譯的品質各位還能接受嗎?是不是很不錯呢?

whisperDesktop-export-subtitle-from-video-13

總結

透過Whisper Desktop,我們可以很方便的幫我們的影片轉譯出字幕檔,並且還可以透過內置的翻譯功能,將字幕轉換成英文再輸出,這對於一些自媒體的創作者來說是一個非常便利的工具。有製作影片字幕檔需求的朋友務必要試試看。