許多經營自媒體的朋友們可能會遇到一個困擾,那就是如何為自己的影片建立字幕檔。在最早期,有的朋友會透過聽打的方式來建立字幕,後來Open AI 開源了它們的Whisper語言模型,雖然執行的效率很高,但是會需要懂一些python的指令,這對一些朋友來說可能會是一個不小的學習障礙。
所以,有熱心的工程師(Konstantin)另外建立了一個新的開源項目-Whisper Desktop。透過Whisper Desktop,使用者不再需要去了解python的指令,而是可以直接透過友善的GUI介面,輕鬆的一鍵輸出影片的字幕檔囉!
Whisper Desktop 小簡介
| 項目名稱 | Whisper Desktop |
|---|---|
| 用途 | 一鍵自動將影片輸出字幕檔 |
| 費用 | 免費 |
| 項目網址 | https://github.com/Const-me/Whisper |
| 軟體下載地址 | https://github.com/Const-me/Whisper/releases |
| 語言模型下載地址 | https://huggingface.co/ggerganov/whisper.cpp/tree/main |
Whisper Desktop 安裝教學
步驟1 | 下載WhisperDesktop軟體壓縮包
1.首先,讓我們打開軟體發佈頁面。在這裡,我們會看到軟體各個發佈版本的下載資源。通常我們會直接選擇最新的版本來下載。找到最新的版本後,我們點擊【WhisperDesktop.zip】下載。

2.下載完畢之後,我們將它解壓縮,會看到以下的內容。

步驟2 | 下載Whisper語言模型
1.首先我們先到Whisper開發網頁了解哪一種規格的模型最適合我們使用。在這個頁面,我們可以找到這樣的表格。

Booster重新將這個表格整理如下,讓我們能更好的理解我們需要的模型規格:
| 尺寸 | 訓練參數 | 只支持英文的模型 | 支持多語言的模型 | 必要的顯示卡記憶體容量 | 字幕檔輸出速度 |
|---|---|---|---|---|---|
| tiny(迷你) | 3900萬 | tiny.en | tiny | 約1GB | 超級快 |
| base(基本) | 7400萬 | base.en | base | 約1GB | 快 |
| small(小規模) | 2億440萬 | small.en | small | 約2GB | 還可以 |
| medium(中規模) | 7億690萬 | medium.en | medium | 約5GB | 慢 |
| large(大規模) | 15億550萬 | 不提供 | large | 約10GB | 超級慢 |
在這裡,Booster會建議各位依照【必要的顯示卡記憶體容量】來做選擇。例如,如果我們的電腦顯卡記憶體有8GB,那麼我們就可以選擇medium。如果是16GB,那我們就可以選擇large。
2.決定好規格之後,我們就可以到模型下載頁面下載模型。例如:我想要使用medium並且支持多語言的模型,我就找到【ggml-medium.bin】並且點擊【右方的圖示】下載。

3.下載完成之後,為了使用上的方便,我們可以將這個模型檔案放到WhisperDesktop的資料夾之中。如下圖:

步驟3 | 打開WhisperDesktop並載入語言模型
1.使用【滑鼠左鍵雙擊WhisperDesktop】啟動程式。

2.第一次啟動時,程式會要求我們提供語言模型的路徑,這時,我們直接在【Model Path】選擇剛剛下載來的模型檔案就可以了。在【Model Implementation】的部份,我們直接使用預設的【GPU】即可。完成後,按下【OK】按鈕。到這裡我們就完成了所有的安裝設定囉!

Whisper Desktop 操作教學
操作實例1 | 一般影片字幕生成
1.在完成了上一節安裝設定後,我們會看到以下的畫面。我們依序選擇影片語言【Language】、需要輸出字幕的影片檔【Transcribe File】及輸出的字幕檔格式【Output Format】。在字幕檔格式的部份,建議可以選擇【SubRip subtitle】,因為這是一個標準的字幕檔格式,可以相容於各種影片軟體及Youtube。接著我們將【Place that file to the input folder】這個選項打勾,這樣字幕檔就會直接放置於影片檔的相同資料夾下了。最後,我們按下【Transcribe】按鈕。

2.按下Transcribe按鈕後,我們會看到這個介面出現了一個進度條。讓我們稍等片刻…。

3.當進度條跑完之後,會彈出一個【Transcribe Completed】視窗。這就表示我們的字幕檔已經輸出完成了。

4.實際將輸出的字幕檔打開,可以看到幾乎是沒有轉譯錯誤的,是不是很棒呢?!

操作實例2 | 將影片先翻譯成英文字幕再生成
事實上,Whisper Desktop除了支持一般的字幕檔輸出外,還支援將影片翻譯成英文字幕再輸出。讓我們來試試看吧!
1.在程式介面的右上方,我們可以看到【Translate】選項。我們先將它打勾。接著,再按下【Transcribe】按鈕

2.等待輸出完成之後,我們再將字幕檔打開。Booster這邊同時將原本的字幕和翻譯成英文的字幕同時打開。如何?翻譯的品質各位還能接受嗎?是不是很不錯呢?

總結
透過Whisper Desktop,我們可以很方便的幫我們的影片轉譯出字幕檔,並且還可以透過內置的翻譯功能,將字幕轉換成英文再輸出,這對於一些自媒體的創作者來說是一個非常便利的工具。有製作影片字幕檔需求的朋友務必要試試看。



