많은 자기 미디어를 운영하는 친구들은 자신의 영상에 자막 파일을 생성하는 방법에 대해 어려움을 겪을 수 있습니다. 초기에는 몇몇 친구들이 청취를 통해 자막을 만드는 방법을 사용하기도 했지만, 이후 Open AI는 그들의 Whisper 언어 모델을 오픈 소스로 공개했습니다. 이 모델은 매우 효율적으로 작동하지만, 일부 친구들에게는 Python 명령을 이해하는 것이 필요하며, 이는 학습 장벽이 될 수 있습니다.

그래서 열성적인 엔지니어인 Konstantin은 Whisper Desktop이라는 새로운 오픈 소스 프로젝트를 개발했습니다. Whisper Desktop을 사용하면 사용자는 더 이상 Python 명령을 이해하는 것이 필요하지 않습니다. 대신 친숙한 GUI 인터페이스를 통해 영상의 자막 파일을 쉽게 출력할 수 있습니다!

바로가기

Whisper Desktop (위스퍼 데스크톱) 소개

프로젝트 명칭	Whisper Desktop
용도	영상의 자막 파일을 원 클릭으로 자동 생성
비용	무료
프로젝트 웹 주소	https://github.com/Const-me/Whisper
소프트웨어 다운로드 주소	https://github.com/Const-me/Whisper/releases
언어 모델 다운로드 주소	https://huggingface.co/ggerganov/whisper.cpp/tree/main

Whisper Desktop 설치 안내

단계 1 | Whisper Desktop 소프트웨어 압축 파일 다운로드

1.먼저 소프트웨어 배포 페이지를 엽니다. 여기에서는 소프트웨어의 다양한 배포 버전 다운로드 자원이 표시됩니다. 일반적으로 최신 버전을 선택하여 다운로드합니다. 최신 버전을 찾으면 “WhisperDesktop.zip”을(를) 클릭하여 다운로드합니다.

whisperDesktop-export-subtitle-from-video-1

2.다운로드가 완료되면, 해당 파일을 압축 해제하게 됩니다. 그 결과 아래와 같은 내용을 볼 수 있습니다.

whisperDesktop-export-subtitle-from-video-2

단계 2 | Whisper 언어 모델 다운로드

1.먼저 우리는 Whisper 개발 웹페이지에 접속하여 어떤 사양의 모델이 우리에게 가장 적합한지를 파악합니다. 이 페이지에서는 다음과 같은 표를 찾을 수 있습니다.

whisperDesktop-export-subtitle-from-video-3

Booster는 이 표를 아래와 같이 정리하여 우리가 필요로 하는 모델의 사양을 더 잘 이해할 수 있도록 하였습니다.

크기	훈련 파라미터	영어만 지원하는 모델	다언어 지원 모델	필요한 GPU 메모리 용량	자막 파일 출력 속도
tiny(미니)	3900만	tiny.en	tiny	약 1GB	초고속
base(베이스)	7400만	base.en	base	약 1GB	빠름
small(소규모)	2억 4400만	small.en	small	약 2GB	꽤 빠름
medium(중규모)	7억 6900만	medium.en	medium	약 5GB	느림
large(대규모)	15억 5500만	제공되지 않음	large	약 10GB	초느림

여기에서 Booster는 【필요한 GPU 메모리 용량】에 따라 선택하도록 권장합니다. 예를 들어, 컴퓨터의 GPU 메모리가 8GB인 경우, medium을 선택할 수 있습니다. 16GB인 경우 large를 선택할 수 있습니다.

2.사양을 결정한 후, 모델 다운로드 페이지로 이동하여 모델을 다운로드합니다. 예를 들어, medium 사이즈이면서 다언어 지원 모델을 사용하려면, 【ggml-medium.bin】을 찾아서 【오른쪽 아이콘】을 클릭하여 다운로드합니다.

whisperDesktop-export-subtitle-from-video-4

3.다운로드가 완료되면 편의를 위해 모델 파일을 WhisperDesktop 폴더에 넣을 수 있습니다. 아래 그림을 참조하세요.

whisperDesktop-export-subtitle-from-video-5

단계 3 | WhisperDesktop을 열고 언어 모델을 로드

1.【마우스 왼쪽 버튼을 두 번 클릭하여 WhisperDesktop을 실행】하세요.

whisperDesktop-export-subtitle-from-video-6

2.첫 번째 실행 시, 프로그램은 언어 모델의 경로를 제공하라는 요청이 표시됩니다. 이때, 【Model Path】에서 방금 다운로드한 모델 파일을 선택하면 됩니다. 【Model Implementation】 부분에서는 기본값으로 【GPU】를 사용합니다. 완료되면 【OK】 버튼을 눌러주세요. 이로써 모든 설치 설정이 완료되었습니다!

whisperDesktop-export-subtitle-from-video-7

Whisper Desktop 조작 안내

조작 예시 1 | 일반 영상 자막 생성

1.이전의 설치 설정을 완료한 후, 다음과 같은 화면이 표시됩니다. 차례대로, 영상 언어【Language】, 자막을 생성할 영상 파일【Transcribe File】, 생성될 자막 파일의 형식【Output Format】을 선택합니다. 자막 파일 형식의 부분에서는 【SubRip subtitle】을 선택하는 것이 좋습니다. 이것은 표준 자막 파일 형식으로 다양한 영상 소프트웨어 및 YouTube와 호환됩니다. 그런 다음, 【Place that file to the input folder】 옵션에 체크를 표시합니다. 이렇게 하면 자막 파일이 영상 파일과 같은 폴더에 직접 배치됩니다. 마지막으로, 【Transcribe】 버튼을 누릅니다.

whisperDesktop-export-subtitle-from-video-8

2.【Transcribe】 버튼을 클릭하면 진행률 표시줄이 나타나는 화면이 표시됩니다. 잠시 기다려주세요…

whisperDesktop-export-subtitle-from-video-9

3.진행률 표시줄이 완료되면 【Transcribe Completed】 창이 나타납니다. 이로써 자막 파일이 완료되었음을 나타냅니다.

whisperDesktop-export-subtitle-from-video-10

4.실제로 출력된 자막 파일을 열어보면 거의 변환 오류가 없는 것을 볼 수 있습니다. 멋지지 않나요?!

whisperDesktop-export-subtitle-from-video-11

조작 예시 2 | 영상을 먼저 영어 자막으로 번역한 후 생성

사실, Whisper Desktop은 일반 자막 파일 출력뿐만 아니라 영상을 영어 자막으로 번역하여 출력하는 기능도 지원합니다. 한번 시도해보세요!

1.프로그램 인터페이스의 오른쪽 위에 【Translate】 옵션이 표시됩니다. 이에 체크를 표시합니다. 그 다음, 【Transcribe】 버튼을 누릅니다.

whisperDesktop-export-subtitle-from-video-12

2.출력이 완료된 후, 자막 파일을 엽니다. Booster에서는 원래 자막과 영어로 번역된 자막을 동시에 엽니다. 어떠세요? 번역의 품질은 만족스러우셨나요? 멋지지 않나요?!

whisperDesktop-export-subtitle-from-video-13

요약

Whisper Desktop을 통해 우리는 쉽게 영상의 자막 파일을 생성하고, 내장된 번역 기능을 사용하여 자막을 영어로 변환하여 출력할 수 있습니다. 이는 일부 미디어 크리에이터에게 매우 편리한 도구입니다. 영상의 자막 파일을 생성해야하는 분들은 꼭 한번 시도해보세요.

boosterminiclass