本文介紹如何在Google Colab中使用Open AI的Whisper語音轉文字API將音頻或視頻轉換為SRT文件並導入《簡憶生詞本》的音頻目錄，以便學習和記憶其中的單字並練習外語聽力。

2. 點擊「添加筆記本」，在上方「代碼執行程序」菜單中選擇「更改運行時類別」，在「硬件加速器」中選擇GPU。

3. 在筆記本中輸入以下代碼並點擊左側運行按鈕：

!pip install git+https://github.com/openai/whisper.git

!sudo apt update && sudo apt install ffmpeg

4. 如果要提取視頻文件中的文本，可以在Mac上輸入以下命令將視頻轉換為mp3：

brew install ffmpeg

ffmpeg -I input.mp4 input.mp3

5. 點擊Colab左側目錄圖標，將音頻文件拖拽到Colab文件視圖中並等待上傳完成。

6. 在筆記本中輸入以下代碼並運行：

!whisper input.mp3 —-model medium （英文語音使用）

!whisper input.mp3 —-model medium —-language ja （日語語音使用）

7. 運行完成後，在左側文件視圖中選擇input.srt，並點擊右側三個圓點，選擇「下載」。

8. 打開《簡憶生詞本》APP，點擊添加目錄，並選擇「添加音頻目錄（文件）」或「添加視頻目錄（文件）」，並選擇視頻或語音文件的位置。

9. 在新添加的音頻/視頻目錄中，點擊右上角三個圓點的圖標，並選擇「導入歌詞、字幕文件」，並選擇剛剛下載的SRT文件。

使用Google Colab和OpenAI語音轉文字API（Whisper）提取並學習音頻、視頻中的單字

評論