Upload files to "/"

2024-06-27 21:03:11 +00:00 · 2024-06-27 21:03:11 +00:00 · a4f70ba965
parent 391bcea53f
commit a4f70ba965
2 changed files with 44 additions and 0 deletions
--- a/requirements.txt
+++ b/requirements.txt
@ -0,0 +1,2 @@
 pytube
 whisper
--- a/script.py
+++ b/script.py
@ -0,0 +1,42 @@
 from pytube import YouTube
 import whisper
 import os
 import re
 import warnings
 def sanitize_filename(filename):
    return re.sub(r'[\\/*?:"<>|]', '_', filename)
 def save_transcription(transcription, folder_path, file_name='transcription.txt'):
    file_path = os.path.join(folder_path, file_name)
    with open(file_path, 'w', encoding='utf-8') as file:
        file.write(transcription)
    return file_path
 def download_youtube_audio(url, folder_path):
    yt = YouTube(url)
    video_title = sanitize_filename(yt.title)
    folder_path = os.path.join(folder_path, video_title)
    os.makedirs(folder_path, exist_ok=True)
    audio_path = os.path.join(folder_path, 'audio.mp3')
    yt.streams.filter(only_audio=True).first().download(filename=audio_path)
    return audio_path, folder_path
 def transcribe_audio(audio_path, model_name='base'):
    warnings.filterwarnings("ignore", message="FP16 is not supported on CPU; using FP32 instead")
    model = whisper.load_model(model_name)
    result = model.transcribe(audio_path)
    return result['text']
 video_url = input("Enter the YouTube video URL: ")
 folder_path = 'Downloaded_Audios'
 audio_path, folder_path = download_youtube_audio(video_url, folder_path)
 transcription = transcribe_audio(audio_path)
 transcription_file_path = save_transcription(transcription, folder_path)
 print(f"Transcription saved to: {transcription_file_path}")
 print("\nTranscription:\n")
 print(transcription)