Video hochladen
Wähle eine MP4-Datei zum Starten der Pipeline.
MP4 per Drag & Drop hier ablegen
oder klicken zum Auswählen
Sprechpausen erkennen
Silero VAD erkennt Sprach- und Pausensegmente im Video.
Parameter
Transkription
Faster-Whisper transkribiert die Sprache im Video. Du kannst auch eine vorhandene SRT hochladen.
Modell & Optionen
Oder: Vorhandenes Transkript hochladen
AD-Slots generieren
Wandle Sprechpausen in Audio-Deskriptions-Slots um und bewerte deren Qualität.
Parameter
Bilder extrahieren
SceneDetect identifiziert Szenen und extrahiert repräsentative Frames für jeden AD-Slot.
Parameter
Prompts & GPT-Konfiguration
Definiere System-Instruktion, User-Instruktion, AD-Regeln und Modell-Parameter.
System-Instruktion (Rolle & Grundregeln)
User-Instruktion (Aufgabe & Format)
AD-Regeln
Few-Shots (optional)
GPT-Modell & Parameter
🔑 OpenAI API Key
Der API-Key wird nur für diesen Browser-Tab verwendet und nicht gespeichert.
Audiodeskriptionen generieren
GPT beschreibt jeden AD-Slot basierend auf Szenenbildern und deinen Prompts.
Konfigurationsübersicht
Ergebnisse & Download
Lade alle erzeugten Audiodeskriptions-Dateien herunter.
Ausgabedateien