Audiodeskription Pipeline

📁

Video hochladen

Wähle eine MP4-Datei zum Starten der Pipeline.

🎞️

MP4 per Drag & Drop hier ablegen

oder klicken zum Auswählen

Uploading…
🔇

Sprechpausen erkennen

Silero VAD erkennt Sprach- und Pausensegmente im Video.

Parameter

0.5
📝

Transkription

Faster-Whisper transkribiert die Sprache im Video. Du kannst auch eine vorhandene SRT hochladen.

Modell & Optionen

Oder: Vorhandenes Transkript hochladen

🕐

AD-Slots generieren

Wandle Sprechpausen in Audio-Deskriptions-Slots um und bewerte deren Qualität.

Parameter

🖼️

Bilder extrahieren

SceneDetect identifiziert Szenen und extrahiert repräsentative Frames für jeden AD-Slot.

Parameter

24
80
⚙️

Prompts & GPT-Konfiguration

Definiere System-Instruktion, User-Instruktion, AD-Regeln und Modell-Parameter.

System-Instruktion (Rolle & Grundregeln)

User-Instruktion (Aufgabe & Format)

AD-Regeln

Few-Shots (optional)

GPT-Modell & Parameter

0.2

🔑 OpenAI API Key

Der API-Key wird nur für diesen Browser-Tab verwendet und nicht gespeichert.

🤖

Audiodeskriptionen generieren

GPT beschreibt jeden AD-Slot basierend auf Szenenbildern und deinen Prompts.

Konfigurationsübersicht

📥

Ergebnisse & Download

Lade alle erzeugten Audiodeskriptions-Dateien herunter.

Ausgabedateien