Du lädst dein Rohmaterial hoch. Eine KI als Regisseur wählt aus doppelt angesetzten Takes den besten, schneidet Füller und Pausen sekundengenau und liefert ein fertiges Video. Longform oder Reels. Kein Premiere, kein neu ansetzen.
Du entscheidest beim Upload, was rauskommen soll. Die Regie baut erst den sauberen Master und schlachtet ihn auf Wunsch direkt in vertikale Shorts aus.
Die KI liest das verbatim-Transkript mit Wort-Timings und Audio-Events. Sie markiert doppelte Takes, Füller, Dead-Air am Anfang und False-Starts. Welcher Take ist der beste?
Aus dem Plan wird ein erster Schnitt gebaut und zusammengefügt. Saubere Cuts mit weichen Audio-Übergängen, kein Knacken.
Springt es? Wurde im Wort geschnitten? Ist der Atem abgehackt? Bei Bedarf geht es zurück in den Plan. Erst dann weiter.
Jede Schnittkante wird auf das echte Audio-Onset gesnappt. Füller-Mikroschnitte, Opening-Pause hart raus. Hier wird es sekundengenau.
Bei Interviews mit mehreren Sprechern oder Kameras: Sprechererkennung, Split-Screen oder A-zu-B-Schnitt, Titel-Transition in die Mitte, damit es nicht stürmt.
Die meisten Tools schneiden auf Transkript-Zeitstempel. Die sind nie sekundengenau, sie driften 50 bis 100 Millisekunden. Wir analysieren die Audio-Energie selbst und snappen jeden Schnitt auf den Punkt, an dem du tatsächlich zu sprechen anfängst und aufhörst. Genau das macht den Anfangs-Cut perfekt und holt die riesige Wirkung am Video-Start.
Re-Take-Erkennung, Füller-Schnitt, Audio-primäres Schneiden, Split-Screen und Caption-Pipeline laufen bereits. Neu sind nur der Web-Upload und ein echtes Präzisions-Upgrade.
Julian Ivanov hat den kompletten Ablauf mit Open-Source-Werkzeugen plus Claude Code öffentlich gezeigt: schneiden, animieren, rendern, ganz ohne Schnittprogramm. Wir übernehmen die Architektur, aber nicht die externen Dienste.
Das Vorbild von Julian Ivanov. Wir bauen den Ablauf eigenständig und lokal nach.
Ein Schalter, der den Schnittstil ändert.
| Sachlich | Emotional | |
|---|---|---|
| Pausen | aggressiv kürzen, snappy | Beats stehen lassen |
| Tempo | hoch, harte Cuts | weicher, J- und L-Cuts |
| Overlays | niedrig, Fakten-Pops | höher, Mood, Transitions |
| Zoom | sparsam | folgt der Emotion |
Ein Rohvideo komplett durch die fünf Stufen, inklusive Onset-Step. Sekundengenaue Cuts belegen.
Wellenform-Snapping als wiederverwendbarer Schritt in der Cut-Engine.
Upload, Stil- und Format-Schalter, Render auf den eigenen Workern, Download.
Bewertungs-Loop und Sprechererkennung scharf schalten.
Als Podmark-Service ausrollen. Editor-Stunden werden zu Agent-Minuten.