So automatisierst du deinen Präsentations-Livestream

Felix Kleinsteuber Mittwoch, 21. Januar 2026

So automatisierst du deinen Präsentations-Livestream

Präsentations-Livestreams sehen einfach aus – bis du mal einen drei Stunden lang am Stück bedienst.

Ein „langweiliger“ Vortrag benötigt normalerweise:

  • ein sauberes Speaker-Bild (idealerweise mit Tracking)
  • Folien, wenn sie relevant sind
  • eine Totale der Bühne als Sicherheitseinstellung
  • Zwischenschnitte ins Publikum (optional, wertet die Produktion aber auf)
  • PiP-Layouts (Bild-in-Bild: Sprecher + Folien)

Das manuell zu erledigen ist monoton und fehleranfällig, besonders bei kleinen Teams oder langen Programmen.

Dieser Leitfaden zeigt dir, wie du einen automatisierten, bedienerfreundlichen Workflow mit PTZ-Kameras und Bildmischern wie Blackmagic ATEM oder Software-Mixern wie vMix aufbaust. Dabei liegt der Fokus auf Regeln für Produktionsqualität: saubere Schnitte, keine sichtbaren PTZ-Fahrten im Live-Bild und vorhersehbares Verhalten.

Was „Automatisierung“ in Präsentations-Workflows erreichen sollte

Basis-Automatisierung:

  • Den Präsentator tracken (der Bildausschnitt bleibt korrekt)
  • Im richtigen Moment zwischen Sprecher / Folien / Totale / PiP umschalten
  • Audio nutzen, um zu erkennen, „wer gerade spricht“ (einzelne oder mehrere Sprecher)

Fortgeschrittene Ziele:

  • Folienwechsel erkennen und darauf reagieren
  • Applaus/Lachen erkennen und ins Publikum schneiden
  • Automatisierung für Panels mit mehreren Sprechern durch Einzelmikrofone + Presets

Schritt für Schritt: Einen Präsentations-Livestream automatisieren

Schritt 1 – Definiere deine Shots

Ein zuverlässiger Automatisierungs-Workflow beginnt mit einem stabilen Shot-Plan:

Empfohlenes Minimal-Set:

  • Bühne (Totale): Statische Sicherheitseinstellung der gesamten Szene (erforderlich)
  • Sprecher: PTZ-Kamera, die dem Präsentator folgt
  • Präsentation: Direkter Feed der Folien (HDMI/SDI-Capture oder NDI®)
  • Optional: Publikums-Kamera für Reaktionen
  • Optional: PiP-Input (Kombination aus Sprecher + Folien)

Wähle deine Kameras: Abhängig von deinem Budget und deinen Anforderungen kannst du eine breite Palette an PTZ-Kameras von Telycam, Panasonic, Sony, Canon, Marshall, BirdDog oder Obsbot nutzen.

Schritt 2 – Erstelle Video-Feeds mit geringer Latenz

Tracking und gute Bildregie hängen von der Latenz ab.

Gängige Input-Pfade:

  • Capture-Card (SDI/HDMI) → meist die geringste Latenz
  • NDI → moderate Latenz (oft akzeptabel) – viele PTZ-Kameras unterstützen NDI nativ
  • MJPEG-Streams → moderate Latenz (oft akzeptabel) – fast alle PTZ-Kameras unterstützen dies
  • SRT und RTSP → hohe Latenz – nützlich für Video-Feeds über das Internet, aber nicht für Tracking geeignet

Schritt 3 – Folien-Capture, das dir die Show nicht versaut

Folien sind oft die Quelle für Chaos in letzter Minute.

Optionen:

  • HDMI-Ausgang des Präsentations-Rechners → Capture → Bildmischer
  • NDI®-Ausgang vom Präsentations-Rechner → Receiver → Bildmischer/Automatisierung

Regeln:

  • Nutze eine stabile Auflösung
  • Vermeide OS-Popups / Benachrichtigungen

Schritt 4 – Audio-Routing (Einzel- vs. Mehrfach-Sprecher)

Vortrag mit einem Sprecher

  • Ein sauberer Mikrofon-Feed + optionales Raummikrofon

Panel-Diskussion / Town Hall mit mehreren Sprechern

  • Du erhältst eine bessere Automatisierung durch:
    • einen Mikrofonkanal pro Sprecher (oder zumindest pro Sprecherposition)
    • plus optionales Raum-/Publikumsmikrofon

Warum das wichtig ist:

  • Eine „Active-Speaker“-Logik erfordert in der Regel isolierte Kanäle.

Schritt 5 – Wähle deine Strategie für die Bildmischer-Steuerung

Du benötigst einen Bildmischer oder eine Software, die von einer Automatisierung gesteuert werden kann.

Typische Auswahl:

  • Blackmagic ATEM (Hardware)
  • vMix (Software)
  • Ross / Roland / OBS

Deine Automatisierungsebene muss folgendes wissen:

  • Input-Mapping (Eingangsbelegung)
  • Vorschau-/Programm-Status (Preview/Program)

Schritt 6 – Entscheide dich für deine Automatisierungs-Logik

Es gibt drei gängige Modelle:

Modell A: Einfacher Zeitplan + manuelles Eingreifen

  • Start mit der Totalen
  • Folien in festen Segmenten zeigen
  • Zurück zum Sprecher
  • Manuelles Eingreifen für besondere Momente

Gut geeignet für:

  • geskriptete / geprobte Vorträge

Dies lässt sich bei den meisten Bildmischern einfach mit Makros oder Plugins (bei Software-Mixern) umsetzen. Für dynamische Präsentationen ist es jedoch oft nicht flexibel genug.

Modell B: Audio-gesteuert + Regeln

  • Sprecher-Mikro aktiv → zeige Sprecher
  • Stille → zeige Totale
  • Publikums-Mikro aktiv → zeige Publikum
  • Optional: Folienwechsel triggert Folien-Ansicht

Gut geeignet für:

  • die meisten realen Vorträge

Gut umgesetzt deckt dies 80 % der Anforderungen ab, erfordert jedoch umfassende Programmierkenntnisse für die Feinabstimmung.

Modell C: KI-gestützter Auto-Cut (am besten für lange Sessions)

  • Nutzt Audio- + Video-KI-Analyse zur Entscheidung:
    • wann die Folien wichtig sind
    • wann der Sprecher gezeigt werden soll
    • wann Totale / Publikum gezeigt werden
  • Koordiniert PTZ-Bewegungen mit dem Status des Bildmischers

Gut geeignet für:

  • Präsentationen, Panel-Diskussionen, lange Konferenzen, Universitäten, Town Halls

Dies ist genau die Art von Workflow, für die MiruSuite entwickelt wurde: automatisierte, hochwertige Produktion mit minimalem Aufwand für den Operator. MiruSuite ist eine fertige Lösung, die sich in bestehende AV-Workflows integrieren lässt, ohne dass eine eigene Programmierung nötig ist.


FAQ

„Wie automatisiere ich Vorlesungs-Streaming ohne Kameraleute?“

Du benötigst:

  • mindestens eine tracking-fähige Sprecher-Kamera (PTZ + Tracking)
  • einen Folien-Feed
  • einen steuerbaren Bildmischer
  • eine Automatisierungsebene wie MiruSuite, die das Umschalten übernimmt und verhindert, dass Kamerabewegungen im Live-Bild sichtbar sind

Starte mit: Totale + Sprecher + Folien.

„Wie schalte ich automatisch zwischen Folien und Sprecher um?“

Entweder:

  • Du steuerst das Umschalten über Regeln (Audio-Aktivität + Folienwechsel-Erkennung)
  • oder du nutzt eine KI-Auto-Cut-Ebene, die den Folien-Feed analysiert und entscheidet, wann die Folien „interessant“ genug sind, um sie zu zeigen.

„Kann ich Panels mit mehreren Sprechern automatisieren?“

Ja, sofern du Folgendes hast:

  • Mikrofonkanäle pro Sprecher (oder pro Position)
  • Presets für jeden Sprecher von mindestens einer Kamera (zwei Kameras sind besser)
  • Eine Logik, die hektisches Hin-und-Her-Schalten bei gleichzeitigem Sprechen vermeidet

Wo MiruSuite ins Spiel kommt

Wenn du Vorträge produzierst, die:

  • lang sind
  • sich wiederholen
  • in hohem Volumen anfallen (Universitäten, Konferenzen, interne Town Halls)

MiruSuite wurde exakt für diese Formate entwickelt:

  • automatisiertes Person-Tracking
  • automatisierter Live-Schnitt („AutoCut“) für Präsentationsszenarien
  • folien-basierte Entscheidungsfindung
  • Bildmischer-Integration, damit sich Kameras nicht bewegen, während sie „on air“ sind
  • manuelles Eingreifen jederzeit möglich

MiruSuite unterstützt gängige PTZ-Systeme (Panasonic, Sony, Canon, Marshall, BirdDog, Telycam) und typische Bildmischer-Setups (Blackmagic ATEM, Ross Video, vMix, OBS, Roland AV).

MiruSuite ist die neue All-In-One Lösung für Automatisierung von Live-Videoproduktionen.

Mehr erfahren Jetzt kostenlos testen
Bundesministerium für Wirtschaft und Energie Logo
WIPANO logo
ende