Präsentations-Livestreams sehen einfach aus – bis du mal einen drei Stunden lang am Stück bedienst.
Ein „langweiliger“ Vortrag benötigt normalerweise:
- ein sauberes Speaker-Bild (idealerweise mit Tracking)
- Folien, wenn sie relevant sind
- eine Totale der Bühne als Sicherheitseinstellung
- Zwischenschnitte ins Publikum (optional, wertet die Produktion aber auf)
- PiP-Layouts (Bild-in-Bild: Sprecher + Folien)
Das manuell zu erledigen ist monoton und fehleranfällig, besonders bei kleinen Teams oder langen Programmen.
Dieser Leitfaden zeigt dir, wie du einen automatisierten, bedienerfreundlichen Workflow mit PTZ-Kameras und Bildmischern wie Blackmagic ATEM oder Software-Mixern wie vMix aufbaust. Dabei liegt der Fokus auf Regeln für Produktionsqualität: saubere Schnitte, keine sichtbaren PTZ-Fahrten im Live-Bild und vorhersehbares Verhalten.
Basis-Automatisierung:
- Den Präsentator tracken (der Bildausschnitt bleibt korrekt)
- Im richtigen Moment zwischen Sprecher / Folien / Totale / PiP umschalten
- Audio nutzen, um zu erkennen, „wer gerade spricht“ (einzelne oder mehrere Sprecher)
Fortgeschrittene Ziele:
- Folienwechsel erkennen und darauf reagieren
- Applaus/Lachen erkennen und ins Publikum schneiden
- Automatisierung für Panels mit mehreren Sprechern durch Einzelmikrofone + Presets
Ein zuverlässiger Automatisierungs-Workflow beginnt mit einem stabilen Shot-Plan:
Empfohlenes Minimal-Set:
- Bühne (Totale): Statische Sicherheitseinstellung der gesamten Szene (erforderlich)
- Sprecher: PTZ-Kamera, die dem Präsentator folgt
- Präsentation: Direkter Feed der Folien (HDMI/SDI-Capture oder NDI®)
- Optional: Publikums-Kamera für Reaktionen
- Optional: PiP-Input (Kombination aus Sprecher + Folien)
Wähle deine Kameras: Abhängig von deinem Budget und deinen Anforderungen kannst du eine breite Palette an PTZ-Kameras von Telycam, Panasonic, Sony, Canon, Marshall, BirdDog oder Obsbot nutzen.
Tracking und gute Bildregie hängen von der Latenz ab.
Gängige Input-Pfade:
- Capture-Card (SDI/HDMI) → meist die geringste Latenz
- NDI → moderate Latenz (oft akzeptabel) – viele PTZ-Kameras unterstützen NDI nativ
- MJPEG-Streams → moderate Latenz (oft akzeptabel) – fast alle PTZ-Kameras unterstützen dies
- SRT und RTSP → hohe Latenz – nützlich für Video-Feeds über das Internet, aber nicht für Tracking geeignet
Folien sind oft die Quelle für Chaos in letzter Minute.
Optionen:
- HDMI-Ausgang des Präsentations-Rechners → Capture → Bildmischer
- NDI®-Ausgang vom Präsentations-Rechner → Receiver → Bildmischer/Automatisierung
Regeln:
- Nutze eine stabile Auflösung
- Vermeide OS-Popups / Benachrichtigungen
Vortrag mit einem Sprecher
- Ein sauberer Mikrofon-Feed + optionales Raummikrofon
Panel-Diskussion / Town Hall mit mehreren Sprechern
- Du erhältst eine bessere Automatisierung durch:
- einen Mikrofonkanal pro Sprecher (oder zumindest pro Sprecherposition)
- plus optionales Raum-/Publikumsmikrofon
Warum das wichtig ist:
- Eine „Active-Speaker“-Logik erfordert in der Regel isolierte Kanäle.
Du benötigst einen Bildmischer oder eine Software, die von einer Automatisierung gesteuert werden kann.
Typische Auswahl:
- Blackmagic ATEM (Hardware)
- vMix (Software)
- Ross / Roland / OBS
Deine Automatisierungsebene muss folgendes wissen:
- Input-Mapping (Eingangsbelegung)
- Vorschau-/Programm-Status (Preview/Program)
Es gibt drei gängige Modelle:
- Start mit der Totalen
- Folien in festen Segmenten zeigen
- Zurück zum Sprecher
- Manuelles Eingreifen für besondere Momente
Gut geeignet für:
- geskriptete / geprobte Vorträge
Dies lässt sich bei den meisten Bildmischern einfach mit Makros oder Plugins (bei Software-Mixern) umsetzen. Für dynamische Präsentationen ist es jedoch oft nicht flexibel genug.
- Sprecher-Mikro aktiv → zeige Sprecher
- Stille → zeige Totale
- Publikums-Mikro aktiv → zeige Publikum
- Optional: Folienwechsel triggert Folien-Ansicht
Gut geeignet für:
- die meisten realen Vorträge
Gut umgesetzt deckt dies 80 % der Anforderungen ab, erfordert jedoch umfassende Programmierkenntnisse für die Feinabstimmung.
- Nutzt Audio- + Video-KI-Analyse zur Entscheidung:
- wann die Folien wichtig sind
- wann der Sprecher gezeigt werden soll
- wann Totale / Publikum gezeigt werden
- Koordiniert PTZ-Bewegungen mit dem Status des Bildmischers
Gut geeignet für:
- Präsentationen, Panel-Diskussionen, lange Konferenzen, Universitäten, Town Halls
Dies ist genau die Art von Workflow, für die MiruSuite entwickelt wurde: automatisierte, hochwertige Produktion mit minimalem Aufwand für den Operator.
MiruSuite ist eine fertige Lösung, die sich in bestehende AV-Workflows integrieren lässt, ohne dass eine eigene Programmierung nötig ist.
Du benötigst:
- mindestens eine tracking-fähige Sprecher-Kamera (PTZ + Tracking)
- einen Folien-Feed
- einen steuerbaren Bildmischer
- eine Automatisierungsebene wie MiruSuite, die das Umschalten übernimmt und verhindert, dass Kamerabewegungen im Live-Bild sichtbar sind
Starte mit: Totale + Sprecher + Folien.
Entweder:
- Du steuerst das Umschalten über Regeln (Audio-Aktivität + Folienwechsel-Erkennung)
- oder du nutzt eine KI-Auto-Cut-Ebene, die den Folien-Feed analysiert und entscheidet, wann die Folien „interessant“ genug sind, um sie zu zeigen.
Ja, sofern du Folgendes hast:
- Mikrofonkanäle pro Sprecher (oder pro Position)
- Presets für jeden Sprecher von mindestens einer Kamera (zwei Kameras sind besser)
- Eine Logik, die hektisches Hin-und-Her-Schalten bei gleichzeitigem Sprechen vermeidet
Wenn du Vorträge produzierst, die:
- lang sind
- sich wiederholen
- in hohem Volumen anfallen (Universitäten, Konferenzen, interne Town Halls)
MiruSuite wurde exakt für diese Formate entwickelt:
- automatisiertes Person-Tracking
- automatisierter Live-Schnitt („AutoCut“) für Präsentationsszenarien
- folien-basierte Entscheidungsfindung
- Bildmischer-Integration, damit sich Kameras nicht bewegen, während sie „on air“ sind
- manuelles Eingreifen jederzeit möglich
MiruSuite unterstützt gängige PTZ-Systeme (Panasonic, Sony, Canon, Marshall, BirdDog, Telycam) und typische Bildmischer-Setups (Blackmagic ATEM, Ross Video, vMix, OBS, Roland AV).