Zusammenhang zwischen Videodelay und Audiodelay bei der Großbildpräsentation von Sprechern und einem Live-Kamerabild in der Präsentation



Eine Verzögerung des Videobildes durch die digitale Bearbeitung in der Gerätekette von der Videokreuzschiene bis zum Videodisplay (Projektor) ist nicht zu verhindern. Nur ein rein analoges System mit analoger Kamerabildbearbeitung (Videoschnitt) kann hier Abhilfe schaffen.
Andererseits ist die Siganlverzögerung nicht so kritisch, wie sie im ersten Augenblick erscheint. Der absolute Großteil der Zuhörer im Saal schauen auf das Videobild des Redners und nicht auf ihn selbst, da sie zu weit entfernt sind, um Details zu erkennen. Die Problematik ist also nicht die Synchronisation zwischen wirklicher Erscheinung und Videobild sondern die Synchronisation zwischen Videobild und Beschallungston.
Hier ergibt sich allerdings eine weitere Schwierigkeit: Der Sprecher hört seine eigene Stimme aus der Beschallungsanlage und sollte kein allzu großes Delay in der Beschallung zu seiner eigenen Stimme spüren. Eine Verzögerung über ein bestimmtes Maß hinaus erzeugt Unbehagen beim Sprecher und sollte unbedingt vermieden werden.

Die Aufgabenstellung ist also, den Ton möglichst zu verzögern, um ihn dem Bild anzugleichen und dem Redner gleichzeitig ein möglichst unverzögertes Signal zu liefern.
Bei der Videoverzögerung muß man von mindestens ein bis zwei Frames ausgehen, das heißt, wir bewegen uns in einem Bereich von 40 bis 100 msec.
Für Zuschauer, die mindestens 10 Meter von den Beschallungslautsprechern entfernt sitzen, ergibt sich schon durch die physikalische Verzögerung des Schalls ein Delay von mindestens 30 msec. Das Audiosignalprozessing zwischen Mikrofon und Beschallungslautsprechern erzeugt auch ein Delay von 5 bis 15 msec, je nach System.
Das Signal, das beim Redner aus der Beschallungsanlage eintrifft, sollte keine größere Verzögerung als 20 - 25 msec haben, um nicht negativ wahrgenommen zu werden.
Da sich der Redner in der Regel näher an den Beschallungslautsprechern befindet als das Publikum, bewirkt das physikalische Delay (Bewegung des Schalls im Raum) beim Redner einen geringeren Effekt als beim durchschnittlichen Publikum. Das Beschallungssignal sollte also so weit zusätzlich verzögert werden, dass es gerade noch nicht beim Redner negativ in Erscheinung tritt.
Bei einem Delay des Beschallungssignals von 25msec beim Redner ist beim Publikum in einer Entfernung von 10 Metern ein Delay von ca. 50 bis 60 msec zu erwarten. Die Differenz zwischen dem Delay des Videobildes und diesem realen Audiodelay ist das Delay, von dem man in der Realität ausgehen muß.

Es gibt aber eine weitere Möglichkeit, hier einzugreifen: Durch eine gute Ton-Monitorsituation kann man dem Redner eine eigene Ton-Umgebung schaffen, bei der er das Delay der Beschallungsanlage selbst nicht mehr wahrnehmen kann. Sowie der Redner ein Monitorsignal aus einem auf ihn gerichteten Lautsprecher empfängt, dass ca. 20 msec früher auftrifft als das Signal aus der Beschallungsanlage, so wird das Beschallungssignal unbewußt phsychoakustisch um ca. 10dB abgesenkt (sogenannter Haas-Effekt). Das Monitorsignal wird das Ausschlaggebende für die phsychische Situation des Redners im Raum, das Beschallungssignal wird nebensächlich. Das Publikum dagegen kann den oder die Monitorlautsprecher nicht hören, da sie nur auf den Redner gerichtet sind. Für das Publikum ist die normale Beschallung das einzige Beschallungssignal, das es wahrnehmen kann. In dieser Situation ist es ohne weiteres möglich, das Signal der Beschallungsanlage um weitere 20 msec zu erhöhen, um es weiter dem Delay des Videobildes anzugleichen.

Delay des Videobildes: 100 msec, Delay des Audiosignals: Signalprozessing: 10 msec, zusätzliche Verzögerung des Beschallungssignals bei der Benutzung von Monitorlautsprechern: 20 msec, physikalische Verzögerung des Schalls im Raum in einer Entfernung von 10 Metern: 30 msec, Gesamte Verzögerung des Audiosignals in 10 Metern Entfernung: 60 msec. Die Differenz von 40 msec ist der Bereich, der für eine Großbilddarstellung eines Sprechers akzeptabel ist.