KI-Kopfhörer schaffen Silenz-Zonen für klare Gespräche

Wer kennt das nicht? In einem lauten Restaurant, auf einer geschäftigen Party oder bei einem Meeting im Büro müssen wir oft unsere Stimme erheben, um uns Gehör zu verschaffen. Hintergrundgeräusche, Gespräche anderer und allgemeiner Lärm erschweren es, sich auf ein einzelnes Gespräch zu konzentrieren. Unsere Ohren und das Gehirn sind nicht besonders gut darin, sich in solchen Situationen auf eine bestimmte Klangquelle zu fokussieren. Mit zunehmendem Alter und damit einhergehendem Hörverlust wird dieses Problem noch verstärkt, was zu sozialer Isolation führen kann.

Forscher der Universität Washington, in Zusammenarbeit mit Microsoft und Assembly AI, haben jedoch eine neue Technologie entwickelt, die genau diese Herausforderung adressiert. Mithilfe von Künstlicher Intelligenz (KI) werden Umgebungsgeräusche isoliert, sodass eine Zone der Stille entsteht, in der Personen störungsfrei miteinander sprechen können – selbst in einem Raum voller Lärm.

Innovative Lösung für das „Cocktailparty-Problem“

Das Forschungsteam unter der Leitung von Professor Shyam Gollakota von der Universität Washington hat eine bahnbrechende Technik entwickelt, die es Nutzern ermöglicht, sich in lauten Umgebungen besser auf ihre Gesprächspartner zu konzentrieren. Gollakota und sein Team arbeiten an der Integration von KI in tragbare Geräte, um die menschlichen Sinne zu erweitern. Dabei geht es nicht um die Nutzung leistungsstarker Computerressourcen wie bei Anwendungen wie ChatGPT, sondern darum, mit den vorhandenen technischen Möglichkeiten effiziente und nützliche KI-Anwendungen zu entwickeln.

Ein Schlüsselproblem, das die Forscher ansprechen, ist das sogenannte „Cocktailparty-Problem“ – das Phänomen, dass es in lauten Umgebungen schwer ist, sich auf eine einzelne Unterhaltung zu konzentrieren, während gleichzeitig viele Geräusche und Gespräche die Wahrnehmung überfluten. Die neue Technologie nutzt KI, um diese Herausforderung zu bewältigen und eine personalisierte, effektive Geräuschunterdrückung zu ermöglichen.

Die Technologie im Detail

Aktuelle Geräuschunterdrückungssysteme haben ihre Grenzen. Sie sind zwar in der Lage, Umgebungsgeräusche zu dämpfen, berücksichtigen jedoch nicht Faktoren wie den Abstand zu den Schallquellen oder die akustischen Eigenschaften eines Raumes. Hier setzt die neue Entwicklung an: Das System der Forscher nutzt KI-gestützte neuronale Netzwerke, um Schallquellen präzise zu identifizieren und eine „Sound-Bubble“ zu schaffen, in der störende Geräusche außerhalb dieser Zone stark reduziert werden.

Ein spezielles Feature des Systems ist die Fähigkeit, diese Sound-Bubble anpassbar zu gestalten. Die Nutzer können die Größe der Zone selbst festlegen – von einem Meter bis zu zwei Metern. Sobald ein Gesprächspartner sich innerhalb dieser Zone befindet, wird der Schall so gefiltert, dass die Verständigung nahezu ohne Störungen möglich ist. Störgeräusche außerhalb der Zone werden durch die KI-Technologie in Echtzeit unterdrückt, ohne dass eine Verzögerung im Klang wahrgenommen wird.

Technologie im Einsatz

Das System funktioniert mit einem kommerziellen Geräuschunterdrückungskopfhörer, der mit bis zu sechs Mikrofonen ausgestattet ist, die sowohl nahe als auch entfernte Geräusche erfassen. Diese Mikrofone liefern Daten, die von einem speziell entwickelten neuronalen Netzwerk analysiert werden. Das Netzwerk bestimmt die Entfernung der Schallquellen und berechnet, welche innerhalb des einstellbaren Radius liegen. Diese Daten werden dann nahezu sofort an die Kopfhörer zurückgesendet, was eine präzise und latenzfreie Geräuschunterdrückung ermöglicht.

In Tests zeigte sich, dass der Algorithmus der Sound-Bubble-Technologie die Lautstärke von Geräuschen außerhalb der Zone um bis zu 49 Dezibel reduziert – das entspricht etwa 0,001 Prozent der Intensität der Geräusche innerhalb der Zone. Das System funktionierte zuverlässig, selbst in neuen akustischen Umgebungen und mit unterschiedlichen Nutzern, und konnte bis zu zwei Sprecher innerhalb der Zone sowie störende Geräusche von außen effizient unterdrücken.

Vielseitige Anwendungsgebiete

Die möglichen Anwendungen dieser Technologie sind vielfältig. Insbesondere in Umgebungen, in denen klare Kommunikation erforderlich ist – sei es in Büros, auf Veranstaltungen oder bei Meetings in belebten Cafés – könnte die neue Technologie von großem Nutzen sein. Die „Sound-Bubble“-Technologie würde es den Nutzern ermöglichen, Gespräche zu führen, ohne sich von der Lautstärke der Umgebung ablenken zu lassen. Darüber hinaus könnte sie helfen, soziale Isolation zu verhindern, indem sie den Nutzern ermöglicht, trotz Lärm weiterhin zu kommunizieren und sich zu vernetzen.

Ein weiteres großes Potenzial liegt in der Integration der Technologie in Hörgeräte. Unternehmen wie Google und Phonak haben bereits KI-gestützte Funktionen in ihre Hörsysteme integriert, doch die Sound-Bubble-Technologie könnte noch einen Schritt weitergehen, indem sie eine genauere und individuell anpassbare Geräuschfilterung bietet. Gollakota und sein Team sind bereits dabei, zu erforschen, wie diese Technologie in Hörgeräte integriert werden könnte, die bequem zu tragen sind und über den ganzen Tag hinweg zuverlässig arbeiten.

Die Zukunft der Kommunikation

Die KI-gestützte Geräuschunterdrückungstechnologie steht erst am Anfang ihrer Entwicklung, doch die Fortschritte, die bereits erzielt wurden, lassen auf eine vielversprechende Zukunft hoffen. Es wird erwartet, dass solche Technologien in den kommenden Jahren nicht nur die Lebensqualität vieler Menschen verbessern, sondern auch die Art und Weise, wie wir in lauten Umgebungen miteinander kommunizieren, revolutionieren.

Das große Ziel der Forscher ist es, eine benutzerfreundliche, alltagstaugliche Lösung zu entwickeln, die die Vorteile von KI und Hardware optimal kombiniert, um die Kommunikation für alle zu verbessern. In einer Welt, in der Lärm und Ablenkungen immer mehr zunehmen, könnte diese Technologie ein wichtiger Schritt in Richtung einer besseren, klareren und inklusiveren Kommunikation sein.

Innovative Lösung für das „Cocktailparty-Problem“

Die Technologie im Detail

Technologie im Einsatz

Vielseitige Anwendungsgebiete

Die Zukunft der Kommunikation

Neumann

Related Posts