Bild nicht mehr verfügbar.

Könnten Sprachassistenten künftig erkennen, wenn wir krank sind?

Foto: AP/Elaine Thompson

Zehn Minuten. So lange dauert es, seine Stimme zu spenden. Der virtuelle Doktor bittet, tief einzuatmen, dann einige Sekunden lang "aaa" zu sagen und laut von 50 bis 70 zu zählen. Schließlich werden noch Covid-19 Symptome abgefragt. Vermutet die künstliche Intelligenz (KI), dass ich mich infiziert habe, wird sie mich demnächst informieren.

Während Krankenhäuser, Forschende und Testteams Proben aus Nase und Rachen nehmen, hat sich das Start-up Vocalismit Sitz in Boston und Jerusalem auf Proben in Form von Vokalen und Konsonanten konzentriert. Es ist kein PCR-Test, der eine Infektion mit dem Coronavirus mit Sicherheit bestätigt, aber eine Art Screening, das Unternehmen, Ärzten oder Individuen mehr Sicherheit geben und im Fall zu weiteren Tests aufrufen kann.

Diagnosen anhand der Stimme sind an sich nichts Neues. Auch Ärzte und Ärztinnen können den Gesundheitszustand von Patienten oft mithilfe ihrer Ohren besser einschätzen – etwa wenn jemand kurzatmig ist.

Nun haben Start-ups wie Vocalis stimmbasierte Apps entwickelt, um etwa Verschlechterung von chronischen Krankheiten wie COPD festzustellen. "Wir wandeln die Stimmprobe in ein Spektrogramm um, das die Merkmale – von Dezibel bis zu Frequenz – in verschiedenen Farben anzeigt. Eine Art Abdruck der Stimme an einem bestimmten Tag", erklärt Michael Seggev, Verkaufsdirektor bei Vocalis.

Illustration: Fatih Aydogdu

Die Stimme ist das neue Blut

Die Bilder sind die Grundlage, um sogenannte Biomarker zu entwickeln, die charakteristisch für eine Erkrankung sind. Durch maschinelles Lernen wird dann ein Algorithmus trainiert, um die Spektrogramme mit einer bestehenden Datenbank zu vergleichen.

Geht es nach Forschenden in diesem Bereich, dann ist die Stimme das neue Blut. Björn Schuller, Professor am Imperial College in London und an der Universität Augsburg, arbeitet bereits seit 20 Jahren in diesem Bereich. Angefangen habe alles mit der Erkennung der Sprecheridentität und des Geschlechts.

Später konnte man immer mehr, etwa Emotion oder Persönlichkeit, aus der Stimme ablesen. Heute gebe es bereits Hinweise darauf, dass zahlreiche Erkrankungen wie Depressionen, Autismus, Alzheimer oder Parkinson hörbar seien. "Wir nützen biologische Merkmale wie Intonation, Sprechgeschwindigkeit, Grundfrequenz und Intensität, also Lautstärke", so Schuller. "Im Endeffekt sind es aber zwischen 100 und 1000 Merkmale, die sich aus Statistiken über den Krankheitsverlauf ergeben."

Auch der Inhalt zählt

Eingebaute Sprachanalysesysteme in Siri oder Alexa könnten einen in Zukunft darüber informieren, wenn man eine Erkältung hat oder sich untersuchen lassen sollte.

Bei Demenz oder Depression ist auch der Inhalt des Gesprochenen interessant. Die Zusammensetzung zwischen Nomen und Verben kann sich verändern, aber auch die Wortwahl, sagt Schuller: "Bei Depression wird hier oft überkompensiert, also absichtlich besonders positive Wörter gewählt. Oder es gibt eine charakteristische, düstere Sprachwahl."

Herausfordernd sind im Moment hauptsächlich die Datenmengen. Das System muss mit mehreren Tausend Stunden Sprache trainiert werden. "Teilweise mehr, als ein Mensch im Leben hören würde", sagt Schuller. Die benötigte Menge erhöht sich, wenn man es außerdem auf verschiedene Sprachen und Dialekte ausweiten will. Außerdem sind insbesondere Daten von Kindern oder älteren, dementen Personen sensibel.

Dazu kommt, dass sich diese Anwendungen in den Händen von Arbeitgebern oder Versicherungen nicht immer positiv auf den Betroffenen auswirken könnten. Erkennt eine KI eine Erkrankung in der Stimme, während der Patient etwa in der Warteschlange einer Krankenkasse hängt, könnte diese ihn anders einstufen – vielleicht sogar noch bevor der Patient selbst seine Diagnose kennt. Laut Schuller arbeite man aber bereits daran, die Symptome in der Stimme unkenntlich zu machen, indem man zum Beispiel das Tempo anpasst oder ein Rauschen hinzufügt. Die KI könnte die Krankheit so verschleiern, für Menschen wäre es unverständlich. (Katharina Kropshofer, 1.12.2020)