Computer im Mundl-Modus
Ein nun vorgestelltes Forschungsprojekt will dem Computer das Wienerische näherbringen. Von der gehobenen Umgangssprache, dem Schönbrunner Deutsch, bis zum Wiener Dialekt mit Ausdrücken wie "Nudlaug" und "Heast, G'schissana, hau di iba d'Heisa" soll der Computer mit seinem Nutzer in Zukunft auf verbaler Augenhöhe kommunizieren.
"Hallo, ich hör nichts", tönt es bei der Präsentation im Schutzhaus auf der Schmelz
in Wien. "He, Nudlaug, wos is?", ist die etwas forscher formulierte Version - beides
sind Beispiele, wie der Computer in Zukunft auf eine nicht erfolgte Eingabe reagieren
könnte.
"Hallo, ich hör' nichts"
Download
(36,31 KB)
"He, Nudlaug, wos is?"
Download
(25,95 KB)
Wissenschaftler des interdisziplinären Forschungsprojekts unter der Führung des
Forschungszentrums Telekommunikation Wien (ftw) haben dazu zwei Jahre lang an dem
Projekt "Wiener Soziolekt und Dialektsynthese" gearbeitet.
Von Schönbrunn bis Favoriten
Dabei wurden die Stimmen von vier Schauspielern und Sprechern (Hanno Pöschl, Helma
Gautier, Stephan Pokorny und Julia Österreicher) in vier verschiedenen Soziolekten
(österreichisches Deutsch, Wiener Dialekt, Wiener Umgangssprache oder Schönbrunner
Deutsch und Wiener Jugendsprache) aufgenommen und verarbeitet.
"Gehen Sie, geht das nicht ein bisserl deutlicher?" (Schönbrunner Deutsch, Helma Gautier)
Download (53,02 KB)
"Du klingst, als warst du blunznfett" (Wienerisch für: "Du hörst dich an, als wärst
du betrunken", Hanno Pöschl)
Download (50,71 KB)
Zwei Ansätze für Sprachsynthese
Bei der Verarbeitung selbst kamen zwei Methoden zum Einsatz, erklärt Projektleiter
Michael Pucher vom ftw. Die klassische Methode der natürlichen Sprachsynthese besteht
darin, Texte sowie einzelne Sätze und Wörter aufzunehmen, die dann in einzelne Sequenzen
zerschnitten und wieder zusammengesetzt werden. Der Vorteil dieser Methode sei,
dass die Sprachausgabe relativ natürlich klinge, der Nachteil, dass dafür sehr viele
Aufnahmen gemacht werden müssen, erklärt Pucher.
Bei der Methode der adaptiven Sprachsynthese wird die Sprache vorher analysiert
und ihre einzelnen Merkmale abgetastet. Daraus wird ein Modell trainiert, das dann
bei der Synthese zum Einsatz kommt. "Diese Methode geht davon aus, dass Sprache
in zwei Prozesse zerlegt werden kann: erstens die durch die strömende Luft vibrierenden
Stimmbänder und den Signalfilter Mund- und Nasenraum, der das Signal noch einmal
modifiziert."
Dieses Quelle-Filter-Modell könne man in Hinblick auf die Signalverarbeitung sehr
schön implementieren, und auch technologisch sei es besser nutzbar. Da es aber eine
Idealisierung sei, höre man einen deutlichen Unterschied zur klassischen Methode,
die viel natürlicher klinge. Ein weiterer Vorteil dieser Methode sei, dass man für
die Synthese einer Stimme weniger Daten brauche und den Dialekt stufenlos einstellen
könne, so Pucher.
Beispiele
"Nur kein Schmalz nicht habe ich gesagt" auf Wienerisch:
Download (42,07 KB)
und im Schönbrunner Deutsch:
Download (61,08 KB)
Kommerzielle Anwendung soll kommen
Die bestehenden Aufnahmen und Daten sollen auch kommerziell zum Einsatz kommen,
etwa als Software, die dann Texte vom Bildschirm in österreichischem Deutsch vorliest.
Für das Wienerische sei die Abdeckung noch nicht groß genug, um auch alle möglichen
Inhalte generieren zu können, erklärt Pucher: "Wir können mit den vorhandenen Daten
zwar theoretisch bereits alles synthetisieren, aber wir wissen noch nicht genau,
wie wir das von der Orthografie auf das Phonetische umsetzen sollen."
In technischer Hinsicht sei ein Dialekt nicht schwieriger als Hochsprache, es würden
allerdings öfter Ressourcen wie Texte, Lexika und entsprechende Vorarbeiten fehlen,
da Dialekte sich ökonomisch nicht so sehr rechnen würden. "Für Englisch gibt es
viel, auch für Deutsch, aber für Österreichisch gibt es nichts, und für Roma-Sprachen
etwa gibt es auch nichts", so Pucher.
Wienerisch vorerst nur für Demonstrationen
Für das Wienerische werde es daher vorerst vor allem spezielle Anwendung wie den
bei der Vorstellung präsentierten Restaurantguide geben, der einem Anrufer in den
vier aufgenommenen Ausprägungen im Dialogsystem Restaurants empfiehlt - inklusive
"Nudlaug". Die Anwendungsdemonstration sowie weitere Soundfiles dazu sollen nächste
Woche auf der ftw-Website publiziert werden.
"Heast, G'scherda, i vasteh di ned"
("Zugereister, ich verstehe dich nicht")
Download
(38,78 KB)
"Heast, G'schissana, hau di iba d'Heisa"
(Sehr unflätiger Ausdruck für: "Geh mir aus den Augen")
Download (55,9 KB)
Beiden Versionen der Sprachsynthese ist ihre künstliche Erzeugung zum Teil noch
sehr deutlich anzumerken, und nicht immer kann man das Gesprochene auch richtig
verstehen, wie etwa Gautier nach der Präsentation anmerkte. Es werde auch noch einiges
an Forschung brauchen, um den Computern ein halbwegs menschliches Ausdrucksvermögen
mit etwa unterschiedlichen Stimmlagen näher zubringen, so Pucher.
via FZ
Das könnte Dich auch interessieren:
Der 5,34-Petaflop-Rechner war einst weltweit auf Platz 20 in Sachen Performance und sollte eigentlich schon 2021 ersetzt werden
Eine öffentliche Versteigerung von ehemaligen Regierungs-Supercomputern gibt es selten. Die ersten Gebote wurden bereits abgegeben.
Ähnliche News:
Smart-TV vin HiSense bringt Computer zum Absturz
Microsoft meldet Fortschritt bei Quanten-Computern
xz-utils: Wie die Computerwelt gerade haarscharf an einer Sicherheitskatastrophe vorbeigeschrammt is ...
Ohne AMD und Intel: China tauscht Regierungscomputer aus
Gelähmter steuert Computer mit Gedanken über Neuralink
Die Supercomputer der Nasa sind veraltet
Europa setzt auf neue Generation von Exascale-Supercomputern
Waferscale Engine 3: Der größte Computerchip aller Zeiten
Sipearl Rhea-2: Europas zweite Supercomputer-CPU wird komplex
Weitere News:
HVO100: Klimaschonender Diesel geht in Deutschland an den Start
Gaming-Router Archer C5400X von TP-Link anfällig für Schadcodeausführung
Die RTX 5090 soll zum Titan-Ersatz werden
Update entfernt Cortana-App und WordPad App, die seit 30 Jahren Teil von Windows war
EU-Pläne: Bestellen auf Temu und Shein soll ab 2025 teurer werden
Neues Material ist lichtdurchlässiger als Glas, aber nicht durchsichtig
Copilot-Plus-PC: Microsoft Recall läuft auch ohne NPU
Cyberangriff kostet Kyivstar bisher rund 83 Millionen Euro
MSI zeigt Desktop-Mainboard mit CAMM2
Einen Kommentar schreiben
Bitte bleibe sachlich und fair in deinen Äußerungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.
Kommentare:
Du hast bereits für diesen
Kommentar angestimmt...
;-)
© by Ress Design Group, 2001 - 2024