Computer im Mundl-Modus

Ein nun vorgestelltes Forschungsprojekt will dem Computer das Wienerische n�herbringen. Von der gehobenen Umgangssprache, dem Sch�nbrunner Deutsch, bis zum Wiener Dialekt mit Ausdr�cken wie "Nudlaug" und "Heast, G'schissana, hau di iba d'Heisa" soll der Computer mit seinem Nutzer in Zukunft auf verbaler Augenh�he kommunizieren.

"Hallo, ich h�r nichts", t�nt es bei der Pr�sentation im Schutzhaus auf der Schmelz in Wien. "He, Nudlaug, wos is?", ist die etwas forscher formulierte Version - beides sind Beispiele, wie der Computer in Zukunft auf eine nicht erfolgte Eingabe reagieren k�nnte.

"Hallo, ich h�r' nichts"

Download (36,31 KB)

"He, Nudlaug, wos is?"

Download (25,95 KB)

Wissenschaftler des interdisziplin�ren Forschungsprojekts unter der F�hrung des Forschungszentrums Telekommunikation Wien (ftw) haben dazu zwei Jahre lang an dem Projekt "Wiener Soziolekt und Dialektsynthese" gearbeitet.

Von Sch�nbrunn bis Favoriten
Dabei wurden die Stimmen von vier Schauspielern und Sprechern (Hanno P�schl, Helma Gautier, Stephan Pokorny und Julia �sterreicher) in vier verschiedenen Soziolekten (�sterreichisches Deutsch, Wiener Dialekt, Wiener Umgangssprache oder Sch�nbrunner Deutsch und Wiener Jugendsprache) aufgenommen und verarbeitet.

Info An der Entwicklung beteiligt waren neben dem ftw das �sterreichische Forschungszentrum f�r k�nstliche Intelligenz (�FAI), das Centre for Speech Technology Research (CSTR) in Edinburgh und das Wiener Institut f�r Schallforschung (ARI).
Ftw
�FAI
CSTR
ARI

"Gehen Sie, geht das nicht ein bisserl deutlicher?" (Sch�nbrunner Deutsch, Helma Gautier)

Download (53,02 KB)

"Du klingst, als warst du blunznfett" (Wienerisch f�r: "Du h�rst dich an, als w�rst du betrunken", Hanno P�schl)

Download (50,71 KB)

Zwei Ans�tze f�r Sprachsynthese
Bei der Verarbeitung selbst kamen zwei Methoden zum Einsatz, erkl�rt Projektleiter Michael Pucher vom ftw. Die klassische Methode der nat�rlichen Sprachsynthese besteht darin, Texte sowie einzelne S�tze und W�rter aufzunehmen, die dann in einzelne Sequenzen zerschnitten und wieder zusammengesetzt werden. Der Vorteil dieser Methode sei, dass die Sprachausgabe relativ nat�rlich klinge, der Nachteil, dass daf�r sehr viele Aufnahmen gemacht werden m�ssen, erkl�rt Pucher.

Bei der Methode der adaptiven Sprachsynthese wird die Sprache vorher analysiert und ihre einzelnen Merkmale abgetastet. Daraus wird ein Modell trainiert, das dann bei der Synthese zum Einsatz kommt. "Diese Methode geht davon aus, dass Sprache in zwei Prozesse zerlegt werden kann: erstens die durch die str�mende Luft vibrierenden Stimmb�nder und den Signalfilter Mund- und Nasenraum, der das Signal noch einmal modifiziert."

Dieses Quelle-Filter-Modell k�nne man in Hinblick auf die Signalverarbeitung sehr sch�n implementieren, und auch technologisch sei es besser nutzbar. Da es aber eine Idealisierung sei, h�re man einen deutlichen Unterschied zur klassischen Methode, die viel nat�rlicher klinge. Ein weiterer Vorteil dieser Methode sei, dass man f�r die Synthese einer Stimme weniger Daten brauche und den Dialekt stufenlos einstellen k�nne, so Pucher.

Beispiele
"Nur kein Schmalz nicht habe ich gesagt" auf Wienerisch:

Download (42,07 KB)

und im Sch�nbrunner Deutsch:

Download (61,08 KB)

Kommerzielle Anwendung soll kommen
Die bestehenden Aufnahmen und Daten sollen auch kommerziell zum Einsatz kommen, etwa als Software, die dann Texte vom Bildschirm in �sterreichischem Deutsch vorliest. F�r das Wienerische sei die Abdeckung noch nicht gro� genug, um auch alle m�glichen Inhalte generieren zu k�nnen, erkl�rt Pucher: "Wir k�nnen mit den vorhandenen Daten zwar theoretisch bereits alles synthetisieren, aber wir wissen noch nicht genau, wie wir das von der Orthografie auf das Phonetische umsetzen sollen."

In technischer Hinsicht sei ein Dialekt nicht schwieriger als Hochsprache, es w�rden allerdings �fter Ressourcen wie Texte, Lexika und entsprechende Vorarbeiten fehlen, da Dialekte sich �konomisch nicht so sehr rechnen w�rden. "F�r Englisch gibt es viel, auch f�r Deutsch, aber f�r �sterreichisch gibt es nichts, und f�r Roma-Sprachen etwa gibt es auch nichts", so Pucher.

Wienerisch vorerst nur f�r Demonstrationen
F�r das Wienerische werde es daher vorerst vor allem spezielle Anwendung wie den bei der Vorstellung pr�sentierten Restaurantguide geben, der einem Anrufer in den vier aufgenommenen Auspr�gungen im Dialogsystem Restaurants empfiehlt - inklusive "Nudlaug". Die Anwendungsdemonstration sowie weitere Soundfiles dazu sollen n�chste Woche auf der ftw-Website publiziert werden.

"Heast, G'scherda, i vasteh di ned"
("Zugereister, ich verstehe dich nicht")

Download (38,78 KB)

"Heast, G'schissana, hau di iba d'Heisa"
(Sehr unfl�tiger Ausdruck f�r: "Geh mir aus den Augen")

Download (55,9 KB)

Beiden Versionen der Sprachsynthese ist ihre k�nstliche Erzeugung zum Teil noch sehr deutlich anzumerken, und nicht immer kann man das Gesprochene auch richtig verstehen, wie etwa Gautier nach der Pr�sentation anmerkte. Es werde auch noch einiges an Forschung brauchen, um den Computern ein halbwegs menschliches Ausdrucksverm�gen mit etwa unterschiedlichen Stimmlagen n�her zubringen, so Pucher.

via FZ

Autor schreiben

Kurze URL:

Currently 4.67/5
1
2
3
4
5

Bewertung: 4.7/5 (3 Stimmen)

Das k�nnte Dich auch interessieren:

Supercomputer Cheyenne um 480.000 Dollar versteigert
Der 5,34-Petaflop-Rechner war einst weltweit auf Platz 20 in Sachen Performance und sollte eigentlich schon 2021 ersetzt werden

SGI ICE XA: Ehemaliger Top-20-Supercomputer wird versteigert
Eine �ffentliche Versteigerung von ehemaligen Regierungs-Supercomputern gibt es selten. Die ersten Gebote wurden bereits abgegeben.

�hnliche News:

Computerchips f�r die "H�lle": Galliumnitrid h�lt 500 Grad Hitze aus
Smart-TV vin HiSense bringt Computer zum Absturz
Microsoft meldet Fortschritt bei Quanten-Computern
xz-utils: Wie die Computerwelt gerade haarscharf an einer Sicherheitskatastrophe vorbeigeschrammt is ...
Ohne AMD und Intel: China tauscht Regierungscomputer aus
Gel�hmter steuert Computer mit Gedanken �ber Neuralink
Die Supercomputer der Nasa sind veraltet
Europa setzt auf neue Generation von Exascale-Supercomputern
Waferscale Engine 3: Der gr��te Computerchip aller Zeiten
Sipearl Rhea-2: Europas zweite Supercomputer-CPU wird komplex

Weitere News:

aleX fotografiert: Schnecken und einen Hasen
HVO100: Klimaschonender Diesel geht in Deutschland an den Start
Gaming-Router Archer C5400X von TP-Link anf�llig f�r Schadcodeausf�hrung
Die RTX 5090 soll zum Titan-Ersatz werden
Update entfernt Cortana-App und WordPad App, die seit 30 Jahren Teil von Windows war
EU-Pl�ne: Bestellen auf Temu und Shein soll ab 2025 teurer werden
Neues Material ist lichtdurchl�ssiger als Glas, aber nicht durchsichtig
Copilot-Plus-PC: Microsoft Recall l�uft auch ohne NPU
Cyberangriff kostet Kyivstar bisher rund 83 Millionen Euro
MSI zeigt Desktop-Mainboard mit CAMM2

Einen Kommentar schreiben

Kommentare

(1)

Bitte bleibe sachlich und fair in deinen �u�erungen. Sollte dein Kommentar nicht sofort erscheinen, ist er in der Warteschlange gelandet und wird meist zeitnah freigeschaltet.

Kommentare:

Leider hast du das Java-Plugin deaktiviert...
Die Kommentarfunktion brauch das Java Plugin aber...

Du kannst aber gerne �ber das Forum Newskommentare schreiben...

Du hast bereits f�r diesen Kommentar angestimmt...

;-)