Automatisierte Erstellung neuer Sprachkorpora: Ein Beispiel anhand des Lėtzebuergeschen Contributor(s): Gaal, Syxtus (Author) |
|
ISBN: 3863411420 ISBN-13: 9783863411428 Publisher: Bachelor + Master Publishing OUR PRICE: $37.91 Product Type: Paperback Language: German Published: March 2012 |
Additional Information |
BISAC Categories: - Computers | Programming Languages - General |
Physical Information: 0.1" H x 7" W x 10" (0.22 lbs) 48 pages |
Descriptions, Reviews, Etc. |
Publisher Description: Sprachtechnologien, einmal ein Thema f r theoretische Forschung und Science-Fiction-Filme, sind Alltag geworden. Dank stetig steigender Rechenleistung und jahrzehntelangem Forschungsaufwand kann man heute Sprachsteuerung vielf ltig einsetzen - beim Autofahren, Telefonieren, Surfen und Arbeiten. Hinter dieser ausgereiften Technologie steckt viel Arbeitsaufwand. Um Spracherkennung und Sprachsynthese, also die k nstliche Erzeugung einer Stimme, m glich zu machen, m ssen gro e Mengen von Sprachdaten analysiert und verarbeitet werden. Forscher und Entwickler verwenden diese Daten, um ihrer Computersoftware beizubringen, einen Begriff zu erkennen oder richtig auszusprechen. Sprachtechnologien stehen und fallen mit der Menge guter Sprachdaten. Diese bestehen nicht nur aus reinen Aufnahmen; sie k nnen auch Informationen ber die einzelnen Phoneme, Silben und W rter beinhalten. Sie beschreiben, wo jeder Laut anf ngt und aufh rt, welche Wortteile verwendet wurden und wie die W rter, Phrasen und S tze akzentuiert sind. Alle diese Informationen m ssen f r jeden Laut, jede Silbe, jedes Wort und jeden Satz vorhanden sein. Die Bereitstellung solcher annotierten Sprachdaten ist ein gewaltiger Aufwand. Gebildete Fachkr fte m ssen zwischen 30 Minuten und einer Stunde Zeit opfern um eine Minute der Sprachaufnahmen zu bearbeiten. Oft sind dutzende oder hunderte Stunden solcher bearbeiteter Sprachaufnahmen notwendig, um ein ausgereiftes Spracherkennungs- oder Sprachsynthesesystem zu entwickeln. Wenn man bedenkt, dass die Zeit der notwendigen manuellen Bearbeitung mit 30 bzw. 60 multipliziert werden muss, so ist ein hoher Kostenfaktor erkennbar. Dieser Faktor l sst sich f r gro e Sprachen rechtfertigen, da die Endsysteme f r eine gro e Benutzergruppe zur Verf gung stehen werden. Bei kleineren Sprachen ist der Entwicklungsaufwand genau so gro , da die Zielgruppe jedoch viel kleiner ist, kann er oft nicht gerechtfertigt werden. So f hrt es dazu, dass kleinere Sprachen oft bei der Entwicklu |