Ëmfro iwwert de Lëtzebuergesch-Unterrecht

De Lëtzebuerger Bildungssystem am Wandel. Dëst ass d’Theema mat deem sech d’Véronique Glod an hirer Masteraarbecht befaasst. Dass et säit dem éischte Schoulgesetz vun 1843 zu villen Ännerungen am Schoulsystem komm ass, ass verständlech, mee wéi hunn dës d’Entwécklung vum Lëtzebuergesch-Unterrecht beaflosst? Fir dat erauszefannen ass Är Hëllef gefrot: Wéi huet Äre Lëtzebuergesch-Unterrecht ausgesinn an…

Ganzen Artikel

Automatic speech recognition in Luxembourgish. A very first model

The recent advent of highly performant models in Machine Learning had a considerable impact also on automatic speech recognition (ASR) systems in general and on low-resource language in particular. Models that have been trained on thousands of hours of labeled (or unlabeled) speech are achieving today error rates that were inconceivable even ten years ago. However, while these models mainly exist for big languages (i.e. mainly English), small and low-resource languages typically were left out as the preparation of appropriate training material was too costly or too complicated due to the lack of the required high amount of text and audio data. At least since the development of self-supervised learning frameworks like wav2vec2, low-resource languages are experiencing also some considerable advancement in speech recognition and related tasks. Instead of developing an ASR system entirely from scratch for a certain small language, one can now use one of the massive multilingual self-supervised models and fine-tune them with a smaller amount of data for a specific target language.

Ganzen Artikel

Job offer: PhD position in Linguistics/Automatic Speech Recognition

The University of Luxembourg is an international research university with a distinctly multilingual and interdisciplinary character. The University was founded in 2003 and counts more than 6,700 students and more than 2,000 employees from around the world. The University’s faculties and interdisciplinary centres focus on research in the areas of Computer Science and ICT Security, Materials Science, European and International Law, Finance and…

Ganzen Artikel

Neie lëtzebuergesche Sproochatlas online

‚t ass eis eng grouss Freed, no laanger Virbereedungszäit den neie lëtzebuergesche Sproochatlas unzekënnegen, deen an der éischter Phas online publizéiert gëtt. Den ‚ale‘ ‚Luxemburgischer Sprachatlas‘ datéiert an d’Joer 1963 a baséiert op Sproochdate vun der Zäit virum 2. Weltkrich. Et ass also evident, datt sech d’Sprooch villfälteg Manéieren zënterhier verännert huet. An dësem neien…

Ganzen Artikel

Ëmfro iwwer Voice AI zu Lëtzebuerg

Heimat wëll ech op eng aktuell Ëmfro hiweisen, an där et ëm d’Voice AI geet, also automatesch Sproochsteierung. D’Ëmfro ass Deel vun der Ofschlossaarbecht enger Studentin vun der Salford University, Manchester an ass iwwert dëse Link ze erreechen: https://www.surveymonkey.com/r/QPF22TZ Maacht wgl. all mat, wann Der Zäit a Loscht hutt. — Weider Infoen: Dear Participant, Voice…

Ganzen Artikel

Eis Schnëssen-Auswäertung fir den 3. Advent: Den Zesummefall vum ‚ch‘ mam ’sch‘

Well mir Iech d’Adventszäit och dëst Joer erëm mat e puer flotten Auswäertungen aus der Schnëssen-App wëlle verséissen, fannt Dir hei am Fuerschungsportal an och op eise Social-Media-Kanäl (Facebook, Instagram an Twitter) all Adventssonndeg e kuerze Video, deen sech mat jeeweils engem vu villen interessante Variatiounsphenomeener vum Lëtzebuergesche beschäftegt. Am Video vun haut dréit sech…

Ganzen Artikel

Automatic phonetic segmentation for Luxembourgish

In collaboration with the Bavarian Archive for Speech Signals, we have developed a new functionality for the automatic analysis of spoken speech data: Luxembourgish has been added to the list of languages of the BASWebServices for the automatic analysis of sound files. It is now possible to process the phonetic segmentation of speech recordings automatically, provided an orthographic…

Ganzen Artikel

Lëtzebuergesch lo als Sprooch an de spaCy-NLP-Tools

D’Lëtzebuergescht ass lo als Sprooch an d’spaCy-NLP-Tools opgeholl ginn. spaCy ass am Moment mat déi wichtegst Python-Bibliothéik fir d’Software-Entwécklung am Beräich vum automateschen Traitement vun der Sprooch. An dësem Beispill-Skript erklären ech déi Funktionalitéiten (Tokenisation, Lemmatisation, POS-Tagging), déi den Ament scho méiglech sinn an ouni groussen Opwand aner Programmer agebaut kënne ginn. Dës Funktionalitéite si…

Ganzen Artikel