Projekt Meta-led MMS: Revoluční průlom v rozpoznávání a syntéze řeči

27. 05. 2023
Projekt Meta-led MMS: Revoluční průlom v rozpoznávání a syntéze řeči
foto: Pixabay/ilustrativní

Projekt Meta-led Massively Multilingual Speech (MMS) přináší revoluční pokrok v oblasti rozpoznávání a syntézy řeči. Díky kombinaci technik samočinného učení a využití náboženských textů, jako je Bible, dokáže projekt MMS rozpoznat a pracovat s více než 4000 jazyky. S předtrénovanými modely wav2vec 2.0 a vícejazyčným rozpoznáváním řeči nabízí společnost Meta efektivní řešení pro identifikaci jazyka a převod mluveného slova na text. Projekt MMS představuje významný krok vpřed v překonávání jazykových bariér a poskytování informací ve světovém měřítku.

Ještě nedávno byl nedostatek označených dat jedním z problémů mnoha aplikací v oblasti jazyků a mluvené řeči. Většina z používaných aplikací momentálně podporuje pouze kolem sta jazyků, což je vzhledem k více než 7000 světovým řečem velmi málo, uvádí server Synced.. Společnost Meta se rozhodla tento problém řešit. Projekt Meta-led Massively Multilingual Speech (MMS), zaměřený právě na tuto oblast, dosahuje rychlého a úžasného pokroku. Díky technikám samoučení a využití mnoha náboženských textů jsou současné modely schopny rozpoznat 4017 jazyků. Byly vytvořeny předtrénované modely wav2vec 2.0, které pokrývají 1406 jazyků, a také vícejazyčný model pro automatické rozpoznávání řeči a modely syntézy řeči pro 1107 jazyků.

Velkým problémem, se kterým se vývojáři hned z počátku projektu potýkali, bylo nalézt vhodný zdroj dat. Zatímco v angličtině je dostupné obrovské množství obsahu, najít doslovně stejný text napsaný a namluvený v co nejvíce jazycích nebylo vůbec snadné. Nakonec byly využity náboženské texty, jako je Bible, které v rámci možností vyhovovaly požadavkům, informuje server AINEWS. Dalším významným faktorem byla existence zvukových nahrávek těchto materiálů. Například Nový zákon byl dostupný ve více než 1100 jazycích a neoznačené náboženské texty v 4 000 jazycích.

Pro společnost Meta je to další velký pokrok. Projekt je zaměřen na úkoly jako je vícejazyčné rozpoznávání řeči a identifikace jazyka. Program dosahuje překvapivě dobrých výsledků, včetně převodu mluveného slova na text. I přes omezení vstupních dat, která převážně pocházejí od mužských řečníků, program zvládá i ženské mluvčí a prokazuje vysokou úspěšnost.

 

 

Tagy

▼-1%
1 den
▼-0.33%
1 týden
▲+4.15%
1 měsíc
▲+32.76%
1 rok
Akcioměr 40.68%
info
▲+1.13
1 den
▲+4.6
1 týden
▼-8.17
1 měsíc
▼-7.04
1 rok
Index stresu 40.57
info
Naše zprávy najdete i na sítích
FCB, Twitter, LinkedIn