Mozilla veröffentlicht Common Voice Corpus 22.0
Mit Common Voice stellt Mozilla den weltweit größten öffentlichen Datensatz menschlicher Stimmen bereit – kostenlos und für jeden nutzbar. Mozilla hat Version 22.0 seines Datensatzes veröffentlicht.
Der Markt für Spracherkennung wird von den ganz großen Namen kommerzieller Anbieter dominiert: Amazon, Apple, Google, Microsoft. Darum hat Mozilla im Jahr 2017 das Projekt Common Voice gestartet. Mit Common Voice bietet Mozilla eine kostenlose Alternative an, zu der jeder beitragen kann und die jedem zur Verfügung steht. Damit möchte Mozilla Innovation und Wettbewerb in der Sprachtechnologie auf Basis von Maschinenlernen fördern.
Mit dem nun veröffentlichten Common Voice Corpus 22.0 wächst der deutschsprachige Datensatz von 1.452 auf 1.476 Stunden an. Wer bereits den Common Voice Corpus 21.0 besitzt, kann wie immer auch nur ein sogenanntes Delta Segment mit den Unterschieden zur Vorversion herunterladen. Für Deutsch würde das den Download von 33,38 GB auf 463,63 MB reduzieren.
Insgesamt deckt Mozilla Common Voice mit der neuen Version 137 Sprachen mit insgesamt 33.816 aufgenommenen Stunden ab, was Mozilla Common Voice zum vielfältigsten mehrsprachigen Sprachkorpus der Welt macht.
Weitere aktuelle Artikel aus der Kategorie „Mozilla“
- 20.06.2025USA: Privacy Protection Plan bündelt Mozilla VPN, Mozilla Monitor Plus und Firefox Relay Premium
- 22.05.2025Mozilla stellt Pocket und Fakespot ein
- 09.04.2025US-Regierung streicht Fördergelder für Mozilla Foundation in Millionenhöhe
- 24.03.2025Mozilla veröffentlicht Common Voice Corpus 21.0
- 23.02.2025Mozilla stellt sich auf Führungsebene breiter auf
Füge diese URL in deine WordPress-Website ein, um sie einzubetten
Füge diesen Code in deine Website ein, um ihn einzubinden