Mozilla veröffentlicht Common Voice 24
Mit Common Voice stellt Mozilla den weltweit größten öffentlichen Datensatz menschlicher Stimmen bereit – kostenlos und für jeden nutzbar. Mozilla hat Version 24 seines Datensatzes veröffentlicht.
Der Markt für Spracherkennung wird von den ganz großen Namen kommerzieller Anbieter dominiert: Amazon, Apple, Google, Microsoft. Darum hat Mozilla im Jahr 2017 das Projekt Common Voice gestartet. Mit Common Voice bietet Mozilla eine kostenlose Alternative an, zu der jeder beitragen kann und die jedem zur Verfügung steht. Damit möchte Mozilla Innovation und Wettbewerb in der Sprachtechnologie auf Basis von Maschinenlernen fördern.
Mozilla Common Voice 24
Der nun veröffentlichte Datensatz Common Voice Scripted Speech 24 beinhaltet für die deutsche Sprache 1.483 Stunden an Daten und ist 34,53 GB groß. In Summe waren 20.413 Menschen am deutschsprachigen Datensatz beteiligt. Der Datensatz Common Voice Spontaneous Speech 2 für spontane Sprache kommt für Deutsch auf zwei Stunden an Daten und ist 21,96 MB groß, beigetragen von 17 Personen.
Insgesamt deckt Mozilla Common Voice mit der neuen Version, die wieder Unterstützung für drei neue Sprachen bringt, 289 Sprachen mit insgesamt 38.932 aufgenommenen Stunden ab, was Mozilla Common Voice zum vielfältigsten mehrsprachigen Sprachkorpus der Welt macht. Die Anzahl der unterstützten Sprachen für spontane Sprache ist von 58 auf 62 Sprachen gewachsen.
Zum Download der Mozilla Common Voice Datensätze
Zu Mozilla Common Voice beitragen
Weitere aktuelle Artikel aus der Kategorie „Mozilla“
- 16.12.2025Anthony Enzor-DeMeo ist neuer CEO der Mozilla Corporation
- 08.12.2025🎄🎁 Weihnachten steht vor der Tür - Produkte von Mozilla als Geschenkidee
- 24.11.2025Mozilla Common Voice 23: 149 neue Sprachen und Spontane Sprache
- 23.11.2025Mozilla startet Datenplattform Mozilla Data Collective
- 28.06.2025Mozilla veröffentlicht Common Voice Corpus 22.0
Füge diese URL in deine WordPress-Website ein, um sie einzubetten
Füge diesen Code in deine Website ein, um ihn einzubinden