9 Reaktionen

Mozilla startet Beta von Firefox Voice

Geschätzte Lesedauer:

Mozilla hat die Betaphase von Firefox Voice gestartet. Mit Firefox Voice bringt Mozilla Sprachsteuerung in den Browser.

Firefox Voice ist ein neues Experiment von Mozilla, welches es erlaubt, Firefox per Sprache zu steuern. Es handelt sich dabei um eine Erweiterung für den Desktop-Firefox. Für Mobilgeräte steht Firefox Voice zu diesem Zeitpunkt noch nicht zur Verfügung.

Download Mozilla Firefox Voice Beta

Sprachsteuerung via Firefox Voice

Direkt nach der Installation fragt Firefox Voice, ob Mozilla anonymisierte Sprachmitschriften sammeln und analysieren darf, womit der Nutzer dabei hilft, die Genauigkeit des Dienstes zu verbessern, und die Entwicklung weiterer Features unterstützt. Die Sprachmitschriften werden auf Mozillas Servern gespeichert und nicht mit Dritten geteilt, außerdem werden diese nach einigen Monaten gelöscht. Das Ganze ist aber optional, Firefox Voice funktioniert auch, wenn diese Frage verneint wird.

Jedoch ist es zur Verarbeitung der Sprachbefehle notwendig, diese an den Google Cloud Speech Service zu senden, um Ergebnisse zu erhalten. Die Sprachaufnahmen werden von Google in gar keinem Fall und, falls nicht explizit in den Einstellungen der Erweiterung aktiviert, auch von Mozilla nicht gespeichert. Wie die meisten Mozilla-Produkte ist auch Firefox Voice Open Source, der Code steht auf GitHub zur Verfügung.

Firefox Voice Beta

Unterstützt wird derzeit lediglich die englische Sprache. Zur Verwendung muss das entsprechende Symbol in der Symbolleiste von Firefox gedrückt oder eine Tastenkombination betätigt werden, welche vom Nutzer auch geändert werden kann. Anschließend kann der Nutzer den gewünschten Sprachbefehl in das Mikrofon seines Computers sprechen. Ein paar Beispiele:

  • Go to New York Times
  • Read the article on this page
  • Show movie times at the closest theater
  • Find my calendar tab
  • Shop for dog beds on Amazon

Die Erweiterung beinhaltet eine Hilfe-Seite mit zahlreichen weiteren Beispielen.

Mozillas Arbeit auf dem Gebiet der Sprachtechnologie

Dies ist nicht Mozilla einzige Bestrebung im Bereich der Sprachtechnologie. Im Gegenteil leistet Mozilla hier einen wichtigen Beitrag, auf den in einem gesonderten Spezial-Artikel detaillierter eingegangen wird.

Firefox Voice: Mozilla bittet um Feedback

Firefox Voice ist Mozillas neueste Bestrebung im Bereich der Sprachtechnologie, befindet sich jedoch noch in einem frühen Stadium und ist daher auch noch als Experiment zu betrachten.

Nutzer sind dazu eingeladen, Mozilla auf dieser Seite Feedback zu geben.

Dieser Artikel wurde von Sören Hentzschel verfasst.

Sören Hentzschel ist Webentwickler aus Salzburg. Auf soeren-hentzschel.at informiert er umfassend über Neuigkeiten zu Mozilla. Außerdem ist er Betreiber von camp-firefox.de, der ersten Anlaufstelle im deutschsprachigen Raum für Firefox-Probleme aller Art. Weitere Projekte sind firefox.agenedia.com, mozilla.de, firefoxosdevices.org sowie sozone.de.

9 Kommentare - bis jetzt!

Eigenen Kommentar verfassen
  1. Frank
    schrieb am :

    Habe sehr lange darauf gewartet und freue mich darüber.

    zu den Voice commands:

    ich denke das das noch ausgebaut wird?

    was ist mit page back – page forward – restart Browser?

    Was mir negativ auffällt ist das sich das Voice Icon sich über die Tabs legt und sich nur oben in der Linie verschieben lässt!

    Also kein Floating.

    Eine farbliche anpassung an Dark Mode würde es perfekt machen.

    Ansonsten ist das sehr erfreulich!

  2. Sören Hentzschel Verfasser des Artikels
    schrieb am :

    Siehe dazu der letzte Satz des Artikels:

    Nutzer sind dazu eingeladen, Mozilla auf dieser Seite Feedback zu geben.

    Dort kannst du Mozilla alles vorschlagen, was du noch vermisst. Das ist nicht nur für Fehlermeldungen, sondern auch für Feature-Anfragen. 😉

    Was mir negativ auffällt ist das sich das Voice Icon sich über die Tabs legt und sich nur oben in der Linie verschieben lässt!

    Also kein Floating.

    Was du damit meinst, weiß ich allerdings nicht.

  3. Frank
    schrieb am :

    Ok..Vorschläge machen…dann werde ich das wohl müssen. Auf En oder De?

    Mit Floating meine ich einen Button/Icon der sich nach überallhin verschieben lässt auf dem Desktop oder innerhalb des Browserwindows.
    Momentan ist nur ein Horizontales Verschieben möglich, nach einem Neustart des Browsers (ich habe ein Problem mit Videofenstern) ist er wieder in der Mitte. Er legt sich auch oberhalb eines Videos, bleibt sichtbar. Na dann werd ich das mal bemeckern gehen 🙂

     

  4. Sören Hentzschel Verfasser des Artikels
    schrieb am :

    Das musst du auf Englisch machen.

    Der Button lässt sich ganz normal wie jeder andere Toolbar-Button auch innerhalb der Toolbar verschieben. Die Möglichkeit, den Button ganz woanders hinzuschieben, ist eine Möglichkeit, die in Firefox überhaupt nicht existiert und dementsprechend eine Erweiterung auch nicht tun kann. Das zu implementieren, hätte mit Firefox Voice nichts zu tun, das müsste für Firefox implementiert werden und würde dann für alle Buttons gelten.

  5. Julian
    schrieb am :

    Werden die Sprachmitschnitte für Common Voice gesammelt?

    Und Google Cloud Speech Service wird genutzt, weil Common Voice für den Alltag noch nicht ausgereift genug ist?

  6. Sören Hentzschel Verfasser des Artikels
    schrieb am :

    Die Alternative zu Google Cloud Speech wäre eher Mozilla DeepSpeech. Bei der Web Speech API, an der Mozilla für Firefox arbeitet, wird auch die Google Cloud Speech API genutzt, mit dem Ziel, langfristig Mozilla DeepSpeech zu nutzen, zumindest für Englisch. Siehe auch mein parallel erschienener Artikel Mozillas Arbeit auf dem Gebiet der Sprachtechnologie.

    In den Einstellungen von Firefox Voice gibt es drei verschiedene Einstellungen bzgl. der Sammlung von Daten, um Mozilla zu helfen. Ob da nun Common Voice, Deep Speech oder was auch immer profitiert, kann ich im Detail nicht sagen, aber ja, die Daten können allgemein gesprochen auch dazu genutzt werden, um Mozillas Sprachtechnologie zu verbessern, sofern der Nutzer zustimmt.

  7. Julian
    schrieb am :

    Das DeepSpeech die Engine dahinter ist, ist natürlich klar. Das steht und fällt aber alles mit dem Sprachmodell. Darum geben die verschiedenen Player ja so gerne Deep Learning-Anwendungen open source frei, weil der wirkliche Wert in den dahinterliegenden Daten liegt.

    Und damit kommt halt Common Voice ins Spiel. Der freiwillige Input über die Website ist ja ganz nett. Wenn die Eingaben über Firefox Voice auch einfließen, hätte das wenigsten etwas mehr Schlagkraft. Wenn die Daten nur an Google, die sie ohnehin kaum nötig haben, gehen, wäre das schon eine Farce.

    Kann man ja auch kuratiert machen. Sprach-Samples werden gesammelt und man kann dann selbst entscheiden, was hochgeladen wird (evtl. sogar mir Korrektur), sodass dann auch die Privatsphäre gewahrt wird.

    Siehe auch Mycroft. Das Programm ist zwar open source, man bedient sich auch DeepSpeech und Common Voice. Die neuen Daten, die erhoben werden, wenn man dem zustimmt, fließen exklusiv in das eigene, abgeschlossene Projekt, wodurch dann Common Voice dann nicht profitiert.

  8. Sören Hentzschel Verfasser des Artikels
    schrieb am :

    Wenn die Daten nur an Google, die sie ohnehin kaum nötig haben, gehen, wäre das schon eine Farce.

    Da es Google nicht gestattet ist, die Sprachaufnahmen zu behalten, kann von einer "Farce" nicht die Rede sein. Das steht aber auch im Artikel, genau wie dass die Aufnahmen optional an Mozilla gesendet werden können. Unklar ist lediglich, wie die Aufnahmen genau von Mozilla zur Verbesserung genutzt werden.

  9. Julian
    schrieb am :

    Da es Google nicht gestattet ist, die Sprachaufnahmen zu behalten, kann von einer "Farce" nicht die Rede sein. Das steht aber auch im Artikel, genau wie dass die Aufnahmen optional an Mozilla gesendet werden können. Unklar ist lediglich, wie die Aufnahmen genau von Mozilla zur Verbesserung genutzt werden.

    Das mit Google war mich zugegebenermaßen im letzten Post nicht mehr so präsent. Darum ging es mir ja auch gar nicht in der Hauptsache. Mich hat einfach interessiert, ob ich damit auch Common Voice unterstützen kann. Geantwortet habe ich eigentlich nur noch mal, weil die genutzten Daten ja doch noch separat von der DeepSpeech-Engine zu betrachten sind, die sie nur unabhängig von der konkreten Quelle verarbeitet. Für das Debugging, können die Daten aber natürlich auch einen gewissen Wert für die Entwicklung der Engine direkt haben.

Und jetzt du! Deine Meinung?

Erforderliche Felder sind mit einem Asterisk (*) gekennzeichnet. Die E-Mail-Adresse wird nicht veröffentlicht.
  1. Nach Absenden des Kommentar-Formulars erfolgt eine Verarbeitung der von Ihnen eingegebenen personenbezogenen Daten durch den datenschutzrechtlich Verantwortlichen zum Zweck der Bearbeitung Ihrer Anfrage auf Grundlage Ihrer durch das Absenden des Formulars erteilten Einwilligung.
    Weitere Informationen