Aunque Mozilla es sobretodo conocida por Firefox o Thunderbird, posee numerosos proyectos relacionados con la tecnología y siempre Open Source. Este es el caso de una gran colección de datos de voz que recopilados de voluntarios que hacen uso de su proyecto Firefox Voice.
Se trata de un proyecto en el que ponen a disposición de la comunidad miles de horas de conversación transcrita y con información sobre la persona que habla, acento y demás características que puedan ayudar. Esta enorme base de datos tiene como fin la ayuda a la creación de aplicaciones de voz sin necesidad de tener que estar todo el rato escuchando de nosotros.
El crecimiento que ha experimentado estos datos de voz ha sido enorme. Desde Febrero de 2019, ha pasado de las 1400 horas en 18 idiomas hasta las 7226 horas en 54 idiomas. Es decir, un total de 5.5 millones de clips de audio donde se puede ver lo que dice la persona y quién lo dice. Toda esta información ha sido gracias a miles de personas que colaboran en el proyecto. Por ejemplo, palabras como “hey”, “Firefox”, “Si”, “No”, los números del 0 al 9 han sido grabados por 11.000 personas en 18 idiomas en más de 120 horas de clips.
Todo este proyecto, tiene en cuenta la privacidad de las personas que colaboran, y, las grabaciones se hacen de forma voluntaria. La idea de todo el proyecto es conseguir ofrecer una fuente de información suficiente para poder crear aplicaciones de reconocimiento de voz. A diferencia de los asistentes virtuales actuales que obtienen sus datos de las escuchas continuas (con polémica en Google, Apple, Amazon y Microsoft), este proyecto tiene más en cuenta la privacidad de la gente y se realiza de forma activa.
Más info aquí.
La entrada Mozilla actualiza su colección Open Source de datos de voz se publicó primero en Domótica en Casa.