ISSN 0798 1015


logo


Vol. 41 (Nº 32) Año 2020. Art. 16

Recibido: 07/07/2019 • Aprobado: 16/08/2020 • Publicado 27/08/2020

Reconocimiento de voz para el control de una silla de ruedas, basado en MFCC-Entropía Difusa

Speech Recognition for wheelchair control based on MFCC-Fuzzy Entropy

MEDINA, Boris A. 1  
SIERRA, Javier E. 2
LÓPEZ, José L. 3

Resumen
Este artículo presenta un enfoque para el reconocimiento de voz basado en el uso de los coeficientes cepstrales de frecuencia de Mel-Entropía difusa (MFCC-FE), cuyo propósito consiste en extraer y seleccionar los coeficientes de mayor relevancia que permitan identificar el comando de voz específico para ordenar el movimiento y direccionamiento de una silla de ruedas. La técnica MFCC extrae las características relevantes de la señal de voz y el criterio de Entropía Difusa reduce su dimensionalidad. Un algoritmo de clasificación proporcionado por Maquina de Vector de Soporte (SVM) recibe el vector de coeficientes resultante para decidir entre cinco palabras (Avanzar, Atrás, Parar, Izquierda y Derecha), la acción que ejecutarán los motores de CC en cada una de las ruedas de la silla de ruedas. Los resultados de la implementación comparan las técnicas MFCC y MFCC-FE, y entregan una precisión de reconocimiento superior al 91%.
Palabras clave: MFCC, entropía difusa, SVM, reconocimiento de voz.

Abstract
This article presents an approach to speech recognition based on the use of the Mel Frequency Cepstral Coefficients – Fuzzy Entropy (MFCC-FE), whose purpose is to extract and select the most relevant coefficients that allow the specific Speech command to be identified to order the movement and direction of a wheelchair. MFCC technique extracts the relevant features of the speech signal and the Fuzzy Entropy criterion reduces its dimensionality. A classifier algorithm provided by Support Vector Machine (SVM) receives the resulting vector of coefficients to decide between five words (Go, Back, Stop, Left and Right), the action that the DC motors will execute in each of the wheelchair wheels. The implementation results compare the MFCC and MFCC-FE techniques, and deliver a recognition accuracy of over 91%.
key words: MFCC, fuzzy entropy, SVM, speech recognition.


Artículo completo en PDFArtículo completo en PDF


1. Ingeniero Electrónico. Magíster en Automatización y Control Industrial. Docente Investigador Universidad de Sucre, Facultad de Ingenieía. E.mail: boris.medina@unisucre.edu.co

2. Ingeniero Electrónico; Magíster en Ingeniería. Doctor en Ingeniería. Docente Investigador Universidad de Sucre, Facultad de Ingenieía. E.mail: javier.sierra@unisucre.edu.co

3. Ingeniero Electrónico; Magíster en Ingeniería. Docente Investigador Universidad de Sucre, Facultad de Ingenieía. E.mail: jose.lopez@unisucre.edu.co


Revista ESPACIOS. ISSN 0798 1015
Vol. 41 (Nº 32) Año 2020

[Índice]

[En caso de encontrar algún error en este website favor enviar email a webmaster]

revistaespacios.com

Licencia de Creative Commons
Esta obra está bajo una licencia de Creative Commons
Reconocimiento-NoComercial 4.0 Internacional