Diseño de una interfaz de reconocimiento de voz para el manejo de una silla de ruedas, mediante la implementación de sistemas embebidos en FPA

dc.contributor.advisorGuzmán Serna, Fabio Alonso
dc.contributor.authorPrieto Almonacid, Juan Daniel
dc.contributor.authorGarcia Prada, Jefferson Manuel
dc.coverage.spatialBucaramanga
dc.coverage.temporal2016
dc.creator.grantorUniversidad Pontificia Bolivariana
dc.date.accessioned2026-05-12T21:07:08Z
dc.date.issued2016
dc.descriptionPáginas 172spa
dc.description.abstractEste proyecto plantea el desarrollo e implementación de un sistema que permite manipular una silla de ruedas, endosada con motores de corriente continua, utilizando comandos de voz en habla hispana a través de un ecosistema capaz de realizar reconocimiento de voz por deletreo mediante procesamiento de señales y captación de fonemas en una interfaz embebida programada sobre una FPGA. Se retoma un proyecto existente en la Universidad Pontificia Bolivariana el cual utilizaba un analizador de espectros comercial capaz de identificar muestras de audio pre-grabadas para ejecutar acciones en la silla de ruedas. Se adquiere un board de desarrollo DE1-SoC que satisface las necesidades requeridas. Primero se almacena la voz proveniente de un micrófono en formato WAV, para que esto ocurra se debe superar cierto umbral de intensidad. Esta adquisición de datos ocurre en un módulo ADC que muestrea a 8Khz. Para lograr la detección de la o las palabras pronunciadas, se recurren a los coeficientes cepstrales en las frecuencias de MEL (MFCC), los cuales concentran características propias de los fonemas en bancos de filtros, y desecha información poco valiosa que empobrecen el reconocimiento de voz tales como ruido de fondo, emociones, volumen o tono. El algoritmo implementado utiliza varios tipos de transformadas como Fourier (FFT) y Coseno (DCT), así como filtrado digital (FIR) y modelo oculto de Markov (HMM). Finalmente se añade una capa de seguridad mediante la implementación de sensores de radar ultrasónicos (SRF02), conectados a un bus I2C, para evitar colisiones en el desplazamiento. Al integrar todo el proceso matemático procesado en el ARM con aceleración por hardware se logran resultados satisfactorios siendo capaz de reconocer palabras con tiempos de ejecución reducidos y favorables para la implementación del manejo de la silla de ruedas.spa
dc.description.abstractThis project proposes the development and implementation of a system able to handle a wheelchair, endorsed with DC motors, using spanish speaking voice commands through an ecosystem capable to process speech recognition by using signal processing and uptake phonemes into a programmed interface embedded on a FPGA. We’ve designed based on Universidad Pontificia Bolivariana project which used a commercial spectral analyzer capable of identifying audio samples pre-recorded in order to execute actions on the wheelchair. A DE1-SoC board was acquired because it can execute efficiently the algorithm proposed. First the voice from a microphone is stored in a WAV file, but it must exceed certain intensity threshold before recording. Data acquisition occurs by an analog-to-digital converter (ADC) which sampling at 8 KHz. the goal is design an algorithm capable to detect and understand the words stored in the audio file. The Mel Frequency Cepstral Coefficients (MFCC) are designed as an approximate human voice scale and allow better representation of speech sounds, it’s hugely applied in automatic speech recognition software. MFCC keeps some important phonemes characteristics in filter banks, discarding some useless information that impoverish the speech recognition such as background noise, emotions, volume or tone. The implemented algorithm uses different math transformations like Fast Fourier Transform (FFT) and Discrete Cosine Transform (DCT), as well as digital filters (FIR) and the Hidden Markov Model (HMM). Finally, a security layer is added by implementing some ultrasonic radar sensors (SRF02), connected to an I2C bus, in order to avoid possible collisions along the displacement. The math process running in the ARM works truly fine with the hardware acceleration. Both achieved awesome results being capable of recognize many different words in short periods of time, making the final project able to handle the wheelchair successfully.eng
dc.description.degreenameIngeniero Electrónico
dc.description.sectionalBucaramanga
dc.format.mimetypeapplication/pdf
dc.identifier.urihttp://hdl.handle.net/20.500.11912/13779
dc.language.isospa
dc.publisher.departmentEscuela de Ingeniería
dc.publisher.programIngeniería Electrónica
dc.rightsAttribution-NonCommercial-NoDerivs 2.5 Colombiaen
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.subjectSistemas De Computador Embebidosspa
dc.subjectSillas De Ruedasspa
dc.subjectSistemas De Comando Y Controlspa
dc.subjectUniversidades - Universidad Pontificia Bolivariana - Bucaramangaspa
dc.subjectAlgoritmosspa
dc.subjectSistemas De Procesamiento De La Vozspa
dc.titleDiseño de una interfaz de reconocimiento de voz para el manejo de una silla de ruedas, mediante la implementación de sistemas embebidos en FPAspa
dc.typeTrabajo de grado
dc.type.hasVersionpublishedVersion

Archivos

Bloque original

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
documento (14).pdf
Tamaño:
5.78 MB
Formato:
Adobe Portable Document Format

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
Prieto Almonacid, Juan Daniel - Garcia Prada, Jefferson Manuel_0001.pdf
Tamaño:
741.16 KB
Formato:
Item-specific license agreed upon to submission
Descripción: