CHAPTER II LITERATURE REVIEW
B. Mass Transfer in Electrochemical Dissolution Processes 1 Fundamental Equations
A continuación se describen los resultados obtenidos a partir de la aplicación de SVM-G3 a los sujetos descritos mediante el plano HD. La Figura 3.6 A muestra, de forma general, las regiones del plano correspondientes a los grupos analizados en este trabajo. Se observa en esta figura como, similar que en casos anteriores, los sujetos sanos ocupan el extremo derecho del HD, los sujetos presentan MTDc la región central y los Neruogénicos el extremo derecho del plano HD. La Figura 3.6 B muestra las curvas obtenidas por SVM-G3 en relación con la distribución de los datos en el diagrama HD.
S Sp P Pn TCC Sano 0.78 0.87 0.65 0.92 0.85 Neurogénico 0.24 0.81 0.23 0.82 0.70 MTDc 0.83 0.54 0.70 0.71 0.70 0.61 0.74 0.53 0.82 TCC 0.70 Err 0.30
Figura 3.6 Representación de los resultados obtenidas por el SVM-G3 (A) se muestran las regiones del plano HD donde se ubican los diferentes grupos etiológicos (B) rectas obtenidas por el SVM-G3 teniendo en cuenta la distribución real de los datos en el plano HD
Tabla 3.9 Matriz de confusión obtenida a partir de la clasificación utilizando SVM-G3 REFERENCIA "GOLD STANDARD" Sano Neurogénico MTDc SALIDA Sano 128 14 55 Neurogénico 0 28 10 MTDc 27 81 290
Tabla 3.10. Medidas obtenidas a partir de la matriz de confusión
La Tabla 3.9 muestra la matriz de confusión obtenida de la aplicación de SVM-G3. Se observa como la mayoría de los sujetos sanos fueron clasificados como tal (83%, ver Tabla 3.10). De los clasificados incorrectamente ninguno de ellos fue catalogado como Neurogénico sino como MTDc. La clasificación de los sujetos neurológicos resulta ser peor que en para LDA, SVM-G1 y SVM-G2. Solo el 23% (ver Tabla 3.10) de los sujetos que realmente pertenecen a la clase Neurogénico fueron clasificados como tal. De los incorrectamente clasificados el 85% fue catalogado como MTDc, similar a lo sucedido al
S Sp P Pn TCC Sano 0.83 0.86 0.65 0.94 0.85 Neurogénico 0.23 0.82 0.23 0.81 0.70 MTDc 0.82 0.56 0.70 0.71 0.70 0.62 0.75 0.53 0.82 TCC 0.70 Err 0.30 A B
aplicar LDA, SVM-G1 y SVM-G2 (secciones 3.3.1, 3.3.2.1 y 3.3.2.2 respectivamente). La clasificación de los sujetos con MTDc fue peor que con SVM-G2 pues en este caso el 82% de los casos fueron clasificados correctamente y el 84% de los clasificados incorrectamente fueron catalogados como sujetos sanos. De forma general mediante la aplicación de SVM- G3 es posible lograr que el 70% del total de sujetos sea clasificado correctamente (ver Tabla 3.10).
Redes Neuronales Multicapa (MLP)
En esta sección se describen los resultados correspondientes a la aplicación de MLP a la clasificación de voces patológicas según su etiología. La Figura 3.7 A muestra, de forma general, las diferentes zonas en el plano HD donde se ubican los diferentes grupos analizados dada las curvas obtenidas por el MLP. En la Figura 3.7 B se pueden observar las curvas obtenidas en relación a la distribución de los datos en el plano HD.
Figura 3.7 Representación de los resultados obtenidas por el MLP (A) se muestran las regiones del plano HD donde se ubican los diferentes grupos etiológicos (B) rectas obtenidas por el MLP teniendo en cuenta la distribución real de los datos en el plano HD
Tabla 3.11 Matriz de confusión obtenida a partir de la clasificación utilizando MLP REFERENCIA "GOLD STANDARD" Sano Neurogénico MTDc SALIDA Sano 133 14 60 Neurogénico 0 45 13 MTDc 22 64 282 A B
Tabla 3.12 Medidas obtenidas a partir de la matriz de confusión
La Tabla 3.11 muestra la matriz de confusión obtenida por MLP. Se observa en la tabla como de un total de 155 sujetos sanos 133 fueron clasificados correctamente (86%, ver Tabla 3.11). En el caso de los Neurogénicos se observa como más del 50% (63%) de los casos fueron clasificados correctamente. Nuevamente la mayoría de ellos 82 fueron clasificados como MTDc y el resto como Sanos comprobándose nuevamente el solapamiento entre estas dos clases. En el caso de los sujetos MTDc el 79% (ver Tabla 3.11) del total fue clasificado correctamente, del resto (73 casos) la mayoría representada por el 82% fue catalogada como Sanos y el resto como Neurogénicos. De forma general utilizando el MLP es posible alcanzar un 73% de clasificación correcta de todas las instancias analizadas (ver Tabla 3.12).
Árboles de Decisión (J48)
A continuación se describen los resultados obtenidos a partir de la clasificación de voces patológicas según su etiología utilizando la variante J48. La Figura 3.8 muestra el árbol obtenido por el Weka [88] para separar las diferentes clases.
Tabla 3.13 Matriz de confusión obtenida a partir de la clasificación utilizando J48 REFERENCIA "GOLD STANDARD" Sano Neurogénico MTDc SALIDA Sano 124 14 59 Neurogénico 0 38 18 MTDc 31 71 278
La Tabla 3.13 muestra la matriz de confusión obtenida a partir de la aplicación del algoritmo J48. En este caso el 80% de los sujetos sanos fueron clasificados correctamente y el resto fueron cataloga como MTDc. En ninguno de los casos analizados los sujetos sanos han sido clasificados erróneamente como Nerurogénicos. En el caso del grupo Neruogénico sólo el 31% fue clasificado correctamente de los restantes el 85% fue incorrectamente catalogado
S Sp P Pn TCC Sano 0.86 0.85 0.64 0.95 0.85 Neurogénico 0.37 0.81 0.32 0.84 0.73 MTDc 0.79 0.64 0.74 0.71 0.73 0.67 0.77 0.57 0.83 TCC 0.73 Err 0.27
como MTDc y el resto como Sano. Este comportamiento se observa a lo largo de los clasificadores utilizados (ver secciones 3.3.1, 3.3.2.1, 3.3.2.3 y 3.3.3). En el caso de los sujetos que tienen algún padecimiento de MTDc el 78% fueron clasificados correctamente del resto, la mayor parte que representa el 77% fueron catalogados de forma incorrecta como sanos. De manera general utilizando J48 se logra que el 70% de los casos analizados se clasifique de forma correcta (ver Tabla 3.14).
Figura 3.8 Árbol de decisión obtenido por Weka.
Tabla 3.14 Medidas obtenidas a partir de la matriz de confusión
S Sp P Pn TCC Sano 0.80 0.85 0.63 0.93 0.84 Neurológico 0.31 0.79 0.26 0.83 0.70 MTDc 0.78 0.58 0.71 0.68 0.70 0.63 0.74 0.53 0.81 TCC 0.70 Err 0.30 Ruido <= 1.293 | Irregularidad <= 4.452 | | Irregularidad <= 3.644: Sano | | Irregularidad > 3.644 | | | Ruido <= 0.798 | | | | Ruido <= 0.511: Sano | | | | Ruido > 0.511 | | | | | Ruido <= 0.586: MTDc | | | | | Ruido > 0.586: Sano | | | Ruido > 0.798 | | | | Irregularidad <= 4.261 | | | | | Irregularidad <= 4.102 | | | | | | Irregularidad <= 3.769: Sano | | | | | | Irregularidad > 3.769: MTDc | | | | | Irregularidad > 4.102 | | | | | | Ruido <= 1.054: Neurogénico | | | | | | Ruido > 1.054: Sano | | | | Irregularidad > 4.261: MTDc | Irregularidad > 4.452: MTDC Ruido > 1.293 | Irregularidad <= 4.497 | | Irregularidad <= 2.86 | | | Irregularidad <= 1.993: Sano | | | Irregularidad > 1.993 | | | | Ruido <= 2.086 | | | | | Ruido <= 1.901: MTDc | | | | | Ruido > 1.901: Neurogénico | | | | Ruido > 2.086: MTDc | | Irregularidad > 2.86: MTDc | Irregularidad > 4.497 | | Irregularidad <= 6.277: MTDc | | Irregularidad > 6.277: Neurogénico
Conclusiones Parciales
De forma general se observa en el plano HD la clase Sano se concentran, en su mayoría, en la esquina inferior izquierda. Los valores de CR obtenidos están alrededor de 0.86 y valores de CI por debajo de 4.5. En el caso del grupo MTDc se obtuvo que este se concentra en la región media del plano HD con valores de CR entre 0.5 a 4 y valores de CI entre 3 y 6 aproximadamente. Los casos de la clase Neurogénico se encuentran esparcidos por todo el diagrama HD sin embargos se pueden observar algunos casos ubicado en la esquina superior izquierda con altos valores de CI y CD que coinciden con sujetos que presentan parálisis bilaterales de las cuerdas vocales. En cuanto a la clasificación se obtuvo que el método que mejor logra separar las diferentes clases en el plano HD es MLP alcanzando un 73% de clasificación correcta.
CONCLUSIONES Y RECOMENDACIONES
Conclusiones
Con respecto a “Conformar una base de datos de voces patológicas a partir de las limitaciones encontradas en las bases de datos MEEI y YM”
1. Se conformó una base de datos de voces patológicas a partir de la combinación de grabaciones de las bases MEEI y YM teniendo en cuenta la estandarización de la frecuencia de muestreo (25kHz) y el tiempo de fonación (1 s).
2. Los casos seleccionados en la nueva base de datos se correspondes con los grupos MTDc, Neurogénico y Sano por ser los más representados en MEEI y YM.
3. Con la nueva base de datos MEEI+YM se logra un balance entre las diferentes clases con respecto al número de casos.
Con respecto a “Obtener un conjunto de rasgos acústicos que caracterizan el proceso biomecánico de las cuerdas vocales”
1. Se emplearon CI y CR, componentes del diagrama de ronquera (HD), como rasgos acústicos pues HD es un espacio bidimensional queha sido utilizado para caracterizar diferentes procesos biomecánicos de la vibración de las cuerdas vocales.
Con respecto a “Evaluar métodos conocidos de clasificación para la predicción de voces patológicas según su etiología”
1. Se evaluaron cuatro métodos de clasificadores reportados en la literatura (LDA, SVM, MLP y J48)
2. Se logra una separación entre las clases Sano, MTDc y Neurogénico, en cuanto a TCC, de 73% (utilizando MLP) arribando a regiones relativamente bien definidas en las localizaciones del HD esperadas.
Recomendaciones
1. Considerar otros rasgos acústicos diferentes de las perturbaciones de la periodicidad y ruido.
2. Considerar las valoraciones subjetivas (escala GRBAS) en la clasificación de las diferentes etiologías.
3. Validar los algoritmos de clasificación en otras bases de datos de voces patológicas: Príncipe de Asturias y Saarbreucken Database.
REFERENCIAS BIBLIOGRÁFICAS
[1] P. H. Dejonckere, "Assessment of Voice and Respiratory Function," in Surgery of
Larynx and Trachea, M. Remacle and H. E. Eckel, Eds., ed: Springer Berlin
Heidelberg, 2010, pp. 11-26.
[2] D. B, Steven "Acoustic characteristics of normal and pathological voices," Speech
and language: advances in basic research and practice, vol. 1, pp. 271-335, 1979.
[3] L.-C. Gavidia and J. H. Hansen, "Direct speech feature estimation using an iterative EM algorithm for vocal fold pathology detection," Biomedical Engineering, IEEE
Transactions on, vol. 43, pp. 373-383, 1996.
[4] D. Michaelis, T. Gramss, and H. W. Strube, "Glottal-to-noise excitation ratio–a new measure for describing pathological voices," Acta Acustica united with Acustica, vol. 83, pp. 700-706, 1997.
[5] B. Boyanov and S. Hadjitodorov, "Acoustic Analysis of Pathological Voices," IEEE
Eng Med Biol Mag, vol. 16, pp. 74-78, 1997.
[6] J. H. Hansen, L. Gavidia-Ceballos, and J. F. Kaiser, "A nonlinear operator-based speech feature analysis method with application to vocal fold pathology assessment,"
Biomedical Engineering, IEEE Transactions on, vol. 45, pp. 300-313, 1998.
[7] D. Michaelis, M. Fröhlich, and H. W. Strube, "Selection and combination of acoustic features for the description of pathologic voices," The Journal of the Acoustical
Society of America, vol. 103, pp. 1628-1639, 1998.
[8] D. E. Callan, R. D. Kent, N. Roy, and S. M. Tasko, "Self-organizing map for the classification of normal and disordered female voices," Journal of Speech, Language,
and Hearing Research, vol. 42, pp. 355-366, 1999.
[9] V. Parsa and D. G. Jamieson, "Identification of pathological voices using glottal noise measures," Journal of Speech, Language, and Hearing Research, vol. 43, pp. 469- 485, 2000.
[10] J. B. Alonso, J. De Leon, I. Alonso, and M. A. Ferrer, "Automatic detection of pathologies in the voice by HOS based parameters," EURASIP Journal on Applied
Signal Processing, vol. 4, pp. 275-284, 2001.
[11] V. Parsa and D. G. Jamieson, "Acoustic Discrimination of Pathological VoiceSustained Vowels Versus Continuous Speech," Journal of Speech, Language,
and Hearing Research, vol. 44, pp. 327-339, 2001.
[12] T. L, Eadie and D. C. Philip, "Classification of Dysphonic Voice: Acoustic and Auditory-Perceptual Measures," Journal of Voice, vol. 19, pp. 1-14, 2004.
[13] J. B. Alonso, F. Díaz-de-María, C. M. Travieso, and M. A. Ferrer, "Using nonlinear features for voice disorder detection," in ISCA Tutorial and Research Workshop
(ITRW) on Non-Linear Speech Processing, 2005.
[14] R. Fraile, N. Saenz-Lechon, J. I. Godino-Llorente, V. Osma-Ruiz, and C. Fredouille, "Automatic detection of laryngeal pathologies in records of sustained vowels by
means of mel-frequency cepstral coefficient parameters and differentiation of patients by sex," Folia Phoniatrica et Logopaedica, vol. 61, pp. 146-52, 2009.
[15] M. Hariharan, M. P. Paulraj, and Y. Sazali, "TIME-DOMAIN FEATURES AND PROBABILISTIC NEURAL NETWORK FOR THE DETECTION OF VOCAL FOLD PATHOLOGY " Malasyan Journal of Computer Science, vol. 23, pp. 60-67, 2010.
[16] V. Majidnezhad and I. Kheidorov, "A Hybrid of Genetic Algorithm and Gaussian Mixture Model for Features Reduction and Detection of Vocal Fold Pathology,"
Journal of Advances in Computer Research, vol. 4, pp. 53-62, 2013.
[17] V. Sellam and J. Jagadeesan, "Classification of Normal and Pathological Voice Using SVM and RBFNN " Journal of Signal and Information Processing, 2014, 5, 1-7, 2013.
[18] J. Mekyska, E. Janousova, P. Gomez-Vilda, Z. Smekal, I. Rektorova, I. Eliasova, et al., "Robust and Complex Approach of Pathological Speech Signal Analysis,"
Neurocomputing, 2015.
[19] N. Roy, J. Barkmeier-Kraemer, T. Eadie, M. P. Sivasankar, D. Mehta, D. Paul, et al., "Evidence-based clinical voice assessment: a systematic review," American Journal
of Speech-Language Pathology, vol. 22, pp. 212-226, 2013.
[20] K. Honda, "Physiological Process of Speech Production," in Handbook of Speech
Processing, J. Benesty, M. M. Sondhi, and Y. Huang, Eds., ed Berlin: Springer
Verlag, 2008.
[21] J. L. Flanagan, "Some properties of the glottal sound source," Journal of Speech,
Language, and Hearing Research, vol. 1, pp. 99-116, 1958.
[22] Y. Maryn, "Acoustic Measurement of Overall Voice Quality in Sustained Vowels and Continuous Speech," PhD Doctoral, Department of otorhinolaryngology, Faculty of Medicine and Health Sciences, Universidad de Guent, Ghent, 2010.
[23] I. Titze, Principles of Voice Production. Englewood Cliffs: Prentice Hall, 1994. [24] J. Bernal, J. Bobadilla, and P. Gómez Vilda, Reconocimiento de Voz y Fonética
Acústica. Madrid: RA-MA Editorial, 2000.
[25] T. F. Quatieri, Discrete-Time Speech Signal Processing. Principles and Practice. New Jersey: Prentice Hall, 2002.
[26] K. Marasek, "EGG & Voice Quality," PhD, Sttugart University, germany, 1997. [27] G. Fant, Acoustic theory of speech production: with calculations based on X-ray
studies of Russian articulations vol. 2: Walter de Gruyter, 1971.
[28] K. N. Stevens, "Airflow and turbulence noise for fricative and stop consonants: Static considerations," The Journal of the Acoustical Society of America, vol. 50, pp. 1180- 1192, 1971.
[29] P. J. Murphy, "Perturbation-free measurement of the harmonics-to-noise ratio in voice signals using pitch synchronous harmonic analysis," The Journal of the
[30] C. Ferrer, E. González, M. E. Hernández-Díaz, D. Torres, and A. del Toro, "Removing the influence of shimmer in the calculation of harmonics-to-noise ratios using ensemble-averages in voice signals," EURASIP Journal on Advances in Signal
Processing, vol. 2009, p. 4, 2009.
[31] D. Torres and C. Ferrery, "Correcting HNR Estimation in Voice Signals Based on Periodicity Detection," in V Latin American Congress on Biomedical Engineering
CLAIB 2011 May 16-21, 2011, Habana, Cuba, 2013, pp. 1190-1193.
[32] D. Torres-Boza and C. A. Ferrer, "Improvements to the HNR Estimation Based-on Generalized Variogram," in Progress in Pattern Recognition, Image Analysis,
Computer Vision, and Applications, ed: Springer, 2013, pp. 519-526.
[33] T. Drugman, "Advances in glottal analysis and its applications," PhD Doctoral Thesis, TCTS Lab, University of Mons, Mons, 2012.
[34] R. J. Baken, Clinical Measurements of Speech and Voice. San Diego: Singular, 1999. [35] B. Cranen and F. de Jong, "Laryngostroboscopy," in Voice quality measurements, R. D. Kent and M. J. Ball, Eds., ed San Diego, California: Singular Publishing Group, 2000.
[36] A. Fourcin, "Voice Quality and Electrolaryngography," in Voice Quality
Measurement, R. D. Kent and M. J. Ball, Eds., ed San Diego: Singular Publushing
Group, 2000.
[37] J. L. Flanagan, "Some properties of the glottal source," Journal of Speech and
Hearing Research, vol. 1, pp. 99-116, 1958.
[38] M. Rothmberg, "An interactive Model for the Voice Source," in Vocal Fold
Physiology: Contemporary Research and Clinical Issues, D. M. Bless and J. H. Abbs,
Eds., ed San Diego: College Hill Press, 1983.
[39] A. Ní and C. Golb, "Voice Source Variation," in The Handbook of Phonetic Sciences, W. J. Hardcastle and J. Laver, Eds., ed Oxford: Blackwell Publishing, 1999.
[40] E. O'Leidhin and P. Murphy, "Preliminary glottal source modeling for pathologic voices," in Maveba Proceedings, Florence, 2003, pp. 237-240.
[41] G. Fant, J. Liljencrants, and Q. Lin, "A four parameter model of the glottal flow," Royal Institute of Technology, Suecia1985.
[42] R. Veldhuis, "A computationally efficient alternative for the Liljencrants-Fant model and its percptual evaluation," Journal of the Acoustical Society of America, vol. 103, pp. 566-571, 1998.
[43] A. E. Rosenberg, "Effect of glottal pulse shape on the quality of natural vowels,"
Journal of the Acoustical Society of America, vol. 84, pp. 583-588, 1971.
[44] J. D. Markel and A. H. Gray, Linear Prediction of Speech vol. 12. New York: Springer-Verlag, 1976.
[45] L. R. Rabiner and R. C. Schafer, Digital Processing of Speech Signals. New Jersey: Prentice Hall, 1978.
[46] Y. Medan, E. Yair, and D. Chazan, "Super resolution pitch determination of the speech signals," IEEE Transaction on Signal Processing, pp. 40-48, 1991.
[47] V. Parsa and D. G. Jamieson, "A comparison of high precision F0 extration algorithms for sustained vowels," Journal of Speech and Hearing Research, vol. 42, pp. 112-126, 1999.
[48] D. Torres and C. A. Ferrer, "Mejoras al alineamiento temporal de contornos de período fundamental " presented at the V Congreso Nacional de Reconocimiento de Patrones, La Habana, Cuba, 2007.
[49] D. Torres and C. A. Ferrer, "Shimmer insertion in ensemble-average HNR estimation in pathological voices.," Cuba-Flanders Workshop on Machine Learning and
Knowledge Discovery 2010.
[50] R. E. Hillman, E. Oesterle, and L. L. Feth, "Characteristics of the glottal turbulent noise source," Journal of the Acoustical Society of America, vol. 74, pp. 691-694, 1983.
[51] L. Mathieson, The Voice and its Disorders: John Wiley & Sons, 2013.
[52] I. R. Titze, Principles of voice production: National Center for Voice and Speech, 2000.
[53] M. D. Morrison, H. Nichol, and L. A. Rammage, "Diagnostic criteria in functional dysphonia," The Laryngoscope, vol. 96, pp. 1-8, 1986.
[54] L. Heaver, "Psychiatric observations on the personality structure of patients with habitual dysphonia," Logos, vol. 1, pp. 21-26, 1958.
[55] O. M. Kleinsasser and E. Microsurgery, "p. 32," ed: Philadelphia, 1968.
[56] M. Remacle, J. C. Degols, and M. Delos, "Exudative lesions of Reinke's space. An anatomopathological correlation," Acta oto-rhino-laryngologica Belgica, vol. 50, pp. 253-264, 1995.
[57] L. O. Ramig and R. Scherer, "Speech therapy for neurologic disorders of the larynx,"
Neurologic disorders of the larynx, pp. 163-181, 1992.
[58] L. A. Ramig, I. R. Titze, R. C. Scherer, and S. P. Ringel, "Acoustic analysis of voices of patients with neurologic disease: rationale and preliminary data," Annals of
Otology, Rhinology & Laryngology, vol. 97, pp. 164-172, 1988.
[59] N. Isshiki, "Remarks on mechanism for vocal intensity variation," Journal of Speech,
Language, and Hearing Research, vol. 12, pp. 669-672, 1969.
[60] A. Sama, P. Carding, S. Price, P. Kelly, and J. Wilson, "The clinical features of functional dysphonia," The Laryngoscope, vol. 111, pp. 458-463, 2001.
[61] S. Tanaka, M. Hirano, and R. Terasawa, "Examination of air usage during phonation: Correlations among test parameters," Journal of Voice, vol. 5, pp. 106-112, 1991. [62] D. Michaelis, "Das Göttinger Heiserkeits-Diagramm-Entwicklung und Prüfung eines
Verfahrens zur objektiven Stimmgütebeurteilung pathologischer Stimmen," Niedersächsische Staats-und Universitätsbibliothek Göttingen, 2000.
[63] S. Iwata and H. Von Leden, "Pitch perturbations in normal and pathologic voices,"
Folia Phoniatrica et Logopaedica, vol. 22, pp. 413-424, 1970.
[64] M. H. Hecker and E. J. Kreul, "Descriptions of the speech of patients with cancer of the vocal folds. Part I: Measures of fundamental frequency," The Journal of the
Acoustical Society of America, vol. 49, pp. 1275-1282, 1971.
[65] T. Murry and E. T. Doherty, "Selected acoustic characteristics of pathologic and normal speakers," Journal of Speech, Language, and Hearing Research, vol. 23, pp. 361-369, 1980.
[66] M. Remacle and I. Trigaux, "Characteristics of nodules through the high-resolution frequency analyzer," Folia Phoniatrica et Logopaedica, vol. 43, pp. 53-59, 1991. [67] J. A. Shohet, M. S. Courey, M. A. Scott, and R. H. Ossoff, "Value of
videostroboscopic parameters in differentiating true vocal fold cysts from polyps,"
The Laryngoscope, vol. 106, pp. 19-26, 1996.
[68] F. G. Dikkers and P. G. Nikkels, "Lamina propria of the mucosa of benign lesions of the vocal folds," The Laryngoscope, vol. 109, pp. 1684-1689, 1999.
[69] K. Werth, D. Voigt, M. Döllinger, U. Eysholdt, and J. Lohscheller, "Clinical value of acoustic voice measures: a retrospective study," European Archives of Oto-Rhino-
Laryngology, vol. 267, pp. 1261-1271, 2010.
[70] P. Gómez-Vilda, V. Rodellar-Biarge, V. Nieto-Lluis, C. Muñoz-Mulas, L. M. Mazaira-Fernández, R. Martínez-Olalla, et al., "Characterizing neurological disease from voice quality biomechanical analysis," Cognitive Computation, vol. 5, pp. 399- 425, 2013.
[71] K. Elemetrics, "Voice disorders database," Voice and Speech Laboratory
Massachusetts Eye and Ear Infirmary, 1992.
[72] J. Mekyska, E. Janousova, P. Gomez-Vilda, Z. Smekal, I. Rektorova, I. Eliasova, et al., "Robust and complex approach of pathological speech signal analysis,"
Neurocomputing, 2015.
[73] K. Elemetrics, "Voice disorders database," 1994.
[74] J. I. Godino-Llorente, P. Gómez-Vilda, F. Cruz-Roldán, M. Blanco-Velasco, and R. Fraile, "Pathological likelihood index as a measurement of the degree of voice normality and perceived hoarseness," Journal of Voice, vol. 24, pp. 667-677, 2010. [75] J. D. Arias-Londoño, J. I. Godino-Llorente, M. Markaki, and Y. Stylianou, "On
combining information from modulation spectra and mel-frequency cepstral coefficients for automatic detection of pathological voices," Logopedics Phoniatrics
Vocology, vol. 36, pp. 60-69, 2011.
[76] M. Pützer and W. J. Barry, "Saarbrucken voice database ", ed.
http://www.stimmdatenbank.coli.uni-saarland.de/help_en.php4 2014.
[77] J. Mekyska, Z. Smekal, M. Kostalova, M. Mrackova, S. Skutilova, and I. Rektorova, "Motor Aspects of Speech Imparment in Parkinson's Disease and their Assessment,"
CESKA A SLOVENSKA NEUROLOGIE A NEUROCHIRURGIE, vol. 74, pp. 662-
[78] I. R. Titze and B. H. Story, "Rules for controlling low-dimensional vocal fold models with muscle activation," The Journal of the Acoustical Society of America, vol. 112, pp. 1064-1076, 2002.
[79] A. Tsanas, M. Little, P. E. McSharry, and L. O. Ramig, "Accurate telemonitoring of Parkinson's disease progression by noninvasive speech tests," Biomedical
Engineering, IEEE Transactions on, vol. 57, pp. 884-893, 2010.
[80] M. Fröhlich, D. Michaelis, H. W. Strube, and E. Kruse, "Acoustic voice quality description: Case studies for different regions of the hoarseness diagram," Advances
in Quantitative Laryngoscopy, 2nd ‘Round Table, pp. 143-150, 1997.
[81] E. Kruse, D. Michaelis, P. Zwirner, and E. Bender, "Stimmfunktionelle Qualitätssicherung in der kurativen Mikrochirurgie der Larynxmalignome Postoperative Stimmrehabilitation auf Basis der „laryngealen Doppelventilfunktion”*," HNO, vol. 45, pp. 712-718, 1997.
[82] M. Fröhlich, D. Michaelis, and E. Kruse, "Image sequences as necessary supplement to a pathological voice data base," Procedings of VOICEDATA98, pp. 64-69, 1998. [83] M. Fröhlich, D. Michaelis, and E. Kruse, "Objektive Beschreibung der Stimmgüte
unter Verwendung des Heiserkeits-Diagramms," HNO, vol. 46, pp. 684-689, 1998. [84] F. L. Wuyts, M. S. De Bodt, G. Molenberghs, M. Remacle, L. Heylen, B. Millet, et
al., "The Dysphonia Severity IndexAn Objective Measure of Vocal Quality Based on a Multiparameter Approach," Journal of Speech, Language, and Hearing Research, vol. 43, pp. 796-809, 2000.
[85] P. Milenkovic, "Least mean square measures of voice perturbation," Journal of
Speech, Language, and Hearing Research, vol. 30, pp. 529-538, 1987.