• No results found

El uso del esquema de discretizaci´on obtenido por EBLA3 puede ser utilizado como base para proponer una medida de distancia propia de EBLA3, con lo que se puede ayudar a obtener m´as altos porcentajes de precisi´on en la clasificaci´on, tal y como SAX utiliza su propia medida de distancia para reconstruir parte de los datos originales manteniendo as´ı una relaci´on entre la representaci´on discreta y la representaci´on continua de las series de tiempo.

El empleo de algoritmos gen´eticos para la b´usqueda del esquema puede resultar m´as eficiente que el enfoque de recocido simulado, porque un algoritmo gen´etico permitir´ıa generar poblaciones de esquemas, con lo que podr´ıa lograrse una convergencia m´as r´apida. Como funci´on de aptitud puede ser utilizada la ganancia de informaci´on propuesta en esta tesis.

Proponer una medida de ponderaci´on para preferir la selecci´on de puntos de corte cuya distancia entre dos puntos est´en espaciadas al m´aximo sin que el intervalo generado pierda informaci´on relevante(p.ej. de la figura 6.1 la distanciad01 y d02 permite una mejor

distribuci´on qued1 yd2, tomando en cuenta que los valores de utilidad para los dos puntos

de corte son iguales), esto podr´ıa contribuir a reducir el n´umero de intervalos necesarios para discretizar el conjunto de series de tiempo, esto puede verse como un compromiso entre los l´ımites de dos intervalos cuyas clases pueden estar mezcladas, y de esta manera no dar prioridad a ninguno de los dos, sin tener que generar m´as intervalos para hacer una refinada discriminaci´on.

EBLA3 puede ser utilizado para ayudar a la caracterizaci´on de actividades cerebrales registradas en forma de series temporales, debido a que EBLA3 permite transformar las series de tiempo continuas a discreta, y por medio de ´arboles de decisi´on encontrar los segmentos caracter´ısticos de la actividad cerebral.

El algoritmo de clasificaci´on Na¨ıve Bayes simple obtiene los mayores porcentajes de precisi´on en la mayor´ıa de las bases de datos probadas en series de tiempo extra´ıdas de

Figura 6.1:Dos puntos de corte con igual valor de utilidad

im´agenes colposc´opicas, por lo que habr´ıa que realizar pruebas con este clasificador pa- ra representaci´on continuas y realizar un an´alisis sobre el comportamiento de este y la representaci´on EBLA3.

Referencias

[1] Acosta-Mesa H´ector-Gabriel, Cruz-Ram´ırez Nicandro y Garc´ıa L´opez Daniel Alejan- dro.“Entropy Based Linear Approximation Algorithm for Time Series Discretization”. Research in Computing Science. Instituto Polit´ecnico Nacional, 2007(Publicaci´on Pen- diente).

[2] J. Aguilar-P´erez , A. Leyva-L´opez, D. Angulo-Najera, A. Salinas y Lazcano-Ponce E. Tamizaje en c´ancer cervical: conocimiento de la utilidad y uso de citolog´ıa cervical en M´exico. Rev Sal´ud P´ublica 2003;37(1):100-6

[3] R. Agrawal, C. Faloutsos y A. Swami. “Efficient Similarity Search In Sequence Da- tabases”, En Proceedings of the 4th International Conference of Foundations of Data Organization and Algorithms, (October 13 - 15, 1993). D. B. Lomet, Ed. Lecture Notes In Computer Science, vol. 730. Springer-Verlag, London, 69-84, 1993.

[4] H. Andr´e-J¨onsson, D. Badal, “Using Signature Files for Querying Time-Series Data”. En Proceedings of the First European Symposium on Principles of Data Mining and Knowledge Discovery, 1997.

[5] K. Chakrabarti , E. Keogh, S. Mehrotra y M. Pazzani, “Locally Adaptive Dimensio- nality Reduction for Indexing Large Time Series Databases”. ACM Trans. Database Syst. 27, 2 (Jun. 2002), 188-228, 2002.

[6] Miguel A. Carreira-Perpi˜n´an, “A Review of Dimension Reduction Techniques”, Tech- nical Report CS-96-09, Dept. of Computer Science, University of Sheffield, 1997. [7] K. Chan, W.C. Fu, “Efficient Time Series Matching by Wavelets”, 15th International

Conference on Data Engineering. ICDE. IEEE Computer Society, Washington, DC, pp. 126, 1999.

[8] B.L. Craine, E.R. Craine , J.R. Engel y N.T. Wemple , “A clinical system for digital imaging colposcopy”, R.H. Medical Imaging II,R.H. Schneider and S. Dwyer III, Eds., Proc. SPIE, vol. 914, pp. 505-511, 1988.

[9] E.S. Dimitrova, J. McGee y E. Laubenbacher, “Discretization of Time Series Data”, eprint arXiv:q-bio/0505028,arXiv:q-bio/0505028, 2005.

[10] Direcci´on General del Desempe˜no, Subsecretar´ıa de Innovaci´on y calidad, Secretar´ıa de salud. Salud: Mexico 2001-2005, Informaci´on estrat´egica por entidad federativa, primera Edici´on. M´exico D.F.

[11] J. Dougherty, R. Kohavi and M. Sahami. “Supervised and unsupervised discretiza- tion of continuous features”. Proceedings of the Twelfth International Conference on Machine Learning (pp. 194–202), Tahoe City, CA: Morgan Kaufmann, 1995.

[12] U. Fayyad y K. Irani, “Multi-Interval Discretization of Continuous-Valued Attributes for Classification Learning”, En Proceedings of the 13th International Joint Conference on Artificial Intelligence, pp. 1022–1027, Chambery, France, Morgan Kaufmann, 1993. [13] Garc´ıa-L´opez Daniel-Alejandro, Acosta-Mesa H´ector-Gabriel, Cruz-Ram´ırez Nicandro y Gutierrez-Fragoso Karina, “Supervised Discretization Algorithm for Time Series”. First International Workshop and Challenge on Time Series Classification, 2007. [14] P. Geurts. “Pattern Extraction for Time Series Classification”, En Proceedings of

PKDD 2001, 5th European Conference on Principles of Data Mining and Knowledge Discovery(Septiembre 03 - 05, 2001). L. D. Raedt and A. Siebes, Eds. Lecture Notes In Computer Science, vol. 2168. Springer-Verlag, London, 115-127. 2001.

[15] R.C. Gonzalez y R.E Woods, “Digital Image Processing.” Second Edition. Prentice Hall, 2002.

[16] J. Han y M. Kamber. Data mining, Concepts and techniques Morgan Kaufmann, 2001.

[17] E. Hern´andez-Galicia, Propuesta metodol´ogica para la detecci´on de lesiones precurso- ras de c´ancer c´ervico uterino utiizando funciones din´amicas de respuesta acetoblanca. Tesis de Maestria, Universidad Veracruzana, 2006.

[18] Y. Huang y P.S Yu, “Adaptive query processing for time-series data”, In Proceedings of the Fifth ACM SIGKDD international Conference on Knowledge Discovery and Data Mining (San Diego, California, United States, August 15 - 18, 1999). KDD ’99. ACM Press, New York, NY, 282-286, 1999.

[19] M.A. Jim´enez-Monta˜no, R. Feistel y O. Diez-Mart´ınez, “Information Hidden in Signals and Macromolecules I. Symbolic Time-series Analysis”, Nonlinear Dynamics, Psycho- logy & Life sciences, Vol. 8 (4): 445-478, 2004.

[20] I.T. Jolliffe, “Principal Component Analysis”. Springer, 1986.

[21] E. Keogh, S. Lonardi y C. A. Ratanamahatana, “Towards parameter-free data mining”. In Proceedings of the Tenth ACM SIGKDD international Conference on Knowledge Discovery and Data Mining, (Seattle, WA, USA, August 22 - 25, 2004). KDD ’04. ACM Press, New York, NY, 206-215, 2004.

[22] E. Keogh, y S. Kasetty. “On the need for time series data mining benchmarks: a survey and empirical demonstration.” In Proceedings of the Eighth ACM SIGKDD international Conference on Knowledge Discovery and Data Mining(Edmonton, Al- berta, Canada, July 23 - 26, 2002). KDD ’02. ACM Press, New York, NY, 102-111, 2002.

[23] E. Keogh, X. Xi, L. Wei y C.A. Ratanamahatana, The UCR Time Series Classifica- tion/Clustering P´agina web: www.cs.ucr.edu/˜eamonn/time series data/, 2006. [24] R. Kohavi. A study of Cross-validation and Bootstrap for accuracy Estimation and

Model Selection, Proceedings of the Fourteenth International Joint Conference on Ar- tificial Intelligence, San Mateo, CA: Morgan Kaufmann, pages 1137–1143, 1995.

[25] R. Kohavi y H. John George, “Wrappers for Feature Subset Selection”, Artificial In- telligence 97, 1-2(Dic. 1997), 1997.

[26] L. Kurgan y K. Cios, “CAIM Discretization Algorithm”, IEEE Transactions On Kno- wledge And Data Engineering, 16(2), 145-153, 2004.

[27] M. Last, A. Kandel, H. Bunke.Data mining in time series databases, World Scientific Pub Co Inc, 2004.

[28] J. Lin, E. Keogh, S. Lonardi y B. Chiu, “A symbolic representation of time series, with implications for streaming Algorithms”, En Proceedings of the 8th ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery (San Diego, California, June 13 - 13, 2003). DMKD ’03. ACM Press, New York, NY, 2-11, 2003. [29] M. Liakat, Feature Selection of DNA Microarray Data. Seminar and Computing Tools,

http://web2.uwindsor.ca/courses/cs/aggarwal/cs60520/SeminarMaterial/ FeatureSe- lectionDNAData.pdf, 2005.

[30] J. Llaguno-Roque. “An´alisis del comportamiento espectral del epitelio escamoso nor- mal del c´ervix y el epitelio acetoblanco por infecci´on del virus del papiloma, mediante el procesamiento digital de im´agenes colposc´opicas usando un modelo din´amico lineal.” Tesis de Maestr´ıa, Universidad Veracruzana, 2007.

[31] T.M. Mitchel. Machine Learning, McGraw Hill, Boston, MA, 1997.

[32] F. M¨orchen y A. Ultsch, “Optimizing Time Series Discretization for Knowledge Disco- very”, en Proc. of the Eleventh ACM SIGKDD international Conference on Knowledge Discovery in Data Mining (Chicago, Illinois, USA, August 21 - 24, 2005). KDD ’05. ACM Press, New York, NY, 660-665, 2005.

[33] H. Niemann, “Linear and non-linear mappings of patterns”. Pattern Recognition 12, pp. 83-87, 1980.

[34] N. J. Nilsson, “‘Artificial Intelligence. A New Synthesis” (San Francisco, Morgan Kauf- mann), Mc Graw Hill, 1998.

[35] Q. Ji , J. Engel y E. Craine. “Texture Analysis for classification of Cervix Lesions”. IEEE Transaction on Medical Imaging. Vol. 19 No 11. pp. 1144–1149, 2000.

[36] S. Russell, P. Norving, “Inteligencia Artificial. “Un enfoque moderno” Segunda Edi- ci´on. Prentice Hall. 2004.

[37] J.Rissanen, “Modeling by shortest data description”, Automatica, vol. 14, pp. 465-471, 1978.

[38] S.J. Rusell y P. Norvig, “Inteligencia Artificial Un enfoque moderno, sda Edici´on”, Pearson Education S.A., 2004.

[39] N. Saito, “Local feature extraction and its application using a library of bases”, PhD thesis, Yale University, 1994.

[40] Jr. Sammon , J.W., “A nonlinear structure analysis mapping for data”, IEEE Trans. Comp. C-18, 401-409, 1969.

[41] H.A. Simon, Las ciencias de lo artificial, COMARES, 2006.

[42] B. Scholkopf, Smola A.J., Muller K.-R, “Nonlinear component analysis as a kernel eigenvalue problem”, Techical Report. Tuebingen: Max-Plank Institut fur biologische Kybernetik, 1996.

[43] E. Suaste-G´omez, Ma-Dolores. Rodr´ıguez-Guzm´an. “Acci´on del espectro electro- magn´etico visible como elemento del diagn´ostico m´edico”. Revista CINVESTAV, pp.44-54, Vol 26, N´um. 01, Enero-Marzo 2007.

[45] Wikipedia, “IEEE punto flotante — Wikipedia, La enciclopedia libre”, 2007, “http://es.wikipedia.org/w/index.php?title=IEEE punto flotante&oldid=9720411”, [Internet; descargado 4-julio-2007].

[46] Wikipedia, “Streaming media — Wikipedia, La enciclopedia libre”, 2007, “http://en.wikipedia.org/w/index.php?title=Streaming media&oldid=155181245”, [Internet; descargado 5-Septiembre-2007]

Related documents