• No results found

D: Ejecuta el método de validación interna Y-scrambling. (Este debe seleccionarse antes de ejecutar el clasificador). Muestra una ventana con los resultados al final de la ejecución del clasificador.

Conclusiones

Con el desarrollo de este trabajo se llevó a cabo la implementación de varios algoritmos para mejorar el trabajo QSAR con el programa Weka, aproximando este último a las necesidades del estudio en cuestión.

Se realizó una modificación al Weka, logrando una interfaz gráfica con el usuario (GUI) que permite al investigador seguir la metodología QSAR.

Además se efectuó una selección de los algoritmos de selección de atributos, clasificación y regresión al igual que de fusión en Weka y fueron incluidos en la aplicación.

Se llevó a cabo la implementación de nuevos métodos de selección de atributos, de limpieza de datos, de división racional de los datos y métodos de validación propios de este dominio de aplicación. Fueron incluidos en este producto software.

Se desarrolló un manual de usuario para una mejor interpretación y uso del producto software.

Como colofón de este trabajo se proponen los siguientes aspectos para un posterior desarrollo y mejora de estos en función de obtener una mejor aplicación.

Mejorar los algoritmos implementados para obtener una versión de la aplicación más rápida. Implementar nuevas funcionalidades y algoritmos de trabajo QSAR al software.

Bibliografía

Cerius2 A program suite for molecular modelling activities. Scranton Road, San Diego, CA 92121- 3752, USA., Molecular Simulations Inc.

CODESSA 2.13 ed. 7204 Mullen, Shawnee, KS 66216, USA. TSAR. v3.3 ed., Oxford Moleculars Ltd.

A. M. HARPER, D. S. (2001) the north american chapter of the international chemometrics society. Newsletter #5.

ABDELMALIK MOUJAHID, I. I. (2010) Manual de practicas de minería de datos usando el software Weka

AJAY (1993) A unified framework for using neural networks to build QSARs. J Med Chem, 36,

3565-71.

ALEXANDER GOLBRAIKH, M. S., ZHIYAN XIAO, YUN-DE XIAO, KUO-HSIUNG LEE & ALEXANDER & TROPSHA (2003) Rational selection of training and test sets for the development of validated QSAR models. Journal of Computer-Aided Molecular Design. ARCHER, S. (1978) QSAR: a critical appraisal. NIDA Res Monogr, 86-102.

ASIKAINEN, A. H., RUUSKANEN, J. & TUPPURAINEN, K. A. (2004) Consensus kNN QSAR: a versatile method for predicting the estrogenic activity of organic compounds in silico. A comparative study with five estrogen receptors and a large, diverse set of ligands. Environ Sci Technol, 38, 6724-9.

BARLOW, R. B. (1981) QSAR with random biological data. J Pharm Pharmacol, 33, 62-3. BONIFACIO MARTIN DEL BRIO, A. S. M. (1997) Redes neuronales y sistemas difusos. CORPORATION, N. S. (2010) Network Science-NetSci.

COUNCIL, S. T. F. (2009) The chemical database service.

CHONG, C. R., CHEN, X., SHI, L., LIU, J. O. & SULLIVAN, D. J. (2006) A clinical Drug Library Screen Identifies Astemizole as an Antimalarial Agent. Nat. Chem. Biol., 2, 415-416.

DANIEL BARBOSA DE OLIVEIRA, A. C. G. ( 2003) BuildQSAR: A New Computer Program for QSAR Analysis. Wiley Online Library, 19.

DEARDENA, J. C., CRONIN, M. T. D. & KAISER, K. L. E. (2009) How not to develop a quantitative structure–activity or structure–property relationship (QSAR/QSPR) SAR and QSAR in Environmental Research, 20, 241–266.

EIBE, F., MARK, H., TRIGG, L., HOLMES, H. & WITTEN, I. (2004) Data mining in bioinformatics using Weka. Bioinformatics, 20, 2479–2481.

FRANK, I. H. W. E. (2005) Data mining. Practical machine learning tools and techniques Diane Cerra.

GERMANO, T. (1999) Self organizing maps.

GOLBRAIKH, A. (2000) Molecular Dataset Diversity Indices and Their Applications to Comparison of Chemical Databases and QSAR Analysis. J. Chem. Inf. Comput. Sci., 40.

GUHA, R. S., J.; JURS, P.C. (2004) “Generation of QSAR Sets with a Self-Organizing Map”. J. Mol. Model. Graph.

HANSCH, C. (1979) QSAR in cancer chemotherapy. Farmaco [Sci], 34, 89-104.

ITSKOWITZ, P. & TROPSHA, A. (2005) kappa Nearest neighbors QSAR modeling as a variational problem: theory and applications. J Chem Inf Model, 45, 777-85.

JAIN, A. N. (2004) Ligand-based structural hypotheses for virtual screening. J Med Chem, 47, 947- 61.

JOACHIM BRAUN, M. M. A. C. R. (2003) MOLGEN QSPR.

JOHNSON, R. A. & WICHERN, D. W. (1988) Applied Multivariate Statistical Analysis, New Jersey, Prentice-Hall.

KAISER, K. L. (2004) Validation of (Q)SARs models. Environ Health Perspect, 112, A86; author reply A86-7.

KUBINYI, H. (1995) Strategies and recent technologies in drug discovery. Pharmazie, 50, 647-62. LENNART ERIKSSON, J. J., ANDREW P. WORTH, MARK T.D. CRONIN, ROBERT M.

MCDOWELL AND PAOLA GRAMATICA (2003) Methods for Reliability and Uncertainty Assessment and for Applicability Evaluations of Classification- and Regression- Based QSARs.

LOEW, G. H., VILLAR, H. O. & ALKORTA, I. (1993) Strategies for indirect computer-aided drug design. Pharm Res, 10, 475-86.

MARRERO-PONCE, Y., IYARRETA-VEITIA, M., MONTERO-TORRES, A., ROMERO- ZALDIVAR, C., BRANDT, C. A., AVILA, P. E., KIRCHGATTER, K. & MACHADO, Y. (2005) Ligand-Based Virtual Screening and in silico Design of New Antimalarial Compounds Using Nonstochastic and Stochastic Total and Atom-Type Quadratic Maps. J. Chem. Inf. Comput. Sci., 45, 1082-100.

NORUSIS, M. J. (1985) Advanced Statistics Guide. SPSS-X New York McGraw-Hill.

OECD (2007. http://www.oecd.org/dataoecd/55/35/38130292.pdf.) Guidance document on the validation of quantitative structure-activity relationship [QSAR] models. OECD Environment Health and Safety Publication, Series on testing and assessment no. 69. Paris. PEREZ, R. B. (1993) Curso introductorio a las redes neuronales artificiales.

QSAR (2003) Quantitative structure activity relationships (QSAR). R.TODESCHINI (2004) QSAR-MobyDigs Software.

RIVERA-BORROTO, O. M., MARRERO-PONCE, Y., MENESES-MARCEL, A., ESCARIO, J. A., GÓMEZ-BARRIO, A., A., A. V., MARTINS-ALHO, M. A., MONTERO PEREIRA, D., NOGAL, J. J., TORRENS, F., IBARRA-VELARDE, F., VERA MONTENEGRO, V., HUESCA-GUILLE, A., RIVERA, N. & VOGEL, V. (2008) Discovery of Novel Trichomonacidals Using LDA-Driven QSAR Models and Bond-Based Bilinear Indices as Molecular Descriptors. QSAR Comb. Sci., DOI: 10.1002/qsar.200610165.

RUIZ, J. S. A. (2008) Preprocesado de datos y aprendizaje basado en reglas. SEMICHEM, I. (1994) Codessa features.

SHEN, Q., JIANG, J. H., TAO, J. C., SHEN, G. L. & YU, R. Q. (2005) Modified ant colony optimization algorithm for variable selection in QSAR modeling: QSAR studies of cyclooxygenase inhibitors. J Chem Inf Model, 45, 1024-9.

SOFIE VAN DAMME, P. B. (2007) A new computer program for QSAR-Analysis:ARTE-QSAR. Inorganic and Physical Chemistry. Gent.

TROPSHA, A. (2010a) Best Practices for QSAR Model Development, Validation, and Exploitation. Mol. Inf., 29, 476 – 488.

TROPSHA, A. (2010b) Best Practices for QSAR Model Development, Validation,and Exploitation. Mol.Inf. 2010.

VAN DE WATERBEEMD, H. (1995) Chemometric Methods in Molecular Design, New York. WEN LUO, S. M., JATIN MISRA, GERHARD J NOHYNEK (2007) Predicting human skin

absorption of chemicals: development of a novel quantitative structure activity relationship. Sage journals online.

WIESE, M. & SCHAPER, K. J. (1993) Application of neural networks in the QSAR analysis of percent effect biological data: comparison with adaptive least squares and nonlinear regression analysis. SAR QSAR Environ Res, 1, 137-52.

WOLD, S. & ERIKSON, L. (1995) Statistical Validation of QSAR Results. Validation Tools. IN VAN DE WATERBEEMD, H. (Ed.) Chemometric Methods in Molecular Design. New York, VCH Publishers.

ZERNOV, V. V., BALAKIN, K. V., IVASCHENKO, A. A., SAVCHUK, N. P. & PLETNEV, I. V. (2003) Drug discovery using support vector machines. The case studies of drug-likeness, agrochemical-likeness, and enzyme inhibition predictions. J Chem Inf Comput Sci, 43, 2048- 56.

ZHAO, C. Y., ZHANG, H. X., ZHANG, X. Y., LIU, M. C., HU, Z. D. & FAN, B. T. (2005) Application of support vector machine (SVM) for prediction toxic activity of different data sets. Toxicology.