• No results found

CHAPTER 3: ANALYSIS OF SEDIMENT YIELDS AND BASIN PERFORMANCE

3.4 CONCLUSION

A continuación se presenta la comparación de los resultados obtenidos por el algoritmo DMOH con otros dos algoritmos de los más recientes y que han sido referenciados anteriormente en esta investigación. Estos algoritmos son el GRGS- GA y el HACA, una propuesta basada en algoritmos genéticos con cadenas de crecimiento restringido orientadas a grupo y otra que usa la optimización basada en colonias de hormigas, respectivamente. La comparación se centra en las dos instancias del problema para las cuales se disponen todos los datos de configuración, entrada y salida, reportados en la literatura consultada. Dichas instancias son las MUA (10x8) y MUA (20x15) recogidas en la tabla I y el anexo A, respectivamente. En todos los casos los datos corresponden a los alcanzados tras cien corridas de cada uno de los algoritmos involucrados en la comparación.

Como puede apreciarse en la tabla XVIII, el número de iteraciones promedio necesarias para alcanzar el óptimo para la MUA (10x8) es de 23.7 con HACA y 25.1 con GRGS-GA, sin embargo, con DMOH es de tan solo 6.12. Analizando la cantidad de veces que se obtiene el óptimo para esta instancia, con HACA se logra noventa y siete veces, con GRGS-GA se logra noventa y cinco veces y con DMOH se logra las cien veces. El número de iteraciones promedio necesarias para alcanzar el óptimo para la MUA (20x15) es de 32.8 con HACA y 36.9 con

Capítulo III. Evaluación y experimentación Página 62 GRGS-GA, siendo mejorado también por DMOH, ya que requiere solo 31.55. En cuanto a la cantidad de veces que se alcanza el óptimo para esta instancia del problema, se puede observar que se igualan las noventa y cuatro veces alcanzadas por HACA que superan las noventa y una veces que lo logra GRGS- GA.

Tabla XVIII. Comparación de DMOH con otros métodos de fragmentación vertical recientes.

Algoritmos Parámetros MUA (10x8) MUA (20x15)

HACA Número de iteraciones 23.7 32.8

Número de hormigas 3 5

Número de fragmentos promedio 3.03 4.06

Costo promedio 5826 4654

Cantidad de veces que se alcanza el óptimo 97 94

GRGS-GA Número de generaciones 25.1 36.9

Población 100 150

Número de fragmentos promedio 3.05 4.09

Costo promedio 5830 4667

Cantidad de veces que se alcanza el óptimo 95 91

DMOH Número de iteraciones 6.12 31.55

Población 99 153

Número de fragmentos promedio 3 4.09

Costo promedio 5820 4845.31

Cantidad de veces que se alcanza el óptimo 100 94

Tras esta comparación se concluye que para estas dos instancias del problema se aprecia que DMOH experimenta una velocidad de convergencia más rápida.

3.4 Conclusiones parciales.

En este capítulo se experimentó con siete instancias del problema de fragmentación vertical con óptimos conocidos. Se pudo comprobar que la propuesta de solución que usa DMO converge hacia el óptimo y logra alcanzarlo en cada caso. También se comprueba, por métodos estadísticos, que hibridando DMO con una búsqueda local que consiste en mutar, de tres formas diferentes, al máximo global de cada iteración, se obtienen resultados con diferencias significativas que mejoran el nivel de convergencia del método en su forma clásica. De igual manera se comprueba que, aunque con DMOH se mejora la

Capítulo III. Evaluación y experimentación Página 63 cantidad de veces que se alcanza el óptimo con DMO, las diferencias no son significativas. Finalmente, se comparó el algoritmo DMOH con otros dos algoritmos recientes, HACA y GRGS-GA, para las dos instancias del problema de las cuales se conocen los datos de configuración, de entrada y de salida, notando que para estos casos específicos, los resultados alcanzados son mejores y la convergencia es más rápida.

Conclusiones Página 64

CONCLUSIONES

Luego de desarrollar la presente investigación se puede concluir que:

1. Se sistematizó en el diseño de distribución de BD teniendo en cuenta los más recientes métodos y algoritmos desarrollados.

2. Se modeló un nuevo método de fragmentación vertical basado en DMO, usando una representación de las soluciones con cadenas de crecimiento restringido orientadas a grupo que evita redundancias y aplicando el evaluador de particiones de Chakravarthy como función objetivo basada en costos.

3. Se implementó computacionalmente una hibridación del método DMO con una búsqueda local que, aunque no tiene efecto significativo sobre la cantidad de veces que se obtiene el óptimo, sí mejora los niveles de convergencia, demostrado mediante pruebas estadísticas.

4. Se comparó el algoritmo propuesto DMOH con dos de los algoritmos más recientes reportados en la literatura, para las dos instancias del problema que se disponen los datos de configuración, de entrada y de salida. Y sin ánimos de realizar una afirmación rigurosa, los resultados alcanzados son mejores y la convergencia más rápida.

Recomendación Página 65

RECOMENDACIÓN

1. Implementar los métodos HACA y GRGS-GA para experimentar con un mayor número de instancias del problema y realizar las comparaciones correspondientes.

REFERENCIAS BIBLIOGRÁFICA

1. Özsu , M. T. y Valduriez , P. Principles of Distributed Database Systems. 2da Edición. New Jersey : Prentice Hall, 1999. ISBN 0-13-659707-6.

2. Taddei Zavala, E. y Kuri Morales, Á. Fragmentación vertical y asignación simultánea en BDD usando algoritmos genéticos. [En línea] 2000. [Citado el: 3 de Junio de 2013.] http://cursos.itam.mx/akuri/PUBLICA.CNS/2000/Fragmentaci%f3n%20Vertical%20usand o%20AG.pdf.

3. An improved Combinatorial Particle Swarm Optimization Algorithm to Database Vertical Partition. Benmessahel, B. y Touahria, M. 3, 2011, Journal of Emerging Trends in Computing and Information Sciences, Vol. 2, págs. 130-135.

4. Vertical Partitioning algorithms for database design. Navathe, S., y otros. 4, 1984, ACM Transactions on Database Systems, Vol. 9, págs. 680-710.

5. Genetic algorithms based approach to database vertical partition. Du, J., Alhajj, R. y Barker, K. 2, 2006, Journal of Intelligent Information Systems, Vol. 26, págs. 167-183. 6. A Dendrite Method for Cluster Analysis. Caliński, T. y Harabasz, J. 1, 1974,

Communications in Statistics - Theory and Methods, Vol. 3, págs. 1-27.

7. The Use of Cluster Analysis in Physical Database Design. Hoffer, J. A. y Severance, D.G. [ed.] D. S. KERR. Framingham, MA, USA : ACM, 1975. Proceedings of the 1st International Conference on Very Large Databases.

8. A Problem Decomposition and Data Reorganization by a Clustering Techniques.

MCCORMICK, W. T. , SCHWEITZER, P. J. y WHITE, T. W. 5, 1972, Operation Research, Vol. 20, págs. 993-1009.

9. A Vertical Partitioning Algorithm for Relational Databases. CORNELL, D. W. y YU, P. S. . Los Angeles, CA, USA : IEEE Computer Society, 1987. Proceedings of the Third International Conference on Data Engineering. págs. 30-35.

10. CERI, S. y PERNICI, B. . DATAID-D: Methodology for Distributed Database Design.

[ed.] A. Albano, V. De Antonellis y A. Di Leva. North-Holland : s.n., 1985. págs. 157-183. ISBN 0-444-87735-5.

11. A Formal Approach to the Vertical Partitioning Problem in Distributed Database Design. MUTHURAJ, J., y otros. San Diego, CA, USA : IEEE Computer Society, 1993. Proceedings of the 2nd International Conference on Parallel and Distributed Information Systems (PDIS 1993).

12. Valdés, L. Asistentes para el Diseño Lógicode Bases de Datos Distribuidas. Facultad de Matemática, Física y Computación, Universidad Central “Marta Abreu” de Las Villas. Santa Clara : s.n., 2009. pág. 75, Trabajo de Diploma.

13. Evolutionary Computation: Comments on the History and Current State. Bäck, T., Hammel, U. y Schwefel, H. 1, 1997, EEE Transactions on Evolutionary Computation, Vol. 1, págs. 3-17.

14. Using Evolutionary Algorithms as Instance Selection for Data Reduction in KDD: An Experimental Study. Cano, J. R., Herrera, F. y Lozano, M. 6, 2003, IEEE Transactions of Evolutionary Computation, Vol. 7, págs. 561-575.

15. Bonabeau, E., Dorigo, M. y Theraulaz, G. Swarm Intelligence: From natural to artificial systems. 1ra Edición. s.l. : Oxford University Press, 1999. ISBN 13: 9780198030157.

16. Engelbrecht, A. P. Fundamentals of Computational Swarm Intelligence. s.l. : John Wiley y Sons, 2006. pág. 616.

17. Darwin, C. On the Origin of Species. London : John Murray, 1959. pág. 126.

18. Goldberg, D. E. Genetic Algorithms in Search. Optimization and Machine Learning.

7ma Edición. s.l. : Addison-Wesley Publishing Company: University of Alabama, 1998. pág. 412. ISBN: 0-201-15767-5.

19. Particle swarm optimization. Kennedy, J. y Eberhart, R. C. Piscataway, New Jersey, USA : IEEE Press, 1995. Proceedings of the IEEE International Conference on Neural Networks IV. Vol. 4, págs. 1942- 1948.

20. Dorigo, M. Optimization, Learning and Natural Algorithms. Dipartimento di Elettronica, Politecnico di Milano. 1992. pág. 213, Tesis doctoral.

21. Puris, A. Y. Desarrollo de meta-heurísticas poblacionales para la solución de problemas complejos. Centro de Estudios de Informática, Departamento de Ciencia de la Computación, Facultad de Matemática, Física y Computación, UCLV. Santa Clara, Cuba : s.n., 2009. Tesis en opción al título de Doctor en Ciencias Técnicas, Especialidad Informática.

22. A new vertical fragmentation algorithm based on ant collective behavior in distributed database systems. Goli, M., Rouhani, R. y Taghi, S. M. 2, 2012, Knowledge and Information Systems, Vol. 30, págs. 435-455.

23. A Tutorial on Heuristic Methods. Silver, E. A., Vidal, R. V. y Werra, D. D. 3, 1980, European Journal of Operational Research, Vol. 5, págs. 153–162.

24. No Free Lunch Theorems for Optimization. Wolpert, D. H. y Macready, W. G. 1, 1997, Vol. 1, págs. 67-82.

25. Hansen, Gary W. y Hansen, James V. Diseño y Administración de Bases de Datos.

[ed.] Andrés Otero. [trad.] Miguel Katrib Mora y Patricio Yustas Torijano. 2da Edición. Madrid : PRENTICE HALL, 1997. pág. 592. ISBN: 84-8322-002-4.

26. Date, C. J. Introducción a los Sistemas de Bases de Datos. [ed.] José Luis Vázquez. [trad.] Serguio Luis María Ruiz Faudón. 7ma Edición. Naucalpan de Juárez : PEARSON EDUCACIÓN, 2001. pág. 960. ISBN: 968-444-419-2.

27. Elmasri, Ramez y Navathe, Shamkant B. Sistemas de Bases de Datos: Conceptos fundamentales. [trad.] Roberto Escalona García. 2da Edición. México : Addison-Wesley Iberoamericana, 2000. pág. 887. ISBN: 093 028583.

28. Silberschatz, Abraham, Korth, Henry F. y Sudarshan, S. Fundamentos de Bases de Datos. [ed.] Concepción Fernández Madrid. [trad.] Fernando Sáenz Pérez. 4ta Edición. Madrid : McGRAW-HILL/INTERAMERICANA DE ESPAÑA, S. A. U., 2002. pág. 787. ISBN: 84-481-3654-3.

29. Rodríguez Mazahua, Lisbeth. Fragmentación Vertical Dinámica de Bases de Datos Multimedia. Dpto. de Computación, Unidad Zacatenco, Centro de Investigación y de Estudios Avanzados del Instituto Politécnico Nacional. México : s.n., Diciembre, 2012. pág. 236, Tesis para obtener el grado de Doctora en Ciencias en Computación.

30. Chakravarthy, Sharma, y otros. An Objective Function for Vertically Partitioning Relations in Distributed Databases and its Analysis. Department of Computer and Informaction Sciences, University of Florida. Gainesville, Florida : s.n., 1992. Technical Report UF-CIS-TR-92-045.

31. Morell Pérez, Alberto . Un Enfoque a la Fragmentación Vertical en Bases de Datos Distribuidas. Facultad de Matemática, Física y Computación, Universidad Central “Marta

32. Constraint preserving and lossless database transformations. Grant, John. 2, s.l. : Elsevier Ltd., 1984, Information Systems, Vol. 9, págs. 139–146.

33. A heuristic approach to attribute partitioning. Hammer, Michael y Niamir, Bahram. New York, USA : ACM New York, 1979. SIGMOD’79: Proceedings of the 1979 ACM SIGMOD international conference on Management of data. págs. 93-101. ISBN:0-89791- 001-X.

34. A Novel Vertical Partition Approach: Group-Oriented Restricted Growth String Based Genetics Algorithm. Du, Jun, Alhajj, Reda y Barker, Ken. Budapest, Hungary : s.n., August 26-28, 2004. ISDA 2004 IEEE 4th International Conference on Intelligent Systems Design and Application. págs. 79-84.

35. Cruz Reyes, Laura. Automatización del Diseño de la Fragmentación Vertical y Ubicación en Bases de Datos Distribuidas Usando Métodos Heurísticos y Exactos.

Dirección Académica de la Universidad Virtual, Instituto Tecnológico y de Estudios Superiores de Monterrey. Monterrey, México : s.n., Mayo, 1999. pág. 131, Tesis para optar al título de Maestra en Ciencias de la Computación.

36. Attraction - A Global Affinity Measure for Database Vertical Partitioning. Du, Jun, Barker, Ken y Alhajj, Reda. [ed.] Pedro Isaías y Nitya Karmakar. Algarve, Portugal : s.n., 5-8 November 2003. Proceedings of the IADIS International Conference WWW/Internet 2003. págs. 538-548. ISBN: 972-98947-1-X.

37. Herrera Moreno, Alejandro. La clasificación numérica y su aplicación en la ecología. 1ra Edición. Santo Domingo : República Dominicana, 2000. ISBN 99934-25-12- 5.

38. Vertical partitioning impact on performance and manageability of distributed database systems (A Comparative study of some vertical partitioning algorithms). Abdalla, Hassan I. y Marir, F. Riyadh, Saudi Arabia : s.n., March 26-29, 2006. The 18th Saudi National Computer Conference (NCC18). págs. 1-7.

39. An effective approach to vertical partition for physical design of. Cornell, D. W. y Yu, P. S. 2, 1990, IEEE Transactions on Software Engineering, Vol. 16, págs. 248–258.

40. Vertical partitioning for database design: a graphical algorithm. Navathe, Shamkant B. y Ra, Mingyoung. 2, June de 1989, ACM SIGMOD Record, Vol. 18, págs. 440-450. 41. Un método para la fragmentación vertical de bases de datos y su variante como evaluador de particiones. Vega Ortiz, Yurisbel y Rodríguez Morffi, Abel. 1, La Habana, Cuba : Grupo Editorial “Ediciones Futuro”, Enero-Marzo de 2013, Revista Cubana de Ciencias Informáticas, Vol. 7, págs. 68-75. ISSN: 2227-1899.

42. A Transaction-Based Approach to Vertical Partitioning for Relational Database. Chu, W. W. y Ieong, I. T. 8, Aug. de 1993, IEEE Transactions on Software Engineering, Vol. 19, págs. 804-812. ISSN: 0098-5589 .

43. Simple combinatorial Gray codes constructed by reversing sublists. Ruskey, Frank. s.l. : Springer Berlin Heidelberg, 1993, Algorithms and Computation, Lecture Notes in Computer Science, Vol. 762, págs. 201-208. ISSN: 0302-9743.

44. Combinatorial particle swarm optimization (CPSO) for partitional clustering problem.

Jarboui, B., y otros. 2, s.l. : Elsevier, 15 de September de 2007, Applied Mathematics and Computation, Vol. 192, págs. 337–345.

45. Diversity and adaption in populations of clustering ants. Lumer, E. y Faieta, B. Cambridge, MA : MIT Press, 1994. 3rd international conference on simulation of adaptive behaviour: from animals to animats. Vol. 3, págs. 501-508. ISBN: 0262531224.

46. Optimización basada en Mallas Dinámicas. Su aplicación en la solución de problemas de optimización continuos. Puris, Amilkar y Bello, Rafael. Málaga, España : s.n., 2009. VI Congreso Español sobre Metaheurísticas, Algoritmos Evolutivos y Bioinspirados (MAEB'09). págs. 441–448.

47. System-Level Fault Diagnosis with Dynamic Mesh Optimization. Falcon, Rafael, y otros. 2, México : s.n., abr./jun. de 2012, Computación y Sistemas, Vol. 16, págs. 203-220. ISSN 1405-5546.

48. Recent approaches to global optimization problems through Particle Swarm Optimization. Parsopoulos, K. E. y Vrahatis, M. N. June de 2002 , Natural Computing, Vol. 1, págs. 235-306.

49. Particle swarm optimization. Kennedy, J. y Eberhart, R. C. Piscataway, New York, USA : s.n., 1995. IEEE International Conference on Neural Networks. Vol. 4, págs. 1942-- 1948.

50. Goldberg, D.E. Genetic Algorithms in Search. Optimization and Machine Learning.

s.l. : Addison-Wesley Publishing Company: University of Alabama, 1998.

51. Feature selection through Dynamic Mesh Optimization. Bello, Rafael, Puris, Amilkar y Falcón, Rafael. Habana, Cuba : Springer Berlin Heidelberg, 9-12 de September de 2008, 13th Iberoamerican Congress on Pattern Recognition, CIARP 2008. Lecture Notes on Computer Sciences LNCS, Vol. 5197, págs. 348-355. ISSN: 0302-9743.

52. A new algorithm for facility location problem based on Dynamic Mesh Optimization.

Costa Salas, Yasel José, y otros. Hunedoara, Rumanía : s.n., January-March, 2011. Acta Técnica Corviniensis-Bulletin of Engineering. Tome IV. págs. 19-22. ISSN 2067-3809. 53. A hybrid grouping genetic algorithm for bin packing. Falkenauer, Emanuel. 1, s.l. : Kluwer Academic Publishers, 1 de june de 1996, Journal of Heuristics, Vol. 2, págs. 5-30. ISSN: 1381-1231.

54. Deza, Elena y Deza, Michel Marie. Dictionary of Distances. 1ra Edición. s.l. : Elsevier, 2006. ISBN: 978-0-444-52087-6.

55. Towards Vertical Fragmentation in Distributed Databases. Runceanu, A. Craiova, Rumanía : Editura Universitaria, 18-20 october 2007. Proceedings International Symposium on Systems Theory, Automation, Robotics, Computers, Informatics, Electronics and Instrumentation - SINTES 13. Vol. II, págs. 80-85. ISBN: 978-973-742- 816-5.

56. Fragmentation in distributed databases. Runceanu, Adrian. s.l. : Springer Netherlands, 2008, Innovations and Advanced Techniques in Systems, Computing Sciences and Software Engineering, págs. 57-62. ISBN: 978-1-4020-8734-9.

57. A Genetic Algorithm for Vertical Fragmentation and Access Path Selection. Song, Suk- Kyu y Gorla, Narasimhaiah . 1, 2000, The Computer Journal, Vol. 43, págs. 81-93. 58. Vertical Data Fragmentation and Fragment Allocation in Distributed Database Systems. Zhou, Zehai y Sheng, Olivia. Brisbane, Australia : s.n., 1997. The Third Pacific Asia Conference on Information Systems, PACIS 1997. pág. 80.

ANEXOS

Anexo A. Matriz de Uso de Atributos que relaciona 20 atributos con 15 transacciones [4]

A1 A2 A3 A4 A5 A6 A7 A8 A9 A10 A11 A12 A13 A14 A15 A16 A17 A18 A19 A20

T1 50 0 0 50 50 50 0 50 0 0 0 0 0 0 0 0 0 0 0 0 T2 0 50 0 0 0 0 0 0 50 0 0 50 50 50 0 0 0 0 0 0 T3 0 0 50 0 0 0 50 0 0 50 50 0 0 0 0 0 50 50 0 0 T4 0 0 0 0 0 0 0 0 0 0 0 0 0 0 50 50 0 0 50 50 T5 15 0 0 0 15 0 0 15 0 0 0 0 0 0 0 0 0 0 0 0 T6 15 0 0 0 0 0 0 15 0 15 15 0 0 0 0 0 0 0 0 0 T7 0 0 15 0 0 0 15 0 0 15 15 0 0 0 0 0 15 0 0 0 T8 0 15 0 0 0 0 0 0 0 0 0 15 15 15 15 15 0 15 0 15 T9 0 10 0 0 10 0 0 0 0 0 10 0 0 10 0 0 0 0 10 0 T10 10 0 0 0 0 0 0 0 10 0 0 0 0 0 0 10 0 10 0 0 T11 10 10 10 0 10 10 0 0 10 0 0 10 10 0 0 0 0 0 0 0 T12 0 0 0 10 0 0 10 0 0 10 0 0 0 10 0 0 0 0 10 10 T13 0 0 0 0 0 0 0 10 0 0 10 0 0 0 10 10 10 10 0 0 T14 5 5 5 5 5 5 5 5 5 0 0 0 0 0 0 0 0 0 0 0 T15 0 0 0 0 0 0 0 0 0 0 0 0 0 0 5 5 5 5 5 5