• No results found

El trabajo de esta tesis se realizó de acuerdo a los alcances planeados al inicio de la misma. Si bien se realizó la implementación de una interface para realizar búsquedas de audio por contenido, existe mucho trabajo por realizar con respecto al diseño e implementación de nuevas interfaces de consulta, además del trabajo necesario para realizar las búsquedas por contenido. Por lo cual se consideran como trabajo a futuro los siguientes puntos.

 Realizar una técnica de representación de señales basada en características geométricas propias del espacio.

 Generar una estructura o índice, donde el tiempo de respuesta a una consulta sea constante, es decir, al someter una búsqueda el tiempo de espera para un usuario final no dependa de la cantidad de elementos en una colección. Este índice debe tener una precisión y un recall aceptable comparado con los resultados que se pueden observar en el estado del arte.

 La implementación de una interfaz para la consulta de audio por contenido, esta interfaz se desenvolvería en escenarios donde no se cuenta con una computadora, pero si con un dispositivo móvil como un celular.

Bibliografía

Allamanche, E., Herre, J., Hellmuth, O., Fröba, B., Kastner, T., Cremer, M. (2001). Content-based identification of audio material using MPEG-7 low level description. En Proceedings of the International Symposium of Music Information Retrieval 2001.páginas 197- 204, Octubre 15-17, Indiana, USA.

Baeza-Yates, R. (1997). Searching: an algorithmic tour. Encyclopedia of Computer Science and Technology, 37(1): 331-359.

Baeza-Yates, R., Cunto, W., Manber, U., Wu, S. (1994). Proximity matching using fixed- queries trees. En Proceedings of the 5th Combinatorial Pattern Matching 1994. páginas 198- 212, Junio 5-8, California, USA.

Bozkaya, T., Ozsoyoglu, M. (1997). Distance-based indexing for high-dimensional metric spaces. En Proceedings of the ACM SIGMOD international conference on Management of data 1997. páginas 357-368. Mayo 13-15, Arizona, USA.

Burkhard, W. A., Keller, R. M. (1973). Some approaches to best-match file searching. Communications of the ACM, 16(4): 230-236.

Bustos, B., Navarro, G. (2004). Probabilistic proximity searching algorithms based on compact partitions. Journal of Discrete Algorithms, 2(1), 115-134.

Camarena-Ibarrola, A., Chávez, E. (2006). A Robust Entropy-Based Audio-Fingerprint. En Proceeding of the International Conference on Multimedia and Expo (ICME 2006). páginas. 1729 - 1732, Junio 9-12, Toronto, Canada.

Cano, P., Batlle, E., Kalker, T., Haitsma, J. (2005). A review of audio fingerprinting. The Journal of VLSI Signal Processing, 41(3): 271-284.

Chávez, E. (1999). Optimal discretization for pivot based algorithms. Manuscript. ftp://garota. fismat. umich. mx/pub/users/elchavez/minimax. ps. gz.

Chávez, E., Figueroa, K., Navarro, G. (2008). Effective proximity retrieval by ordering permutations. IEEE transactions on pattern analysis and machine intelligence, 30(9): 1647- 1658.

Chávez, E., Navarro, G., Baeza-Yates, R., Marroquín, J. L. (2001). Searching in metric spaces. ACM Computing Surveys (CSUR), 33(3): 273-321.

Ciaccia, P., Patella, M., Zezula, P. (1997). M-tree: An efficient access method for similarity search in metric spaces. En Proceedings of the International Conference on Very Large Data Bases 1997. páginas 426-435, Agosto 25-29, Atenas, Grecia.

Cormen, T. H., Leiserson, C. E., Rivest, R. L., Stein, C. (2001). Introduction to algorithms. The MIT press. 1184.

Dehne, F., Noltemeier, H. (1987). Voronoi trees and clustering problems. Information Systems, 12(2), 171-175.

Doraisamy, S., Ruger, S. (2002). A Comparative and Fault-tolerance Study of the Use of N-grams with Polyphonic Music. En Proceedings of the International Conference on Music Information Retrieval 2002. páginas 53-70, Octubre 13-17, Paris, Francia.

Fagin, R., Kumar, R., Sivakumar, D. (2003). Comparing top k lists. En Proceedings of the fourteenth annual ACM-SIAM symposium on Discrete algorithms 2003. páginas 28-36, Enero 12-14, Baltimore, USA.

Grossman, D. A., Frieder, O. (2004). Information retrieval: Algorithms and heuristics. Kluwer Academic Pub. 332.

Guo, A., Siegelmann, H. (2004). Time-warped longest common subsequence algorithm for music retrieval. En International Conference on Music Information Retrieval 2004, Octubre 10-14, Barcelona, Espana.

Haitsma, J., Kalker, T. (2003). A highly robust audio fingerprinting system with an efficient search strategy. Journal of New Music Research, 32(2): 211-221.

Haus, G., Pollastri, E. (2001). An audio front end for query-by-humming systems. En International Symposium on Music Information Retrieval 2001. páginas 65-72, Octubre 15-17, Indiana, USA.

Herre, J., Allamanche, E., Hellmuth, O. (2002). Robust matching of audio signals using spectral flatness features. In Workshop on the Applications of Signal Processing to Audio and Acoustics, 2001 IEEE. páginas. 127-130, Octubre 21-24, Nueva York, USA.

Kalantari, I., McDonald, G. (2006). A data structure and an algorithm for the nearest point problem. IEEE Transactions on Software Engineering, 9(5): 631-634.

Kim, S., Yoo, C. D. (2007). Boosted binary audio fingerprint based on spectral subband moments. En International Conference on Acoustics, Speech and Signal Processing, 2007. ICASSP 2007. páginas 241-244, Abril 15-17, Honolulu, Hawai.

Kurth, F., Scherzer, R. (2003). Robust Real-Time-Identification of PCM Audio Sources. Preprints-Audio Enginering Society, páginas 5821.

Manning, D., Prabhakar, R., Hinrich, S. (2008). Introduction to Information Retrieval (1 ed.). Cambridge University Press. 496.

Noltemeier, H., Verbarg, K., Zirkelbach, C. (1992). Monotonous Bisector* Trees—a tool for efficient partitioning of complex scenes of geometric objects. Data structures and efficient algorithms, 594(1), 186-203.

Olson, M. A., Bostic, K., Seltzer, M. (1999). Berkeley db. En Proceedings of the FREENIX Track: USENIX Annual Technical Conference 1999. páginas 183-192, Junio 6-11, California, USA.

Pauws, S. (2004). Musical key extraction from audio. En Proceedings of the International Symposium of Music Information Retrieval 2004, Octubre 10-14, Barcelona, España

Ruiz, V. (1986). An algorithm for finding nearest neighbours in (approximately) constant average time. Pattern Recognition Letters, 4(3): 145-157.

Seo, J. S., Jin, M., Lee, S., Jang, D., Lee, S., Yoo, C. D. (2005). Audio fingerprinting based on normalized spectral subband centroids. En Proceedings in the Acoustics, Speech, and Signal Processing 2005. páginas 213-216, Marzo 18-23, Philadelphia, USA

Shanon, C. E., Weaver, W. (2001). The mathematical theory of communication. ACM SIGMOBILE Mobile Computing and Communications Review, 5(1): 3-55.

Sukittanon, S., Atlas, L. (2002). Modulation frequency features for audio fingerprinting. En Proceedings on the Acoustics, Speech, and Signal Processing, 2002. páginas 1773 - 1776, Mayo 13-17, Florida, USA.

Tellez, E. S., Chavez, E. (2010). On locality sensitive hashing in metric spaces. En Proceedings of the Third International Conference on SIiilarity Search and Applications 2010. páginas 67-74, Septiembre 18-19,Istanbul, Turquía.

Uhlmann, J. (1991). Implementing metric trees to satisfy general proximity/similarity queries. Information Processing Letters, 40(4): 175-179.

Wang, A. (2003). An industrial strength audio search algorithm. En Proceedings of the International Symposium of Music Information Retrieval 2003. páginas 7-13, Octubre 26-30, Maryland, USA.

Wold, E., Blum, T., Keislar, D., Wheaten, J. (2002). Content-based classification, search, and retrieval of audio. IEEE Multimedia, 3(3): 27-36.

Yianilos, P. N. (1993). Data structures and algorithms for nearest neighbor search in general metric spaces. En Proceedings of the fourth annual ACM-SIAM Symposium on Discrete algorithms 1993. páginas 311-321, Enero 25-27, Texas, USA.

Yianilos, P. N. (1999). Excluded middle vantage point forests for nearest neighbor search. In In DIMACS Implementation Challenge, ALENEX'99.

Apéndice A

Implementación de Natix