• No results found

Según la Figura 11 Diagrama de Venn con tabla explicativa sobre el contenido de datos necesarios para los procesos de cada análisis, los tres instrumentos de análisis comparten datos en común para sus procesos. Dichos datos son: el año de solicitud, la fecha de publicación de la patente, los países donde es válida la nacionalidad y naturaleza de los solicitantes y los inventores, y si pertenece a una familia de patentes. Por consiguiente estos son los primeros datos que deberían estar normalizados y deberían encontrarse en todas las patentes del corpus.

Las preguntas que buscaban analizar el contenido de los datos en las patentes eran las siguientes:

117  ¿Hay datos en la patente que indiquen el año de solicitud de la patente?

 ¿Hay datos en la patente que indiquen la fecha de publicación de la patente?

 ¿Hay datos en la patente que indiquen los países dónde la patente es válida?

 ¿Hay datos en la patente que indiquen la nacionalidad de los inventores?

 ¿Hay datos en la patente que indiquen la nacionalidad de los solicitantes?

 ¿Hay datos en la patente que indiquen la naturaleza de los solicitantes?

Tal como se puede apreciar en la siguiente tabla, el único dato que el corpus no poseía en su totalidad fue un indicador que señalara claramente si la patente pertenecía a una familia de patentes. Sin embargo su ausencia no perjudica demasiado los procesos de análisis de los tres instrumentos. Esto se debe a que, si bien un dato que indique si la patente pertenece a una familia es necesario en los para los tres instrumentos de análisis, no cambiaría mucho el producto final, siempre que éste fuese el único dato que faltara (Organización para la cooperación y el desarrollo económicos (OCDE), 2009).

Existencia en el corpus de los datos en

común entre los tres instrumentos de análisis Sí No ¿Hay datos en la patente que indiquen si

existe familia de patentes? 18 52

¿Hay datos en la patente que indiquen el año

de solicitud de la patente? 70 0

¿Hay datos en la patente que indiquen la

fecha de publicación de la patente? 70 0

¿Hay datos en la patente que indiquen los

países dónde la patente es válida? 70 0

¿Hay datos en la patente que indiquen la

nacionalidad de los inventores? 70 0

¿Hay datos en la patente que indiquen la

nacionalidad de los solicitantes? 70 0

¿Hay datos en la patente que indiquen la

naturaleza de los solicitantes? 70 0

Tabla 26 Discriminación de los resultados de la lista de chequeo aplicada al corpus - datos en común entre los tres instrumentos de análisis

A diferencia de los resultados en la prueba piloto, al aplicar la lista de chequeo a todo el corpus se encuentra que sí existen patentes que tienen datos sobre la existencia de familias de patentes. En la siguiente gráfica se puede apreciar que dichas patentes representan el 24%. Como se explicó en anteriores apartados, la familia de patentes es funcional para trazar la evolución tecnológica de un invento o innovación tecnológica. Así como afirmó Diessler en Las patentes

118 como fuente de información para la innovación en entornos competitivos, la trazabilidad es un

aspecto importante a la hora del análisis para la inversión tecnológica; las tendencias de innovación en una campo tecnológico a nivel local, regional, continental o global; y el análisis del crecimiento de un área tecnológica respecto a otras en el mismo país, o región o continente.

A continuación se encuentran las preguntas que componen el los datos particulares para el instrumento de análisis del contenido de las patentes. Como se puede apreciar en la gráfica y la tabla siguientes, las patentes en química de alimentos colombianas sólo tienen información de tres de las 7 preguntas. Como era de esperarse, ninguna patente ha sido renovada y esto se debe al hecho de que en Colombia, los derechos de explotación de una patente de invención son de 20 años. Ninguna de las patentes presentó algún grado de citación o un uso para hacer oposición al reconocimiento de otra patente. Esta información vital para el estudio de inversión tecnológica para una patente.

Existencia en el corpus de los datos para el análisis del

contenido de las patentes (sin los datos en común) Sí No ¿Hay datos en la patente que indiquen si la patente ha sido

citada en otras patentes? 0 70

¿Hay datos en la patente que indiquen si la patente ha citado

a otras patentes? 0 70

0% 20% 40% 60% 80% 100%

¿Hay datos en la patente que indiquen si existe familia de patentes? ¿Hay datos en la patente que indiquen el

año de solicitud de la patente? ¿Hay datos en la patente que indiquen la

fecha de publicación de la patente? ¿Hay datos en la patente que indiquen los

países dónde la patente es válida? ¿Hay datos en la patente que indiquen la

nacionalidad de los inventores? ¿Hay datos en la patente que indiquen la

nacionalidad de los solicitantes? ¿Hay datos en la patente que indiquen la

naturaleza de los solicitantes?

Existencia en el corpus de los datos en común entre los tres instrumentos de análisis

119 ¿Hay datos en la patente que señalen que la patente contiene

investigación previa? 58 12

¿Hay datos en la patente que indiquen si ha sido renovada? 0 70 ¿Hay datos en la patente que indiquen los países dónde la

patente es válida? 70 0

¿Hay datos en la patente que indiquen si la patente contiene

modelos o ilustraciones de uso? 4 66

¿Hay datos en la patente que indiquen si la patente ha sido

utilizada para hacer oposición a otra patente? 0 70 ¿Hay datos en la patente que indiquen que la patente ha

presentado oposición? 0 70

Tabla 27 Discriminación de los resultados de la lista de chequeo aplicada al Corpus -Datos para el análisis del contenido de las patentes

Como es señalado en la anterior gráfica, hay una diferencia visible entre los resultados de la prueba piloto y los resultados del corpus. Esto es el aumento en el porcentaje de patentes que presentaron investigación previa. Dichas patentes representan el 83% de las patentes colombianas en química de alimentos presentadas entre el 2002 y 2012. A partir de lo anterior se puede deducir que la calidad del contenido de la patente (Diessler, 2010) tiende a ser mayor que lo pronosticado en los resultados de la prueba piloto. Otra diferencia es la existencia de patentes que tienen modelos o ilustraciones de uso. Esto significa que al menos el 6% de las patentes en ésta área tecnológica presentaron innovaciones en maquinaria. De igual forma, si se juntan done

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% ¿Hay datos en la patente que indiquen si la

patente ha sido citada en otras patentes? ¿Hay datos en la patente que indiquen si la

patente ha citado a otras patentes? ¿Hay datos en la patente que señalen que la

patente contiene investigación previa? ¿Hay datos en la patente que indiquen si ha sido

renovada?

¿Hay datos en la patente que indiquen los países dónde la patente es válida?

¿Hay datos en la patente que indiquen si la patente contiene modelos o ilustraciones de uso?

¿Hay datos en la patente que indiquen si la

patente ha sido utilizada para hacer oposición a…

¿Hay datos en la patente que indiquen que la patente ha presentado oposición?

Existencia en el corpus de los datos para el análisis del contenido de las patentes (sin los datos en común)

120

variables como investigación previa, renovaciones y año de publicación es posible hacer suposiciones sobre la potencial calidad y novedad de la patente.

En la siguiente tabla se muestran los resultados del corpus de los datos únicos para el proceso del instrumento de análisis de tendencias tecnológicas. En éste caso, todas las patentes tienen un descriptor temático sobre su contenido. Sin embargo no hay un control entre la cantidad de descriptores temáticos máximos para una patente, y sólo el 14% de las patentes tenían descriptores en dos sistemas de clasificación diferentes. Esto lleva a pensar que no hay un control en la asignación de descriptores temáticos en las patentes de química de alimentos.

Existencia en el corpus de los datos para el análisis de

tendencias tecnológicas (sin los datos en común) Sí No ¿Hay patentes cuyos datos indiquen los campos

tecnológicos que trata el contenido de la patente según el

sistema de clasificación internacional de patentes? 70 0 ¿Hay patentes cuyos datos indiquen que ésta pertenece a

más de una clase de campo tecnológico en el sistema de

clasificación internacional de patentes? 28 42 ¿Hay patentes cuyos datos indiquen si la patente aplica a

más de un sistema de clasificación de campo

tecnológico? 10 60

¿Hay datos en la patente que indiquen los campos tecnológicos que trata el contenido de la patente en el

otro sistema de clasificación? 10 60

¿Hay patentes cuyos datos indiquen que ésta pertenece a más de un área tecnológica en el sistema de clasificación

cooperativo? 9 61

¿Hay datos en la patente que indiquen términos clave del

contenido de la patente? 70 0

Tabla 28 Discriminación de los resultados de la lista de chequeo aplicada al corpus - datos para el análisis de tendencias tecnológicas

Para ilustrar lo anterior se elaboró una gráfica. En primer lugar se puede apreciar que no hay un control sobre la cantidad de descriptores temáticos que puede tener una patente. Según la gráfica el 40% de las patentes tiene más de un descriptor y como se puede evidenciar en el Anexo 4 Corpus del trabajo de grado., hay patentes que tienen hasta seis descriptores temáticos. Como menciona (Diessler, 2010) y (Ayuso- Sánchez & Ayuso-García, 2003), la falta de control en los descriptores impide una recuperación exacta de la patente y disminuye la calidad del documento.

121

A parte de lo anterior, también se puede apreciar que el 14% de las patentes tienen descriptores en la clasificación internacional de patentes (CIP) y la clasificación cooperativa de patentes (CCP). Como fue mencionado en el apartado 2.2.3.2 Patentes de invención en química de alimentos, la clasificación cooperativa de patentes es una fusión entre la clasificación

internacional de patentes y el sistema de clasificación utilizado por la oficina de patentes de Japón. Ésta clasificación tiene como objetivo homologar las clasificaciones entre las oficinas que utilizan el CIP y la oficina de Japón. El hecho de que no haya un control sobre los sistemas de clasificación que debe usar la patente también vuelva a fraccionar las posibilidades de recuperación a través de otras oficinas de patentes.

Por último se encuentra la tabla que evalúa los datos únicos necesarios para el proceso del instrumento de análisis estadístico de las patentes. Como se mencionó en apartados pasados, estas dos preguntas propenden a señalar el potencial para el trabajo cooperativo en las patentes colombianas.

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

¿Hay patentes cuyos datos indiquen los campos tecnológicos que trata el contenido de la patente según el

sistema de clasificación internacional de patentes? ¿Hay patentes cuyos datos indiquen que ésta pertenece a

más de una clase de campo tecnológico en el sistema de clasificación internacional de patentes? ¿Hay patentes cuyos datos indiquen si la patente aplica a más de un sistema de clasificación de campo tecnológico? ¿Hay datos en la patente que indiquen los campos tecnológicos que trata el contenido de la patente en el

otro sistema de clasificación?

¿Hay patentes cuyos datos indiquen que ésta pertenece a más de un área tecnológica en el sistema de clasificación

cooperativo?

¿Hay datos en la patente que indiquen términos clave del contenido de la patente?

Existencia en el corpus de los datos para el análisis de tendencias tecnológicas (sin los datos en común)

122 Existencia en el corpus de los datos para el análisis

estadístico de las patentes (sin los datos en

común) Sí No

¿Hay datos en la patente que indiquen su país de

publicación? 70 0

¿Hay datos en la patente que indiquen si el trabajo fue

cooperativo? 4 66

Tabla 29 Discriminación de los resultados de la lista de chequeo aplicada al Corpus - datos para el análisis estadístico de las patentes

Como se pudo apreciar, las patentes colombianas en química de alimentos carecen de ciertos datos necesarios para los procesos de algunos de los instrumentos de análisis.

Como el corpus analizado son documentos, la tabla relacional sólo evaluará la existencia de datos curados en el ámbito descriptivo. De acuerdo con lo estipulado por (Lewis, y otros, 2014),

(Nečaský, y otros, 2014), y el UK Data Archive, los datos curados son metadatos que presentan una normalización sea ésta por la cantidad existente en un área, el nivel de control de los metadatos con su significado, y el control de extensión de datos.

Con el fin de establecer las relaciones entre la curación de datos y las patentes se elaboró una tabla relacional. En dicha tabla se muestran dos grandes grupos de la curación de datos: normalización de los datos y controles de aspectos de los datos. Se escogieron estos dos campos porque los aspectos de la curación de datos a evaluar en la patente pertenecen al universo descriptivo que plantea Lewis et al (ver Ilustración 7 Tipos de relación que puede tener la curación de datos con los documentos (Lewis et al)pág. 50) ya que el corpus está compuesto por

documentos que pueden formar una colección y pueden ser descritos como ítems.

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% ¿Hay datos en la patente que indiquen su país de

publicación?

¿Hay datos en la patente que indiquen si el trabajo fue cooperativo?

Existencia en el corpus de los datos para el análisis

estadístico de las patentes (sin los datos en común)

123

La tabla también señala la evidencia de los diferentes datos curados en las patentes correspondientes a los tipos de curación de datos establecidos en la tabla. Para evitar repetición de los datos en la evidencia de las patentes, los aspectos de la curación de datos a relacionar indagan por elementos específicos tales como el control de la extensión de los datos en cuyo caso la evidencia en la patente debe constatar la extensión de los datos controlados.

Por último la tabla también presenta la cantidad de patentes del corpus que presentan los elementos controlados. De ésta forma es posible hacer un análisis porcentual que denote las oportunidades de aplicación de curación de datos para las patentes colombianas en química de alimentos.

Tipo de curación de datos Evidencia en la patente Número de patentes con dicho elemento

Normalización

a) Temática IPC - clasificación internacional de patentes CCP- clasificación cooperativa de patentes 70 b) Número de identificación Número de publicación Número de solicitud Número de prioridad 70

c) Relación con otras patentes Also published As 18 Control de cantidad (Cantidad de descriptores temáticos IPC) Control de la cantidad de números del IPC en una patente 42 Control de cantidad (Cantidad de descriptores temáticos CCP) Control de la cantidad de números del CCP en una patente

1

Control de tipos de descriptores temáticos en una patente

Control sobre si la patente tiene normalizado hacer descripciones tanto en IPC como CCP

10

Control de longitud del datos Número de prioridad (13 dígitos) Número de solicitud (9 dígitos) 70

Control de los metadatos con su significado

Identificación de nacionalidad [CO]

IPC y CCP

70

124

La primera categoría de la curación de datos es la normalización, la segunda es el control de diferentes aspectos de los datos. Para la normalización se escogieron tres campos:

1. La temática que se refiere al tema del contenido de la patente 2. Los diferentes datos de identificación documental de cada patente 3. Los datos que relacionan la patente con otras patentes.

En la siguiente gráfica se puede evidenciar que las patentes tienen normalizados todos los datos relacionados con su descripción temática (área tecnológica) e identificación como documento individual. Por otro lado, sólo el 26% del corpus presenta datos sobre las relaciones entre patentes.

Figura 15 Porcentaje de datos normalizados en las patentes colombianas de química de alimentos

El segundo campo de elementos de curación de datos son los controles de diferentes aspectos de los datos. Éstos van desde el control de la extensión de los datos hasta la cantidad de datos existentes. El control es importante en el ejercicio de curación de datos porque permiten establecer la calidad del documento y una mejor organización, identificación y almacenamiento de los datos. De acuerdo con las evaluaciones cuantitativas del UK data archive para la curación de datos, el control de los datos ayuda a la escalabilidad de los procesos de gestión o recuperación de documentos en diferentes sistemas. La siguiente figura presenta los datos que

100% 100% 26% 0% 20% 40% 60% 80% 100% 120%

Porcentaje de datos normalizados en las patentes colombianas de química de alimentos

125

posee una patente en las diferentes categorías de control junto con la cantidad de patentes que presentan el control.

Figura 16 Porcentaje de datos controlados en las patente colombianas de química de alimentos

Como se puede apreciar en la figura, todas las patentes tienen controlado la longitud de los datos y el control del significado de los metadatos descriptivos. Sin embargo, tal como se enunció en el análisis de los resultados de la evaluación del Corpus, no hay un control en la cantidad de descriptores temáticos de las patentes. Esto contrasta con a otra medición aplicada a los descriptores temáticos.

Las clasificaciones están normalizadas y el significado de cada ítem es único. Pero al carecer de un control de cantidad de elementos descriptivos para una patente, y el número de patentes existe el peligro de poca recuperación y pertinencia en las patentes que se desea buscar.

Adicional a lo anterior trayendo a colación lo que expone Abbad et al, los datos en las patentes pueden ser usados entre otras cosas para analizar las tendencias de las patentes; pronosticar el desarrollo tecnológico en un dominio (área de conocimiento, CIT) particular16; determinar la calidad de las patentes para su inversión y aplicación17; mapeo de las patentes;

16 Instrumento de análisis #2: análisis de tendencias tecnológicas de las patentes 17 Instrumento de análisis #1: análisis de contenido de la patente

60% 1% 14% 100% 100% 0% 20% 40% 60% 80% 100% 120%

Porcentaje de datos controlados en las patente colombianas de química de alimentos

Control de cantidad (Cantidad de descriptores temáticos IPC)

Control de cantidad (Cantidad de descriptores temáticos CCP)

Control de tipos de descriptores temáticos en una patente Control de longitud del datos

Control de los metadatos con su significado

126

identificación de los puntos de mayor y menor actividad tecnológica18. Éstos son claros ejemplos de gestión de la información en una patente y pueden apoyar la toma de decisiones para el manejo de inversiones para investigación, la identificación de qué patentes o tecnologías en química de alimentos tiene mayor rentabilidad, saber cuáles son las áreas con mayor desarrollo y cuál es el desempeño del país a nivel regional, o inclusive, cómo es el desempeño de un área de