Lade Inhalt...

Tesauros y Bases de Datos Internacionales. La Indización de Textos científicos en Salud

von José Raúl Pérez Martínez (Autor)

Essay 2018 17 Seiten

Bibliothekswissenschaften, Information Science

Leseprobe

Índice (Index) :

INTRODUCCIÓN

DESARROLLO

A qué podemos llamar Indización

¿Qué es un lenguaje de indización?

Tesauros MeSH y DeCS

Un conjunto de elementos que todo buen tesauro debe tener

SciELO-Cuba es la biblioteca virtual electrónica de las revistas cubanas de medicina

Scopus (http://www.elsevier.com/online-tools/scopus)

EBSCO

LILACS

CONCLUSIONES

CONCLUSIONS

REFERENCIAS BIBLIOGRÁFICAS

RESUMEN:

El presente ensayo académico ofrece una mirada atenta hacia los procesos de representación del contenido temático de un recurso de información, tanto en lo que respecta a la construcción de una referencia dirigida a la identificación de este recurso, como en lo tocante a posibilitar su ulterior recuperación, con el objetivo de recobrar la mayor cantidad de información pertinente sobre un tema de investigación determinado. Se abordan conceptos tales como la Indización (en ocasiones denominada indexación). También se hace referencia a un conjunto de bases de datos que son empleadas regularmente en el ámbito científico en general y en específico por parte de los más diversos especialistas de las ciencias médicas, para la localización de información confiable, pertinente y actualizada, en apoyo de sus labores docentes; académica y de investigación. Es abordado, también a nivel conceptual y desde el punto de vista de sus características y criterios fundamentales, a los tesauros de mayor importancia en Salud Pública en Cuba, toda vez que estos constituyen instrumentos indispensables tanto para la indización como a efectos de la localización de información científica.

Palabras claves: Indizar, indexar, indexador, tesauro, lenguaje controlado, lenguaje de indización, SciELO, Scopus, EBSCO.

ABSTRACT:

This academic essay offers a careful look at the processes of representation of the thematic content of an information resource, both with regard to the construction of a reference aimed at the identification of this resource, and in terms of enabling its further recovery, with the aim of recovering the largest amount of pertinent information on a specific research topic. Concepts such as Indexing are addressed. Reference is also made to a set of databases that are regularly used in the scientific field in general and specifically by the most diverse specialists in the medical sciences, to locate reliable, relevant and up-to-date information in support of his teaching duties; academic and research. It is approached, also at a conceptual level and from the point of view of its characteristics and fundamental criteria, to the most important thesauri in Public Health in Cuba, since these are indispensable instruments both for indexing and for the purpose of locating scientific information.

Keywords: Indexing, indexer, thesaurus, controlled language, indexing language, SciELO, Scopus, EBSCO.

INTRODUCCIÓN

En esta primera mitad del siglo XXI ya para nadie es un secreto que la tenencia de información pertinente y actualizada es indispensable para la toma oportuna de decisiones, para apoyar y potenciar la educación de las nuevas generaciones, desde el nivel primaria hasta la formación postgradual, sin contar como la actualización del conocimiento de académicos y muchos otros especialistas.

De la disponibilidad de fuentes confiables de información, arbitradas y fidedignas, depende la sustentación y crecimiento de todas las apuestas a futuro que pueda hacer un país por su desarrollo; del progreso de su infraestructura industrial, del avance de los procesos de innovación y desarrollo en todos los frentes e incluso de la calidad de la atención médica que esa nación puede prodigar a sus ciudadanos, en directa proporción con la preparación técnica y profesional del personal capacitado que ofrece sus servicios en los centros asistenciales, sobre todo en el sector de la salud pública, porque para nadie es un secreto que amplios sectores poblacionales no logran acceder a los cuidados médicos que prodiga el sector privado; donde se localiza un extenso espectro de especialistas dotados de la más alta calificación.

Un conjunto de organizaciones líderes de la salud, especialmente de la salud pública a nivel mundial, han apoyado, subvencionado y promovido un variado grupo de iniciativas y proyectos destinados a hacer llegar información de calidad a los países económicamente menos favorecidos, con el objetivo de reducir la brecha tecnológica y de desarrollo entre estas naciones y las más desarrolladas, y como una forma más de redistribución de la riqueza a nivel mundial; partiendo de la premisa de que la información científica es un bien inestimable y materia prima esencial de la actual sociedad del conocimiento.

Algunas de las organizaciones que obran de la manera aquí descrita son: la OMS u Organización Mundial de la Salud y la OPS u Organización Panamericana de la Salud, las cuales cuentan con la voluntad política de los gobiernos de aquellas naciones que ven en el acceso a la información científica una apuesta a futuro, a mediano y largo plazo, para el desarrollo y la supervivencia de sus naciones. Justo es señalar que estas entidades disponen de un grupo de organismos asociados que, en innumerables ocasiones, han hecho la diferencia lo que respecta al alcance y éxitos de las metas trazadas a nivel internacional.

La presente investigación brinda una mirada atenta hacia los procesos de representación del contenido temático de un recurso de información, tanto en lo que respecta a la construcción de una referencia a este recurso, como en lo tocante a posibilitar su ulterior recuperación, con el objetivo de recobrar la mayor cantidad de información pertinente con respecto a un tema de investigación determinado.

Aquí se abordan conceptos tales como la Indización (en ocasiones denominada indexación) como parte del proceso analítico – sintético de la documentación. También se hace referencia a un conjunto de bases de datos que son empleadas regularmente en el ámbito científico en general y en específico por parte de los más diversos especialistas de las ciencias médicas para la localización de información confiable, pertinente y actualizada, en apoyo de sus labores docentes, académica y de investigación.

Como un instrumento indispensable, fuertemente vinculado a los procesos y gestiones aquí descritos, se presentan los vocabularios controlados, en especial los tesauros; depositarios de todo un sistema de términos que hacen mucho más fácil, rápida y fluida, tanto la indización como la localización de información científica en las diversas bases de datos puestas a la disposición de un conjunto heterogéneo y creciente de usuarios a nivel internacional. Sobre este tema, sus particularidades y características también estarán tratando los acápites del presente ensayo académico.

DESARROLLO

A qué podemos llamar Indización

La indización, término que a su vez recibe el nombre equivalente de indexación, no es únicamente utilizable en el ámbito de las ciencias de la salud. En el terreno económico la indización es aplicada “…mediante la corrección de los precios de determinados productos de consumo, salarios, tasas de interés, entre otros, con la misión de equilibrarlos y acercarlos al aumento general de precios. La indexación que se aplicará será el resultado de la medición de un índice, como el costo de vida, o, en su defecto, el precio del oro, o la devaluación de la moneda.” (1)

Desde un punto de vista más cercano a las ciencias de la información científica y la bibliotecología, se conoce a la indización como al proceso que hace posible explicar o “…representar el contenido temático de un recurso de información para elaborar un índice que consiste en obtener los conceptos representativos del contenido de un documento donde se pueden emplear materias, palabras claves o descriptores”. (2)

Otros autores del ámbito de la salud se refieren a la Indización como“… una de las etapas del procesamiento analítico sintético de la información. Se define como la enumeración sucesiva de los diferentes encabezamientos (términos) que expresan los temas contenidos en un documento, y que requiere de la aplicación de criterios uniformes; así como del establecimiento previo de una lista de términos en la cual se basa dicha indización.”(3)

También, puede definirse como el análisis del contenido informativo de un documento y posterior asignación de encabezamientos de materia, utilizados para convertir el lenguaje natural en otro, artificial controlado, a partir de su lectura técnica y con vistas a su ulterior recuperación. Su finalidad es permitir una búsqueda eficaz de la información contenida en un fondo documental. La indización es, entonces, un requisito necesario para un adecuado almacenamiento y recuperación de la información.(3)

La indización, en opinión de Cañedo Andalia y Small Chapman,“… se ubica por su complejidad intelectual entre la clasificación y la confección de resúmenes. El producto final de este proceso es generalmente un índice bibliográfico, una base de datos automatizada o simplemente un catálogo alfabético de materias manual, indispensables para asegurar el acceso y consulta de la información a los usuarios. Esta aseveración significa que se toman en cuenta los mismos criterios para la ejecución. Ellos son exhaustividad, multiplicidad, especificidad, coherencia, imparcialidad, fidelidad y buen juicio.”(4)

Según expresan los dos autores aquí referidos, “… en la indización, la especificidad y la exhaustividad constituyen los dos atributos cardinales. Estos son esenciales para determinar la clase de recuperación que se realizará.”(4)

“La exhaustividad se define por el grado de cobertura que presentan los tópicos o asuntos tratados en los documentos o solicitudes en los resultados de la indización, es decir, en el producto.” “Cuanto mayor sea la representación de los tópicos expuestos en un documento o solicitud en su indización, mayor será la exhaustividad del proceso.” “Se expresa cuantitativamente por el número de términos utilizados para realizar la representación. Comprende tópicos centrales y colaterales (principales y secundarios).”(4)

Cañedo Andalia y Small Chapmandefinen a la especificidad como al “… nivel de detalle y exactitud con que se representa cada tópico tratado en un documento o solicitud en la indización. La recuperación de información de manera eficiente requiere de la determinación de los términos más específicos que representan los conceptos presentes en un documento o solicitud. La representación de un concepto particular mediante un término, cuyo significado es más general que el concepto tratado en la entidad que se indiza, conduce a una pérdida de especificidad y, por consiguiente, de información.”(4)

Entre el abarcador conjunto de factores que deben considerarse al indizar, resaltan además: el análisis estricto del documento, la cobertura de los aspectos principales y secundarios discutidos en cada texto, la imparcialidad, fidelidad así como la realización de la lectura del documento a partir de la formulación de las siguientes preguntas: ¿Qué?, ¿Cómo?, ¿Dónde?, ¿Con qué resultados? (5)

En el artículo titulado “Indización en línea: ¿capricho o necesidad?”, sus autores aseguran que “…para lograr la indización correcta de un documento o solicitud de búsqueda es necesario utilizar los lenguajes de indización existentes. Estos lenguajes artificiales, llamados lenguajes de búsqueda informativa, lenguajes de indización, lenguajes documentales, lenguajes de almacenamiento y recuperación, entre otras denominaciones, son herramientas auxiliares, creadas por el hombre con el propósito de expresar el contenido semántico fundamental de los documentos o solicitudes de información y localizar la información que responda a las necesidades de los usuarios.” (5)

¿Qué es un lenguaje de indización?

Un lenguaje de búsqueda informativa o lenguaje de almacenamiento y recuperación o vocabulario controlado es aquél que ha sido perfilado bajo criterios preestablecidos de normalización, lo cual arroja como resultado un modelo que facilita el acceso y la recuperación de la información. (6)

Los lenguajes de indización son considerados lenguajes artificiales de estructuras precoordinadas, cuya finalidad principal ha de estar centrada en servir como instrumento mediador entre las preguntas que efectúan los usuarios de la información y la documentación o los contenidos que se administran en las bases de datos bibliográficas o documentales, a través de una interrelación semántica-conceptual, permitiendo obtener altos niveles de acierto y efectividad sobre los resultados obtenidos. Entre los lenguajes de indización más comúnmente empleados podemos citar los tesauros, los índices, los vocabularios controlados, las listas de encabezamientos de materias y las ontologías. (7)

Según lo define Lamarca Lapuente, en su sitio web “Hipertexto”, “…un tesauro es un vocabulario controlado y estructurado formalmente, formado por términos que guardan entre sí relaciones semánticas y genéricas: de equivalencia, jerárquicas y asociativas. Se trata de un instrumento de control terminológico que permite convertir el lenguaje natural de los documentos en un lenguaje controlado, ya que representa, de manera unívoca, el contenido de estos, con el fin de servir tanto para la indización, como para la recuperación de los documentos.

La Wikipedia se refiere al tesauro como a“… la lista de palabras o términos controlados empleados para representar conceptos. Esta enciclopedia en línea declara que el término proviene del latín thesaurus (‘tesoro’), y este a su vez del griego clásico thēsaurós (θησαυρός, ‘almacén’, ‘tesorería’).” (9)

En el ámbito de la biblioteconomía y las ciencias de la información, el Tesauro posee un signo de representación lingüístico, un vocabulario controlado y una sintaxis poscoordinada. Aunque en la práctica tradicional se habla de unitérminos, en la actualidad se ha efectuado grandes variaciones dando incorporación a términos o descriptores compuestos, es decir, descriptores que se componen de dos o más palabras. (9)

Aunque el presente no constituye un tesauro especializado en Ciencias de la Salud, sí puede citarse como un loable ejemplo de indización, se trata del Tesauro de la UNESCO, “…una lista controlada y estructurada de términos para el análisis temático y la búsqueda de documentos y publicaciones en los campos de la educación, cultura, ciencias naturales, ciencias sociales y humanas, comunicación e información. Continuamente ampliada y actualizada, su terminología multidisciplinaria refleja la evolución de los programas y actividades de la UNESCO.” (10)

Tesauros MeSH y DeCS

En la esfera de la salud, en Cuba, los lenguajes de búsqueda informativa más utilizados son: el Medical Subject Headings (MeSH) y Descriptores en Ciencias de la Salud (DeCS). (5)

El MeSH es el vocabulario utilizado por la Biblioteca Nacional de Medicina (NLM) de Estados Unidos para la descripción del contenido y recuperación de los documentos ingresados a la base de datos Medline, mientras que el DeCS, es el vocabulario utilizado por la red del Centro Latinoamericano y del Caribe de Información en Ciencias de la Salud (BIREME) para la descripción del contenido y recuperación de los documentos incorporados a la base de datos Lilacs (Literatura Latinoamericana y del Caribe en Ciencias de la Salud ). Para la elaboración del DeCS, se tomó como base el MeSH. Aun cuando son equivalentes, debe respetarse la uniformidad de criterios en el uso de cada uno de dichos lenguajes. (5)

Es necesario aclarar que Medline es la base de datos biomédica más conocida, utilizada y una de las más completas en su área, producida por la Biblioteca Nacional de Medicina de los Estados Unidos. Este valioso recurso “…cubre los campos de la medicina, la enfermería, la estomatología, los sistemas de cuidados de salud, las ciencias básicas y la veterinaria. Procesa unos 4 800 títulos de publicaciones seriadas procedentes de más de 70 países. Comprende unos 14 millones de referencias bibliográficas -el 76 % de ellas con resúmenes, a trabajos publicados desde los años 50 hasta la fecha. Aunque su cubrimiento es mundial, presenta una clara preferencia por la literatura generada en los países de habla inglesa.” (11)

La base de datos Medline es “…accesible gratuitamente por medio de PubMed, un proyecto impulsado por el Centro Nacional para la Información Biotecnológica, la Biblioteca Nacional de Medicina, así como varias casas editoras, localizado en el Instituto Nacional de Salud de los Estados Unidos, cuyo objetivo es facilitar el acceso a los textos completos de los trabajos referidos en Medline y otras bases de datos afines, participantes en dicho proyecto.” (11)

Dicho esto, resulta más sencillo comprender el lugar que ocupa el MeSH o Medical Subject Heading, este constituye el “… vocabulario controlado que emplea Medline y otras bases de datos biomédicas para procesar la información que se introduce en cada una de ellas. Contiene encabezamientos de materias, calificadores (subencabezamientos), definiciones, referencias cruzadas, sinónimos y listas de términos estrechamente relacionados. Consta de más de 33 000 términos ordenados en estructuras jerárquicas llamadas árboles, que se revisan anualmente para asegurar que constituyan un fiel reflejo de la práctica y la terminología médica actual.” (12)

Por su parte, el DeCS “…es el diccionario de términos normalizados (tesauro) autorizado como lenguaje convencional para indizar tanto los documentos como las solicitudes de información dentro de todo el Sistema de Información Latinoamericano y del Caribe en Ciencias de la Salud. Se crea para describir la información contenida en los documentos ingresados en la base de datos LILACS. Es un vocabulario trilingüe (español-portugués-inglés), basado en el MeSH”. “Como se inspira en el MeSH, este factor resulta determinante en la compatibilidad de ambos. Ostenta la condición de lenguaje artificial con carácter normativo y términos provistos de notas redactadas para orientar a los indizadores y usuarios en la indización de los documentos y recuperación de información respectivamente y debe su nombre a tales notas. Constituye el principal documento conjugado con el manual de indización en lo relativo a este proceso. Forma parte de la metodología LILACS.” (13)

El DeCS cubre las temáticas inherentes a la literatura médica por cuanto refleja la terminología utilizada en las distintas ramas de la medicina y ciencias afines. En particular, abarca aspectos relevantes para la región latinoamericana tales como la homeopatía (categoría HP) y la salud pública (categoría SP) enfocada a partir de nuestra realidad. (13)

Un conjunto de elementos que todo buen tesauro debe tener

En primer lugar están los términos Permitidos, o sea, aquellos que pueden ser utilizados tanto durante el proceso analítico sintético de un documento que se está incorporando a la base de datos que se sirve del tesauro en cuestión como para la recuperación de un texto procedente de dicha base de datos, a estos términos admisibles para tales fines se les denominaDescriptores. También es posible que el mismo tesauro incorpore algunos términos que no son admisibles a estos fines, o sea, que los indizadores y los usuarios no pueden utilizar, también conocidos comoNo descriptores. (14)

En opinión del Profesor Gastaminza, a partir de un no descriptor “… debe ser posible ver qué término se debe utilizar en lugar del otro. Un tesauro también suele permitir observar los no permitidos a partir de un descriptor. Esto da una idea mejor de lo que se supone que el término puede significar.” (14)

Relaciones Semánticas: Así como relaciona términos válidos con términos no válidos, un tesauro también muestra conexiones entre diversos descriptores. Estas conexiones se establecen generalmente mediante relaciones semánticas. Las conexiones semánticas pueden ayudar a dirigir al término adecuado y a aclarar el significado del término en cuestión. (14)

Directrices de aplicación: Un buen tesauro debe dejar muy claro qué significado cubre un término. Lo hace mediante los términos no válidos y las relaciones semánticas. Otras maneras de dirigir el uso del tesauro son las notas introductorias y las notas de alcance. Una nota de alcance toma a menudo la forma de una definición del término. Asegurar que los términos están utilizados constantemente con el mismo significado es otro aspecto importante del control del vocabulario. (14)

Reglas para la síntesis: Generalmente, un tesauro enumera todos sus descriptores explícitamente. Tales tesauros son enumerativos. Algunos tesauros indican algunos descriptores indirectamente: en vez de enumerarlos todos, dan las reglas para crearlos a partir de ciertos componentes. Tales tesauros son por lo menos en parte sintéticos. (14)

Otro elemento de importancia que utilizan los tesauros son losCalificadores, este recurso es especialmente útil cuando se está empleando, en la búsqueda de información, alguna palabra polisémica (un término que tiene varios significados), Toda vez que tesauro debe dejar claro el significado del término, lo cual es posible añadiendo un calificador al término. Al respecto, el Profesor Gastaminza provee de un ejemplo, a saber: RESISTENCIA (ELECTRICIDAD), aunque aclara que también se puede evitar la polisemia por transformación sintagmática: "RESISTENCIA ELÉCTRICA". (14)

En la actualidad, un conjunto de organizaciones e instituciones, tanto nacionales como internacionales, privadas algunas y otras de carácter público, otras dotadas de carácter o respaldo gubernamental o interestatal, han puesto a la disposición de académicos y estudiosos del planeta, una amplia diversidad de bases de datos y motores de búsqueda útiles para cualquier entorno académico; herramientas que permiten encontrar y acceder a artículos en revistas científicas, en repositorios, trabajos finales de investigación tales como tesinas, tesis de grado, tesis de maestría y doctorado, libros o capítulos de éstos, folletos y ponencias, resúmenes de congresos, relatorías de eventos, entre otras colecciones de textos científicos, en el presente documento se abordará con más detenimiento en qué consisten estas bases de datos y serán abordados algunos de estos recursos presentes en internet y de utilidad para los especialistas de las ciencias médicas.

[...]

Details

Seiten
17
Jahr
2018
ISBN (eBook)
9783668681613
ISBN (Buch)
9783668681620
Dateigröße
617 KB
Sprache
Spanisch
Katalognummer
v419308
Note
Schlagworte
Indizar indexar indexador tesauro lenguaje controlado lenguaje de indización SciELO Scopus EBSCO

Autor

  • Wenn Sie diese Meldung sehen, konnt das Bild nicht geladen und dargestellt werden.

    José Raúl Pérez Martínez (Autor)

Zurück

Titel: Tesauros y Bases de Datos Internacionales. La Indización de Textos científicos en Salud