SciELO - Scientific Electronic Library Online

 
vol.7 suppl.1Radio broadcasts regarding child nutrition and hygiene in the Second Spanish Republic (1933-1935)E-services platform for child-oriented nutritional education and health author indexsubject indexarticles search
Home Page  

Salud Colectiva

On-line version ISSN 1851-8265

Salud Colectiva vol.7  suppl.1 Lanús Oct. 2011

http://dx.doi.org/10.1590/S1851-82652011000400007 

ARTÍCULOS

Los lenguajes de indización en e-Salud: su aplicación a los documentos sobre trastornos de la conducta alimentaria

Indexing languages in e-Health: applications for documents about eating disorders

 

Sanz-Valero, Javier1; Guardiola-Wanden-Berghe, Rocío2; Castiel, Luis David3

1Doctor en Salud Pública. Profesor del Departamento de Salud Pública, Historia de la Ciencia y Ginecología, Universidad Miguel Hernández, España. Profesor del Departamento de Enfermería Comunitaria, Medicina Preventiva y Salud Pública e Historia de la Ciencia, Universidad de Alicante, España. jsanz@umh.es
2Licenciada en Psicología. Doctoranda del Departamento de Enfermería Comunitaria, Medicina Preventiva y Salud Pública e Historia de la Ciencia. Universidad de Alicante, España. rochi_gw@hotmail.com
3Doctor en Salud Pública. Investigador titular del Departamento de Epidemiología y Métodos Cuantitativos en Salud, Escuela Nacional de Salud Pública, Fundación Oswaldo Cruz, Brasil. luis.castiel@ensp.fiocruz.br

 


RESUMEN La presencia cada vez mayor de las bases de datos especializadas y su uso generalizado, así como las posibilidades de difusión que las nuevas tecnologías ofrecen, obliga a un análisis pertinente de los documentos. Los lenguajes de indización nacen a raíz del crecimiento de la información generado por la revolución científica, como una forma rápida y normalizada de procesar, almacenar y recuperar los contenidos documentales. Este trabajo examina las características y ventajas de los lenguajes documentales en la era digital describiendo ejemplos de tesauros, y sus correspondientes relaciones jerárquicas, aplicados a los trastornos de la conducta alimentaria.

PALABRAS CLAVE Resumen e Indización como Asunto; Vocabulario Controlado; Almacenamiento y Recuperación de la Información.

ABSTRACT The increased presence and widespread use of specialized databases, as well as the possibilities for distribution offered by new technologies, require a pertinent method for analyzing documents. Indexing languages emerge from the information growth generated by the scientific revolution as a quick, standardized way to process, store and retrieve document contents. This paper examines the characteristics and advantages of documentary languages in the digital age, describing examples of thesauri and their corresponding hierarchical relationships as applied to eating disorders.

KEY WORDS Abstracting and Indexing as Topic; Vocabulary, Controlled; Information Storage and Retrieval.


 

INTRODUCCIÓN

Internet es una fuente de información que ya ha demostrado su enorme potencial de desarrollo. La difusión de documentos a través de la red es un hecho incuestionable muy presente en la vida cotidiana que a estas alturas del progreso de las tecnologías de la información y la comunicación (TIC) no supone ninguna novedad, sino una realidad palpable en los ámbitos privado, laboral, académico o científico (1).

Esta información es un recurso creciente que exige una seria labor de análisis y organización para poder ser almacenada y posteriormente recuperada con un mínimo de rigor. En consecuencia, el tratamiento de los documentos tendrá que tener en cuenta, dentro del mundo en red, los problemas que puedan derivarse de la búsqueda, el acceso y la recuperación selectiva de la información. La destreza de rechazar lo irrelevante en la búsqueda de la mejor evidencia es una habilidad reciente e indispensable provocada por la inmensa cantidad de información que continuamente llega a los profesionales de las ciencias de la salud. De hecho, la eficiencia en una búsqueda de información se expresa con resultados de exhaustividad y pertinencia, o como si de una prueba diagnóstica se tratara, en términos de sensibilidad y especificidad (2,3). Así, existe la necesidad de crear potentes sistemas de información estructurales y relacionales, que dispongan de bancos terminológicos que garanticen el control del vocabulario y la recuperación ágil y pertinente de la información. La normalización de la terminología permitirá utilizar adecuadamente los vocablos y conceptos en los procesos relacionados con la trasmisión de la información (4).

El análisis documental

Comprende el conjunto de procedimientos (técnicos e intelectuales) utilizados para representar tanto la forma como el contenido de los documentos primarios, permitiendo la perfecta caracterización de los mismos (5). La descripción formal, como proceso técnico, debe permitir la identificación de los documentos primarios para facilitar su almacenamiento y su localización posterior. Comprende tanto la descripción bibliográfica como la catalogación. La descripción del contenido, como operación intelectual, debe efectuar el análisis interno y conceptual de los documentos y engloba las operaciones de clasificación, indización y resumen.

La indización

El lenguaje ha sido postulado como la capacidad humana diferencial para generar un mundo particular, distinto de los designios de la naturaleza. Ha sido un ámbito de discusión y reflexión intensa y mantiene hasta hoy un lugar central en el estudio de los fenómenos humanos. El lenguaje no se utiliza para saber qué se dice ni qué se quiere decir, sino para comprender cómo se organizan las relaciones sociales y simbólicas y cómo se estructura la subjetividad. Este será el vínculo crucial para comprender la importancia del lenguaje en la configuración de las relaciones temáticas, pues así como el mundo social es organizado por un lenguaje, la subjetividad también lo es. Las investigaciones más avanzadas en este campo se sostienen en esta dimensión estructurante del lenguaje para la subjetividad humana (6).

Un lenguaje documental es un sistema convencional de signos que permite representar el contenido de los documentos con el fin de encontrar aquellos pertinentes en respuesta a preguntas sobre un determinado tema. El concepto de lenguaje documental es sinónimo, para la mayoría de los especialistas, de lenguaje controlado, que, frente al lenguaje natural (cargado de singulares y plurales, metáforas, sinonimias, homonimias o polisemias y ambigüedades) permite una recuperación eficaz del documento a salvo de dos grandes problemas: el ruido (exceso de información encontrada no pertinente) y el silencio (ausencia de información pertinente existente que no es recuperada) (7).

Su importancia radica, básicamente, en la necesidad de habilitar un sistema de almacenamiento, búsqueda y recuperación de la literatura científica mediante la utilización de las nuevas tecnologías informáticas. La explosión informativa, acentuada a partir de finales del siglo pasado, ha propiciado el surgimiento de poderosos sistemas de indización relacionados con las ciencias de la salud, que se vuelven imprescindibles en el tratamiento adecuado de la ingente documentación digital.

La indización es una de las etapas del procesamiento analítico sintético de la información y constituye el proceso fundamental del análisis de contenido, tomando los conceptos más representativos para vincularlos a términos extraídos del lenguaje natural o a un vocabulario controlado (lenguaje documental o lenguaje de indización) seleccionado previamente. Es decir, en la indización libre se identifica el contenido conceptual de un documento mediante un conjunto de vocablos abiertos, mientras que en la indización controlada se utiliza un conjunto cerrado de términos pertenecientes a una lista de autoridad (tesauro).

En este último caso, quizá el más utilizado en las ciencias de la salud, al disponer de excelentes tesauros como el Medical Subject Headings (MeSH) desarrollado por la U.S. National Library of Medicine, los principales factores que afectan a una adecuada indización son:

  • Especificidad: nivel de concreción que deben tener los descriptores en relación con el tema del documento.
  • Exhaustividad: necesidad de reflejar todos los temas y conceptos relevantes (número adecuado de descriptores).
  • Pertinencia: grado de adecuación del descriptor utilizado con relación al concepto expresado en el texto original. Un buen descriptor debe ser siempre un punto preciso y fiel de acceso y responder a las expectativas de búsqueda del usuario.
  • Coherencia: nivel de concordancia y uniformidad de la indización. La coherencia depende en gran medida de la capacidad de conceptualizar del responsable de la indización. La coherencia en la indización se refiere al grado de concordancia entre indizadores (coherencia interindizador) o de uno mismo (coherencia intraindizador).

Según la norma UNE 50121:1991 Documentación: Métodos para el análisis de documentos, determinación de su contenido y la selección de los términos de indización (8) (equivalente a la norma ISO 5963:1985), la indización engloba tres etapas, que tienden a solaparse en la práctica:

  1. Examen del documento y determinación del contenido.
  2. Identificación y selección de los conceptos principales del contenido.
  3. Traducción de los principales conceptos escogidos al lenguaje de indización (selección de los términos de indización: asignación de los descriptores).

Así, el ejercicio intelectual de lectura, abstracción, análisis y síntesis, que supone la indización, implica tener en cuenta varios elementos del texto (7): el mensaje del documento o la información que ofrece, la forma que adopta o cómo se presenta la información, la estructura interna o sistema de relaciones semánticas y las aportaciones del documento respecto al corpus científico general.

 

INDIZACIÓN EN LAS CIENCIAS DE LA SALUD

El proceso de automatización de los fondos documentales en ciencias de la salud comenzó en 1964, en la U.S. National Library of Medicine, con el desarrollo de un sistema de búsqueda computarizado, denominado Medical Literature Analisis and Retrieval System (MEDLARS) concebido para facilitar las consultas al usuario del Index Medicus. Esto fue el inicio de la informatización de los índices bibliográficos, lo que supuso el nacimiento de las actuales bases de datos sobre ciencias de la salud en Internet, con las consiguientes ventajas: mayor rapidez, mayor exhaustividad, superior precisión y, sobre todo, una constante y fácil actualización. La disposición de los MEDLARS de forma online dio lugar a la conocida base de datos MEDLINE (9).

La literatura en ciencias de la salud presenta características que hacen que la gestión de la información sea un proceso de recuperación complejo. Estas dificultades se reflejan en dos aspectos. Por un lado, el crecimiento continuo de un enorme volumen de información unido a la urgencia para localizar las respuestas relevantes. Y, por otro, las constantes modificaciones que sufre esta terminología científica, motivadas por las nuevas investigaciones (10).

En la ciencia y la tecnología se utiliza la lengua de una manera peculiar. El profesional, para aludir a cosas que en el uso cotidiano de la lengua requieren un cierto número de enunciados, normalmente emplea una expresión breve de gran efectividad expresiva que, además, cumple tres importantes características:

  1. La univocidad: los términos y proposiciones del lenguaje científico y tecnológico, debido al uso que se hace de ellos en la investigación especializada, se refieren a un solo hecho de la realidad, mientras que, los de la lengua común, con asidua frecuencia, resultan ambiguos y connotativos.
  2. La universalidad: el registro científico y tecnológico tiende a ser universal como las cosas a las que se refiere. Al ser la misma realidad a la que se alude con las unidades léxicas que lo integran en diferentes lenguas, la traducción de estas de una a otra lengua no suele acarrear problemas.
  3. La verificabilidad: el hecho de que la verdad de los datos ofrecidos por el lenguaje científico y tecnológico pueda ser probada radica, en última instancia, en nuestra experiencia de la realidad. Las palabras se convierten en sustitutos de las cosas. Entre ellas y los objetos designados hay adecuación. Los rasgos que caracterizan a los términos científicos y tecnológicos pertenecen a los objetos reales.

Así, cuando hablamos de palabras clave (PC) en las ciencias de la salud necesariamente hacemos referencia a una técnica para ayudar y guiar la búsqueda de información, entendida como un paso necesario en la adquisición de conocimientos que permiten ampliar o precisar los que se tienen sobre una materia determinada. La destreza de rechazar lo irrelevante, en la búsqueda de la mejor evidencia, es una habilidad reciente e indispensable provocada por la inmensa cantidad de información que continuamente llega a los profesionales de las ciencias de la salud. De hecho, la eficiencia en una búsqueda de información se expresa como si se tratara de una prueba diagnóstica, en términos de sensibilidad y especificidad (11).

En el lenguaje científico, la utilización del lenguaje natural al consultar las bases de datos puede producir resultados ambiguos o poco fiables en cuanto a precisión y exhaustividad. Para enfrentar estos problemas, se ha recurrido a los Knowledge Organization Systems (KOS). Estos son un recurso semántico que representa la terminología y las relaciones entre los conceptos de un dominio. Dentro de este tipo de sistemas se encuentran las ontologías, las taxonomías o los tesauros. En la práctica, los KOS pueden ser utilizados para mejorar la inteligibilidad de los documentos científico-técnicos y para optimizar el almacenamiento y posterior recuperación de la información (12). Mediante los KOS se pueden resolver parcialmente los problemas del lenguaje natural debidos a la polisemia y a la sinonimia. Asimismo, se disminuyen las complicaciones derivadas del frecuente uso de acrónimos y abreviaturas de nombres.

En consecuencia, a la hora de redactar un texto científico, punto final de todo trabajo de investigación, el cumplimiento del método científico es tan importante como utilizar las PC adecuadas. No se debe subestimar su trascendencia, ya que una incorrecta utilización puede dificultar la difusión del documento e incluso su total olvido por problemas de identificación. Para evitar esta situación, un gran número de revistas recomiendan y, en ocasiones, obligan a emplear como PC los MeSH de la U.S. National Library of Medicine (13).

Las PC y los MeSH no son exactamente sinónimos, pues mientras que las primeras son vocablos extraídos del lenguaje natural, los segundos son términos unívocos, controlados y estructurados jerárquicamente, componentes de un tesauro, organizados formalmente con objeto de hacer explícitas las relaciones entre conceptos. La correspondencia de las PC con los MeSH es esencial a la hora de una adecuada indización del artículo científico para su archivo en las bases de datos bibliográficas. Pero adquiere mucha mayor importancia, cuando se pretenden recuperar los documentos. En este sentido, Jenuwine y Floyd (14), en 2004, insisten en la importancia del adecuado uso de los MeSH en comparación con el texto libre, observando una mayor sensibilidad de los resultados obtenidos en la búsqueda bibliográfica con su utilización.

 

INDIZACIÓN: APLICACIÓN A LOS DOCUMENTOS SOBRE TRASTORNOS DE LA CONDUCTA ALIMENTARIA

En la actualidad, se puede entender la indización como proceso y finalidad. Desde la primera posición, es la descripción y la caracterización del contenido de un documento, con la ayuda de las representaciones de los conceptos; sin embargo, su fin último es posibilitar la recuperación de la información almacenada en el sistema. Es decir, la indización es el paso previo para una adecuada recuperación de la información, según temáticas.

En ciencias de la salud, los descriptores delimitan conceptos y no palabras, ya que dan una idea del contenido del texto que representan. Por ejemplo "Trastornos de la Conducta Alimentaria" es un concepto formado por más de un vocablo que además es capaz de delimitar un área temática del conocimiento. Por tanto, los MeSH no solo son útiles para realizar búsquedas bibliográficas, sino que además sirven para analizar los trabajos por áreas de conocimiento y brindan innegables posibilidades de profundización temática que serían inviables tan solo a través del título o del resumen del trabajo (3,15).

En consecuencia, el empleo del tesauro (lenguaje controlado, estructurado y jerarquizado, utilizado para la indización de los documentos), en ciencias de la salud, tiene como finalidad expresar con la mayor exactitud posible una determinada noción que identifique unívocamente conceptos de un tema concreto y servirá tanto para almacenar como para recuperar la información. El tesauro es un instrumento que permite la sistematización y recuperación de la información a través de conceptos que tengan igual significado para los participantes en el proceso.

Entrando en el campo temático de los Trastornos de la Conducta Alimentaria (TCA), se puede observar que su producción científica es variada, múltiple y compleja, debido a que estos estudios reúnen diversas disciplinas (salud pública, nutrición, psicología, etc.), enfoques e intereses, aunque son en sí mismos un campo temático específico. Por lo tanto, será necesario conocer los tesauros, dentro de las ciencias de la salud, que normalicen su clasificación y den acceso a los materiales que se producen en este ámbito.

A continuación se describen los principales tesauros que indizan los TCA y permiten recuperar la documentación sobre esta área temática.

Medical Subject Headings (MeSH)

Desarrollados por la U.S. National Library Medicine, dependiente del National Institutes of Health de EE.UU., conforman una estructura jerárquica, en forma de raíz, compuesta por 16 grandes categorías (Anatomía; Organismos; Enfermedades; Compuestos químicos y drogas; Técnicas y equipos analíticos, diagnósticos y terapéuticos; Psiquiatría y psicología; Fenómenos y procesos; Disciplinas y ocupaciones; Antropología, educación, sociología y fenómenos sociales; Tecnología, industria y agricultura; Humanidades; Ciencia de la información; Denominaciones de grupos; Atención de salud; Características de publicaciones; Denominaciones geográficas), a partir de las cuales dependen todos los MeSH que lo componen. Este tesauro, de acceso libre y gratuito (16), se utiliza para localizar la documentación científica indizada en la base de datos MEDLINE. La Figura 1 muestra la organización específica para los TCA.


 
  Psychiatry and Psychology Category    
Mental Disorders
    Eating Disorders    
      Anorexia Nervosa  
      Binge-Eating Disorder  
      Bulimia Nervosa  
      Coprophagia   
      Female Athlete Triad Syndrome
      Pica   
 

Figura 1. Estructura jerárquica para los descriptores relacionados con los trastornos de la conducta alimentaria en el tesauro MeSH.

Fuente: National Library of Medicine (16).

 

Descriptores en Ciencias de la Salud (DeCS)

Vocabulario estructurado y trilingüe (portugués, castellano e inglés) creado por el Centro Latinoamericano y del Caribe de Información en Ciencias de la Salud, también conocido por su nombre original de Biblioteca Regional de Medicina (BIREME), es un centro especializado de la Organización Panamericana de la Salud / Organización Mundial de la Salud (OPS/OMS), orientado a la cooperación técnica en información científica en salud, para servir como un lenguaje único en la indización de documentos y ser usado en la búsqueda y recuperación de la literatura científica en las fuentes de información disponibles en la Biblioteca Virtual en Salud (BVS). Se puede acceder a él de forma libre y gratuita (17). Se desarrolló a partir del MeSH, pero, además de las 16 grandes categorías originales que componen el MeSH, se desarrollaron cuatro áreas específicas iniciales más (Salud Pública, Homeopatía, Ciencia y Salud, y Vigilancia Sanitaria). La Figura 2 muestra la organización específica para los TCA, en castellano, que sería similar a la del MeSH.


     
  Psiquiatría y Psicología    
    Trastornos Mentales    
      Trastornos de la Conducta Alimentaria 
        Anorexia Nerviosa
        Trastorno por Atracón
        Bulimia Nerviosa
        Coprofagia
        Síndrome de la Tríada de la Atleta Femenina
        Pica
       

Figura 2. Estructura jerárquica para los descriptores relacionados con los trastornos de la conducta alimentaria en el tesauro DeCS.

Fuente: Biblioteca Virtual en Salud (17).

 

The Life Science Thesaurus (Emtree)

Tesauro de las ciencias de la vida, desarrollado por la editorial Elsevier. Se trata de una estructura jerárquica y controlada sobre temas de biomedicina. Su uso se centra en la búsqueda y recuperación integral de la documentación biomédica indizada en la base de datos Embase. El acceso al tesauro y a la base de datos es mediante pago (18). Su estructura está basada en los MeSH, pero su contenido y disposición es diferente, partiendo esta estructura de raíz de 15 categorías (Conceptos anatómicos; Nombres de organismos; Enfermedades físicas, trastornos y alteraciones; Productos químicos y drogas; Técnicas analíticas, diagnósticas y terapéuticas, equipos y parámetros; Fenómenos psicológicos y psiquiátricos; Fenómenos biológicos y funciones; Química, física y fenómenos matemáticos; Sociedad y medio ambiente; Tipos de artículos o estudios; Nombres geográficos; Grupos por edad y sexo; Nombres de grupos de personas; Conceptos de atención de la salud; Disciplinas biomédicas, ciencia y arte). La Figura 3 muestra la organización específica para los TCA.


     
  Psychological and psychiatric phenomena    
    Mental disease    
      Behavior disorder  
        Eating disorder
          Anorexia nervosa
          Binge eating disorder
          Bulimia
          Female athlete triad
          Food adversion
          Pica
           

Figura 3. Estructura jerárquica para los descriptores relacionados con los trastornos de la conducta alimentaria en el tesauro Emtree.

Fuente: Embase (18).


APA Psychological Index Terms (APA Terms)

En el área de la psicología, la American Psychological Association (APA) ha desarrollado un tesauro específico: el Psychological Index Terms. Es un vocabulario controlado y jerarquizado utilizado para la indización, catalogación y búsqueda de documentación científica sobre psicología recogida en la base de datos bibliográfica PsycINFO. El tesauro parte de nueve categorías, cuyos términos se agrupan por similitud conceptual (Ordenadores; Trastornos; Educación; Jurídica; Neuropsicología y Neurología; Trabajo y Empleo; Estadística; Test y Pruebas; Tratamiento). El acceso al mismo es mediante pago a través de la página web de la APA (19). La Figura 4 muestra la disposición específica para los TCA.


     
  Disorders    
    Mental Disorders  
      Eating Disorders  
        Anorexia Nervosa
        Binge Eating Disorder
        Bulimia
        Hyperphagia
        Kleine Levin Syndrome
        Pica
        Purging (Eating Disorders)
         

Figura 4. Estructura jerárquica para los descriptores relacionados con los trastornos de la conducta alimentaria en el tesauro APA Terms.

Fuente: American Psychological Association (19).

 

NAL Thesaurus

Vocabulario en inglés y castellano de términos relacionados con la agricultura y la alimentación desarrollado de modo cooperativo por la National Agriculture Library, dependiente del U.S. Department of Agriculture (USDA), y el Instituto Interamericano de Cooperación para la Agricultura a través de la Biblioteca Conmemorativa Orton de la Red Mexicana de Bibliotecas de Agricultura (REMBA), así como otras instituciones agrícolas de América Latina que pertenecen al Agriculture Information and Documentation Service of the Americas (SIDALC). Este tesauro se conforma también en una estructura jerárquica compuesta por 17 categorías (Ciencias y Productos Animales; Ciencias Biológicas; Cría y Mejoramiento Genético; Economía, Comercio e Industria; Granjas y Sistemas Agrícolas; Alimentación y Nutrición Humana; Ciencias y Productos Forestales; Ubicaciones geográficas; Gobierno, Leyes y Reglamentos; Salud y Patología; Insectos y Entomología; Recursos Naturales, Tierra y Medio Ambiente; Ciencias Físicas y Químicas; Ciencia de Plantas y Productos Vegetales; Investigación, Tecnología e Ingeniería; Sociología Rural y Agrícola; Clasificación taxonómica de los organismos). Se puede acceder a él de forma libre y gratuita (20) y su uso se centra en la recuperación de la información indizada en la base bibliográfica AGRICOLA. La Figura 5 muestra la estructura jerárquica específica para los TCA.


   
  Health and Pathology
    Animal and human health
      Diseases and disorders (animals and humans)
        Noninfectious diseases
          Behavior disorders / diet related diseases
            Eating disorders
                Anorexia nervosa
                Binge Eating Disorder
                Bulimia
                Pica
                Purging (food)
                 

Figura 5. Estructura jerárquica para los descriptores relacionados con los trastornos de la conducta alimentaria en el tesauro NAL.

Fuente: National Agricultural Library (20).


CONSIDERACIONES FINALES

El formato electrónico es esencial en la elaboración y aplicación de los lenguajes documentales para su uso en sistemas informatizados. Todas las bases de datos bibliográficas importantes sobre ciencias de la salud han desarrollado su tesauro para facilitar la recuperación eficiente de la información que contienen. La accesibilidad y la manejabilidad se ven notablemente incrementadas si se añaden al tesauro propiedades de hipertexto.

Los tesauros en formato electrónico son muy útiles cuando se trata de terminologías en varios idiomas, ya que gracias a las propiedades del hipertexto se puede ir de un término a su equivalente traducido en otro idioma.

La indización documental y la recuperación de la información es un campo de investigación muy amplio y se ve magnificado al introducir en él el fenómeno de la gestión de la información en red. Todo lo que implica extracción de datos (data mining), gestión y búsqueda de contenidos constituirá el siguiente paso hacia sistemas de indización automatizados inteligentes; quizá el futuro de la verdadera gestión del conocimiento mediante los sistemas asistidos de indización automática (computer assisted indexing systems).

Un lenguaje documental no puede ser diseñado ni construido fuera del contexto para el que ha sido creado. Por esta razón, el usuario tiene que conocer las herramientas actualmente disponibles para poder ser competente en la gestión de la producción científica sobre un área temática determinada. La normalización de esa terminología permitirá utilizar con propiedad los términos y conceptos constituyentes del tesauro. Este incorporará todos estos términos a una base de datos y cada uno de ellos se convertirá en un punto de acceso para la recuperación documental. Asimismo, la estructura jerárquica permitirá la búsqueda de términos generales que incluyen, a su vez y por defecto, términos más específicos. Lógicamente, un tesauro construido a partir de categorías de términos que se enlazan entre sí mediante hiperenlaces, revelando la relación existente entre ellos, permitirá localizar información con varios niveles de especificidad.

En cualquier caso, se puede concluir que el criterio fundamental para seleccionar conceptos debe ser la capacidad para expresar el contenido temático con vistas a la recuperación de esa información.

 

AGRADECIMIENTOS

El presente artículo forma parte del Proyecto PCI-AECID (D/030704/10), dentro de la convocatoria del Programa de Cooperación Interuniversitaria e Investigación Científica (PCI), perteneciente a las ayudas para Acciones Integradas para el Fortalecimiento Científico e Institucional de la Agencia Española de Cooperación Internacional para el Desarrollo (AECID).

CONFLICTO DE INTERESES

Los autores declaran que no existe ningún compromiso o vínculo con las entidades financiadoras que pueda ser entendido como un conflicto de intereses.

 

REFERENCIAS BIBLIOGRÁFICAS

1. Laguens García JL. Tesauros y lenguajes controlados en Internet. Anales de Documentación. 2006;9(1):105-121.         [ Links ]

2. Calvache JA, Delgado M. El resumen y las palabras clave en la literatura médica. Revista Facultad de Ciencias de la Salud de la Universidad del Cauca. 2006;8(1):7-11.         [ Links ]

3. Tomás-Casterá V, Sanz-Valero J, Wanden-Berghe C, Landaeta M. Descriptores versus Palabras Clave sobre nutrición: aportación a la correcta indización. Anales Venezolanos de Nutrición. 2009;22(2):90-94.         [ Links ]

4. Mitre Aranda M. TESQUAL: propuesta de microtesauro para el ámbito de la gestión de calidad en el Espacio Europeo de Educación Superior. Revista Española de Documentación Científica. 2009;32(2):66-82.         [ Links ]

5. Martín Gavilán C. El documento y sus clases. Análisis documental: indización y resumen [Internet]. 2009 [citado 8 abr 2011]. Disponible en: http://hdl.handle.net/10760/14605        [ Links ]

6. Golubov Figueroa NL, compiladora. Tesauro de género: lenguaje con equidad. México DF: Instituto Nacional de la Mujeres; 2006.         [ Links ]

7. Rubio-Liniers MC. El análisis documental: indización y resumen en bases de datos especializadas [Internet]. 2004 [citado 10 abr 2011]. Disponible en: http://eprints.rclis.org/handle/10760/6015        [ Links ]

8. Asociación Española de Normalización y Certificación. Documentación: Métodos para el análisis de documentos, determinación de su contenido y la selección de los términos de indización. Madrid: AENOR; 1991. (UNE 50121:1991)        [ Links ]

9. Sanz-Valero J, Castiel LD. La búsqueda de información científica sobre las Ciencias de la Nutrición en Internet. Nutrición Hospitalaria. 2010;25(Supl 3):31-37.         [ Links ]

10. Morato J, Sánchez-Cuadrado S, Moreno V. Aplicación de técnicas de procesamiento del lenguaje a la literatura biomédica. En: Cuevas A. Competencias en Información y Salud Pública. Brasilia: Editora do Departamento de Ciência da Informação e Documentação da Universidade de Brasilia; 2008. p. 173-202.         [ Links ]

11. Sánchez-Cuadrado S, Morato-Lara J, Palacios-Madrid V, Llorens-Morillo J, Moreiro-González JA. De repente, ¿todos hablamos de ontologías? El Profesional de la Información. 2007;16(6):562-568.         [ Links ]

12. Calvache JA, Delgado M. El resumen y las palabras clave en la literatura médica. Revista Facultad de Ciencias de la Salud de la Universidad del Cauca. 2006;8(1):7-11.         [ Links ]

13. De Granda Orive JI, García Río F, Roig Vázquez F, Escobar Sacristán J, Gutiérrez Jiménez T, Callol Sánchez L. Las palabras clave como herramientas imprescindibles en las búsquedas bibliográficas: Análisis de las áreas del sistema respiratorio a través de Archivos de Bronconeumología. Archivos de Bronconeumología. 2005;41(2):78-83.         [ Links ]

14. Jenuwine ES. Floyd JA. Comparison of Medical Subject Headings and text-word searches in MEDLINE to retrieve studies on sleep in healthy individuals. Journal of the Medical Library Association. 2004;92(39):349-353.         [ Links ]

15. Sanz-Valero J, Rojo-Alonso C. La medicina del trabajo en los Medical Subject Heading Terms (MeSH) y los Descriptores de Ciencias de la Salud (DeSC). Medicina y Seguridad del Trabajo. 2008;54(210):636.         [ Links ]

16. U.S. National Library of Medicine. Medical Subject Headings [Internet]. 2010 [citado 10 abr 2011]. Disponible en: http://www.nlm.nih.gov/mesh/meshhome.html        [ Links ]

17. Biblioteca Virtual en Salud. Descriptores en Ciencias de la Salud [Internet]. 2011 [citado 10 abr 2011]. Disponible en: http://decs.bvs.br/E/homepagee.htm        [ Links ]

18. Embase. Emtree: The Life Science Thesaurus [Internet]. Elsevier; c2011 [citado 10 abr 2011]. Disponible en: http://www.embase.com/info/what-is-embase/emtree        [ Links ]

19. American Psychological Association. Thesaurus of Psychological Index Terms [Internet]. 2007 [citado 11 abr 2011]. Disponible en: http://www.apa.org/pubs/databases/training/thesaurus.aspx        [ Links ]

20. National Agricultural Library. Thesaurus and Glossary Home [Internet]. 2011 [citado 11 abr 2011]. Disponible en: http://agclass.nal.usda.gov/agt.shtml        [ Links ]

Recibido el 21 de junio de 2011
Aprobado el 12 de septiembre de 2011