Seleccionar página

Noción

Un tesauro es requisito de los mejores sistemas de recuperación de información, y es terreno de especialistas.

La palabra tesauro responde a las siguientes nociones:

“Etimológicamente viene del latín y su significación era tesoro. Definición que tiene poco que ver con el concepto que tiene hoy para un documentalista, así la norma ISO 2788 / TC 46 “Principes directeurs pour létablissement et le devellopement de thesaurus monolingues”, nos dice que estos se pueden definir según su función y según su estructura:

  – Por su función. Como un instrumento de control terminológico utilizado para trasponer a un lenguaje más estricto el idioma natural empleado en los documentos y por los indizadores.

  -Por su estructura. Es un vocabulario controlado y dinámico de términos que tienen entre ellos relaciones semánticas y genéricas y que se aplica a un dominio particular del conocimiento.

  P. Levery, es el puente entre el lenguaje del informado (documentalista) y el lenguaje del no informado (usuario)” (Universidad de Salamanca, fuente: http://sabus.usal.es/docu/pdf/Tesauro.PDF).

La norma ISO actual es otra: ISO 25964-1:2011: “Information and documentation — Thesauri and interoperability with other vocabularies — Part 1: Thesauri for information retrieval” .

Ejemplo en el campo TIC

La UNESCO tiene un tesauro de información y comunicación, dentro del Tesauro Unesco, de alcance general:

“El Tesauro de la UNESCO es una lista controlada y estructurada de términos para el análisis temático y la búsqueda de documentos y publicaciones en los campos de la educación, cultura, ciencias naturales, ciencias sociales y humanas, comunicación e información. Continuamente ampliada y actualizada, su terminología multidisciplinaria refleja la evolución de los programas y actividades de la Organización.

El Tesauro contiene 7,000 términos en inglés y en ruso, y 8,600 en francés y en español” (ver Ver: http://www.iso.org/iso/catalogue_detail.htm?csnumber=53657).

Como mi especialidad es el área de las comunicaciones, como ilustración señalo que este tesauro tiene siete listas principales, de las cuales la 5ª es “Información y comunicación”, descompuesta en estos microtesauros:

“5.05 Ciencias de la información,

5.10 Investigación y política de la comunicación,

5.15 Gestión de la información,

5.20 Industria de la información,

5.25 Sistemas de información documental,

5.30 Fuentes de información,

5.35 Tratamiento de la información documental,

5.40 Tecnología de la información (programas),

5.45 Tecnología de la información (equipos));” (misma fuente)

El 5.10 contiene, por ejemplo, este término:

“Término:    Investigación sobre la comunicación   [560]    registro siguiente

MT 5.10 Investigación y política de la comunicación

TE Estudio de audiencia    [175]

      UP Análisis de audiencia

….TE2 Cifra de tirada    [28]

….TE2 Medición de audiencia    [28]

….TE2 Participación del público    [51]

….TE2 Reacción del público    [90]

TE Historia de la comunicación    [187]

TE Impacto de la comunicación    [773]

      UP Efectos de la comunicación

TE Psicología de la comunicación    [158]

TE Sociología de la comunicación    [306]

….TE2 Opinión pública    [354]

TE Teoría de la información    [159]

      UP Contenido

      UP Emisor

      UP Mensaje

      UP Receptor

      UP Teoría de la comunicación

….TE2 Código    [51]” (ibid.)

Los grupos de letras MT, TE y otras corresponden a “símbolos” propios de la jerga de la elaboración de tesauros:

“Significado de los símbolos

NA – Nota de alcance: indica la utilización a que se destina un descriptor.

MT – Microtesauro: número y nombre del microtesauro al que pertenece un término.

UP – Utilizado por: indica un no descriptor, es decir, un sinónimo o término muy cercano al descriptor.

USE – Utilizar: indica el término preferido, es decir, el descriptor.

TG – Término genérico: indica el término más amplio.

TE – Término específico: indica el término más restringido.

TR – Término relacionado: indica la relación entre descriptores unidos por una asociación de ideas” (Fuente: http://databases.unesco.org/thessp/help.html#sn) .

Ahora tiene la idea de qué es un tesauro.

Hablemos de un tesauro de uso diario: el de medios de comunicación. ¿No se ha preguntado cómo hacen los grandes medios de comunicación para clasificar la información disponible, de tal manera que pueda encontrarse más fácilmente y, además, información relacionada? Para eso existe el IPTC (http://orff.uc3m.es/bitstream/handle/10016/9799/tesauros_garcia_ICT_2007.pdf?sequence=1).

Cómo se hace un tesauro de medios: http://orff.uc3m.es/bitstream/handle/10016/9799/tesauros_garcia_ICT_2007.pdf?sequence=1.