Ir al contenido principal

Prueba Aurelio: Búsqueda de Información

Estrategia

Estrategia de Búsqueda

La búsqueda de información se fundamenta en una serie de pasos precisos para obtener con la mayor rapidez, exhaustividad y pertinencia posible la información deseada. Es lo que se conoce como estrategia de búsqueda:

  • definir o resumir en una o varias frases cortas el tema sobre el que se desea obtener información.
  • buscar los conceptos clave que definan esas frases cortas, y expresarlos del mayor número de formas posibles empleando sinónimos, variantes gramaticales, etc. Y buscar su traducción al inglés si se van a utilizar recursos en este idioma.
  • traducir los conceptos clave a los términos de interrogación utilizados por el sistema en el que vamos a realizar la búsqueda
  • construir una expresión o ecuación de búsqueda utilizando los operadores booleanos, para buscar en un campo determinado (búsqueda sencilla) o bien en varios simultáneamente (búsqueda avanzada)
  • evaluar y refinar los resultados obtenidos.

Operadores boobleanos

Operadores Lógicos o booleanos

Intersección: Y, AND
Selecciona sólo los documentos que contienen ambos términos a la vez.

Queremos localizar aquellos trabajos en los que conste publicidad y mujeres.
La ecuación de búsqueda que realizaríamos sería: publicidad AND mujeres

operador AND

Negación: NO, NOT

Selecciona los documentos que contengan el primer término, pero no el segundo.

Queremos localizar aquellos documentos que contengan el término publicidad y no contengan el término mujeres. La ecuación de búsqueda que realizaríamos sería: publicidad NOT mujeres

Operador NOT

Reunión o suma lógica: O, OR

Selecciona aquellos documentos que o bien contienen alguno de los dos términos separadamente, o bien los dos a la vez. Cuando no indicamos ningún operador entre palabras, los sistemas lo interpretan como si hubiéramos colocado OR.

Queremos localizar aquellos artículos que contengan el término publicidad o el término mujeres o el término marketing. La ecuación de búsqueda que realizaríamos sería: publicicad OR mujeres OR marketing

Operador OR

Operadores de Truncamiento y Proximidad

Operadores de Truncamiento y máscaras o caracteres comodín

Son operadores cuya presencia puede sustituir un carácter o un conjunto de caracteres, situados a la derecha de un término. Se utilizan cuando es necesario utilizar no un término simple, sino también sus derivados (con prefijos, sufijos, variantes léxicas...).

Los más comunes son:

Operador $: Permite el truncamiento de un número múltiple de caracteres en medio o al final de un término de búsqueda.

Operador ?: Permite sustituir un carácter en medio o al final de un término de búsqueda. No se puede utilizar al inicio de una palabra.

El símbolo * se usa únicamente como carácter de truncamiento a la derecha para encontrar todas las formas de una palabra.

Ejemplo: econom* encontrará economy, economics, econometrics, econometrical

En la utilización del truncamiento hay que tener en consideración que:

Es aconsejable en términos largos e inequívocos pues se obtienen formas importantes de un mismo término (gerundios, participios, plurales, etc.) así como sustantivaciones o adjetivaciones de verbos.

No es aconsejable hacer un truncamiento con menos de cuatro letras en la raíz.

Los truncamientos que dan lugar a la selección de un número muy grande de términos corren el riesgo de generar ruido y bloquear el ordenador, pues éste necesitará mucho tiempo para realizar todas las sumas lógicas.

Debe utilizarse con precaución para evitar que se introduzca ruido con términos impensados.

Permite aumentar la exhaustividad de la recuperación.

Si buscáramos un documento sobre Calidad, pondríamos Calid?d

Otros operadores

Paréntesis

Se utilizan cuando la sentencia de búsqueda incluye tres o más términos a fin de controlar como se va a ejecutar la búsqueda, pues sin paréntesis la búsqueda se hace de izquierda a derecha mientras que con paréntesis las palabras incluidas se buscan primero, y sobre el resultado de esta búsqueda se realiza la siguiente.

Queremos localizar aquellos artículos que contengan, education or teaching and technology or computers o bien (education or teaching) and (technology or computers) En el primer caso la búsqueda recupera todo lo que haya de tecnología en la educación y enseñanza así como todo lo que haya sobre ordenadores, se refieran o no los artículos a la educación de la enseñanza. En el segundo ejemplo hemos usado los paréntesis para localizar sólo artículos sobre tecnología u ordenadores en relación a la enseñanza o a la educación.

Comillas

Se utilizan las "comillas" para buscar una frase exacta con el orden exacto de las palabras a buscar.

"Economía de libre mercado" ó en inglés "market economy"

Lenguajes controlados

Lenguaje natural y vocabularios controlados

La búsqueda de información se puede realizar de dos maneras:

  • seleccionando los términos del lenguaje natural y realizando la consulta con términos libremente elegidos (búsqueda en texto libre)
  • eligiendo los términos de un vocabulario controlado (tesauro u otro tipo de lista de términos controlados) para evitar los problemas que originan la existencia de variantes para un mismo término.

En los catálogos de las bibliotecas y las bases de datos es habitual la utilización de una terminología normalizada (lenguajes documentales) que sirven a los usuarios para conocer los términos que pueden emplear para realizar sus búsquedas: clasificaciones, encabezamientos de materia, índices y tesauros.

Búsqueda en texto libre:

Permite realizar búsquedas muy específicas, aunque son muy complejas porque se tiene que:

  • Encontrar y agrupar todos los sinónimos.
  • Realizar truncamientos para no tener que repetir todas las formas gramaticales de una palabra.
  • Utilizar la búsqueda por proximidad para evitar la falsa coordinación entre palabras situadas en contextos diferentes.

Limpiar el ruido debido a :

  • Polisemias: palabras con varios significados, como banco (sangre u órganos)
  • Homógrafos: palabras iguales pero con significado distinto, como banco ( asiento,
  • financiero)
  • Variantes ortográficas

Búsqueda con términos controlados:

Este tipo de búsqueda permite:

  • Eliminar los inconvenientes anteriores, pero pueden darse casos de falsa coordinación.
  • Extender la búsqueda a otros conceptos más genéricos o específicos.
  • Extender la búsqueda a términos relacionados.

Entre los inconvenientes destaca:

  • En búsquedas exhaustivas pueden perderse documentos relevantes. Esto ocurre si el tema no fue considerado importante y no se le asignaron términos controlados específicos.
  • En ocasiones el término es nuevo y todavía no tiene su término controlado equivalente.
  • Subjetividad en la indización.

Operadores Sintácticos o de Proximidad

Operadores Sintácticos o de proximidad

Se intercalan entre los descriptores para establecer entre ellos una relación de proximidad, es decir, permiten concretar la posición de dos o más palabras en la ecuación de búsqueda y por tanto en el registro. Cada base de datos tiene sus propios operadores de proximidad, habiendo pequeñas diferencias entre unas y otras, por lo que siempre es aconsejable consultar la ayuda que ofrecen.

Los más comunes son los siguientes:

Adyacencia: ADJ, ADY

Este operador permite recuperar registros en los que los términos que figuran en la pregunta aparecen uno junto a otro dentro del documento, sin ninguna palabra que los separe.

Queremos localizar un documento en el que figura "la calidad total se está empezando a implantar en las empresas de servicios"
La ecuación de búsqueda que realizaríamos sería: calidad ADJ total
No recuperaríamos documentos en los que se lea: "la calidad ha reemplazado a la total en los últimos años"

Presencia de términos a una distancia máxima de "n" palabras: W

Este operador permite recuperar registros en los que los términos de la pregunta aparecen en el documento separados uno de otro por un número de palabras igual o menor a la que se indica.

En la ecuación de búsqueda ponemos: calidad 6w total
Recuperaríamos documentos en los que se dijera: La calidad total ha avanzado mucho en los últimos años; La calidad ha avanzado más que la calidad total
No recuperaríamos: La calidad ha avanzado menos la última década que la calidad total

Presencia de dos términos situados a una distancia "en palabras" determinada: P

Este operador permite recuperar documentos en los que los dos términos aparecen separados por un número fijo de palabras entre ellos.

visión 2P empresa
Obtendríamos documentos en los que conste: "visión de la empresa.."
No obtendríamos documentos en los que conste "la visión de Coca Cola."

Presencia dentro de una misma frase: NEAR, S

Este operador se utiliza para localizar aquellos documentos que contienen ambos términos en la misma frase.

Queremos localizar aquellos artículos que contengan en la misma frase calidad y excelencia.
La búsqueda que realizaríamos sería: calidad NEAR excelencia

Este operador permite especificar el número de palabras que pueden existir entre los dos términos.

Queremos localizar artículos que en la misma frase conste calidad y excelencia, como máximo separado por dos palabras.
La búsqueda que realizaríamos sería: calidad NEAR2 excelencia

Dos términos en el mismo campo sin importar el orden en que se encuentren:

F, WITH, W

Este operador permite recuperar aquellos registros en el que se encuentran los dos términos en el mismo campo.

Queremos localizar documentos en los que figura calidad total en el título o en el resumen. La búsqueda que realizaríamos sería: calidad W total
No permitirá que se recupere un documento en el que aparezca en el título: "la calidad en España" y en palabras claves "total".