Ejemplos ?
Yandex comenzó su andadura en 1997. Su nombre se deriva del inglés "Yet Another iNDEXer" (Otro indexador más). La letra rusa "Я" también es el pronombre singular de primera persona en ruso, al igual que la letra I en inglés, lo que hace de Яndex un juego de palabras bilingüe con la palabra index, 'índice'.
El proceso involucra a un Araña web motor de búsqueda, descargarse una página y almacenarla en los servidores del motor de búsqueda, donde un segundo programa, conocido como indexador, extrae información sobre la página, como las palabras que contiene y dónde están localizadas, así como la relevancia de palabras específicas y todos los vínculos que la página contiene, los cuales se almacenan en un proceso programado para ser analizados más tarde.
Cuenta además con diarios digitales como: Kaosenlared.net (fundado en 2001) y que tiene más de un millón de vista al mes, lo que lo convierte en el medio de información más importante de la ciudad y del mundo en su idioma y ámbito comunicacional (ver el indexador infoterrasa.com (fundado en 2002), e-newsterrassa.com (desde 2005, diario digital municipal), y aterrassa.cat (desde abril de 2008, controlado por Avui).
Cada conjunto de sinónimos (synset), tiene un único indexador y comparte sus propiedades, como una definición gloss (o diccionario).
Por este motivo han surgido varios buscadores de escritorio, que si más no sigue la misma idea que un buscador de Internet. Un motor de búsqueda de escritorio típico incluye un indexador que rastrea el disco duro en busca de archivos existentes.
La indexación directa, como antes habíamos mencionado, se salta el último paso, pero aun así todavía quedaría el problema de identificar que tipo de indexador utilizar.
El uso de vocabularios controlados ofrece un conjunto de alternativas “conocidas” para el indexador (y el programador de búsquedas) para llenar los campos.