Hoy en día la potencia de cálculo asequible permite manipular datos de forma rápida y eficiente. No es sólo una consecuencia de que el hardware mejora cada año, sino también de los resultados de diferentes líneas de investigación que ofrecen nuevos algoritmos y técnicas más eficientes. El refinamiento proporciona velocidad a la potencia de cálculo; y cuando algo se puede hacer con rapidez, empieza a ser viable de una u otra forma. Por ejemplo, romper una clave en un tiempo razonable, ofrecer un servicio determinado o hacerlo rentable, como en el caso no tan hipotético del falso asesor bursátil donde la velocidad hace posible lo que veinte años atrás era un ejercicio divulgativo.
Llegado el caso, una combinación inteligente de fuerza bruta, teoría de la información, técnicas de inferencia y redes neuronales será capaz de simular una comprensión semántica de la misma forma que un supercomputador derrota inexorablemente a un campeón de ajedrez. Hay un momento en que la línea entre la potencia de cálculo y la inteligencia se difumina y la diferencia entre ambas resulta borrosa. (Esto es un poco marxista: pequeños saltos cuantitativos que terminan por dar lugar a un salto cualitativo, etc, etc; y, de fondo, está el reduccionismo del pensamiento de una persona a una cadena de sucesos físicos extremadamente compleja y sofisticada pero física al fin y al cabo, lo que nos llevaría a hablar sobre el alma y la trascendencia de la persona, que no es el asunto a tratar ni aquí ni ahora, ni es un reduccionismo sobre el que personamente esté de acuerdo; más sobre esto (pero no mucho según se mire) en la reseña de Axiomático de Greg Egan).
Hoy en día, cuando pones un buscador potente a un cliente grande, el cliente se queja de que salen los resultados que no quiere. El problema es que el buscador acierta, y saca lo que el usuario pide, pero no lo que el cliente desea que salga en primer lugar. Como en instalaciones grandes como una sede web gubernamental en la que tienes a cientos de personas editando contenido, la automatización de los procesos es crucial. El etiquetado, la clasificación por categorías y la preferencia por un contenido u otro son complejos. Si se dejan en manos de personas, clasifican y etiquetan de manera diferente entre sí (cuando no se pervierte a sabiendas). Esto lleva a la confusión, a la profusión de clasificaciones que ofuscan el resultado. Es difícil casar perfectamente la intención de búsqueda con la intención editorial, así que hoy en día se tiende a realizar clasificaciones automáticas que ignoran tags, categorías y cosas parecidas, y se centran en... lo que verdaderamente dice en el documento que se indexa.
Ignorar una clasificación que puede ser espuria o errónea y, en su lugar, identificar lo que realmente dice el documento es algo posible hoy en día. Posible, asequible y rápido, lo que vuelve factible algo que antes no era posible: el tiempo de respuesta se mide en milisegundos, y se invierte tanto o más tiempo en enviar los resultados al navegador que en calcularlos. Véase, por ejemplo, lo que se tarda en recibir un resultado de un buscador.
Lo cierto es que el sistema automático que clasifica no entiende lo que dice el documento ni los términos de búsqueda que introduce el usuario, pero es capaz de determinar si están o no relacionados y hasta qué punto (esta incomprensión se demuestra por el hecho de que el idioma de la búsqueda se cambia con facilidad). La comprensión semántica es, por tanto, inexistente, pero, virtualmente y a todos los efectos, es como si existiera para el propósito deseado. Hay diversos productos en el mercado que emprenden diversas estrategias de búsqueda con mayor o menor fortuna, pero todos, a base de una combinación de fuerza bruta y técnicas refinadas, adquieren esa pseudocomprensión semántica que les permite sacar en primer lugar documentos que tratan sobre lo que se busca. De lo contrario, serían víctimas de todas las trampas que se realizan para adulterar el posicionamiento.
Pero nos estamos apartando del asunto central. Decíamos que el buscador se centra en lo que verdaderamente dice el documento, lo que nos lleva a que prima lo que esté bien escrito. Eso implica que un documento bien escrito y estructurado primará sobre otro cuya redacción sea de peor calidad. Aspectos como los términos apropiados, un lenguage económico y preciso (y no el fárrago nocturno de esta nota con paréntesis anidados) son cruciales. Con los conceptos claros, el discurso preciso y las ideas bien transmitidas es posible alinear la intención de búsqueda con la intención editorial. Bien es cierto que una estructura legible, buena navegabilidad, uso de etiquetas semánticas, URLs legibles, etc, ayudan bastante, pero estas cosas son paulatinamente ignoradas, porque desvían el foco desde lo escrito hacia la maquetación (un viejo clásico nuestro: el fondo contra la forma).
Así, las organizaciones que escriban bien (no líricamente, entiéndase) obtendrán mejores resultados de posicionamiento. Y como el posicionamiento es un afán que se persigue implacablemente, la progresiva pseudocomprensión semántica de los buscadores provocará que, durante unos pocos años, el mercado demande personas capaces de escribir en condiciones, porque las tecnologías de búsqueda son caras, muy caras, y el que pueda reducir costes será más eficiente.
En unos años, un nuevo salto cualitativo llevará lo escrito a un rincón. Dentro de una década la comprensión semántica será lo bastante ágil y la búsqueda podrá dirigirse lo suficiente como para que escribir bien sea sólo un pasatiempo anticuado. Por no hablar, que el asunto pinta difícil para leer. La web se encamina decididamente a una mezcla de vídeo y realidad virtual.
¿PORQUÈ EL TÌTULO ES EL CANTO DE LOS CISNES?
creo que no tiene nada que ver con lo que escribes, o no comprendi bien. explicat!!!
Una página colectiva y ecléctica para comentar y apuntar cosas.
Estás viendo los archivos de Mayo de 2007. Visita la portada para ver las últimas notas.
Si quieres curiosear, puedes consultar:
http://tira.escomposlinux.org
La tira ecol ha vuelto.