[Oracle] Endeca Search

La búsqueda y navegación es la más importante en las compras en línea. Cuando un usuario busca un producto determinado, es importante que se le muestren productos relevantes en un corto período de tiempo. Para hacer esto, los gerentes de la empresa de compras en línea deben recibir una herramienta poderosa para administrar los diferentes aspectos del motor de búsqueda.

Esto es lo que hace Endeca search. Proporciona herramientas para propietarios de sitios de comercio electrónico para ayudar a administrar la experiencia de búsqueda en su sitio web.

 oracle endeca

Añadir búsqueda a su sitio web

¿Qué es Oracle Endeca?

La palabra Endeca significa «Descubrir». Endeca, la compañía fue fundada en 1999, y se centra principalmente en–

  1. Comercio electrónico.
  2. búsqueda Empresarial.
  3. Inteligencia de negocios.

En los sistemas tradicionales de consulta de inventario de comercio electrónico, tenía que comenzar por arriba seleccionando, por ejemplo, ropa de hombre o ropa de mujer, luego seleccionar pantalones de hombre, camisas de hombre, abrigos de hombre, etc. Con el tiempo, llegarías a los pantalones de hombre de 36″ en negro, pero era una ruta muy lineal y «guiada» a través de los datos. Los sitios web que utilizaban la tecnología de búsqueda de Endeca, por el contrario, presentaban una lista de dimensiones y atributos por un lado, y el usuario podía hacer cualquier selección de ellos para reducir su búsqueda. Todo esto sucedió aligerando, rápido y con un back-end que era muy fácil de mantener para el cliente.

Así que Endeca se enfocó en este mercado de comercio electrónico primero, y desarrolló el motor MDEX para soportar esto, comercializándolo como un motor de consultas de desarrollo rápido de almacenamiento de columnas que permite » búsquedas facetadas «en muchos conjuntos de datos diferentes y» irregulares » (es decir, conjuntos de datos que no tienen el mismo modelo de datos, pero con algo en común entre ellos).

Una breve introducción sobre las terminologías en Endeca –

Endeca quería dar a sus usuarios una manera simple y fácil de interactuar y analizar datos con una interfaz de usuario fácil de usar, que se escala a grandes escalas para datos estructurados y no estructurados.

Endeca search satisface la necesidad de los usuarios de buscar, navegar y analizar datos de todos los tamaños desde múltiples fuentes de datos. También ayuda a cortar y cortar en dados a través de las dimensiones y profundizar en los detalles más finos o tener una vista macroscópica de los datos. Además, los usuarios deben poder realizar consultas de búsqueda complejas fácilmente.

Además de dar resultados de búsqueda para una consulta, la navegación guiada de Oracle Endeca podría indicar a los usuarios los siguientes pasos, como refinar y explorar, y también evitar «no se han encontrado resultados». Estas sugerencias se reorganizan y reorganizan con cada clic, lo que ayuda a ofrecer una experiencia de navegación mucho mejor para el usuario.

Componentes de búsqueda guiada de Oracle Endeca

La búsqueda guiada de Oracle Endeca tiene tres componentes principales.

Estos componentes son:

  • Capa de transformación de información Endeca (ITL)
  • Motor Endeca MDEX
  • Nivel de aplicación Endeca

 Componentes de búsqueda guiada Oracle endeca

La capa de transformación de información Endeca (ITL) lee sus datos de origen sin procesar y se convierte en índices de motor Oracle Endeca MDEX. El DIT consiste en

  1. El sistema de adquisición de contenidos.
    1. Servidor y consola CAS de Endeca
    2. API CAS
    3. Rastreador web de Endeca.
  2. Fundición de datos
    1. Forja (un programa de manipulación de datos).
Motor Oracle Endeca MDEX –

¿Qué es MDEX y cómo se compara con productos de Oracle, como Oracle Database y Oracle Essbase?

En primer lugar, vale la pena comprender los objetivos de diseño detrás de MDEX en comparación con, por ejemplo, un cubo Essbase o una base de datos relacional Oracle. Las bases de datos Oracle están diseñadas para almacenar gran cantidad de datos de nivel de detalle de la manera más eficiente posible en cuanto al espacio y con tiempos de recuperación rápidos para filas individuales de datos; Los cubos Essbase están diseñados para pre-calcular y agregar muchos datos de nivel de detalle y luego proporcionar porciones de ellos rápidamente, haciendo suposiciones sólidas sobre las rutas de consulta que tomarán los usuarios. MDEX, sin embargo, fue diseñado para admitir casos de uso de búsqueda y descubrimiento Endeca, donde el usuario puede buscar y filtrar arbitrariamente, y obtener vistas agregadas rápidas que se devuelven a ellos. Como tal, Endeca posiciona a MDEX como una base de datos híbrida de búsqueda y análisis diseñada para el análisis de datos diversos y que cambian rápidamente.

El motor de consultas Oracle Endeca MDEX es el motor de consultas de la búsqueda guiada Oracle Endeca. Contiene-

  1. Indexador (Dgidx).
  2. Dgraph.
  3. Agraph

Los índices generados por la capa del DIT se cargan a través del motor MDEX.

Después de cargar el índice, el motor MDEX recibe consultas de búsqueda del nivel de aplicación, las compara con el índice y devuelve resultados relevantes a la aplicación del navegador web del usuario.

El nivel de aplicación proporciona una interfaz al motor MDEX.

El nivel de aplicación proporciona una interfaz al motor MDEX. Las dos interfaces predeterminadas, que se pueden usar en la misma aplicación, son la API de presentación y la interfaz de servicios Web.

La API de presentación y la interfaz de servicios web se utilizan para consultar el motor MDEX y modificar los resultados. Los componentes del DIT, como Forge, se ejecutan sin conexión en períodos de tiempo específicos en función de las necesidades de su empresa. El motor MDEX y el nivel de aplicación Endeca deben estar en línea cuando quiera que sus clientes accedan a sus datos.

Estas interfaces se utilizan para consultar el motor MDEX y manipular los resultados. Los componentes de ITL de Endeca, como Forge, se ejecutan sin conexión a intervalos que son apropiados para los requisitos de su negocio. El motor Endeca MDEX y el nivel de aplicación Endeca son procesos en línea, lo que significa que deben permanecer en funcionamiento mientras desee que los clientes tengan acceso a su conjunto de datos.

Resultados de consulta del motor Endeca MDEX

El motor Endeca MDEX devuelve dos tipos de información.

  1. Resultados de una consulta (un juego de registros o un solo registro).
  2. La información de apoyo para la construcción sigue a las consultas. (Esta información ayuda a los usuarios a refinar o ampliar sus consultas de búsqueda utilizando facetas y filtros.)

Todos los resultados de las consultas que se devuelven desde el motor Endeca MDEX contienen dos tipos de información. Estos tipos de información son

  • Los resultados apropiados para la consulta (por ejemplo, un conjunto de registros o un registro individual)
  • La información de apoyo para crear consultas de seguimiento La información de consulta de seguimiento permite a los usuarios refinar o ampliar su consulta y, en consecuencia, sus resultados de consulta.

El motor MDEX calcula los resultados de búsqueda para evitar callejones sin salida, como «no se han encontrado resultados», proporcionando opciones de refinamiento del siguiente paso adecuadas.

Esta es una característica clave que diferencia a Endeca de otras soluciones de búsqueda.

Dos tipos de consultas

Oracle Endeca Search admite dos tipos de consultas de búsqueda: consultas de navegación y consultas de búsqueda de palabras clave.

  • Las consultas de navegación devuelven un conjunto de registros basados en características de registro definidas por la aplicación (como el tipo de computadora portátil o la región en una tienda de computadoras portátiles en línea), además de cualquier información de consulta de seguimiento.
  • Las consultas de búsqueda de palabras clave devuelven un conjunto de registros basados en una palabra clave definida por el usuario, además de cualquier información de consulta de seguimiento.

Las consultas de navegación y las consultas de búsqueda de palabras clave son complementarias. De hecho, una consulta de búsqueda de palabras clave es un tipo especial de consulta de navegación, y las estructuras de datos para los resultados de las dos consultas son idénticas: un conjunto de registros e información de consulta de seguimiento.

Los usuarios pueden ejecutar una combinación de consultas de navegación y consultas de búsqueda de palabras clave para navegar a su conjunto de registros deseado de la manera que mejor les funcione. Por ejemplo, los usuarios pueden ejecutar una consulta de búsqueda de palabras clave para recuperar un conjunto de registros y, a continuación, usar una consulta de navegación de seguimiento para refinar ese conjunto de registros. La situación inversa también es válida.

Qué son los registros Endeca

Los registros Endeca contienen los datos a los que los usuarios navegan o buscan.

Los registros Endeca se basan en registros tradicionales en una base de datos de origen. Los registros de la base de datos de origen suelen contener información como las botellas de vino en una tienda de vinos, los registros de clientes en una aplicación de CRM o los fondos mutuos en un evaluador de fondos.

Los registros de base de datos de origen almacenan esta información en uno o más pares clave/valor, conocidos como propiedades. Esta información estará disponible para su aplicación cuando transforme los registros de la base de datos de origen en registros Endeca. Para transformar los registros de la base de datos de origen en registros Endeca, debe asignar las propiedades del registro de origen a las propiedades de los registros Endeca.

Por lo tanto, las dimensiones y los registros Endeca corresponden a las propiedades de los registros de la base de datos de origen. Al igual que las propiedades de registro de origen, las propiedades Endeca son pares clave/valor. La siguiente figura ilustra los pares clave / valor en un registro Endeca simple:

registro endecaUn único registro Endeca puede corresponder a cualquier número de registros de origen. Por ejemplo, supongamos que cuatro registros de fuentes diferentes se refieren al mismo libro en formatos diferentes: tapa dura, tapa blanda, letra grande y audio. Puede configurar su aplicación de búsqueda guiada para combinar la información de estos cuatro registros de origen en un solo registro Endeca.

Qué son las dimensiones y los valores de dimensión de Endeca

Las dimensiones son categorías lógicas que permiten organizar sus registros de Endeca en estructuras por las que los clientes pueden navegar para encontrar información sobre productos o servicios que podrían querer comprar.

Una dimensión es una jerarquía de valores de dimensión. Una dimensión en su conjunto corresponde típicamente a una categoría general de productos o servicios. Los valores de dimensión contienen información cada vez más específica sobre productos y servicios, cuanto más bajos están en la jerarquía.

El valor de dimensión superior en una dimensión se conoce como raíz de dimensión. Una raíz de dimensión sirve como el nombre de su dimensión. Cada valor de dimensión puede tener uno o más valores de dimensión secundarios; un valor de dimensión con valores de dimensión secundarios se conoce como valor de dimensión principal.

Un valor de dimensión secundario solo puede tener un valor de dimensión primario. Los valores de dimensión que son secundarios del mismo valor de dimensión principal se conocen como valores de dimensión hermanos. Los valores de dimensión del hermano no pueden ser idénticos. Sin embargo, los valores de dimensión que no son hermanos pueden ser idénticos, incluso dentro de la misma dimensión.

Los valores de dimensión que no tienen hijos se conocen como valores de dimensión de hoja. Los valores de dimensión de hoja suelen contener información sobre productos y servicios concretos. Por ejemplo, un valor de dimensión no foliar puede representar una gama de precios y los valores de dimensión foliar-sus hijos — pueden representar productos individuales cuyos precios están dentro de esa gama. La siguiente figura ilustra una dimensión simple llamada «Tipo de vino»:

Búsqueda Endeca

Los registros se pueden organizar en jerarquías de búsqueda etiquetándolos con valores de dimensión. Los registros normalmente se etiquetan con valores de dimensión de hoja, pero se pueden etiquetar con valores de dimensión que no son de hoja para fines especiales.

Etiquetar un registro con un valor de dimensión hace lo siguiente:

  • Especifica la ubicación del registro dentro de la dimensión asociada. En el ejemplo siguiente, los registros Endeca para las Botellas A y B se etiquetan con el valor de dimensión roja en la dimensión de Tipo de vino, mientras que los registros Endeca para las Botellas C y D se etiquetan con el valor de dimensión Blanca, y así sucesivamente.
  • Identifica el registro como un resultado válido cuando se selecciona ese valor de dimensión en una consulta de navegación. En el ejemplo siguiente, una consulta de navegación en el valor de dimensión roja produce un conjunto de resultados que contiene las botellas A y B.

Consulta de navegación endeca

Mejores prácticas de búsqueda Endeca:

Los motores de búsqueda requieren mantenimiento regular, como los automóviles.

  1. Resultados de búsqueda precisos:
    1. Genere una lista de palabras clave buscadas diariamente para las que Endeca no obtuvo resultados. La lista se puede extraer del registro de solicitudes del motor Endeca.
    2. Haga que todos los campos de texto se puedan buscar sin hacer que todos formen parte de la interfaz de búsqueda de Endeca existente. Solo se buscarán los campos/dimensiones de la interfaz de búsqueda; los que no forman parte de la interfaz de búsqueda nunca participarán en la búsqueda aunque estén indexados.
    3. Use los términos de búsqueda que no produjeron resultados que identificamos para verificar con todos los campos de texto con capacidad de búsqueda.
    4. Generar un informe que muestre la discrepancia de recuento de resultados entre el campo de texto y la interfaz de búsqueda: si la interfaz de búsqueda no devuelve resultados, pero los campos de texto individuales devuelven resultados superiores a 0, hemos identificado con éxito los casos en los que Endeca había proporcionado por error a los usuarios cero resultados. término de búsqueda cero resultado endeca
    5. La siguiente tabla registra la salida del paso anterior. Para todos los términos de búsqueda (columna 1) que NO produjeron realmente cero resultados (columna 5), se necesitan más análisis y medidas. De hecho, no se suponía que esos términos de búsqueda hubieran producido cero resultados.
    6. La siguiente tabla registra la salida del paso anterior. Para todos los términos de búsqueda (columna 1) que NO produjeron realmente cero resultados (columna 5), se necesitan más análisis y medidas. De hecho, no se suponía que esos términos de búsqueda hubieran producido cero resultados. verificación de resultados de búsqueda endeca zero
    7. En base a los hallazgos anteriores, podemos usar uno de los siguientes enfoques para resolver el problema:
      • Agregue los campos de texto que devuelven resultados a la interfaz de búsqueda existente, o
      • Copie el valor del campo de texto que devuelve resultados a uno de los campos existentes en la interfaz de búsqueda.

      Además, las configuraciones de coincidencia parcial también pueden contribuir a escenarios de acierto cero. Considere los casos en los que los usuarios buscan «lavavajillas potente» y «refrigerador silencioso» en un sitio web de electrodomésticos. La configuración predeterminada de coincidencia parcial de Endeca dicta que los resultados deben coincidir al menos con 2 palabras (imagen siguiente), lo que convierte efectivamente todos los términos de búsqueda con dos palabras clave en «coincidir con todas las palabras clave».»Como resultado, si el sitio web del minorista no incluye «potente» o «silencioso» en sus descripciones o títulos de productos, no aparecerá ningún refrigerador o lavavajillas en la página de resultados de búsqueda del usuario. Los minoristas pueden considerar ajustar la coincidencia parcial para «igualar al menos 1 palabra» para reducir las tasas de acierto cero. interfaz de búsqueda endeca

  2. Resultados de búsqueda eficientes: Endeca utiliza la caché del motor para almacenar los resultados que ya se procesaron en solicitudes anteriores, lo que ayuda a mejorar el rendimiento de búsqueda porque evita procesar las mismas solicitudes repetidamente. Si bien es ventajoso aprovechar la caché del motor para aumentar el rendimiento, hay varias cosas a considerar:
    • Identificar las consultas de los resultados que se pueden almacenar en caché desde el registro de solicitudes del motor. Estas consultas se utilizarán para calentar el motor. Por ejemplo, los elementos del menú de navegación superior con tecnología Endeca son generalmente comunes en todas las páginas. Este es un buen candidato para resultados en caché en lugar de golpear el motor para cada solicitud. Otro buen candidato para el almacenamiento en caché son las consultas de búsqueda populares. Por ejemplo, para un minorista de electrónica o una tienda departamental, algunas consultas de búsqueda populares de días festivos podrían incluir «Xbox», «Amazon Echo» o «ofertas de viernes negro».»
    • La memoria caché del motor tendrá que ser lo suficientemente grande para contener los resultados en caché.
    • La caché del motor se valida después de cada actualización de línea de base (actualización completa del índice), momento en el que la caché debe rellenarse (calentarse) utilizando las consultas identificadas anteriormente.
  3. Relevancia de la búsqueda-La relevancia de la búsqueda de Endeca está fuertemente influenciada por dos componentes principales:
    1. Interfaz de búsqueda de Endeca-consiste en una lista de campos de búsqueda de cada registro en el índice. Cuantos más campos de búsqueda se incluyan en una interfaz de búsqueda, más amplia será la búsqueda. Lo contrario resulta en una búsqueda estrecha.
    2. Módulos de clasificación de relevancia: algoritmos de clasificación listos para usar que, cuando se colocan uno tras otro, producen los pedidos de clasificación deseados. Los módulos más utilizados son:
        • Número de términos: clasifica los resultados en función del número de términos coincidentes coincidentes.

        Término de búsqueda: «fregadero de cocina con fugas»

        Registros coincidentes: «mi fregadero de cocina ya no tiene fugas después de que lo arreglé» y «Aún no he instalado asink en mi cocina»

        Clasificación: el registro 1 se clasifica más alto que el registro 2 porque coincide con las tres palabras clave.

        • Coincidencia única vs coincidencia de campo cruzado: la coincidencia de campo único de todos los términos de búsqueda tiene una puntuación más alta que la de los campos cruzados coincidentes.
      1. Término de búsqueda:»destinos populares de vacaciones de primavera»

        Registros coincidentes:

        Registro 1:

        Título: «Destinos populares para vacaciones de primavera!»

        Descripción: «Tarifa aérea con descuento, hotel para las vacaciones de primavera

        Registro 2:

        Título: «¿Qué es popular para las vacaciones de primavera?»

        Descripción: «¡Estos son los destinos de ensueño de todos!»

        Clasificación: El registro 1 ocupa un lugar más alto que el registro 2 porque su título coincidía con todas las palabras clave del término de búsqueda.

      2. ordenar por valores de campo en orden ascendente/descendente. La popularidad es un buen ejemplo al que puedes aplicar este algoritmo. El siguiente diagrama muestra cómo los componentes de relevancia trabajan juntos para producir el orden de clasificación deseado. relevancia de búsqueda de endeca

¿Por qué se redujo el uso de Oracle Endeca?

Oracle ha perdido su camino. Se ha quedado atrás en la curva tecnológica y no ha logrado proporcionar una hoja de ruta convincente para abordar las nuevas demandas del comercio minorista digital. Endeca era originalmente una plataforma abierta e innovadora construida por algunos de los ingenieros más brillantes de la industria, pero a lo largo de los años Oracle ha convertido Endeca en una «caja negra» rígida y masiva que tiene una funcionalidad limitada, es dolorosamente difícil de cambiar, lenta de implementar, costosa de mantener y casi imposible de innovar.

Si está buscando una alternativa a Endeca, puede echar un vistazo a la alternativa Endeca de Expertrec.

 Alternativa de búsqueda Endeca-expertrec

Utilice una alternativa Endeca

Deja una respuesta

Tu dirección de correo electrónico no será publicada.