[Oracle] Endeca Search

Suche und Navigation ist das Wichtigste beim Online-Shopping. Wenn ein Benutzer nach einem bestimmten Produkt sucht, ist es wichtig, dass dem Benutzer relevante Produkte innerhalb kurzer Zeit angezeigt werden. Zu diesem Zweck sollten die Manager des Online-Shopping-Unternehmens ein leistungsstarkes Tool zur Verwaltung der verschiedenen Aspekte der Suchmaschine erhalten.

Das macht Endeca search. Es bietet E-Commerce-Websitebesitzern Tools zur Verwaltung der Sucherfahrung auf ihrer Website.

oracle endeca

Fügen Sie Ihrer Website eine Suche hinzu

Was ist Oracle Endeca?

Das Wort Endeca bedeutet „Entdecken“. Endeca, das Unternehmen wurde 1999 gegründet und konzentriert sich hauptsächlich auf –

  1. E-Commerce.
  2. Unternehmenssuche.
  3. Geschäftsinformationen.

In traditionellen E-Commerce-Bestandsabfragesystemen mussten Sie ganz oben beginnen, indem Sie beispielsweise Herrenbekleidung oder Damenbekleidung auswählten und dann aus Herrenhosen, Herrenhemden, Herrenmänteln usw. auswählten. Schließlich würden Sie zu den 36 „Herrenhosen in Schwarz kommen, aber es war eine sehr lineare und „geführte“ Route durch die Daten. Websites, die die Suchtechnologie von Endeca verwendeten, präsentierten im Gegensatz dazu eine Liste von Dimensionen und Attributen auf einer Seite, und der Benutzer konnte daraus eine beliebige Auswahl treffen, um seine Suche einzugrenzen. All dies geschah blitzschnell und mit einem Backend, das für den Kunden sehr einfach zu warten war.

Also konzentrierte sich Endeca zuerst auf diesen E-Commerce-Markt und entwickelte die MDEX-Engine, um dies zu unterstützen, und vermarktete sie als schnell entwickelnde Abfrage-Engine für Spaltenspeicher, die „facettierte Suchen“ über viele verschiedene „gezackte“ Datensätze hinweg ermöglicht (dh Datensätze, die nicht dasselbe Datenmodell haben, aber eine gewisse Gemeinsamkeit aufweisen).

Eine kurze Einführung zu den Terminologien in Endeca-

Endeca wollte seinen Benutzern eine einfache und einfache Möglichkeit bieten, mit Daten zu interagieren und sie zu analysieren.

Endeca search erfüllt die Anforderungen von Benutzern, Daten jeder Größe aus mehreren Datenquellen zu suchen, zu navigieren und zu analysieren. Es hilft auch, über Dimensionen hinweg zu schneiden und zu würfeln und bis ins kleinste Detail zu bohren oder eine makroskopische Ansicht der Daten zu haben. Außerdem sollten Benutzer in der Lage sein, komplexe Suchanfragen einfach durchzuführen.

Zusätzlich zu den Suchergebnissen für eine Abfrage kann Oracle Endeca Guided Navigation den Benutzern die nächsten Schritte wie Verfeinern und Erkunden sowie das Vermeiden von „Keine Ergebnisse gefunden“ mitteilen. Diese Vorschläge werden mit jedem Klick neu eingestuft und neu organisiert, was zu einem viel besseren Navigationserlebnis für die Benutzer beiträgt.

Oracle Endeca Guided Search-Komponenten

Oracle Endeca Guided Search besteht aus drei Hauptkomponenten.

Diese Komponenten sind:

  • Endeca Information Transformation Layer (ITL)
  • Endeca MDEX Engine
  • Endeca Application Tier

Oracle endeca Guided Search Components

Die Endeca Information Transformation Layer (ITL) liest Ihre rohen Quelldaten und konvertiert sie in Oracle Endeca MDEX Engine-Indizes. Die ITL besteht aus

  1. Dem Content Acquisition System.
    1. Endeca CAS Server und Konsole
    2. CAS API
    3. Endeca Web Crawler.
  2. Data Foundry
    1. Schmiede (ein Datenmanipulationsprogramm).
Oracle Endeca MDEX engine-

Was ist MDEX und wie unterscheidet es sich von Oracle-Produkten wie Oracle Database und Oracle Essbase?

Zunächst lohnt es sich, die Designziele hinter MDEX im Vergleich zu beispielsweise einem Essbase-Cube oder einer relationalen Oracle-Datenbank zu verstehen. Oracle-Datenbanken sind so konzipiert, dass sie viele Daten auf Detailebene auf möglichst platzsparende Weise und mit schnellen Abrufzeiten für einzelne Datenzeilen speichern; Essbase-Cubes wurden entwickelt, um viele Daten auf Detailebene vorab zu berechnen und zu aggregieren und dann schnell Slices davon bereitzustellen, wobei starke Annahmen über die Abfragepfade getroffen werden, die Benutzer verwenden werden. MDEX wurde jedoch entwickelt, um Endeca-Such- und Discovery-Anwendungsfälle zu unterstützen, bei denen der Benutzer beliebig suchen und filtern und schnell aggregierte Ansichten erhalten kann, die an ihn zurückgegeben werden. Daher positioniert Endeca MDEX als hybride Such- / Analysedatenbank, die für die Analyse verschiedener und sich schnell ändernder Daten entwickelt wurde.

Die Oracle Endeca MDEX Engine ist die Abfrage-Engine der Oracle Endeca Guided Search. Es enthält-

  1. Indexer (Dgidx).
  2. Dgraph.
  3. Agraph

Die von der ITL-Schicht erzeugten Indizes werden über die MDEX-Engine geladen.

Nach dem Laden des Index empfängt die MDEX-Engine Suchanfragen von der Anwendungsebene, gleicht sie mit dem Index ab und gibt relevante Ergebnisse an die Webbrowser-Anwendung des Benutzers zurück.

Die Anwendungsebene stellt eine Schnittstelle zur MDEX-Engine bereit.

Die Anwendungsebene stellt eine Schnittstelle zur MDEX-Engine bereit. Die beiden Standardschnittstellen, die in derselben Anwendung verwendet werden können, sind die Präsentations-API und die Webdienstschnittstelle.

Die Präsentations-API und die Webservices-Schnittstelle werden verwendet, um die MDEX-Engine abzufragen und die Ergebnisse zu ändern. Die ITL-Komponenten wie Forge werden zu bestimmten Zeiträumen offline ausgeführt, abhängig von Ihren Geschäftsanforderungen. Die MDEX-Engine und die Endeca-Anwendungsebene müssen online sein, wenn Ihre Kunden auf Ihre Daten zugreifen sollen.

Diese Schnittstellen werden verwendet, um die MDEX-Engine abzufragen und die Ergebnisse zu bearbeiten. Die Endeca ITL-Komponenten wie Forge werden in Intervallen offline ausgeführt, die Ihren Geschäftsanforderungen entsprechen. Die Endeca MDEX Engine und die Endeca Application Tier sind beide Online-Prozesse, d. h. sie müssen so lange ausgeführt werden, wie Clients Zugriff auf Ihren Datensatz haben sollen.

Abfrageergebnisse der Endeca MDEX Engine

Die Endeca MDEX Engine gibt zwei Arten von Informationen zurück.

  1. Ergebnisse für eine Abfrage (Ein Datensatzset oder ein einzelner Datensatz).
  2. Die unterstützenden Informationen für das Bauen folgen auf Abfragen. (Diese Informationen helfen Benutzern, ihre Suchanfragen mithilfe von Facetten und Filtern zu verfeinern oder zu erweitern.)

Alle von der Endeca MDEX-Engine zurückgegebenen Abfrageergebnisse enthalten zwei Arten von Informationen. Diese Informationstypen sind

  • Die entsprechenden Ergebnisse für die Abfrage (z. B. ein Datensatzsatz oder ein einzelner Datensatz)
  • Die unterstützenden Informationen zum Erstellen von Folgeabfragen Die Folgeabfrageinformationen ermöglichen es Benutzern, ihre Abfrage und entsprechend ihre Abfrageergebnisse zu verfeinern oder zu erweitern.

Die MDEX-Engine berechnet Suchergebnisse so, dass Sackgassen wie „Keine Ergebnisse gefunden“ vermieden werden, indem geeignete Verfeinerungsoptionen für den nächsten Schritt bereitgestellt werden.

Dies ist ein wesentliches Merkmal, das Endeca von anderen Suchlösungen unterscheidet.

Zwei Arten von Abfragen

Oracle Endeca Search unterstützt zwei Arten von Suchanfragen: Navigationsabfragen und Stichwortsuchabfragen.

  • Navigationsabfragen geben eine Reihe von Datensätzen zurück, die auf anwendungsdefinierten Datensatzmerkmalen basieren (z. B. Laptoptyp oder Region in einem Online-Laptopspeicher), sowie alle nachfolgenden Abfrageinformationen.
  • Schlüsselwortsuchabfragen geben eine Reihe von Datensätzen zurück, die auf einem benutzerdefinierten Schlüsselwort basieren, sowie alle nachfolgenden Abfrageinformationen.

Navigationsabfragen und Stichwortsuchabfragen ergänzen sich. Tatsächlich ist eine Stichwortsuchabfrage eine spezielle Art von Navigationsabfrage, und die Datenstrukturen für die Ergebnisse der beiden Abfragen sind identisch: eine Reihe von Datensätzen und Follow-on-Abfrage-Informationen.

Benutzer können eine Kombination aus Navigationsabfragen und Stichwortsuchabfragen ausführen, um zu ihrem gewünschten Datensatz so zu navigieren, wie es für sie am besten geeignet ist. Benutzer können beispielsweise eine Stichwortsuchabfrage ausführen, um einen Satz von Datensätzen abzurufen, und dann eine nachfolgende Navigationsabfrage verwenden, um diesen Satz von Datensätzen zu verfeinern. Die umgekehrte Situation ist ebenfalls gültig.

Was sind Endeca-Datensätze?

Endeca-Datensätze enthalten die Daten, zu denen Benutzer navigieren oder nach denen sie suchen.

Endeca-Datensätze basieren auf traditionellen Datensätzen in einer Quelldatenbank. Quelldatenbankeinträge enthalten in der Regel Informationen wie die Weinflaschen in einer Weinhandlung, die Kundendatensätze in einer CRM-Anwendung oder die Investmentfonds in einem Fondsauswerter.

Quelldatenbankeinträge speichern diese Informationen in einem oder mehreren Schlüssel/Wert-Paaren, die als Eigenschaften bezeichnet werden. Diese Informationen stehen Ihrer Anwendung zur Verfügung, wenn Sie die Quelldatenbankeinträge in Endeca-Datensätze umwandeln. Um die Quelldatenbankeinträge in Endeca-Datensätze umzuwandeln, müssen Sie die Quelldatensatzeigenschaften den Eigenschaften von Endeca-Datensätzen zuordnen.

Somit entsprechen Dimensionen und Enddatensätze den Eigenschaften von Quelldatenbankeinträgen. Wie Quelldatensatzeigenschaften sind Enddatensatzeigenschaften Schlüssel / Wert-Paare. Die folgende Abbildung veranschaulicht Schlüssel /Wert-Paare in einem einfachen Endbenutzerdatensatz:

 endeca-DatensatzEin einzelner Endeca-Datensatz kann einer beliebigen Anzahl von Quelldatensätzen entsprechen. Angenommen, vier verschiedene Quelldatensätze beziehen sich auf dasselbe Buch in unterschiedlichen Formaten: hardcover, Taschenbuch, Großdruck und Audio. Sie können Ihre Anwendung für die geführte Suche so konfigurieren, dass die Informationen in diesen vier Quelldatensätzen in einem einzigen Endbenutzerdatensatz zusammengefasst werden.

Was sind Endeca-Dimensionen und Dimensionswerte?

Dimensionen sind logische Kategorien, die es ermöglichen, Ihre Endeca-Datensätze in Strukturen zu organisieren, durch die Kunden navigieren können, um Informationen zu Produkten oder Dienstleistungen zu finden, die sie möglicherweise kaufen möchten.

Eine Dimension ist eine Hierarchie von Dimensionswerten. Eine Dimension als Ganzes entspricht typischerweise einer allgemeinen Kategorie von Produkten oder Dienstleistungen. Dimensionswerte enthalten immer spezifischere Informationen über Produkte und Dienstleistungen, je niedriger sie in der Hierarchie sind.

Der oberste Dimensionswert in einer Dimension wird als Dimensionswurzel bezeichnet. Ein Dimensionsstamm dient als Name seiner Dimension. Jeder Dimensionswert kann einen oder mehrere untergeordnete Dimensionswerte haben; Ein Dimensionswert mit untergeordneten Dimensionswerten wird als übergeordneter Dimensionswert bezeichnet.

Ein untergeordneter Dimensionswert kann nur einen übergeordneten Dimensionswert haben. Dimensionswerte, die untergeordnete Werte desselben übergeordneten Dimensionswerts sind, werden als Geschwisterdimensionswerte bezeichnet. Geschwisterdimensionswerte können nicht identisch sein. Dimensionswerte, die keine Geschwister sind, können jedoch auch innerhalb derselben Dimension identisch sein.

Die Dimensionswerte, die keine untergeordneten Elemente haben, werden als Blattdimensionswerte bezeichnet. Blattdimensionswerte enthalten in der Regel Informationen zu bestimmten Produkten und Dienstleistungen. Beispielsweise kann ein Nicht-Blatt-Dimensionswert einen Preisbereich darstellen, und die Blattdimensionswerte — seine untergeordneten Werte — können einzelne Produkte darstellen, deren Preise in diesen Bereich fallen. Die folgende Abbildung veranschaulicht eine einfache Dimension mit dem Namen „Wine Type“:

Endeca search

Datensätze können in durchsuchbaren Hierarchien organisiert werden, indem sie mit Dimensionswerten versehen werden. Datensätze werden normalerweise mit Blattdimensionswerten markiert, können jedoch für spezielle Zwecke mit Nicht-Blattdimensionswerten markiert werden.

Das Markieren eines Datensatzes mit einem Dimensionswert bewirkt Folgendes:

  • Sie gibt die Position des Datensatzes innerhalb der zugeordneten Dimension an. Im folgenden Beispiel sind die Endeca-Datensätze für die Flaschen A und B mit dem roten Dimensionswert in der Dimension Weintyp gekennzeichnet, während die Endeca-Datensätze für die Flaschen C und D mit dem weißen Dimensionswert usw. gekennzeichnet sind.
  • Identifiziert den Datensatz als gültiges Ergebnis, wenn dieser Dimensionswert in einer Navigationsabfrage ausgewählt wird. Im folgenden Beispiel erzeugt eine Navigationsabfrage für den roten Dimensionswert eine Ergebnismenge, die die Dimensionen A und B enthält.

endeca Navigationsabfrage

Endeca search Best Practices-

Suchmaschinen erfordern eine regelmäßige Wartung wie Autos.

  1. Genaue Suchergebnisse –
    1. Generieren Sie eine Liste der täglich gesuchten Schlüsselwörter, für die Endeca keine Ergebnisse gemeldet hat. Die Liste kann aus dem Anforderungsprotokoll von Endeca Engine extrahiert werden.
    2. Machen Sie alle Textfelder durchsuchbar, ohne sie alle Teil der vorhandenen Endeca-Suchoberfläche zu machen. Nur die Felder / Dimensionen in der Suchoberfläche werden durchsucht; diejenigen, die nicht Teil der Suchoberfläche sind, werden niemals an der Suche teilnehmen, obwohl sie indiziert sind.
    3. Verwenden Sie die Suchbegriffe, die zu null Ergebnissen geführt haben, die wir identifiziert haben, um sie mit allen durchsuchbaren Textfeldern zu vergleichen.
    4. Generieren Sie einen Bericht, der die Diskrepanz der Ergebnisanzahl zwischen dem Textfeld und der Suchoberfläche anzeigt – Wenn die Suchoberfläche keine Ergebnisse zurückgibt, aber einzelne Textfelder Ergebnisse größer als 0 zurückgeben, haben wir erfolgreich die Fälle identifiziert, in denen Endeca Benutzern fälschlicherweise null Ergebnisse geliefert hat.null Ergebnis Suchbegriffe endeca
    5. Die folgende Tabelle zeichnet die Ausgabe des obigen Schritts auf. Für alle Suchbegriffe (Spalte 1), die NICHT wirklich zu null Ergebnissen geführt haben (Spalte 5), sind weitere Analysen und Maßnahmen erforderlich. Diese Suchbegriffe sollten in der Tat nicht zu null Ergebnissen geführt haben.
    6. Die folgende Tabelle zeichnet die Ausgabe des obigen Schritts auf. Für alle Suchbegriffe (Spalte 1), die NICHT wirklich zu null Ergebnissen geführt haben (Spalte 5), sind weitere Analysen und Maßnahmen erforderlich. Diese Suchbegriffe sollten in der Tat nicht zu null Ergebnissen geführt haben.Ende der Nullsuchergebnisverifizierung
    7. Basierend auf den obigen Ergebnissen können wir einen der folgenden Ansätze verwenden, um das Problem zu lösen:
      • Fügen Sie die Textfelder, die Ergebnisse zurückgegeben haben, zur vorhandenen Suchoberfläche hinzu, oder
      • Kopieren Sie den Wert des Textfelds, das Ergebnisse zurückgegeben hat, in eines der vorhandenen Felder in der Suchoberfläche.

      Darüber hinaus können partielle Übereinstimmungskonfigurationen auch zu Zero-Hit-Szenarien beitragen. Betrachten Sie Fälle, in denen Benutzer auf einer Haushaltsgerät-Website nach „leistungsstarkem Geschirrspüler“ und „leisem Kühlschrank“ suchen. Die Standardkonfiguration für End- und Teilübereinstimmungen schreibt vor, dass die Ergebnisse mindestens 2 Wörtern entsprechen müssen (siehe Abbildung unten), wodurch alle Suchbegriffe mit zwei Schlüsselwörtern effektiv in „Alle Schlüsselwörter übereinstimmen“ umgewandelt werden.“ Wenn die Website des Einzelhändlers in seinen Produktbeschreibungen oder Titeln nicht „leistungsstark“ oder „leise“ enthält, wird auf der Suchergebnisseite des Benutzers kein Kühlschrank oder Geschirrspüler angezeigt. Einzelhändler können erwägen, die partielle Übereinstimmung auf „mindestens 1 Wort übereinstimmen“ einzustellen, um die Trefferquote von Null zu reduzieren.ende der Suchoberfläche

  2. Effiziente Suchergebnisse – Endeca verwendet den Engine-Cache, um Ergebnisse zu speichern, die bereits in früheren Anforderungen verarbeitet wurden. Während es vorteilhaft ist, den Engine-Cache zu nutzen, um die Leistung zu steigern, gibt es mehrere Dinge zu beachten:
    • Identifizieren Sie die Abfragen, deren Ergebnisse aus dem Engine-Anforderungsprotokoll zwischengespeichert werden können. Diese Abfragen werden zum Aufwärmen des Motors verwendet. Beispielsweise sind Endeca-basierte Top-Navigationsmenüelemente im Allgemeinen auf allen Seiten üblich. Dies ist ein guter Kandidat für zwischengespeicherte Ergebnisse, anstatt die Engine für jede Anforderung zu treffen. Ein weiterer guter Kandidat für das Caching sind beliebte Suchanfragen. Zum Beispiel, für einen Elektronikhändler oder ein Kaufhaus, Einige beliebte Urlaubssuchanfragen könnten „Xbox“ enthalten, „Amazon Echo,“Oder“Black Friday Deals.“
    • Der Engine-Cache-Speicher muss groß genug sein, um zwischengespeicherte Ergebnisse zu speichern.
    • Der Engine-Cache wird nach jeder Baseline-Aktualisierung (vollständige Aktualisierung des Index) validiert.
  3. Suchrelevanz – Die Endeca-Suchrelevanz wird stark von zwei Hauptkomponenten beeinflusst:
    1. Endeca search interface – besteht aus einer Liste durchsuchbarer Felder aus jedem Datensatz im Index. Je mehr durchsuchbare Felder in einer Suchoberfläche enthalten sind, desto breiter ist die Suche. Das Gegenteil führt zu einer engen Suche.
    2. Relevanz-Ranking-Module – Out-of-the-Box-Ranking-Algorithmen, die, wenn sie nacheinander platziert werden, die gewünschten Ranking-Ordnungen erzeugen. Die am häufigsten verwendeten Module sind:
        • Anzahl der Begriffe – ordnet die Ergebnisse basierend auf der Anzahl der übereinstimmenden Begriffe.

        Suchbegriff: „undichte Küchenspüle“

        Übereinstimmende Datensätze: „Meine Küchenspüle leckt nicht mehr, nachdem ich sie repariert habe“ und „Ich habe asink noch nicht in meiner Küche installiert“

        Ranking: Datensatz 1 wird höher eingestuft als Datensatz 2, da er mit allen drei Schlüsselwörtern übereinstimmt.

        • Single Match vs. Cross Field Match – Single Field Match aller Suchbegriffe hat eine höhere Punktzahl als die übereinstimmenden Cross Field .
      1. Suchbegriff: „popular spring break destinations“

        Übereinstimmende Datensätze:

        Datensatz 1:

        Titel: „Popular destinations for spring break!“

        Beschreibung: „Ermäßigter Flugpreis, Hotel für Spring Break…“

        Datensatz 2:

        Titel: „Was ist beliebt für Spring Break?“

        Beschreibung: „Dies sind die Traumziele aller!“

        Rangfolge: Datensatz 1 wird höher eingestuft als Datensatz 2, da sein Titel mit allen Schlüsselwörtern im Suchbegriff übereinstimmt.

      2. Sortieren nach Feldwerten in aufsteigender / absteigender Reihenfolge. Popularität ist ein gutes Beispiel, auf das Sie diesen Algorithmus anwenden können. Das folgende Diagramm zeigt, wie die Relevanzkomponenten zusammenarbeiten, um die gewünschte Rangfolge zu erzielen.ende der Suche Relevanz

Warum hat sich die Nutzung von Oracle Endeca verringert?

Oracle hat sich verirrt. Es ist hinter die Technologiekurve zurückgefallen und hat es versäumt, eine überzeugende Roadmap für die neuen Anforderungen des digitalen Einzelhandels bereitzustellen. Endeca war ursprünglich eine innovative, offene Plattform, die von einigen der klügsten Ingenieure der Branche entwickelt wurde, aber im Laufe der Jahre hat Oracle Endeca zu einer massiven, starren „Black Box“ gemacht, deren Funktionalität eingeschränkt, schmerzhaft schwer zu ändern, langsam zu implementieren, teuer in der Wartung und nahezu unmöglich zu innovieren ist.

Wenn Sie nach einer Alternative zu Endeca suchen, können Sie sich die Endeca-Alternative von Expertrec ansehen.

Endeca Alternative suchen - expertrec

Eine Endeca Alternative verwenden

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.