[Oracle] Endeca Search

zoeken en navigatie is het belangrijkste in online winkelen. Wanneer een gebruiker zoekt naar een bepaalde is het belangrijk dat relevante producten worden getoond aan de gebruiker binnen een korte periode van tijd. Om dit te doen, de managers in de online shopping bedrijf moet worden gegeven een krachtige tool om de verschillende aspecten van de zoekmachine te beheren.

Dit is wat Endeca search doet. Het biedt e-commerce site-eigenaren tools om te helpen bij het beheren van de zoekervaring op hun website.

Oracle endeca

zoekopdracht toevoegen aan uw website

Wat is Oracle Endeca?

het woord Endeca betekent “ontdekken”. Endeca, het bedrijf werd opgericht in 1999, en het richt zich voornamelijk op–

  1. E-Commerce.
  2. zoeken in ondernemingen.
  3. Business intelligence.

in traditionele e-commerce inventory query-systemen moest u bovenaan beginnen door bijvoorbeeld mannenkleding of dameskleding te selecteren en vervolgens te kiezen uit herenbroeken, herenshirts, Herenjassen, enzovoort. Uiteindelijk kwam je bij de 36″ mannenbroek in het zwart, maar het was een zeer lineaire en “geleide” route door de gegevens. Websites die de zoektechnologie van Endeca gebruikten, presenteerden daarentegen een lijst met afmetingen en attributen aan de ene kant, en de gebruiker kon een selectie maken om hun zoekopdracht te beperken. Dit alles gebeurde bliksem-snel, en met een back-end dat was zeer gemakkelijk voor de klant te onderhouden.

dus richtte Endeca zich eerst op deze e-commerce markt, en ontwikkelde de mdex engine om dit te ondersteunen, door het op de markt te brengen als een column-store, snel ontwikkelende query engine die “gefacetteerde zoekopdrachten” mogelijk maakt in veel verschillende, “gekartelde” datasets (dat wil zeggen datasets die niet hetzelfde datamodel hebben, maar die wel enige overeenkomst vertonen).

een korte inleiding over de terminologieën in Endeca-

Endeca wilde haar gebruikers een eenvoudige en gemakkelijke manier geven om te communiceren met en gegevens te analyseren met een eenvoudig te gebruiken gebruikersinterface, die schaalt naar grote schaal voor zowel gestructureerde als ongestructureerde gegevens.

Endeca search voorziet in de behoefte van gebruikers om gegevens van alle groottes uit meerdere gegevensbronnen te zoeken, te navigeren en te analyseren. Het helpt ook om te snijden en dobbelstenen over afmetingen en boren naar de fijnste details of met een macroscopische weergave van de gegevens. Ook, gebruikers moeten in staat zijn om complexe zoekopdrachten gemakkelijk uit te voeren.

naast het geven van zoekresultaten voor een query, kon Oracle Endeca geleide navigatie gebruikers de volgende stappen vertellen, zoals het verfijnen en verkennen en ook het vermijden van “geen resultaten gevonden”. Deze suggesties worden opnieuw gerangschikt en opnieuw georganiseerd met elke klik die helpt bij het leveren van een veel betere gebruikersnavigatie-ervaring.

Oracle Endeca-geleide Zoekcomponenten

Oracle Endeca-geleide Zoekcomponenten bestaan uit drie belangrijke componenten.

deze componenten zijn:

  • Endeca Information Transformation Layer (ITL)
  • Endeca Mdex Engine
  • Endeca Application Tier

Oracle Endeca guided search components

de Endeca information transformation layer (ITL) leest uw ruwe brongegevens en converteert naar Oracle Endeca mdex engine indices. Het ITL bestaat uit

  1. het systeem voor het verwerven van inhoud.
    1. Endeca CAS-server en-console
    2. CAS-API
    3. Endeca webcrawler.
  2. Gegevensgieterij
    1. Forge (EEN programma voor gegevensmanipulatie).
Oracle Endeca mdex engine-

Wat is MDEX, en hoe verhoudt het zich tot Oracle-producten zoals Oracle Database en Oracle Essbase?

Allereerst is het de moeite waard om de ontwerpdoelen achter MDEX te begrijpen in vergelijking met bijvoorbeeld een Essbase cube of een Oracle relationele database. Oracle-databases zijn ontworpen om veel gegevens op detailniveau op de meest ruimte-efficiënte manier op te slaan, en met snelle opzoektijden voor afzonderlijke gegevensrijen; Essbase-kubussen zijn ontworpen om veel gegevens op detailniveau vooraf te berekenen en samen te voegen en vervolgens snel stukken ervan te verstrekken, waarbij sterke aannames worden gemaakt over de query-paden die gebruikers zullen nemen. MDEX is echter ontworpen om Endeca search and discovery use cases te ondersteunen, waar de gebruiker willekeurig kan zoeken en filteren en snel geaggregeerde weergaven Terug naar hen kan krijgen. Als zodanig positioneert Endeca MDEX als een hybride zoek / analytische database ontworpen voor de analyse van diverse, en snel veranderende, gegevens.

de Oracle Endeca mdex engine is de query engine van de Oracle Endeca Guided search. Het bevat-

  1. Indexer (Dgidx).
  2. Dgraph.
  3. Agraph

de indices die door de ITL-laag worden gegenereerd, worden door de mdex-Motor geladen.

nadat de index is geladen, ontvangt de mdex-engine zoekopdrachten van de toepassingslaag, deze worden vergeleken met de index en geeft relevante resultaten terug aan de webbrowserapplicatie van de gebruiker.

het toepassingsniveau biedt een interface met de mdex-engine.

het toepassingsniveau biedt een interface met de Mdex-Engine. De twee standaard interfaces, die kunnen worden gebruikt in dezelfde toepassing, zijn de presentatie API en de web services interface.

de presentatie API en de web services interface worden gebruikt om de mdex engine te bevragen en de resultaten te wijzigen. De ITL-componenten zoals Forge draaien offline op specifieke tijdstippen, afhankelijk van uw bedrijfsbehoeften. De mdex engine en Endeca application tier moeten online zijn als en wanneer u wilt dat uw klanten toegang hebben tot uw gegevens.

deze interfaces worden gebruikt om de Mdex-Engine te bevragen en de resultaten te manipuleren. De Endeca ITL-componenten, zoals Forge, worden offline uitgevoerd met intervallen die geschikt zijn voor uw zakelijke behoeften. De Endeca Mdex Engine en Endeca Application Tier zijn beide online processen, wat betekent dat ze moeten blijven draaien zolang u wilt dat klanten toegang hebben tot uw dataset.

Endeca Mdex Engine query results

de Endeca mdex engine geeft twee soorten informatie terug.

  1. resultaten voor een query (een recordset of een enkele record).
  2. de ondersteunende informatie voor het bouwen volgt op vragen. (Deze informatie helpt gebruikers om hun zoekopdrachten te verfijnen of te verbreden met behulp van facetten en filters.)

alle query resultaten die worden geretourneerd van de Endeca Mdex Engine bevatten twee soorten informatie. Deze soorten informatie zijn

  • de juiste resultaten voor de query (bijvoorbeeld een recordset of een individueel record)
  • de ondersteunende informatie voor het samenstellen van vervolgvragen de informatie over vervolgvragen stelt gebruikers in staat hun zoekopdracht en, dienovereenkomstig, hun resultaten te verfijnen of uit te breiden.

de mdex-engine berekent zoekresultaten op een manier om doodlopende resultaten zoals “geen resultaten gevonden” te voorkomen door geschikte opties voor de volgende stap verfijning te bieden.

dit is een belangrijke functie die Endeca onderscheidt van andere Zoekoplossingen.

twee soorten query ‘s

Oracle Endeca Search ondersteunt twee soorten zoekquery’ s: navigatiequery ‘ s en zoekwoorden.

  • Navigatiequeries retourneren een reeks records op basis van applicatiegedefinieerde recordkenmerken (zoals laptoptype of regio in een online laptopwinkel), plus alle informatie over vervolgvragen.
  • Keyword search queries retourneren een reeks records op basis van een door de gebruiker gedefinieerd keyword, plus eventuele follow-on query-informatie.

navigatievragen en zoekwoorden zijn complementair. In feite, een zoekwoord zoekopdracht is een speciaal soort navigatie query, en de datastructuren voor de resultaten van de twee query ‘ s zijn identiek: een set van records en follow-on query-informatie.

gebruikers kunnen een combinatie van navigatiequery ‘ s en zoekwoorden uitvoeren om naar hun gewenste record te navigeren op de manier die voor hen het beste werkt. Gebruikers kunnen bijvoorbeeld een zoekwoordquery uitvoeren om een reeks records op te halen en vervolgens een vervolgnavigatiequery gebruiken om die reeks records te verfijnen. De omgekeerde situatie geldt ook.

Wat zijn Endeca-records

Endeca-records bevatten de gegevens waarnaar gebruikers navigeren of zoeken.

Endeca-records zijn gebaseerd op traditionele records in een brondatabank. Bron database records bevatten meestal informatie zoals de flessen wijn in een wijnwinkel, de klant records in een CRM-applicatie, of de beleggingsfondsen in een fonds evaluator.

brondatabankrecords slaan deze informatie op in een of meer sleutel/waardeparen, ook wel eigenschappen genoemd. Deze informatie wordt beschikbaar voor uw toepassing wanneer u de brondatabankrecords omzet in Endeca-records. Als u de records van de brondatabase wilt omzetten in Endeca-records, moet u de eigenschappen van de bronrecord toewijzen aan de eigenschappen van Endeca-records.

afmetingen en Endeca-records komen dus overeen met de eigenschappen van brondatabankrecords. Net als bronrecordeigenschappen zijn Endeca-eigenschappen sleutel – / waardeparen. De volgende figuur illustreert sleutel / waarde paren in een eenvoudige Endeca record:

endeca-recordeen enkele Endeca-record kan overeenkomen met een willekeurig aantal bronrecords. Stel bijvoorbeeld dat vier verschillende bronrecords verwijzen naar hetzelfde boek in verschillende formaten: hardcover, paperback, grote print en audio. U kunt uw begeleide zoektoepassing configureren om de informatie in deze vier bronrecords te combineren tot één Endeca-record.

Wat zijn Endeca-dimensies en dimensiewaarden

dimensies zijn logische categorieën die het mogelijk maken om uw Endeca-records te organiseren in structuren waar klanten doorheen kunnen navigeren om informatie te vinden over producten of diensten die ze misschien willen kopen.

een dimensie is een hiërarchie van dimensiewaarden. Een dimensie als geheel komt doorgaans overeen met een algemene categorie producten of diensten. Dimensiewaarden bevatten steeds specifiekere informatie over producten en diensten, hoe lager ze in de hiërarchie staan.

de hoogste dimensiewaarde in een dimensie staat bekend als de dimensiewortel. Een dimensie wortel dient als de naam van zijn dimensie. Elke dimensie waarde kan een of meer kind dimensie waarden hebben; een dimensie waarde met kind dimensie waarden staat bekend als een ouder dimensie waarde.

een waarde van de dochterdimensie kan slechts één waarde van de ouderdimensie hebben. Dimensiewaarden die kinderen zijn van dezelfde ouderdimensie waarde staan bekend als sibling dimensiewaarden. Sibling dimension waarden kunnen niet identiek zijn. Dimensiewaarden die geen broers of zussen zijn, kunnen echter identiek zijn, zelfs binnen dezelfde dimensie.

de dimensiewaarden zonder kinderen staan bekend als de dimensiewaarden voor bladeren. Blad dimensiewaarden bevatten doorgaans informatie over bepaalde producten en diensten. Zo kan een waarde zonder bladdimensie bijvoorbeeld een reeks prijzen vertegenwoordigen en kunnen de waarden met bladdimensie-de kinderen ervan — individuele producten vertegenwoordigen waarvan de prijzen binnen die reeks vallen. De volgende figuur illustreert een eenvoudige dimensie met de naam “wijntype”:

Endeca search

Records kunnen worden georganiseerd in doorzoekbare hiërarchieën door ze te labelen met dimensiewaarden. Records worden meestal gelabeld met bladdimensie waarden, maar kunnen worden gelabeld met niet-blad dimensie waarden voor speciale doeleinden.

het labelen van een record met een dimensie waarde doet de volgende dingen:

  • het specificeert de locatie van de record binnen de bijbehorende dimensie. In het onderstaande voorbeeld worden de Endeca-records voor flessen A en B gelabeld met de waarde van de Rode dimensie in de dimensie van het wijntype, terwijl de Endeca-records voor flessen C en D gelabeld zijn met de waarde van de witte dimensie, enzovoort.
  • het identificeert de record als een geldig resultaat wanneer die dimensiewaarde is geselecteerd in een navigatiequery. In het onderstaande voorbeeld geeft een navigatiequery op de waarde van de Rode dimensie een resultatenreeks aan die flessen A en B. bevat

Endeca-navigatiequery

Endeca-best practices voor zoekopdrachten –

zoekmachines vereisen regelmatig onderhoud zoals auto ‘ s.

  1. nauwkeurige zoekresultaten –
    1. Genereer een lijst met dagelijks gezochte trefwoorden waarvoor Endeca geen resultaten rapporteerde. De lijst kan worden geëxtraheerd uit Endeca engine request log.
    2. alle tekstvelden doorzoekbaar maken zonder ze allemaal deel te maken van de bestaande zoekinterface van Endeca. Alleen de velden/dimensies in de zoekinterface zullen worden doorzocht; degenen die geen deel uitmaken van de zoekinterface zullen nooit deelnemen aan de zoekopdracht, ook al zijn ze geïndexeerd.
    3. gebruik de zoektermen die geen resultaten opleverden die we hebben geïdentificeerd om te verifiëren met alle doorzoekbare tekstvelden.
    4. Genereer een rapport dat de discrepantie toont tussen het tekstveld en de zoekinterface – als de zoekinterface geen resultaten geeft, maar individuele tekstvelden resultaten groter dan 0 retourneren, hebben we met succes de gevallen geïdentificeerd waarin Endeca gebruikers per ongeluk nul resultaten had gegeven.zoektermen voor nulresultaten endeca
    5. de volgende tabel registreert de uitvoer van de bovenstaande stap. Voor alle zoektermen (kolom 1) die niet echt nul resultaten hebben opgeleverd (kolom 5), zijn verdere analyse en actie nodig. Die zoektermen waren in feite niet verondersteld nul resultaten te hebben geproduceerd.
    6. de volgende tabel registreert de uitvoer van de bovenstaande stap. Voor alle zoektermen (kolom 1) die niet echt nul resultaten hebben opgeleverd (kolom 5), zijn verdere analyse en actie nodig. Die zoektermen waren in feite niet verondersteld nul resultaten te hebben geproduceerd.Endeca zero zoekresultaten verificatie
    7. op basis van de bovenstaande bevindingen kunnen we een van de volgende benaderingen gebruiken om het probleem op te lossen:
      • voeg de tekstvelden toe die resultaten hebben opgeleverd aan de bestaande zoekinterface, of
      • kopieer de waarde van het tekstveld dat resultaten heeft opgeleverd naar een van de bestaande velden in de zoekinterface.

      bovendien kunnen partiële match-configuraties ook bijdragen aan zero-hit-scenario ‘ s. Overweeg gevallen waarin gebruikers zoeken naar “krachtige vaatwasser” en “stille koelkast” op een huishoudelijke apparaat website. De standaard Endeca gedeeltelijke match configuratie dicteert dat de resultaten moeten overeenkomen met ten minste 2 woorden (zie screenshot hieronder), die effectief verandert alle zoektermen met twee zoekwoorden in “overeenkomen met alle zoekwoorden.”Als gevolg daarvan, als de website van de retailer niet “krachtig” of “rustig” in zijn product beschrijvingen of titels, geen koelkast of vaatwasser zou verschijnen op de pagina met zoekresultaten van de gebruiker. Retailers kunnen overwegen het afstemmen van gedeeltelijke match om “match ten minste 1 woord” te verminderen nul-hit tarieven.endeca-zoekinterface

  2. efficiënte zoekresultaten-Endeca gebruikt engine cache om resultaten op te slaan die al zijn verwerkt in eerdere verzoeken, wat helpt bij het verbeteren van de zoekprestaties, omdat het voorkomt dat dezelfde Verzoeken herhaaldelijk worden verwerkt. Hoewel het voordelig is om de motorcache te gebruiken om de prestaties te verbeteren, zijn er verschillende dingen om rekening mee te houden:
    • Identificeer de query ‘ s waarvan de resultaten kunnen worden opgeslagen in de cache van de engine request log. Deze query ‘ s worden gebruikt om de motor op te warmen. Bijvoorbeeld, Endeca-aangedreven Top navigatie menu-items zijn over het algemeen gebruikelijk op alle pagina ‘ s. Dit is een goede kandidaat voor resultaten in de cache in plaats van het raken van de motor voor elk verzoek. Een andere goede kandidaat voor caching is Populaire zoekopdrachten. Bijvoorbeeld, voor een elektronica retailer of een warenhuis, sommige populaire vakantie zoekopdrachten kunnen omvatten “Xbox,” “Amazon Echo,” of “black Friday aanbiedingen.”
    • het engine-cachegeheugen moet groot genoeg zijn om resultaten in de cache te bewaren.
    • de motorcache wordt gevalideerd na elke basislijnupdate (volledige vernieuwing van de index), op welk punt de cache moet worden ingevuld (opgewarmd) met behulp van de bovenstaande query ‘ s.
  3. Zoekrelevantie – Endeca-zoekrelevantie wordt sterk beïnvloed door twee belangrijke componenten:
    1. Endeca-zoekinterface-bestaat uit een lijst van doorzoekbare velden van elk record in de index. Hoe meer doorzoekbare velden in een zoekinterface, hoe breder de zoekopdracht. Het tegenovergestelde resulteert in een smalle zoekopdracht.
    2. relevantie ranking modules-out-of-the-box ranking algoritmen die, wanneer geplaatst de een na de ander, produceren de gewenste ranking orders. De meest gebruikte modules zijn::
        • aantal voorwaarden-rangschikt resultaten op basis van het aantal overeenkomende voorwaarden.

        zoekterm: “lekkende gootsteen”

        overeenkomende records:” mijn gootsteen lekt niet meer nadat ik het heb gerepareerd “en”ik heb nog geen asink in mijn keuken geïnstalleerd”

        Ranking: Record 1 is hoger gerangschikt dan record 2 omdat het overeenkwam met alle drie de trefwoorden.

        • Single match vs. cross field match-single field match van alle zoektermen heeft een hogere score dan die overeenkomende cross field.
      1. zoekterm:”populaire bestemmingen voor voorjaarsvakantie”

        overeenkomende records:

        Record 1:

        Titel: “populaire bestemmingen voor voorjaarsvakantie!”

        Description:”Discounted airfare, hotel for spring break…”

        Record 2:

        Title: “What’ s popular for spring break?”

        Description: “These are everyone’ s dream destinations!”

        rangorde: Record 1 is hoger gerangschikt dan record 2 omdat de titel overeenkomt met alle zoekwoorden in de zoekterm.

      2. Sorteer op veldwaarden in oplopende/aflopende volgorde. Populariteit is een goed voorbeeld waarop je dit algoritme kunt toepassen. Het volgende diagram laat zien hoe de relevante componenten samenwerken om de gewenste rangorde te produceren.Endeca-zoekrelevantie

Waarom is het gebruik van Oracle Endeca verminderd?

Oracle is de weg kwijt. Het is achter op de technologiecurve en niet in geslaagd om een dwingende roadmap om de nieuwe eisen van de digitale retail aan te pakken. Endeca was oorspronkelijk een innovatief, open platform gebouwd door enkele van de slimste ingenieurs in de industrie, maar in de loop der jaren heeft Oracle Endeca veranderd in een enorme, stijve “black box” die beperkt is in functionaliteit, pijnlijk moeilijk te veranderen, langzaam te implementeren, duur te onderhouden, en darn near impossible to innovate with.

als u op zoek bent naar een alternatief voor Endeca, kunt u een kijkje nemen op Expertrec ‘ s Endeca alternatief.

Endeca - zoekalternatief-expertrec

gebruik een Endeca-alternatief

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.