[Oracle] Endeca Search

căutarea și navigarea sunt cele mai importante în cumpărăturile online. Atunci când un utilizator caută un anumit lucru, este important ca produsele relevante să fie afișate utilizatorului într-o perioadă scurtă de timp. Pentru a face acest lucru, managerii din compania de cumpărături online ar trebui să primească un instrument puternic pentru a gestiona diferitele aspecte ale motorului de căutare.

aceasta este ceea ce face Endeca search. Oferă proprietarilor de site-uri de comerț electronic instrumente pentru a ajuta la gestionarea experienței de căutare pe site-ul lor web.

oracle endeca

adăugați căutare pe site-ul dvs.

ce este Oracle Endeca?

Cuvântul Endeca înseamnă „a descoperi”. Endeca, compania a fost fondată în 1999, și se concentrează în principal pe–

  1. comerț electronic.
  2. căutare întreprindere.
  3. business intelligence.

în sistemele tradiționale de interogare a inventarului de comerț electronic, a trebuit să începeți din partea de sus selectând, să zicem, haine pentru bărbați sau haine pentru femei, apoi selectați dintre Pantaloni pentru bărbați, cămăși pentru bărbați, Paltoane pentru bărbați și așa mai departe. În cele din urmă, veți ajunge la pantalonii bărbați de 36″ în negru, dar a fost un traseu foarte liniar și „ghidat” prin date. Site-urile web care au folosit tehnologia de căutare Endeca, în schimb, au prezentat o listă de dimensiuni și atribute pe o parte, iar utilizatorul ar putea face orice selecție din ele pentru a-și restrânge căutarea. Toate acestea s-au întâmplat rapid și cu un back-end care a fost foarte ușor de întreținut pentru client.

Endeca s-a concentrat mai întâi pe această piață de comerț electronic și a dezvoltat motorul MDEX pentru a sprijini acest lucru, comercializându-l ca un motor de interogare cu magazin de coloane, cu dezvoltare rapidă, care permite „căutări fațetate” pe o mulțime de seturi de date diferite, „zimțate” (adică seturi de date care nu au același model de date, dar cu o oarecare comunitate între ele).

o scurtă introducere despre terminologiile din Endeca-

Endeca a dorit să ofere utilizatorilor săi o modalitate simplă și ușoară de a interacționa și de a analiza datele cu o interfață de utilizator simplă de utilizat, care se scalează la scări mari atât pentru datele structurate, cât și pentru cele nestructurate.

Endeca search satisface nevoia utilizatorilor de a căuta, naviga și analiza date de toate dimensiunile din mai multe surse de date. De asemenea, ajută la felie și zaruri peste dimensiuni și de foraj până la cele mai fine detalii sau având o vedere macroscopică a datelor. De asemenea, utilizatorii ar trebui să poată efectua cu ușurință interogări complexe de căutare.

pe lângă faptul că oferă rezultate de căutare pentru o interogare, navigarea ghidată Oracle Endeca ar putea spune utilizatorilor, următorii pași precum rafinarea și explorarea și, de asemenea, evitarea „fără rezultate găsite”. Aceste sugestii sunt re-clasat și re-organizat cu fiecare clic care ajută la furnizarea de o experiență de navigare mult mai bine de utilizator.

Oracle Endeca Guided search components

Oracle Endeca Guided Search are trei componente majore.

aceste componente sunt:

  • Endeca Information Transformation Layer (ITL)
  • Endeca MDEX Engine
  • Endeca Application Tier

 Oracle Endeca guided search components

Endeca information transformation layer (ITL) citește datele sursă brute și se convertește în indicii motorului Oracle Endeca MDEX. ITL este format din

  1. sistemul de achiziție de conținut.
    1. Endeca CAS server și consolă
    2. CAS API
    3. Endeca web crawler.
  2. turnătorie de date
    1. Forge (un program de manipulare a datelor).
Oracle Endeca MDEX engine –

ce este MDEX și cum se compară cu produsele Oracle, cum ar fi Oracle Database și Oracle Essbase?

în primul rând, merită să înțelegeți obiectivele de proiectare din spatele MDEX în comparație cu, să zicem, un cub Essbase sau o bază de date relațională Oracle. Bazele de date Oracle sunt concepute pentru a stoca o mulțime de date la nivel de detaliu în cel mai eficient mod posibil din punct de vedere spațial și cu timpi de recuperare rapizi pentru rânduri individuale de date; Cuburile Essbase sunt concepute pentru a pre-calcula și agrega o mulțime de date la nivel de detaliu și apoi pentru a furniza rapid felii, făcând presupuneri puternice despre căile de interogare pe care le vor lua utilizatorii. MDEX deși a fost conceput pentru a sprijini Endeca căutare și descoperire utilizează cazuri, în cazul în care utilizatorul poate căuta și filtra în mod arbitrar, și de a lua rapid opinii agregate întors înapoi la ei. Ca atare, Endeca poziționează MDEX ca o bază de date hibridă de căutare / analiză concepută pentru analiza datelor diverse și în schimbare rapidă.

motorul Oracle Endeca MDEX este motorul de interogare al căutării ghidate Oracle Endeca. Acesta conține-

  1. indexator (Dgidx).
  2. Dgraph.
  3. Agraph

indicii generați de stratul ITL sunt încărcați prin motorul MDEX.

după încărcarea indexului, motorul MDEX primește interogări de căutare din nivelul aplicației, le potrivește cu indexul și returnează rezultatele relevante aplicației browserului web al utilizatorului.

nivelul aplicației oferă o interfață pentru motorul MDEX.

nivelul aplicației oferă o interfață pentru motorul MDEX. Cele două interfețe implicite, care pot fi utilizate în aceeași aplicație, sunt API-ul de prezentare și interfața serviciilor Web.

API-ul de prezentare și interfața web services sunt utilizate pentru a interoga motorul MDEX și a modifica rezultatele. Componentele ITL, cum ar fi Forge rula offline la anumite perioade de timp, în funcție de nevoile dvs. de afaceri. Motorul MDEX și nivelul aplicației Endeca trebuie să fie online ca și când doriți ca clienții dvs. să vă acceseze datele.

aceste interfețe sunt folosite pentru a interoga motorul MDEX și manipula rezultatele. Componentele Endeca ITL, cum ar fi Forge, sunt rulate offline la intervale adecvate cerințelor dvs. de afaceri. Endeca MDEX Engine și Endeca Application Tier sunt ambele procese online, ceea ce înseamnă că trebuie să rămână în funcțiune atâta timp cât doriți ca clienții să aibă acces la setul dvs. de date.

rezultatele interogării motorului Endeca MDEX

motorul Endeca MDEX returnează două tipuri de informații.

  1. rezultate pentru o interogare (un set de înregistrări sau o singură înregistrare).
  2. informațiile de sprijin pentru construirea urmează pe interogări. (Aceste informații ajută utilizatorii să-și perfecționeze sau să-și extindă interogările de căutare folosind fațete și filtre.)

toate rezultatele interogării returnate de la motorul Endeca MDEX conțin două tipuri de informații. Aceste tipuri de informații sunt

  • rezultatele corespunzătoare pentru interogare (de exemplu, un set de înregistrări sau o înregistrare individuală)
  • informațiile justificative pentru construirea interogărilor de urmărire informațiile de interogare de urmărire permit utilizatorilor să își perfecționeze sau să își extindă interogarea și, în mod corespunzător, rezultatele interogării.

motorul MDEX calculează rezultatele căutării într-un mod astfel încât să prevină fundături, cum ar fi „niciun rezultat găsit”, oferind opțiuni adecvate de rafinare a pasului următor.

aceasta este o caracteristică cheie care diferențiază Endeca de alte soluții de căutare.

două tipuri de interogări

Oracle Endeca Search acceptă două tipuri de interogări de căutare: interogări de navigare și interogări de căutare de cuvinte cheie.

  • interogările de navigare returnează un set de înregistrări pe baza caracteristicilor de înregistrare definite de aplicație (cum ar fi tipul sau regiunea laptopului dintr-un magazin online de laptopuri), plus orice informație de interogare ulterioară.
  • interogările de căutare a cuvintelor cheie returnează un set de înregistrări bazate pe un cuvânt cheie definit de utilizator, plus orice informație de interogare ulterioară.

interogările de navigare și interogările de căutare a cuvintelor cheie sunt complementare. De fapt, o interogare de căutare a cuvintelor cheie este un tip special de interogare de navigare, iar structurile de date pentru rezultatele celor două interogări sunt identice: un set de înregistrări și informații de interogare de urmărire.

utilizatorii pot executa o combinație de interogări de navigare și interogări de căutare de cuvinte cheie pentru a naviga la înregistrarea dorită stabilită în modul care funcționează cel mai bine pentru ei. De exemplu, utilizatorii pot executa o interogare de căutare a cuvintelor cheie pentru a prelua un set de înregistrări, apoi pot utiliza o interogare de navigare ulterioară pentru a rafina acel set de înregistrări. Situația inversă este, de asemenea, valabilă.

ce sunt înregistrările Endeca

înregistrările Endeca conțin datele pe care utilizatorii le navighează sau le caută.

înregistrările Endeca se bazează pe înregistrările tradiționale dintr-o bază de date sursă. Înregistrările bazei de date sursă conțin de obicei informații precum sticlele de vin dintr-un magazin de vinuri, înregistrările clienților într-o aplicație CRM sau fondurile mutuale dintr-un evaluator de fonduri.

înregistrările bazei de date sursă stochează aceste informații într-una sau mai multe perechi cheie/valoare, cunoscute sub numele de proprietăți. Aceste informații devin disponibile pentru aplicația dvs. atunci când transformați înregistrările bazei de date sursă în înregistrări Endeca. Pentru a transforma înregistrările bazei de date sursă în înregistrări Endeca, trebuie să mapați proprietățile înregistrării sursă la proprietățile înregistrărilor Endeca.

astfel, dimensiunile și înregistrările Endeca corespund proprietăților înregistrărilor bazei de date sursă. La fel ca proprietățile de înregistrare sursă, proprietățile Endeca sunt perechi cheie/valoare. Următoarea figură ilustrează perechi cheie / valoare într-o înregistrare Endeca simplă:

endeca recordo singură înregistrare Endeca poate corespunde oricărui număr de înregistrări sursă. De exemplu, să presupunem că patru înregistrări sursă diferite se referă la aceeași carte în formate diferite: hardcover, paperback, imprimare mare și audio. Puteți configura aplicația de căutare ghidată pentru a combina informațiile din aceste patru înregistrări sursă într-o singură înregistrare Endeca.

ce sunt dimensiunile și valorile dimensiunii Endeca

dimensiunile sunt categorii logice care fac posibilă organizarea înregistrărilor Endeca în structuri prin care clienții pot naviga pentru a găsi informații despre produsele sau serviciile pe care ar putea dori să le achiziționeze.

o dimensiune este o ierarhie a valorilor dimensiunii. O dimensiune în ansamblu corespunde de obicei unei categorii generale de produse sau servicii. Valorile dimensiunii conțin informații din ce în ce mai specifice despre produse și servicii, cu cât sunt mai mici în ierarhie.

valoarea de dimensiune cea mai de sus într-o dimensiune este cunoscută sub numele de rădăcină Dimensiune. O rădăcină de dimensiune servește ca nume al dimensiunii sale. Fiecare valoare dimensiune poate avea una sau mai multe valori Dimensiune copil; o valoare dimensiune cu valori Dimensiune copil este cunoscut ca o valoare dimensiune părinte.

o valoare a dimensiunii copil poate avea o singură valoare a dimensiunii părinte. Valorile dimensiunii care sunt copii cu aceeași valoare a dimensiunii părinte sunt cunoscute sub numele de valori ale dimensiunii frate. Valorile dimensiunii fraților nu pot fi identice. Cu toate acestea, valorile dimensiunii care nu sunt frați pot fi identice, chiar și în cadrul aceleiași dimensiuni.

valorile dimensiunii care nu au copii sunt cunoscute ca valori ale dimensiunii frunzelor. Valorile dimensiunii frunzelor conțin de obicei informații despre anumite produse și servicii. De exemplu, o valoare a dimensiunii non — leaf ar putea reprezenta o gamă de prețuri, iar valorile dimensiunii leaf — copiii săi-ar putea reprezenta produse individuale ale căror prețuri se încadrează în intervalul respectiv. Următoarea figură ilustrează o dimensiune simplă numită „tip de vin”:

Endeca search

înregistrările pot fi organizate în ierarhii căutabile prin etichetarea lor cu valori de dimensiune. Înregistrările sunt de obicei etichetate cu valori de dimensiune frunze, dar pot fi etichetate cu valori de dimensiune non-frunze pentru scopuri speciale.

etichetarea unei înregistrări cu o valoare de dimensiune face următoarele lucruri:

  • specifică locația înregistrării în cadrul dimensiunii asociate. În exemplul de mai jos, înregistrările Endeca pentru sticlele a și B sunt etichetate cu valoarea dimensiunii roșii în dimensiunea tipului de vin, în timp ce înregistrările Endeca pentru sticlele C și D sunt etichetate cu valoarea dimensiunii albe și așa mai departe.
  • identifică înregistrarea ca rezultat valid atunci când valoarea parametrului este selectată într-o interogare de navigare. În exemplul de mai jos, o interogare de navigare pe valoarea dimensiunii roșii produce un set de rezultate care conține sticlele a și B.

endeca navigation query

Endeca search best practices-

motoarele de căutare necesită întreținere regulată, cum ar fi mașinile.

  1. rezultate exacte ale căutării–
    1. generați o listă de cuvinte cheie căutate zilnic pentru care Endeca a raportat rezultate zero. Lista poate fi extrasă din Endeca engine request log.
    2. faceți ca toate câmpurile de text să poată fi căutate fără a le face pe toate parte din interfața de căutare Endeca existentă. Numai câmpurile / dimensiunile din interfața de căutare vor fi căutate; cele care nu fac parte din interfața de căutare nu vor participa niciodată la căutare, chiar dacă sunt indexate.
    3. utilizați termenii de căutare care au produs zero rezultate pe care le-am identificat pentru a verifica toate câmpurile de text care pot fi căutate.
    4. generați un raport care arată discrepanța numărului de rezultate dintre câmpul text și interfața de căutare – dacă interfața de căutare nu returnează rezultate, dar câmpurile de text individuale returnează rezultate mai mari de 0, am identificat cu succes cazurile în care Endeca a furnizat în mod eronat utilizatorilor rezultate zero. rezultate zero Termeni de căutare endeca
    5. următorul tabel înregistrează rezultatul pasului de mai sus. Pentru toți termenii de căutare (coloana 1) care nu au produs cu adevărat rezultate zero (coloana 5), sunt necesare analize și acțiuni suplimentare. Acești Termeni de căutare nu ar fi trebuit să producă rezultate zero.
    6. următorul tabel înregistrează rezultatul pasului de mai sus. Pentru toți termenii de căutare (coloana 1) care nu au produs cu adevărat rezultate zero (coloana 5), sunt necesare analize și acțiuni suplimentare. Acești Termeni de căutare nu ar fi trebuit să producă rezultate zero. endeca zero verificarea rezultatelor căutării
    7. pe baza constatărilor de mai sus, putem folosi una dintre următoarele abordări pentru a rezolva problema:
      • adăugați câmpurile de text care au returnat rezultatele la interfața de căutare existentă sau
      • copiați valoarea câmpului de text care a returnat rezultatele la unul dintre câmpurile existente din interfața de căutare.

      în plus, configurațiile parțiale ale meciurilor pot contribui, de asemenea, la scenarii cu lovituri zero. Luați în considerare cazurile în care utilizatorii caută „mașină de spălat vase puternică” și „frigider liniștit” pe un site web pentru electrocasnice. Configurația implicită de potrivire parțială Endeca dictează că rezultatele trebuie să se potrivească cu cel puțin 2 cuvinte (a se vedea captura de ecran de mai jos), care transformă efectiv toți termenii de căutare cu două cuvinte cheie în „potriviți toate cuvintele cheie.”Ca urmare, dacă site-ul comerciantului nu include” puternic „sau” liniștit ” în descrierile sau titlurile produselor sale, Niciun frigider sau mașină de spălat vase nu va apărea pe pagina cu rezultatele căutării utilizatorului. Comercianții cu amănuntul pot lua în considerare reglarea potrivirii parțiale pentru a „potrivi cel puțin 1 cuvânt” pentru a reduce ratele de succes zero.interfață de căutare endeca

  2. rezultate de căutare eficiente-Endeca utilizează memoria cache a motorului pentru a stoca rezultatele care au fost deja procesate în cererile anterioare, ceea ce ajută la îmbunătățirea performanței căutării, deoarece evită procesarea acelorași solicitări în mod repetat. Deși este avantajos să folosiți memoria cache a motorului pentru a spori performanța, există mai multe lucruri de luat în considerare:
    • identificați interogările ale căror rezultate pot fi memorate în cache din jurnalul de solicitări al motorului. Aceste interogări vor fi folosite pentru a încălzi motorul. De exemplu, elementele de meniu de navigare de top alimentate de Endeca sunt în general comune pe toate paginile. Acesta este un candidat bun pentru rezultatele cache, mai degrabă decât lovirea motorului pentru fiecare cerere. Un alt candidat bun pentru cache este interogările de căutare populare. De exemplu, pentru un retailer de electronice sau un magazin universal, unele interogări populare de căutare de vacanță ar putea include „Xbox”, „Amazon Echo” sau „oferte de black Friday.”
    • memoria cache a motorului va trebui să fie suficient de mare pentru a ține rezultatele în cache.
    • memoria cache a motorului este validată după fiecare actualizare de bază (reîmprospătare completă a indexului), moment în care memoria cache trebuie să fie populată (încălzită) folosind interogările identificate mai sus.
  3. relevanța căutării-relevanța căutării Endeca este strâns influențată de două componente majore:
    1. Endeca search interface – constă dintr-o listă de câmpuri care pot fi căutate din fiecare înregistrare din index. Câmpurile mai căutate incluse într-o interfață de căutare, mai larg de căutare. Opusul are ca rezultat o căutare îngustă.
    2. module de clasare a relevanței – algoritmi de clasare out-of-the-box care, atunci când sunt plasați unul după altul, produc comenzile de clasare dorite. Cele mai frecvent utilizate module sunt:
        • număr de termeni-clasează Rezultatele pe baza numărului de termeni potriviți potriviți.

        termen de căutare: „scurgeri chiuveta de bucatarie”

        înregistrări de potrivire: „chiuveta mea de bucatarie nu se mai scurge după ce l-am fixat” și „nu am instalat încă asink în bucătăria mea încă”

        clasament: înregistrare 1 este clasat mai mare decât înregistrare 2, deoarece potrivit toate cele trei cuvinte cheie.

        • Single match vs.cross Field match – un singur meci de câmp a tuturor termenilor de căutare are un scor mai mare decât cele potrivite cross field.
      1. termen de căutare:”destinații populare pentru vacanța de primăvară”

        înregistrări potrivite:

        înregistrare 1:

        Titlu: „destinații populare pentru vacanța de primăvară!”

        descriere: „bilete de avion reduse, hotel pentru vacanța de primăvară…”

        Record 2:

        Titlu: „ce este popular pentru vacanța de primăvară?”

        Descriere: „acestea sunt destinațiile de vis ale tuturor!”

        clasament: Înregistrarea 1 este clasată mai sus decât înregistrarea 2, deoarece titlul său se potrivea cu toate cuvintele cheie din termenul de căutare.

      2. Sortează după valorile câmpului în ordine crescătoare/descrescătoare. Popularitatea este un bun exemplu la care puteți aplica acest algoritm. Următoarea diagramă demonstrează modul în care componentele de relevanță lucrează împreună pentru a produce ordinea de clasare dorită.Endeca relevanta cautarii

de ce s-a redus utilizarea Oracle Endeca?

Oracle și-a pierdut drumul. A rămas în urma curbei tehnologice și nu a reușit să ofere o foaie de parcurs convingătoare pentru a răspunde noilor cerințe ale comerțului cu amănuntul digital. Endeca a fost inițial o platformă inovatoare, deschisă, construită de unii dintre cei mai străluciți ingineri din industrie, dar de-a lungul anilor Oracle a transformat Endeca într-o „cutie neagră” masivă și rigidă, care este limitată în funcționalitate, dureros de greu de schimbat, lent de implementat, costisitor de întreținut și aproape imposibil de inovat.

dacă sunteți în căutarea unei alternative la Endeca, puteți arunca o privire la Endeca alternative de la Expertrec.

 Endeca alternativă de căutare-expertrec

utilizați o alternativă Endeca

Lasă un răspuns

Adresa ta de email nu va fi publicată.