Ricerca e navigazione è il più importante nello shopping online. Quando un utente cerca un dato, è importante che i prodotti pertinenti vengano mostrati all’utente entro un breve periodo di tempo. Per fare questo, i manager della società di shopping online dovrebbe essere dato un potente strumento per gestire i diversi aspetti del motore di ricerca.
Questo è ciò che fa Endeca search. Fornisce strumenti proprietari di siti di e-commerce per aiutare a gestire l’esperienza di ricerca sul loro sito web.
Aggiungi ricerca al tuo sito web
Che cos’è Oracle Endeca?
La parola Endeca significa “scoprire”. Endeca, l’azienda è stata fondata nel 1999, e si concentra principalmente su–
- E-commerce.
- Ricerca aziendale.
- Business intelligence.
Nei tradizionali sistemi di query di inventario dell’e-commerce, dovevi iniziare in alto selezionando, ad esempio, vestiti da uomo o vestiti da donna, quindi selezionare da pantaloni da uomo, camicie da uomo, cappotti da uomo e così via. Alla fine, si arrivava ai pantaloni da uomo da 36″ in nero, ma era un percorso molto lineare e “guidato” attraverso i dati. I siti Web che utilizzavano la tecnologia di ricerca di Endeca, al contrario, presentavano un elenco di dimensioni e attributi da un lato e l’utente poteva effettuare qualsiasi selezione da loro per restringere la ricerca. Tutto questo è accaduto alleggerimento-veloce, e con un back-end che è stato molto facile per il cliente per mantenere.
Quindi Endeca si è concentrata prima su questo mercato dell’e-commerce e ha sviluppato il motore MDEX per supportarlo, commercializzandolo come un motore di query a sviluppo rapido e a colonna che consente “ricerche sfaccettate” su molti set di dati diversi, “frastagliati” (cioè set di dati che non hanno lo stesso modello di dati ma con una certa comunanza tra loro).
Una breve introduzione sulle terminologie in Endeca-
Endeca voleva dare ai suoi utenti un modo semplice e facile per interagire e analizzare i dati con un’interfaccia utente semplice da usare, che scala a grandi scale per dati strutturati e non strutturati.
Endeca search soddisfa la necessità degli utenti di cercare, navigare e analizzare i dati di tutte le dimensioni da più fonti di dati. Aiuta anche a tagliare e tagliare a dadi attraverso le dimensioni e il drill-down fino ai minimi dettagli o avere una vista macroscopica dei dati. Inoltre, gli utenti dovrebbero essere in grado di eseguire query di ricerca complesse facilmente.
Oltre a fornire risultati di ricerca per una query, Oracle Endeca guided navigation potrebbe dire agli utenti, i prossimi passi come perfezionare ed esplorare e anche evitare “nessun risultato trovato”. Questi suggerimenti sono ri-classificato e ri-organizzato con ogni clic che aiuta a fornire una migliore esperienza di navigazione utente.
Oracle Endeca Guided Search components
Oracle Endeca Guided Search ha tre componenti principali.
Questi componenti sono:
- Endeca Information Transformation Layer (ITL)
- Endeca MDEX Engine
- Endeca Application Tier
L’Endeca Information Transformation layer (ITL) legge i dati di origine grezzi e li converte in Oracle Endeca MDEX Engine indices. L’ITL è costituito da
- Il sistema di acquisizione dei contenuti.
- Server e console CAS Endeca
- API CAS
- Crawler web Endeca.
- Data Foundry
- Forge (un programma di manipolazione dei dati).
Oracle Endeca MDEX engine –
Che cos’è MDEX e come si confronta con i prodotti Oracle come Oracle Database e Oracle Essbase?
Prima di tutto, vale la pena comprendere gli obiettivi di progettazione alla base di MDEX rispetto, ad esempio, a un cubo Essbase o a un database relazionale Oracle. I database Oracle sono progettati per archiviare molti dati a livello di dettaglio nel modo più efficiente possibile in termini di spazio e con tempi di recupero rapidi per singole righe di dati; I cubi Essbase sono progettati per pre-calcolare e aggregare molti dati a livello di dettaglio e quindi fornirne rapidamente porzioni, facendo forti ipotesi sui percorsi di query che gli utenti prenderanno. MDEX però è stato progettato per supportare Endeca search and discovery utilizza casi, in cui l’utente può cercare e filtrare arbitrariamente, e ottenere viste aggregate veloci restituiti di nuovo a loro. In quanto tale, Endeca posiziona MDEX come un database ibrido di ricerca/analisi progettato per l’analisi di dati diversi e in rapida evoluzione.
Oracle Endeca MDEX engine è il motore di query della ricerca guidata Oracle Endeca. Contiene-
- Indicizzatore (Dgidx).
- Dgraph.
- Agraph
Gli indici generati dal livello ITL vengono caricati tramite il motore MDEX.
Dopo il caricamento dell’indice, il motore MDEX riceve query di ricerca dal livello dell’applicazione, le confronta con l’indice e restituisce risultati rilevanti all’applicazione del browser Web dell’utente.
Il livello dell’applicazione fornisce un’interfaccia al motore MDEX.
Il livello dell’applicazione fornisce un’interfaccia al motore MDEX. Le due interfacce predefinite, che possono essere utilizzate nella stessa applicazione, sono l’API di presentazione e l’interfaccia dei servizi Web.
L’API di presentazione e l’interfaccia dei servizi Web vengono utilizzate per interrogare il motore MDEX e modificare i risultati. I componenti ITL come Forge vengono eseguiti offline in periodi di tempo specifici a seconda delle esigenze aziendali. Il motore MDEX e il livello di applicazione Endeca devono essere online come e quando vuoi che i tuoi clienti accedano ai tuoi dati.
Queste interfacce vengono utilizzate per interrogare il motore MDEX e manipolare i risultati. I componenti Endeca ITL, come Forge, vengono eseguiti offline a intervalli appropriati per le esigenze aziendali. Endeca MDEX Engine e Endeca Application Tier sono entrambi processi online, il che significa che devono rimanere in esecuzione finché si desidera che i client abbiano accesso al set di dati.
Risultati della query del motore Endeca MDEX
Il motore Endeca MDEX restituisce due tipi di informazioni.
- Risultati per una query (un recordset o un singolo record).
- Le informazioni di supporto per la costruzione seguono le query. (Queste informazioni aiutano gli utenti a perfezionare o ampliare le query di ricerca utilizzando facet e filtri.)
Tutti i risultati delle query restituiti dal motore MDEX Endeca contengono due tipi di informazioni. Questi tipi di informazioni sono
- I risultati appropriati per la query (ad esempio, un recordset o un singolo record)
- Le informazioni di supporto per la creazione di query successive Le informazioni di query successive consentono agli utenti di perfezionare o ampliare la query e, di conseguenza, i risultati della query.
Il motore MDEX calcola i risultati di ricerca in modo da evitare vicoli ciechi come “nessun risultato trovato”, fornendo adeguate opzioni di perfezionamento passo successivo.
Questa è una caratteristica fondamentale che differenzia Endeca da altre soluzioni di ricerca.
Due tipi di query
Oracle Endeca Search supporta due tipi di query di ricerca: query di navigazione e query di ricerca per parole chiave.
- Le query di navigazione restituiscono un set di record in base alle caratteristiche dei record definite dall’applicazione (come il tipo o la regione di laptop in un negozio di laptop online), oltre a qualsiasi informazione di query successiva.
- Le query di ricerca per parole chiave restituiscono un insieme di record basati su una parola chiave definita dall’utente, oltre a qualsiasi informazione di query successiva.
Le query di navigazione e le query di ricerca per parole chiave sono complementari. In effetti, una query di ricerca per parole chiave è un tipo speciale di query di navigazione e le strutture dati per i risultati delle due query sono identiche: un insieme di record e di follow-on informazioni di query.
Gli utenti possono eseguire una combinazione di query di navigazione e query di ricerca per parole chiave per navigare al loro record desiderato impostato nel modo che funziona meglio per loro. Ad esempio, gli utenti possono eseguire una query di ricerca per parole chiave per recuperare un set di record, quindi utilizzare una query di navigazione successiva per perfezionare tale set di record. Anche la situazione inversa è valida.
Cosa sono i record Endeca
I record Endeca contengono i dati che gli utenti navigano o cercano.
I record Endeca sono basati su record tradizionali in un database di origine. I record del database di origine contengono in genere informazioni come le bottiglie di vino in un negozio di vini, i record dei clienti in un’applicazione CRM o i fondi comuni di investimento in un valutatore di fondi.
I record del database di origine memorizzano queste informazioni in una o più coppie chiave / valore, note come proprietà. Queste informazioni diventano disponibili per l’applicazione quando si trasformano i record del database di origine in record Endeca. Per trasformare i record del database di origine in record Endeca, è necessario mappare le proprietà del record di origine alle proprietà dei record Endeca.
Pertanto, le dimensioni e i record Endeca corrispondono alle proprietà dei record del database di origine. Come le proprietà dei record di origine, le proprietà Endeca sono coppie chiave / valore. La figura seguente illustra le coppie chiave / valore in un semplice record Endeca:
Un singolo record Endeca può corrispondere a qualsiasi numero di record sorgente. Ad esempio, supponiamo che quattro diversi record di origine si riferiscano allo stesso libro in formati diversi: copertina rigida, brossura, stampa di grandi dimensioni, e audio. È possibile configurare l’applicazione di ricerca guidata per combinare le informazioni contenute in questi quattro record di origine in un unico record Endeca.
Cosa sono le dimensioni e i valori di dimensione Endeca
Le dimensioni sono categorie logiche che consentono di organizzare i record Endeca in strutture che i clienti possono navigare per trovare informazioni sui prodotti o servizi che potrebbero voler acquistare.
Una dimensione è una gerarchia di valori di dimensione. Una dimensione nel suo complesso corrisponde tipicamente a una categoria generale di prodotti o servizi. I valori di dimensione contengono informazioni sempre più specifiche su prodotti e servizi, più sono bassi nella gerarchia.
Il valore di dimensione più alto in una dimensione è noto come radice di dimensione. Una radice di dimensione funge da nome della sua dimensione. Ogni valore di dimensione può avere uno o più valori di dimensione figlio; un valore di dimensione con valori di dimensione figlio è noto come valore di dimensione padre.
Un valore di dimensione figlio può avere un solo valore di dimensione padre. I valori di dimensione figli dello stesso valore di dimensione padre sono noti come valori di dimensione fratelli. I valori di dimensione fratelli non possono essere identici. Tuttavia, i valori di dimensione che non sono fratelli possono essere identici, anche all’interno della stessa dimensione.
I valori di dimensione che non hanno figli sono noti come valori di dimensione foglia. I valori di dimensione foglia in genere contengono informazioni su particolari prodotti e servizi. Ad esempio, un valore di dimensione non foglia potrebbe rappresentare un intervallo di prezzi e i valori di dimensione foglia-i suoi figli — potrebbero rappresentare singoli prodotti i cui prezzi rientrano in tale intervallo. La figura seguente illustra una dimensione semplice denominata “Wine Type”:
I record possono essere organizzati in gerarchie ricercabili taggandoli con valori di dimensione. I record sono in genere contrassegnati con valori di dimensione foglia, ma possono essere contrassegnati con valori di dimensione non foglia per scopi speciali.
Taggare un record con un valore di dimensione fa le seguenti cose:
- Specifica la posizione del record all’interno della dimensione associata. Nell’esempio seguente, i record Endeca per le bottiglie A e B sono contrassegnati con il valore della dimensione Rossa nella dimensione del tipo di vino, mentre i record Endeca per le bottiglie C e D sono contrassegnati con il valore della dimensione bianca e così via.
- Identifica il record come risultato valido quando tale valore di dimensione viene selezionato in una query di navigazione. Nell’esempio seguente, una query di navigazione sul valore della dimensione rossa produce un set di risultati che contiene le bottiglie A e B.
Best practice di ricerca Endeca-
I motori di ricerca richiedono una manutenzione regolare come le automobili.
- Risultati di ricerca accurati–
- Genera un elenco di parole chiave ricercate quotidianamente per le quali Endeca ha riportato zero risultati. L’elenco può essere estratto dal registro delle richieste del motore Endeca.
- Rendi tutti i campi di testo ricercabili senza renderli tutti parte dell’interfaccia di ricerca Endeca esistente. Verranno cercati solo i campi / dimensioni nell’interfaccia di ricerca; quelli che non fanno parte dell’interfaccia di ricerca non parteciperanno mai alla ricerca anche se sono indicizzati.
- Utilizzare i termini di ricerca che hanno prodotto zero risultati che abbiamo identificato per verificare rispetto a tutti i campi di testo ricercabili.
- Genera un report che mostra la discrepanza del conteggio dei risultati tra il campo di testo e l’interfaccia di ricerca – se l’interfaccia di ricerca non restituisce risultati ma i singoli campi di testo restituiscono risultati superiori a 0, abbiamo identificato con successo i casi in cui Endeca aveva erroneamente fornito agli utenti risultati pari a zero.
- La seguente tabella registra l’output del passaggio precedente. Per tutti i termini di ricerca (colonna 1) che NON hanno effettivamente prodotto risultati zero (colonna 5), sono necessarie ulteriori analisi e azioni. Quei termini di ricerca non avrebbero dovuto produrre risultati zero.
- La seguente tabella registra l’output del passaggio precedente. Per tutti i termini di ricerca (colonna 1) che NON hanno effettivamente prodotto risultati zero (colonna 5), sono necessarie ulteriori analisi e azioni. Quei termini di ricerca non avrebbero dovuto produrre risultati zero.
- Sulla base dei risultati di cui sopra, possiamo utilizzare uno dei seguenti approcci per risolvere il problema:
- Aggiungere i campi di testo che hanno restituito i risultati all’interfaccia di ricerca esistente oppure
- Copiare il valore del campo di testo che ha restituito i risultati in uno dei campi esistenti nell’interfaccia di ricerca.
Inoltre, le configurazioni di corrispondenza parziale possono anche contribuire a scenari zero-hit. Considera i casi in cui gli utenti cercano “lavastoviglie potente” e “frigorifero silenzioso” su un sito Web di elettrodomestici. La configurazione Endeca partial match di default impone che i risultati devono corrispondere almeno 2 parole (vedi screenshot qui sotto), che trasforma in modo efficace tutti i termini di ricerca con due parole chiave in “match all keywords.”Di conseguenza, se il sito Web del rivenditore non include” potente “o” silenzioso ” nelle descrizioni o nei titoli dei prodotti, nessun frigorifero o lavastoviglie verrà visualizzato nella pagina dei risultati di ricerca dell’utente. I rivenditori possono prendere in considerazione l’ottimizzazione della corrispondenza parziale in “corrispondenza di almeno 1 parola” per ridurre i tassi di zero-hit.
- Risultati di ricerca efficienti-Endeca utilizza la cache del motore per memorizzare i risultati già elaborati nelle richieste precedenti, il che aiuta a migliorare le prestazioni di ricerca perché evita di elaborare ripetutamente le stesse richieste. Mentre è vantaggioso sfruttare la cache del motore per aumentare le prestazioni, ci sono diverse cose da considerare:
- Identificare le query di cui i risultati possono essere memorizzati nella cache dal registro delle richieste del motore. Queste query verranno utilizzate per riscaldare il motore. Ad esempio, le voci del menu di navigazione superiore alimentate da Endeca sono generalmente comuni in tutte le pagine. Questo è un buon candidato per i risultati memorizzati nella cache piuttosto che colpire il motore per ogni richiesta. Un altro buon candidato per il caching sono le query di ricerca popolari. Ad esempio, per un rivenditore di elettronica o un grande magazzino, alcune query di ricerca vacanza popolare potrebbe includere “Xbox”, “Amazon Echo,” o “offerte Venerdì nero.”
- La memoria cache del motore dovrà essere abbastanza grande da contenere i risultati memorizzati nella cache.
- La cache del motore viene convalidata dopo ogni aggiornamento di base (aggiornamento completo dell’indice), a quel punto la cache deve essere popolata (riscaldata) utilizzando le query identificate sopra.
- Pertinenza della ricerca-La pertinenza della ricerca Endeca è strettamente influenzata da due componenti principali:
- Interfaccia di ricerca Endeca-consiste in un elenco di campi ricercabili da ciascun record nell’indice. I campi più ricercabili inclusi in un’interfaccia di ricerca, più ampia è la ricerca. I risultati opposti in una ricerca ristretta.
- Moduli di classificazione di pertinenza – algoritmi di classificazione pronti all’uso che, una volta posizionati uno dopo l’altro, producono gli ordini di classificazione desiderati. I moduli più utilizzati sono:
-
- Numero di termini-classifica i risultati in base al numero di termini corrispondenti abbinati.
Termine di ricerca: “lavello da cucina che perde”
Record corrispondenti: “il mio lavello da cucina non perde più dopo averlo risolto” e “Non ho ancora installato asink nella mia cucina”
Classifica: il record 1 è classificato più alto del record 2 perché corrisponde a tutte e tre le parole chiave.
- Single match vs. cross field match – partita campo singolo di tutti i termini di ricerca ha un punteggio più alto rispetto a quelli abbinati cross field.
-
Termine di ricerca:”destinazioni popolari per le vacanze di primavera”
Record corrispondenti:
Record 1:
Titolo: “Destinazioni popolari per le vacanze di primavera!”
Descrizione: “Biglietto aereo scontato, hotel per le vacanze di primavera…”
Record 2:
Titolo: “Cosa c’è di popolare per le vacanze di primavera?”
Descrizione: “Queste sono le destinazioni da sogno di tutti!”
Classifica: Record 1 è classificato più alto di record 2 perché il suo titolo corrisponde a tutte le parole chiave nel termine di ricerca.
- ordina per valori di campo in ordine crescente/decrescente. La popolarità è un buon esempio a cui è possibile applicare questo algoritmo. Il diagramma seguente mostra come i componenti di pertinenza lavorano insieme per produrre l’ordine di classificazione desiderato.
-
Perché l’utilizzo di Oracle Endeca si è ridotto?
Oracle ha perso la sua strada. È rimasto indietro rispetto alla curva tecnologica e non è riuscito a fornire una tabella di marcia convincente per affrontare le nuove esigenze della vendita al dettaglio digitale. Endeca era originariamente una piattaforma innovativa e aperta costruita da alcuni dei più brillanti ingegneri del settore, ma nel corso degli anni Oracle ha trasformato Endeca in una massiccia e rigida “scatola nera” che è limitata nella funzionalità, dolorosamente difficile da cambiare, lenta da implementare, costosa da mantenere e dannatamente quasi impossibile da innovare.
Se stai cercando un’alternativa a Endeca, puoi dare un’occhiata all’alternativa Endeca di Expertrec.
Utilizza un’alternativa Endeca