søgning og navigation er det vigtigste i online shopping. Når en bruger søger efter en given, er det vigtigt, at relevante produkter vises til brugeren inden for en kort periode. For at gøre dette skal lederne i online shoppingfirmaet få et kraftfuldt værktøj til at styre de forskellige aspekter af søgemaskinen.
dette er hvad Endeca search gør. Det giver e-handel site ejere værktøjer til at hjælpe med at styre søgeoplevelsen på deres hjemmeside.
Tilføj søgning til din hjemmeside
Hvad er Oracle Endeca?
ordet Endeca betyder”at opdage”. Endeca, virksomheden blev grundlagt i 1999, og det fokuserer primært på–
- e-handel.
- Enterprise søgning.
- Business intelligence.
i traditionelle e-handelsopgørelsesforespørgselssystemer var du nødt til at starte øverst ved at vælge f.eks. Til sidst ville du komme til de 36″ mænds bukser i sort, men det var en meget lineær og “guidet” rute gennem dataene. Hjemmesider, der brugte Endecas søgeteknologi, præsenterede derimod en liste over dimensioner og attributter ned ad den ene side, og brugeren kunne foretage ethvert valg fra dem for at indsnævre deres søgning. Alt dette skete lynhurtigt, og med en back-end, der var meget let for kunden at vedligeholde.
så Endeca fokuserede først på dette e-handelsmarked og udviklede motoren til at understøtte dette og markedsførte den som en kolonne-butik, hurtig udvikling forespørgselsmotor, der tillader “facetterede søgninger” på tværs af mange forskellige, “taggete” datasæt (dvs.datasæt, der ikke har den samme datamodel, men med en vis fælles mellem dem).
en kort introduktion om terminologierne i Endeca-
Endeca ønskede at give sine brugere en enkel og nem måde at interagere med og analysere data med enkel at bruge brugergrænseflade, der skaleres til store skalaer for både strukturerede og ustrukturerede data.
Endeca search henvender sig til brugernes behov for at søge, navigere og analysere data i alle størrelser fra flere datakilder. Det hjælper også med at skære og terninger på tværs af dimensioner og bore ned til de fineste detaljer eller have et makroskopisk billede af dataene. Brugerne skal også være i stand til nemt at udføre komplekse søgeforespørgsler.
ud over at give søgeresultater for en forespørgsel kunne Oracle Endeca guided navigation fortælle brugerne, de næste trin som at raffinere og udforske og også undgå “ingen resultater fundet”. Disse forslag rangeres og omorganiseres med hvert klik, hvilket hjælper med at levere en meget bedre brugernavigationsoplevelse.
Oracle Endeca Guided Search components
Oracle Endeca Guided Search har tre hovedkomponenter.
disse komponenter er:
- Endeca Information Transformation Layer (ITL)
- Endeca Application Tier
Endeca information transformation layer (ITL) læser dine rå kildedata og konverterer til Oracle Endeca motorindeks. ITL består af
- indholdsopsamlingssystemet.
- Endeca CAS-server og konsol
- CAS API
- Endeca.
- Data Foundry
- Forge (et datamanipulationsprogram).
Oracle Endeca engine –
hvad er Oracle, og hvordan sammenlignes det med Oracle-produkter som Oracle Database og Oracle Essbase?
først og fremmest er det værd at forstå designmålene bag MDEKS sammenlignet med f.eks. Oracle-databaser er designet til at gemme masser af data på detaljeniveau på den mest pladseffektive måde og med hurtige hentningstider for individuelle datarækker; Essbase-terninger er designet til at forudberegne og samle masser af data på detaljeniveau og derefter give skiver af det hurtigt, hvilket gør stærke antagelser om de forespørgselsstier, som brugerne vil tage. Men designet til at understøtte Endeca search og discovery bruger sager, hvor brugeren kan søge og filtrere vilkårligt, og få hurtige aggregerede visninger returneres tilbage til dem. Som sådan placerer Endeca MDEKS som en hybrid søgning/analytisk database designet til analyse af forskellige og hurtigt skiftende data.
Oracle Endeca-motoren er forespørgselsmotoren til Oracle Endeca guidet søgning. Den indeholder-
- indekser (DGI).
- Dgraph.
- agraph
de indekser, der genereres af ITL-laget, indlæses gennem MDEKS-motoren.
når indekset er indlæst, modtager motoren søgeforespørgsler fra applikationsniveauet, det matcher dem mod indekset og returnerer relevante resultater til brugerens internetsøgerapplikation.
applikationsniveauet giver en grænseflade til MDEKSMOTOREN.
applikationsniveauet giver en grænseflade til MDEKSMOTOREN. De to standardgrænseflader, der kan bruges i den samme applikation, er præsentations-API ‘ en og internettjenestegrænsefladen.
præsentations-API ‘ en og internettjenestegrænsefladen bruges til at forespørge og ændre resultaterne. ITL-komponenterne som Forge kører offline på bestemte tidsperioder afhængigt af dine forretningsbehov. Endeca – applikationsniveauet skal være online, når og når du vil have dine kunder adgang til dine data.
disse grænseflader bruges til at forespørge motoren og manipulere resultaterne. Endeca ITL-komponenterne, såsom Forge, køres offline med intervaller, der passer til dine forretningsbehov. Endeca Engine og Endeca Application Tier er begge online processer, hvilket betyder, at de skal forblive kørende, så længe du ønsker, at klienter skal have adgang til dit datasæt.
Endeca mdeksmotorforespørgselsresultater
Endeca mdeksmotoren returnerer to typer information.
- resultater for en forespørgsel ( et postsæt eller en enkelt post).
- de understøttende oplysninger til bygning følger på forespørgsler. (Disse oplysninger hjælper brugerne med at forfine eller udvide deres søgeforespørgsler ved hjælp af facetter og filtre.)
alle forespørgselsresultater, der returneres fra Endeca-motoren, indeholder to typer information. Disse informationstyper er
- de relevante resultater for forespørgslen (for eksempel et postsæt eller en individuel post)
- de understøttende oplysninger til opbygning af opfølgningsforespørgsler opfølgningsforespørgselsoplysningerne giver brugerne mulighed for at forfine eller udvide deres forespørgsel og tilsvarende deres forespørgselsresultater.
motoren beregner søgeresultaterne på en måde, der forhindrer blindgyder som “ingen resultater fundet” ved at give passende næste trin raffinement muligheder.
dette er en nøglefunktion, der adskiller Endeca fra andre søgeløsninger.
to typer forespørgsler
Oracle Endeca Search understøtter to typer søgeforespørgsler: navigationsforespørgsler og søgeordssøgninger.
- Navigationsforespørgsler returnerer et sæt poster baseret på applikationsdefinerede rekordegenskaber (såsom bærbar type eller region i en online bærbar butik) plus eventuelle efterfølgende forespørgselsoplysninger.
- søgeordssøgninger returnerer et sæt poster baseret på et brugerdefineret nøgleord plus eventuelle oplysninger om efterfølgende forespørgsler.
Navigationsforespørgsler og søgeordssøgninger supplerer hinanden. Faktisk er en søgeordssøgning en særlig form for navigationsforespørgsel, og datastrukturerne for resultaterne af de to forespørgsler er identiske: et sæt poster og efterfølgende forespørgselsoplysninger.
brugere kan udføre en kombination af navigationsforespørgsler og søgeordssøgninger for at navigere til deres ønskede postsæt på den måde, der fungerer bedst for dem. For eksempel kan brugere udføre en søgeordssøgning for at hente et sæt poster og derefter bruge en efterfølgende navigationsforespørgsel til at forfine det sæt poster. Den omvendte situation er også gyldig.
Hvad er Endeca-poster
Endeca-poster indeholder de data, som brugerne navigerer til eller søger efter.
Endeca-poster er baseret på traditionelle poster i en kildedatabase. Kildedatabaseposter indeholder typisk oplysninger såsom flasker vin i en vinbutik, kundeposter i en CRM-applikation eller gensidige fonde i en fondsevaluator.
Kildedatabaseposter gemmer disse oplysninger i et eller flere nøgle – /værdipar, kendt som egenskaber. Disse oplysninger bliver tilgængelige for din applikation, når du omdanner kildedatabaseposterne til Endeca-poster. Hvis du vil omdanne kildedatabaseposterne til Endeca-poster, skal du knytte kildepostegenskaberne til Egenskaber for Endeca-poster.
dimensioner og Endeca-poster svarer således til egenskaberne for kildedatabaseposter. Ligesom kildepostegenskaber er Endeca-egenskaber nøgle / værdipar. Følgende figur illustrerer nøgle / værdipar i en simpel Endeca-post:
en enkelt Endeca-post kan svare til et vilkårligt antal kildeposter. Antag for eksempel, at fire forskellige kildeposter henviser til den samme bog i forskellige formater: indbundet, paperback, stort print og lyd. Du kan konfigurere dit guidede søgeprogram til at kombinere oplysningerne i disse fire kildeposter i en enkelt Endeca-post.
Hvad er Endeca-dimensioner og dimensionsværdier
dimensioner er logiske kategorier, der gør det muligt at organisere dine Endeca-poster i strukturer, som kunderne kan navigere igennem for at finde oplysninger om produkter eller tjenester, som de måske vil købe.
en dimension er et hierarki af dimensionsværdier. En dimension som helhed svarer typisk til en generel kategori af produkter eller tjenester. Dimensionsværdier indeholder stadig mere specifik information om produkter og tjenester, jo lavere er de i hierarkiet.
den øverste dimensions værdi i en dimension er kendt som dimensionens rod. En dimension rod tjener som navnet på dens dimension. Hver dimension værdi kan have en eller flere underordnede dimension værdier; en dimension værdi med underordnede dimension værdier er kendt som en overordnet dimension værdi.
en underordnet dimensions værdi kan kun have en overordnet dimensions værdi. Dimension værdier, der er børn af samme overordnede dimension værdi er kendt som søskende dimension værdier. Søskendedimensionsværdier kan ikke være identiske. Imidlertid kan dimensionsværdier, der ikke er søskende, være identiske, selv inden for den samme dimension.
de dimensionsværdier, der ikke har børn, er kendt som bladdimensionsværdier. Leaf dimension værdier indeholder typisk oplysninger om bestemte produkter og tjenester. For eksempel kan en værdi, der ikke er bladdimension, repræsentere en række priser, og værdierne for bladdimension-dets børn — kan repræsentere individuelle produkter, hvis priser falder inden for dette interval. Følgende figur illustrerer en simpel dimension med navnet”vintype”:
Records kan organiseres i søgbare hierarkier ved at mærke dem med dimensionsværdier. Poster er typisk mærket med bladdimensionsværdier, men kan mærkes med ikke-bladdimensionsværdier til specielle formål.
Tagging af en post med en dimensionsværdi gør følgende ting:
- det angiver placeringen af posten inden for den tilknyttede dimension. I eksemplet nedenfor, Endeca-posterne for flasker A og B er mærket med den røde dimensions værdi i vintypedimensionen, mens Endeca-posterne for flasker C og D er mærket med den hvide dimensions værdi, og så videre.
- den identificerer posten som et gyldigt resultat, når dimensionsværdien er valgt i en navigationsforespørgsel. I eksemplet nedenfor producerer en navigationsforespørgsel på den røde dimensions værdi et resultatsæt, der indeholder flasker A og B.
Endeca search best practices-
søgemaskiner kræver regelmæssig vedligeholdelse som biler.
- nøjagtige søgeresultater–
- Generer en liste over daglige søgte søgeord, som Endeca rapporterede nul resultater. Listen kan udvindes fra Endeca motor anmodning log.
- gør alle tekstfelter søgbare uden at gøre dem alle til en del af den eksisterende endecas søgegrænseflade. Kun felterne/dimensionerne i søgegrænsefladen søges; dem, der ikke er en del af søgegrænsefladen, vil aldrig deltage i søgning, selvom de er indekseret.
- Brug de søgetermer, der gav nul resultater, vi har identificeret, til at verificere i forhold til alle søgbare tekstfelter.
- Generer en rapport, der viser uoverensstemmelsen mellem resultattællingen mellem tekstfeltet og søgegrænsefladen – hvis søgegrænsefladen ikke returnerer resultater, men individuelle tekstfelter returnerer resultater, der er større end 0, har vi med succes identificeret de tilfælde, hvor Endeca fejlagtigt havde givet brugerne nul resultater.
- følgende tabel registrerer output fra ovenstående trin. For alle søgetermer (kolonne 1), der ikke rigtig gav nulresultater (kolonne 5), er der behov for yderligere analyse og handling. Disse søgeudtryk skulle faktisk ikke have givet nul resultater.
- følgende tabel registrerer output fra ovenstående trin. For alle søgetermer (kolonne 1), der ikke rigtig gav nulresultater (kolonne 5), er der behov for yderligere analyse og handling. Disse søgeudtryk skulle faktisk ikke have givet nul resultater.
- baseret på ovenstående fund kan vi bruge en af følgende tilgange til at løse problemet:
- Føj de tekstfelter, der returnerede resultater, til den eksisterende søgegrænseflade, eller
- Kopier værdien af det tekstfelt, der returnerede resultater, til et af de eksisterende felter i søgegrænsefladen.
derudover kan delvise matchkonfigurationer også bidrage til nul-hit scenarier. Overvej tilfælde, hvor brugerne søger efter “kraftig opvaskemaskine” og “stille køleskab” på et hjem apparat hjemmeside. Standard Endeca delvis matchkonfiguration dikterer, at resultaterne skal matche mindst 2 ord (se skærmbillede nedenfor), som effektivt forvandler alle søgeudtryk med to nøgleord til “match alle nøgleord.”Som følge heraf, hvis forhandlerens hjemmeside ikke indeholder “kraftig” eller “stille” i sine produktbeskrivelser eller titler, vil der ikke opstå køleskab eller opvaskemaskine på brugerens søgeresultatside. Detailhandlere kan overveje at indstille delvis match til” match mindst 1 ord ” for at reducere nul-hit-satser.
- effektive søgeresultater-Endeca bruger motorcache til at gemme resultater, der allerede blev behandlet i tidligere anmodninger, hvilket hjælper med at forbedre søgeydelsen, fordi det undgår at behandle de samme anmodninger gentagne gange. Selvom det er fordelagtigt at udnytte motorcache for at øge ydeevnen, er der flere ting at overveje:
- Identificer de forespørgsler, som resultater kan cachelagres fra motoranmodningsloggen. Disse forespørgsler vil blive brugt til at varme op motoren. For eksempel er Endeca-drevne topnavigationsmenupunkter generelt almindelige på tværs af alle sider. Dette er en god kandidat til cachelagrede resultater i stedet for at ramme motoren for hver anmodning. En anden god kandidat til caching er populære søgeforespørgsler. For eksempel, for en elektronikforhandler eller et stormagasin, nogle populære feriesøgningsforespørgsler kan omfatte “f.eks.”
- motorens cachehukommelse skal være stor nok til at indeholde cachede resultater.
- motorcachen valideres efter hver baseline-opdatering (fuld opdatering af indekset), hvorefter cachen skal udfyldes (opvarmes) ved hjælp af de forespørgsler, der er identificeret ovenfor.
- Søg relevans-Endeca søg relevans er tæt påvirket af to hovedkomponenter:
- Endeca søgegrænseflade – består af en liste over søgbare felter fra hver post i indekset. Jo mere søgbare felter, der er inkluderet i en søgegrænseflade, jo bredere er søgningen. Det modsatte resulterer i en smal søgning.
- relevans ranking moduler – out-of-the-boks ranking algoritmer, der, når de placeres efter hinanden, producere de ønskede ranking ordrer. De mest anvendte moduler er:
-
- antal vilkår-rangerer resultater baseret på antallet af matchede matchede vilkår.
søgeudtryk: “lækker køkkenvask”
matchende poster: “min køkkenvask lækker ikke længere, efter at jeg har rettet den” og “jeg har endnu ikke installeret asink i mit køkken endnu”
Ranking: Record 1 er rangeret højere end record 2, fordi den matchede alle tre nøgleord.
- Single match vs. cross field match – single field match af alle søgetermer har en højere score end de matchede cross felt.
-
søgeudtryk: “populære spring break destinationer”
matchende poster:
optag 1:
Titel: “populære destinationer for spring break!”
beskrivelse: “rabat flybillet, hotel til spring break…”
rekord 2:
Titel: “Hvad er populært for spring break?”
Beskrivelse: “Disse er alles drøm destinationer!”
placering: Rekord 1 rangeres højere end rekord 2, fordi dens titel matchede alle nøgleord i søgeudtrykket.
- Sorter efter feltværdier i stigende/faldende rækkefølge. Popularitet er et godt eksempel, som du kan anvende denne algoritme på. Følgende diagram viser, hvordan relevanskomponenterne arbejder sammen for at producere den ønskede rangordningsrækkefølge.
-
hvorfor reducerede brugen af Oracle Endeca?
Oracle har mistet sin vej. Det er faldet bag teknologikurven og har ikke leveret en overbevisende køreplan for at imødekomme de nye krav fra digital Detailhandel. Endeca var oprindeligt en innovativ, åben platform bygget af nogle af de lyseste ingeniører i branchen, men gennem årene har Oracle forvandlet Endeca til en massiv, stiv “sort boks”, der er begrænset i funktionalitet, smerteligt svært at ændre, langsom at implementere, dyr at vedligeholde og darn næsten umulig at innovere med.
hvis du leder efter et alternativ til Endeca, kan du se på Ekspertrecs Endeca-alternativ.
brug et Endeca alternativ