a pesquisa e a navegação são as mais importantes nas compras online. Quando um usuário procura por um dado, é importante que os produtos relevantes sejam mostrados ao usuário dentro de um curto período de tempo. Para fazer isso, os gerentes da empresa de compras on-line devem receber uma ferramenta poderosa para gerenciar os diferentes aspectos do mecanismo de pesquisa.
é isso que a Endeca search faz. Ele fornece ferramentas de proprietários de sites de comércio eletrônico para ajudar a gerenciar a experiência de pesquisa em seu site.
Adicionar pesquisa ao seu site
o que é o Oracle Endeca?
A Palavra Endeca significa “descobrir”. Endeca, a empresa foi fundada em 1999, e centra-se principalmente em–
- E-Commerce.
- pesquisa empresarial.
- Business intelligence.
nos sistemas tradicionais de consulta de inventário de comércio eletrônico, você teve que começar no topo selecionando, digamos, roupas masculinas ou femininas, depois selecione entre calças masculinas, camisas masculinas, Casacos masculinos e assim por diante. Eventualmente, você chegaria às 36 ” calças masculinas de preto, mas era uma rota muito linear e “guiada” pelos dados. Os sites que usaram a tecnologia de busca da Endeca, por outro lado, apresentaram uma lista de dimensões e atributos de um lado, e o usuário poderia fazer qualquer seleção deles para restringir sua pesquisa. Tudo isso aconteceu relâmpago-rápido, e com um back-end que foi muito fácil para o cliente manter.
Então Endeca focado em este endereço de e-commerce do mercado de primeira, e desenvolveu o MDEX mecanismo para dar suporte a isso, o marketing é como uma coluna da loja, o rápido desenvolvimento de mecanismo de consulta que permite “lapidado” pesquisas através de muitas diferentes, “irregulares” conjuntos de dados (i.e. conjuntos de dados que não têm o mesmo modelo de dados, mas com alguns aspectos comuns entre eles).
Uma breve introdução sobre as terminologias em Endeca-
Endeca queria dar aos seus usuários uma forma simples e fácil de interagir e analisar dados com o simples de usar interface do Usuário, que se adapta a grande escala, tanto dados estruturados e não estruturados.
Endeca search atende à necessidade dos usuários de pesquisar, navegar e analisar dados de todos os tamanhos de várias fontes de dados. Também ajuda a cortar e cortar em dimensões e perfurar até os melhores detalhes ou ter uma visão macroscópica dos dados. Além disso, os usuários devem ser capazes de realizar consultas de pesquisa complexas facilmente.
além de fornecer resultados de pesquisa para uma consulta, o Oracle Endeca guided navigation poderia informar aos usuários, os próximos passos como refinar e explorar e também evitar “nenhum resultado encontrado”. Essas sugestões são reorganizadas e reorganizadas a cada clique, o que ajuda a oferecer uma experiência de navegação do usuário muito melhor.
Oracle Endeca Guided Search components
Oracle Endeca Guided Search tem três componentes principais.
estes componentes são:
- Endeca Information Transformation Layer (ITL)
- Endeca MDEX Engine
- Endeca Application Tier
a camada de transformação de informações Endeca (ITL) lê seus dados de origem brutos e converte em Índices do Oracle Endeca MDEX engine. O ITL consiste em
- o sistema de aquisição de conteúdo.
- Endeca CAS server and console
- CAS API
- Endeca web crawler.
- fundição de dados
- Forge (UM programa de manipulação de dados).
Oracle Endeca MDEX engine-
o que é MDEX e como ele se compara a produtos Oracle como Oracle Database e Oracle Essbase?Antes de tudo, vale a pena entender os objetivos de design por trás do MDEX em comparação com, digamos, um Essbase cube ou um banco de dados relacional Oracle. Os bancos de dados Oracle são projetados para armazenar muitos dados de nível de detalhes da maneira mais eficiente possível e com tempos de recuperação rápidos para linhas individuais de dados; Os cubos Essbase são projetados para pré-calcular e agregar muitos dados de nível de detalhes e, em seguida, fornecer fatias dele rapidamente, fazendo suposições fortes sobre os caminhos de consulta que os usuários tomarão. O MDEX foi projetado para suportar casos de uso de pesquisa e descoberta do Endeca, onde o usuário pode pesquisar e filtrar arbitrariamente e obter visualizações agregadas rápidas retornadas a eles. Como tal, a Endeca posiciona o MDEX como um banco de dados híbrido de pesquisa/análise projetado para análise de dados diversos e em rápida mudança.
o mecanismo Oracle Endeca MDEX é o mecanismo de consulta da pesquisa guiada Oracle Endeca. Contém-
- indexador (Dgidx).
- Dgraph.
- Agraph
os índices que são gerados pela camada ITL são carregados através do mecanismo MDEX.
depois que o índice é carregado, o mecanismo MDEX recebe consultas de pesquisa do nível do aplicativo, ele as corresponde ao índice e retorna resultados relevantes para o aplicativo do navegador da web do Usuário.
o nível do aplicativo fornece uma interface para o mecanismo MDEX.
o nível do aplicativo fornece uma interface para o mecanismo MDEX. As duas interfaces padrão, que podem ser usadas no mesmo aplicativo, são a API de apresentação e a interface de serviços da Web.
a API de apresentação e a interface de serviços da web são usadas para consultar o mecanismo MDEX e modificar os resultados. Os componentes ITL, como o Forge, são executados offline em períodos de tempo específicos, dependendo das necessidades da sua empresa. O MDEX engine e o Endeca application tier precisam estar online como e quando você deseja que seus clientes acessem seus dados.
essas interfaces são usadas para consultar o mecanismo MDEX e manipular os resultados. Os componentes Endeca ITL, como o Forge, são executados offline em intervalos adequados às suas necessidades de negócios. O Endeca MDEX Engine e o Endeca Application Tier são processos on-line, o que significa que eles devem permanecer em execução desde que você queira que os clientes tenham acesso ao seu conjunto de dados.
resultados da consulta do mecanismo Endeca MDEX
o mecanismo Endeca MDEX retorna dois tipos de informações.
- resultados para uma consulta (um conjunto de registros ou um único registro).
- as informações de suporte para construção seguem as consultas. (Essas informações ajudam os usuários a refinar ou ampliar suas consultas de pesquisa usando facetas e filtros.)
todos os resultados da consulta retornados do mecanismo Endeca MDEX contêm dois tipos de informações. Estes tipos de informações são
- Os resultados apropriados para a consulta (por exemplo, um conjunto de registros ou um registro individual)
- A informação de apoio para a construção de seguimento em consultas de seguimento em consulta de informações permite que os usuários para refinar ou ampliar sua consulta e, correspondentemente, a sua consulta de resultados.
o mecanismo MDEX calcula os resultados da pesquisa de forma a evitar becos sem saída, como “nenhum resultado encontrado”, fornecendo opções adequadas de refinamento da próxima etapa.
esta é uma característica fundamental que diferencia Endeca de outras soluções de pesquisa.
dois tipos de consultas
o Oracle Endeca Search suporta dois tipos de consultas de pesquisa: consultas de navegação e consultas de pesquisa de palavras-chave.
- as consultas de navegação retornam um conjunto de registros com base nas características de registro definidas pelo aplicativo (como tipo de laptop ou região em uma loja de laptop online), além de qualquer informação de consulta subsequente.
- as consultas de pesquisa de palavras-chave retornam um conjunto de registros com base em uma palavra-chave definida pelo usuário, além de qualquer informação de consulta subsequente.
consultas de navegação e consultas de pesquisa de palavras-chave são complementares. Na verdade, uma consulta de pesquisa de palavras-chave é um tipo especial de consulta de navegação, e as estruturas de dados para os resultados das duas consultas são idênticas: um conjunto de registros e informações de consulta de acompanhamento.
os usuários podem executar uma combinação de consultas de navegação e consultas de pesquisa de palavras-chave para navegar até o conjunto de registros desejado da maneira que funciona melhor para eles. Por exemplo, os usuários podem executar uma consulta de pesquisa de palavras-chave para recuperar um conjunto de registros e, em seguida, usar uma consulta de navegação subsequente para refinar esse conjunto de registros. A situação inversa também é válida.
quais são os registros Endeca
os registros Endeca contêm os dados para os quais os usuários navegam ou pesquisam.
os registros Endeca são baseados em registros tradicionais em um banco de dados de origem. Os registros do banco de dados de origem geralmente contêm informações como as garrafas de vinho em uma loja de vinhos, os registros do cliente em um aplicativo CRM ou os fundos mútuos em um avaliador de fundos.
os registros do banco de dados de origem armazenam essas informações em um ou mais pares de chave/valor, conhecidos como propriedades. Essas informações ficam disponíveis para o seu aplicativo quando você transforma os registros do banco de dados de origem em registros Endeca. Para transformar os registros do banco de dados de origem em registros Endeca, você deve mapear as propriedades do registro de origem para propriedades dos registros Endeca.
assim, as dimensões e os registros Endeca correspondem às propriedades dos registros do banco de dados de origem. Como as propriedades de registro de origem, as propriedades Endeca são pares chave / valor. A figura a seguir ilustra pares de chave / valor em um registro Endeca simples:
um único registro Endeca pode corresponder a qualquer número de registros de origem. Por exemplo, suponha que quatro registros de origem diferentes se refiram ao mesmo livro em formatos diferentes: capa dura, brochura, impressão grande e áudio. Você pode configurar seu aplicativo de pesquisa guiada para combinar as informações nesses quatro registros de origem em um único registro Endeca.
quais são as dimensões e valores de dimensão da Endeca
As dimensões são categorias lógicas que permitem organizar seus registros da Endeca em estruturas pelas quais os clientes podem navegar para encontrar informações sobre produtos ou serviços que possam querer comprar.
uma dimensão é uma hierarquia de valores de dimensão. Uma dimensão como um todo normalmente corresponde a uma categoria Geral de produtos ou serviços. Os valores de dimensão contêm informações cada vez mais específicas sobre produtos e serviços, quanto mais baixos eles estão na hierarquia.
o valor de dimensão mais alto em uma dimensão é conhecido como raiz de dimensão. Uma raiz de dimensão serve como o nome de sua dimensão. Cada valor de dimensão pode ter um ou mais valores de dimensão filho; um valor de dimensão com valores de dimensão filho é conhecido como valor de dimensão pai.
um valor de dimensão filho pode ter apenas um valor de dimensão pai. Os valores de dimensão que são filhos do mesmo valor de dimensão pai são conhecidos como valores de dimensão irmão. Os valores da dimensão do irmão não podem ser idênticos. No entanto, valores de dimensão que não são irmãos podem ser idênticos, mesmo dentro da mesma dimensão.
os valores de dimensão que não têm filhos são conhecidos como valores de dimensão de folha. Os valores da dimensão da folha normalmente contêm informações sobre produtos e serviços específicos. Por exemplo, um valor de dimensão não foliar pode representar uma gama de preços e os valores de dimensão foliar-seus filhos — podem representar produtos individuais cujos preços se enquadram nessa faixa. A figura a seguir ilustra uma dimensão simples chamada “Tipo de vinho”:
os registros podem ser organizados em hierarquias pesquisáveis, marcando-os com valores de dimensão. Os registros são normalmente marcados com valores de dimensão de folha, mas podem ser marcados com valores de dimensão não-Folha para fins especiais.
marcar um registro com um valor de dimensão faz as seguintes coisas:
- ele especifica a localização do registro dentro da dimensão associada. No exemplo abaixo, os registros Endeca para garrafas A E B são marcados com o valor da dimensão vermelha na dimensão do tipo de vinho, enquanto os registros Endeca para garrafas C E D são marcados com o valor da dimensão branca e assim por diante.
- ele identifica o registro como um resultado válido quando esse valor de dimensão é selecionado em uma consulta de navegação. No exemplo abaixo, uma consulta de navegação no valor Red dimension produz um conjunto de resultados que contém garrafas A E B.
Endeca search best practices-
os mecanismos de pesquisa exigem manutenção regular como carros.
- resultados de pesquisa precisos–
- gerar uma lista de palavras-chave pesquisadas diariamente para as quais Endeca relatou zero resultados. A lista pode ser extraída do log de solicitação do Endeca engine.
- torne todos os campos de texto pesquisáveis sem fazer todos eles parte da interface de pesquisa do Endeca existente. Somente os campos/dimensões na interface de pesquisa serão pesquisados; aqueles que não fazem parte da interface de pesquisa nunca participarão da pesquisa, mesmo que sejam indexados.
- Use os Termos de pesquisa que produziram zero resultados que identificamos para verificar em todos os campos de texto pesquisáveis.
- Gerar um relatório que mostra o resultado da contagem de discrepância entre o campo de texto e a interface de procura – se a interface de pesquisa não retorna nenhum resultado, mas campos de texto individuais resultados de retorno maior que 0, temos identificado com êxito os casos em que Endeca, por engano, os utilizadores com zero resultados.
- a tabela a seguir registra a saída da etapa acima. Para todos os Termos de pesquisa (coluna 1) que realmente não produziram resultados zero( coluna 5), são necessárias análises e ações adicionais. Esses termos de pesquisa não deveriam ter produzido zero resultados.
- a tabela a seguir registra a saída da etapa acima. Para todos os Termos de pesquisa (coluna 1) que realmente não produziram resultados zero( coluna 5), são necessárias análises e ações adicionais. Esses termos de pesquisa não deveriam ter produzido zero resultados.
- com base nas descobertas acima, podemos usar uma das seguintes abordagens para resolver o problema:
- adicione os campos de texto que retornaram os resultados à interface de pesquisa existente ou
- Copie o valor do campo de texto que retornou os resultados a um dos campos existentes na interface de pesquisa.
além disso, configurações de correspondência parcial também podem contribuir para cenários de acerto zero. Considere casos em que os usuários pesquisam “máquina de lavar louça poderosa” e “geladeira silenciosa” em um site de eletrodomésticos. A configuração de correspondência parcial Endeca padrão determina que os resultados devem corresponder a pelo menos 2 palavras (veja a captura de tela abaixo), o que efetivamente transforma todos os Termos de pesquisa com duas palavras-chave em “corresponder a todas as palavras-chave. Como resultado, se o site do varejista não incluir “poderoso” ou “silencioso” em suas descrições ou títulos de produtos, nenhuma geladeira ou lava-louças apareceria na página de resultados de pesquisa do Usuário. Os varejistas podem considerar ajustar a correspondência parcial para “corresponder pelo menos 1 palavra” para reduzir as taxas de acerto zero.
- Eficiente de resultados de pesquisa-Endeca usa o mecanismo de cache para armazenar os resultados que já foram processadas em solicitações anteriores, o que ajuda a melhorar o desempenho da pesquisa, porque evita o processamento do mesmo solicita repetidamente. Embora seja vantajoso aproveitar o Cache do motor para aumentar o desempenho, há várias coisas a considerar:
- identifique as consultas de quais resultados podem ser armazenados em cache no log de solicitação do motor. Essas consultas serão usadas para aquecer o motor. Por exemplo, itens de menu de navegação superior alimentados por Endeca são geralmente comuns em todas as páginas. Este é um bom candidato para resultados em cache em vez de bater o motor para cada pedido. Outro bom candidato para cache são as consultas de pesquisa populares. Por exemplo, para um varejista de eletrônicos ou uma loja de departamentos, algumas consultas populares de pesquisa de férias podem incluir “Xbox”, “Amazon Echo” ou “ofertas da Black Friday.”
- a memória cache do motor terá que ser grande o suficiente para manter os resultados em cache.
- o Cache do motor é validado após cada atualização de linha de base (atualização completa do Índice), momento em que o cache precisa ser preenchido (aquecido) usando as consultas identificadas acima.
- relevância da pesquisa-a relevância da pesquisa Endeca é fortemente influenciada por dois componentes principais:
- interface de pesquisa Endeca-consiste em uma lista de campos pesquisáveis de cada registro no índice. Quanto mais campos pesquisáveis forem incluídos em uma interface de pesquisa, maior será a pesquisa. O oposto resulta em uma pesquisa restrita.
- módulos de classificação de relevância – algoritmos de classificação prontos para uso que, quando colocados um após o outro, produzem os pedidos de classificação desejados. Os módulos mais utilizados são:
-
- número de termos-classifica os resultados com base no número de termos correspondentes combinados.
termo de Pesquisa: “vazamento de pia de cozinha”
registros Correspondentes: “minha pia da cozinha não vazar mais depois eu fixo ele” e “eu ainda não instalou asink na minha cozinha ainda”
Classificação: Registro 1 é uma classificação superior do que o registro 2 porque ele corresponde as três palavras-chave.
- correspondência única vs. correspondência de campo cruzado – a correspondência de campo único de todos os Termos de pesquisa tem uma pontuação mais alta do que a correspondência de campo cruzado.
-
Termo de pesquisa: “destinos populares de férias de primavera”
registros correspondentes:
registro 1:
título: “destinos populares para férias de primavera!”
Descrição: “passagem aérea com desconto, hotel para férias de primavera…”
recorde 2:
título: “o que é popular para as férias de primavera?”
Descrição: “Estes são os destinos dos sonhos de todos!”
classificação: O registro 1 é classificado acima do registro 2 porque seu título correspondia a todas as palavras-chave no Termo de pesquisa.
- Classificar por valores de campo em ordem crescente / decrescente. Popularidade é um bom exemplo para o qual você pode aplicar este algoritmo. O diagrama a seguir demonstra como os componentes de relevância trabalham juntos para produzir a ordem de classificação desejada.
-
por que o uso do Oracle Endeca reduziu?
Oracle perdeu seu caminho. Ele ficou atrás da curva de tecnologia e não conseguiu fornecer um roteiro convincente para atender às novas demandas do varejo digital. A Endeca foi originalmente uma plataforma inovadora e aberta construída por alguns dos engenheiros mais brilhantes do setor, mas ao longo dos anos a Oracle transformou a Endeca em uma “caixa preta” enorme e rígida, limitada em funcionalidade, dolorosamente difícil de mudar, lenta de implantar, cara de manter e quase impossível de inovar.
Se procura uma alternativa ao Endeca, pode dar uma vista de olhos à alternativa Endeca da Expertrec.
Use uma alternativa Endeca