hogyan szimuláljuk a Googlebotot a Chrome használatával

a DeepCrawl-en évente több ezer technikai SEO-probléma hibakeresésében segítettem a világ legnagyobb vállalati webhelyein.

létrehoztam egy Googlebot szimulátort a Chrome-ban, hogy gyorsan lemásolhassam és hibakereshessem az összetett technikai SEO problémákat. Ezt nevezem Chromebot technikának.

ebben az útmutatóban elmagyarázom, hogyan lehet saját Googlebot szimulátort készíteni a Google Chrome-ban az összetett technikai SEO problémák hibakereséséhez.

mi a Chromebot technika?

a Chromebot technika egy egyszerű, nem kódos megoldás, amely lehetővé teszi az ember számára konfigurálja a chrome beállításait, így úgy viselkedik, mint a Googlebot bejáró (nem renderelés). Segíthet a SEO szakembereknek azonosítani az egyedi feltérképezési és indexelési problémákat egy webhelyen.

miért használja ezt a technikát?

sokat használtam ezt a technikát a DeepCrawl-nél, amikor számtalan kliens feltérképezési és indexelési problémát hibakerestem.

ez egy meglehetősen egyszerű, de hatékony, nem kódolt technika, amely segít a műszaki SEO – knak jobban gondolkodni, mint egy keresőmotor bejárója, és kevésbé, mint egy ember.

sok webhely képes vicces dolgokra, amikor a Googlebot felhasználók oldalakat kérnek.

Honnan tudja a Googlebot robot beállításait?

az összes beállítás azon az időn alapul, amelyet a mérnökökkel való beszélgetéssel, a Googlebot körüli dokumentáció tanulmányozásával és a Deepcrawl Oldalmegjelenítési szolgáltatás dokumentációjának frissítésével töltöttem.

felsoroltam az eredeti dokumentumokat, amelyekre a beállításokat alapoztam:

  • Fix kereséssel kapcsolatos JavaScript problémák
  • megérteni a megjelenítést a Google keresőben
  • JavaScript és SEO: A különbség a feltérképezés és az indexelés között

mi szükséges ehhez a technikához?

csak a Google Chrome Canary-ra és egy virtuális Magánhálózatra (VPN) van szüksége.

miért kell szimulálni a Googlebotot a Google Chrome-ban?

ennek a technikának négy alapvető előnye van, amelyeket röviden elmagyarázok.

hibakeresés a Google Chrome-ban

a DeepCrawl-nál több száz webhelyet hibakerestem. A harmadik féltől származó webes feltérképező eszközök csodálatosak, de mindig azt tapasztaltam, hogy vannak korlátaik.

amikor ezeknek az eszközöknek az eredményeit próbálom értelmezni, mindig a Chrome-hoz fordulok, hogy segítsek megérteni és hibakeresni az összetett problémákat.

a Google Chrome továbbra is a kedvenc nem SEO eszközem a hibák hibakeresésére, és konfigurálva még a Googlebot szimulálására is képes, hogy ellenőrizze, milyen feltérképező eszközök vesznek fel.

a Googlebot Chromiumot használ

Gary tisztázta, hogy a Googlebot saját egyedi megoldást használ a tartalmak letöltésére és letöltésére az internetről. Amelyet ezután továbbítanak az indexelő rendszerekre.

nincs bizonyíték arra, hogy a Googlebot crawler Chromiumot vagy Chrome-ot használna, azonban Joshua Giardino az IPullRank-nál nagyszerű érvet fogalmaz meg arról, hogy a Google a Chromiumot használja egy böngésző alapú webbejáró létrehozásához.

a Google Chrome a nyílt forráskódú Chromium projekten, valamint sok más böngészőn alapul.

ennek akkor van értelme, ha Chromium böngészőt használ a Googlebot webes feltérképezésének szimulálására, hogy jobban megértse webhelyét.

egyedi SEO insights

a Google Chrome segítségével gyorsan értelmezheti a weboldalakat, mint például a Googlebot, segíthet jobban megérteni, hogy miért vannak percek alatt feltérképezési vagy indexelési problémák.

ahelyett, hogy időt töltenék azzal, hogy egy webbejáró befejeződjön, használhatom ezt a technikát a potenciális feltérképezés és indexelés gyors hibakeresésére.

ezután a feltérképezési adatok segítségével Megnézem a probléma mértékét.

a Googlebot nem ember

a web egyre összetettebbé és dinamikusabbá válik.

fontos megjegyezni, hogy a feltérképezési és indexelési problémák hibakeresésekor Ön ember, a Googlebot pedig gép. Sok modern webhely eltérően kezeli ezt a két felhasználót.

a Google Chrome, amelyet arra terveztek, hogy segítse az emberek navigációját az interneten, most segíthet az embereknek egy olyan webhely megtekintésében, mint egy bot.

hogyan kell beállítani Googlebot simulator

jobb, elég a miért. Hadd magyarázzam el, hogyan hozhat létre saját Googlebot szimulátort.

töltse le a Google Chrome-ot

azt javaslom, hogy töltse le a Chrome Canary-t, és ne használja a saját Google Chrome böngészőjét (vagy ha Firefoxra váltott, akkor használja a Google Chrome-ot).

ennek fő oka az, hogy megváltoztatja a böngésző beállításait, ami fájdalmat okozhat, ha elfelejti visszaállítani őket, vagy millió lapot nyit meg. Takarítson meg egy kis időt, és csak használja Canary, mint a dedikált Googlebot szimulátor.

töltse le vagy használjon VPN-t

ha az Egyesült Államokon kívül tartózkodik, akkor győződjön meg róla, hogy hozzáfér egy virtuális magánhálózathoz (VPN), így átkapcsolhatja IP-címét az Egyesült Államokba.

ez azért van, mert alapértelmezés szerint a Googlebot az Egyesült Államokból mászik be, és a feltérképezési viselkedés valódi szimulálásához úgy kell tennie, mintha egy webhelyet az Egyesült Államokból érne el.

Chrome Settings

Miután letöltötte és beállította ezeket, itt az ideje konfigurálni a Chrome beállításait.

magyarázatot adtam arra, hogy miért kell konfigurálnia az egyes beállításokat, de a Chromebot használatának eredeti ötlete akkor merült fel bennem, amikor átírtam az Oldalmegjelenítési szolgáltatási útmutatót.

Web Dev Tools

a Web Developer Tools felhasználói felülete fontos része a webhely, például a Googlebot megtekintésének. Annak érdekében, hogy navigálhasson a konzolon, a Web Dev eszközöket külön ablakba kell helyeznie.

ne feledje, hogy a DevTools ablak ahhoz a laphoz kapcsolódik, amelyen megnyitotta. Ha bezárja ezt a lapot a Google Chrome-ban, a beállítások és a DevTools ablak is bezáródik.

ezt nagyon egyszerű megtenni, csak annyit kell tennie, hogy:

  1. kattintson a jobb gombbal egy weboldalra, majd kattintson az elem ellenőrzése (vagy CTRL + SHIFT + I)
  2. navigáljon a jobb oldalra, kattintson a 3 függőleges pontra, majd válassza a bal szélső dokkoló lehetőséget.

a Web Dev Eszközkonzol most külön ablakban van.

User-agent token

a user-agent karakterlánc – vagy szövegsor – egy módja annak, hogy az alkalmazások azonosítsák magukat a szerverekkel vagy hálózatokkal. A Googlebot szimulálásához frissítenünk kell a böngésző felhasználói ügynökét, hogy a webhely tudja, hogy mi vagyunk a Google webbejárója.

Parancsmenü

használja a Parancsmenüt (CTRL + Shift + P), és írja be a “hálózati feltételek megjelenítése” parancsot a devtools hálózati feltétel lapjának megnyitásához és a user-agent frissítéséhez.

kézikönyv

ehhez keresse meg a különálló Web Dev Tools ablakot, majd nyomja meg az Esc gombot. Ez megnyitja a konzolt.

kattintson a konzol fül bal oldalán található három kis gombra.

az opciók listájában kattintson a hálózati feltételekre. Ez megnyitja a hálózati feltételek fület a konzol fül mellett.

a hálózati feltételek lapon görgessen lefelé, majd törölje a ‘user-agent select automatically’ opciót.

a Google Chrome mostantól lehetővé teszi a böngésző felhasználói ügynök karakterláncának megváltoztatását Googlebotra vagy Googlebot Mobile-ra.

általában a Googlebot Mobile-ra állítom be, alapértelmezés szerint a mobilindexeléssel. Bár azt javaslom, hogy ellenőrizze a Google Search Console-ban, hogy melyik Googlebot feltérképezi a webhelyét leggyakrabban.

Googlebot mobile in network tab

a Googlebot felhasználói ügynök automatikusan a dev beta Chrome verziót használja, nem a stabil verziót. Ez általában nem jelent problémát a webhelyek 99% – ánál, de ha szükséges, beírhatja az egyéni UA-t a stabil Chrome-ból.

most megváltoztatta a felhasználói ügynököt, zárja be a konzolt (nyomja meg ismét az ESC billentyűt).

állapot nélküli feltérképezés engedélyezése

a Googlebot állapot nélküli weboldalakat térképez fel az oldalbetöltések között.

a Google Search fejlesztői dokumentációja kimondja, hogy ez azt jelenti, hogy minden új feltérképezett oldal friss böngészőt használ, és nem használja a gyorsítótárat, a cookie-kat vagy a helyet a weboldalak felfedezéséhez és feltérképezéséhez.

a Googlebot szimulátorunknak is meg kell ismételnie, hogy hontalan (amennyire csak lehet) minden új betöltött oldalon. Ehhez le kell tiltania a gyorsítótárat, a cookie-kat és a helyet a Chrome-ban.

tiltsa le a gyorsítótárat

Parancsmenü

használja a Parancsmenüt (CTRL + Shift + P), majd írja be a “gyorsítótár letiltása” parancsot a gyorsítótár letiltásához, amikor a DevTools meg van nyitva.

Manual

a gyorsítótár letiltásához lépjen a Devtools hálózat paneljére, és ellenőrizze a gyorsítótár letiltását.

cookie-k letiltása

Parancsmenü

használja a Parancsmenüt (CTRL + Shift + P), majd írja be a “gyorsítótár letiltása” parancsot a gyorsítótár letiltásához, amikor a DevTools meg van nyitva.

kézikönyv

a Chrome-ban keresse meg a chrome://beállítások/cookie-kat. A cookie-beállításokban válassza a “harmadik féltől származó cookie-k blokkolása”lehetőséget.

hely letiltása

a Chrome-ban keresse meg a chrome://beállítások/tartalom/hely a böngészőben. Váltson a ” Kérdezzen hozzáférés előtt (ajánlott)” a “blokkolt”értékre.

a szervizmunkások letiltása

a Googlebot a szervizmunkások specifikációja alapján letiltja az interfészeket. Ez azt jelenti, hogy megkerüli a Szervizmunkást, amely gyorsítótárazhatja az adatokat, és lekéri az URL-eket a kiszolgálóról.

ehhez keresse meg az alkalmazás panelt a DevTools alkalmazásban, lépjen a szervizmunkások menüpontba, és jelölje be a ‘hálózat megkerülése’ opciót.

a letiltás után a böngésző kénytelen lesz mindig erőforrást kérni a hálózattól, nem pedig Szervizmunkást használni.

Javascript letiltása

a Googlebot bejáró nem hajt végre JavaScript-et feltérképezéskor.

Googlebot & JavaScript: egy közelebbi pillantást a WRS-TechSEO Boost 2019

a feltérképezési és renderelési alrendszereket a Javascript SEO alapok megértése útmutató és a Googlebot & Javascript: a WRS közelebbi áttekintése a TechSEO Boost 2019-ben.

googlebot feltérképező rendszerek
hogyan feltérképezi és rendereli a Googlebot a webet

a Googlebot nagyon összetett rendszer, és még ez a fenti ábra is túlegyszerűsítés. Azonban; a Googlebot robotnak először le kell töltenie, le kell töltenie és meg kell vizsgálnia egy weboldalt, függetlenül a megjelenítéstől.

fontos, hogy a Googlebot szimulátorunkban ellenőrizhessük a szerveroldali HTML-t, http állapotkódokat és erőforrásokat JavaScript nélkül.

Parancssor

használja a Parancsmenüt (CTRL + Shift + P), és írja be a “Javascript letiltása” parancsot a JavaScript gyors letiltásához.

kézikönyv

a JavaScript letiltásához a Chrome-ban keresse meg a DevTools elemet, majd kattintson a Beállítások fogaskerékre.

ezután jelölje be a’ Javascript letiltása ‘ négyzetet.

Most, amikor a Googlebot szimulátort használja, csak a kezdeti szerveroldali HTML-t fogja ellenőrizni. Ez segít jobban megérteni, hogy van-e olyan link -, tartalom-vagy HTTP-állapotkód-probléma, amely a bejáró problémáit okozza.

hálózati Panel

Végül itt az ideje konfigurálni a hálózati panelt. Ezen a területen a DevTools-ban sok időt fog tölteni Googlebotként.

Google chrome hálózat lap

a hálózat panel az erőforrások letöltésének és letöltésének ellenőrzésére szolgál. Ebben a panelen ellenőrizheti az egyes letöltött URL-ek metaadatait, http fejléceit, tartalmát stb.

azonban; mielőtt megvizsgálnánk a szerverről letöltött erőforrásokat (HTML, CSS, IMG), mint például a Googlebot, frissítenünk kell a fejléceket, hogy megjelenítsük a panelen a legfontosabb információkat.

lépjen a Devtools hálózati paneljére (most egy külön ablak). A panelen lévő táblázatban kattintson a jobb gombbal az oszlopfejlécekre, és válassza ki az alább felsorolt címsorokat, amelyeket oszlopként szeretne hozzáadni a hálózat panelen (távolítsa el a többi fel nem sorolt elemet).

hálózati fejlécek frissítése

rövid magyarázatot adtam az egyes címsorokra és arra, hogy miért kell őket hozzáadni.

Status

a szerverről letöltött URL https állapotkódja. A Googlebot a HTTP-állapotkód típusától függően megváltoztatja a feltérképezés viselkedését – ez az egyik legfontosabb információ, amelyet meg kell érteni az URL-ek ellenőrzésekor.

séma

megjeleníti a letöltött erőforrás nem biztonságos https:// vagy biztonságos https:// sémáját. A Googlebot előnyben részesíti a HTTPS URL-ek feltérképezését és indexelését, ezért fontos, hogy jól megértsük az oldal erőforrásai által használt sémát.

tartomány

megjeleníti azt a tartományt, ahová az erőforrásokat letöltötték. Fontos megérteni, hogy a fontos tartalom külső CDN-re, API-ra vagy aldomainre támaszkodik-e, mivel a Googlebotnak problémái lehetnek a tartalom letöltésével.

távoli cím

a Google Chrome felsorolja annak a gazdagépnek az IP-címét, ahová az erőforrásokat letöltik. Mivel a webhely feltérképezési költségvetése a gazdagép IP-címén alapul, nem pedig a domainen, fontos figyelembe venni az egyes lekért URL-ek IP-címét is.

írja be a

a kért erőforrás MIME-típusát. Fontos, hogy a fontos URL-ek a megfelelő MIME-típusúak legyenek, mivel a Googlebot különböző típusait különböző típusú tartalmak érdeklik (HTML, CSS, IMG).

Méret

a válaszfejlécek és a választest együttes mérete, a szerver által szállított módon. Fontos, hogy javítsa a webhely sebességét, mivel ez mind a felhasználók, mind a Googlebot számára gyorsabb hozzáférést biztosít a webhelyhez.

idő

a teljes időtartam, a kérelem kezdetétől a végső bájt beérkezéséig a válaszban. A kiszolgáló válasza befolyásolhatja a Googlebot feltérképezési sebességkorlátját. Ha a szerver lelassul, akkor a webbejáró kevésbé fogja feltérképezni az Ön webhelyét.

prioritás

a böngésző legjobb tippje, hogy melyik erőforrást kell először betölteni. A Googlebot feltérképezése nem így rangsorolja az URL-eket a feltérképezéshez, de hasznos lehet látni, hogy a böngésző mely erőforrásokat rangsorolja (saját heurisztikáját használva).

Utolsó módosítás

az utoljára módosított válasz HTTP-fejléc tartalmazza azt a dátumot és időpontot, amikor az Origó szerver úgy véli, hogy az erőforrást utoljára módosították. Ezt a választ a Googlebot más jelekkel kombinálva felhasználhatja a webhely feltérképezésének rangsorolására.

US IP-cím

miután frissítette a hálózati panel fejléceit a Chrome DevTools alkalmazásban, a Googlebot szimulátor majdnem készen áll.

ha azonnal használni szeretné, át kell váltania egy amerikai IP-címre.

a Googlebot feltérképezése az Amerikai Egyesült Államokból történik. Ezért mindig azt javaslom, hogy változtassa meg IP-címét az Egyesült Államokra, amikor a Googlebot szimulátort használja.

ez a legjobb módja annak, hogy megértsük, hogyan viselkedik webhelye, amikor a Googlebot meglátogatja. Például, ha egy webhely blokkolja az amerikai IP-címekkel rendelkező látogatókat, vagy földrajzi átirányítja a látogatókat a helyük alapján, ez problémákat okozhat a Google feltérképezésében és egy webhely indexelésében.

I, Googlebot Chrome

ha az IP-cím van kapcsolva, akkor készen áll, hogy menjen, és a saját Googlebot szimulátor.

 googlebot simulator

ha tesztelni szeretné, hogy működik – e, menjen a angular.io vagy eventbrite.com. Ezek a webhelyek JavaScript-et igényelnek a tartalom és a linkek betöltéséhez – a JavaScript letiltásával ezek a webhelyek nem töltik be megfelelően a tartalmat a felületen.

Gyakran Ismételt Kérdések

a szimulátor csak egy lapon működik?

Igen. A Google DevTool beállításai csak a jelenleg megnyitott fülre vonatkoznak. Egy új lap megnyitásával a JavaScript letiltása és a User-agent beállításai visszaállnak.

az egyéb Chrome-alapú beállítások (cookie-k, szervizmunkások) továbbra is konfigurálva lesznek.

ez segít a JavaScript SEO hibakeresésében?

Igen ez a technika használható a JavaScript SEO problémák hibakeresésére egy webhelyen, amikor összehasonlítja a nézetforrást a renderelt HTML-vel. Bár lehet, hogy jobb kiterjesztések és eszközök erre a méretre.

minden alkalommal frissítenem kell a beállításokat?

a lap bezárása után frissítenie kell a következő beállításokat:

  • JavaScript letiltása
  • User-agent token frissítése

az összes többi beállítást elmentette a böngésző.

miért kell használni a Chrome Canary-t?

csak azt javaslom, hogy használja ezt, hogy megakadályozza, hogy elrontsa a Chrome böngészőt, és időt kell töltenie a beállítások között.

ha Firefoxot vagy Safarit használ, akkor csak töltse le a normál Google Chrome-ot.

ezt már beépítettem fej nélküli chrome-ba vagy más automatizáláson keresztül?

először is, szép munka! Ha olyan vagy, mint én, és nincs (jelenleg) ideje/kapacitása új kódolási nyelvek megtanulására, akkor ez a nem Kód módszer nagyszerű az induláshoz.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.