a DeepCrawl-en évente több ezer technikai SEO-probléma hibakeresésében segítettem a világ legnagyobb vállalati webhelyein.
létrehoztam egy Googlebot szimulátort a Chrome-ban, hogy gyorsan lemásolhassam és hibakereshessem az összetett technikai SEO problémákat. Ezt nevezem Chromebot technikának.
ebben az útmutatóban elmagyarázom, hogyan lehet saját Googlebot szimulátort készíteni a Google Chrome-ban az összetett technikai SEO problémák hibakereséséhez.
mi a Chromebot technika?
a Chromebot technika egy egyszerű, nem kódos megoldás, amely lehetővé teszi az ember számára konfigurálja a chrome beállításait, így úgy viselkedik, mint a Googlebot bejáró (nem renderelés). Segíthet a SEO szakembereknek azonosítani az egyedi feltérképezési és indexelési problémákat egy webhelyen.
miért használja ezt a technikát?
sokat használtam ezt a technikát a DeepCrawl-nél, amikor számtalan kliens feltérképezési és indexelési problémát hibakerestem.
ez egy meglehetősen egyszerű, de hatékony, nem kódolt technika, amely segít a műszaki SEO – knak jobban gondolkodni, mint egy keresőmotor bejárója, és kevésbé, mint egy ember.
sok webhely képes vicces dolgokra, amikor a Googlebot felhasználók oldalakat kérnek.
Honnan tudja a Googlebot robot beállításait?
az összes beállítás azon az időn alapul, amelyet a mérnökökkel való beszélgetéssel, a Googlebot körüli dokumentáció tanulmányozásával és a Deepcrawl Oldalmegjelenítési szolgáltatás dokumentációjának frissítésével töltöttem.
felsoroltam az eredeti dokumentumokat, amelyekre a beállításokat alapoztam:
- Fix kereséssel kapcsolatos JavaScript problémák
- megérteni a megjelenítést a Google keresőben
- JavaScript és SEO: A különbség a feltérképezés és az indexelés között
mi szükséges ehhez a technikához?
csak a Google Chrome Canary-ra és egy virtuális Magánhálózatra (VPN) van szüksége.
miért kell szimulálni a Googlebotot a Google Chrome-ban?
ennek a technikának négy alapvető előnye van, amelyeket röviden elmagyarázok.
hibakeresés a Google Chrome-ban
a DeepCrawl-nál több száz webhelyet hibakerestem. A harmadik féltől származó webes feltérképező eszközök csodálatosak, de mindig azt tapasztaltam, hogy vannak korlátaik.
amikor ezeknek az eszközöknek az eredményeit próbálom értelmezni, mindig a Chrome-hoz fordulok, hogy segítsek megérteni és hibakeresni az összetett problémákat.
a Google Chrome továbbra is a kedvenc nem SEO eszközem a hibák hibakeresésére, és konfigurálva még a Googlebot szimulálására is képes, hogy ellenőrizze, milyen feltérképező eszközök vesznek fel.
a Googlebot Chromiumot használ
Gary tisztázta, hogy a Googlebot saját egyedi megoldást használ a tartalmak letöltésére és letöltésére az internetről. Amelyet ezután továbbítanak az indexelő rendszerekre.
nincs bizonyíték arra, hogy a Googlebot crawler Chromiumot vagy Chrome-ot használna, azonban Joshua Giardino az IPullRank-nál nagyszerű érvet fogalmaz meg arról, hogy a Google a Chromiumot használja egy böngésző alapú webbejáró létrehozásához.
a Google Chrome a nyílt forráskódú Chromium projekten, valamint sok más böngészőn alapul.
ennek akkor van értelme, ha Chromium böngészőt használ a Googlebot webes feltérképezésének szimulálására, hogy jobban megértse webhelyét.
egyedi SEO insights
a Google Chrome segítségével gyorsan értelmezheti a weboldalakat, mint például a Googlebot, segíthet jobban megérteni, hogy miért vannak percek alatt feltérképezési vagy indexelési problémák.
ahelyett, hogy időt töltenék azzal, hogy egy webbejáró befejeződjön, használhatom ezt a technikát a potenciális feltérképezés és indexelés gyors hibakeresésére.
ezután a feltérképezési adatok segítségével Megnézem a probléma mértékét.
a Googlebot nem ember
a web egyre összetettebbé és dinamikusabbá válik.
fontos megjegyezni, hogy a feltérképezési és indexelési problémák hibakeresésekor Ön ember, a Googlebot pedig gép. Sok modern webhely eltérően kezeli ezt a két felhasználót.
a Google Chrome, amelyet arra terveztek, hogy segítse az emberek navigációját az interneten, most segíthet az embereknek egy olyan webhely megtekintésében, mint egy bot.
hogyan kell beállítani Googlebot simulator
jobb, elég a miért. Hadd magyarázzam el, hogyan hozhat létre saját Googlebot szimulátort.
töltse le a Google Chrome-ot
azt javaslom, hogy töltse le a Chrome Canary-t, és ne használja a saját Google Chrome böngészőjét (vagy ha Firefoxra váltott, akkor használja a Google Chrome-ot).
ennek fő oka az, hogy megváltoztatja a böngésző beállításait, ami fájdalmat okozhat, ha elfelejti visszaállítani őket, vagy millió lapot nyit meg. Takarítson meg egy kis időt, és csak használja Canary, mint a dedikált Googlebot szimulátor.
töltse le vagy használjon VPN-t
ha az Egyesült Államokon kívül tartózkodik, akkor győződjön meg róla, hogy hozzáfér egy virtuális magánhálózathoz (VPN), így átkapcsolhatja IP-címét az Egyesült Államokba.
ez azért van, mert alapértelmezés szerint a Googlebot az Egyesült Államokból mászik be, és a feltérképezési viselkedés valódi szimulálásához úgy kell tennie, mintha egy webhelyet az Egyesült Államokból érne el.
Chrome Settings
Miután letöltötte és beállította ezeket, itt az ideje konfigurálni a Chrome beállításait.
magyarázatot adtam arra, hogy miért kell konfigurálnia az egyes beállításokat, de a Chromebot használatának eredeti ötlete akkor merült fel bennem, amikor átírtam az Oldalmegjelenítési szolgáltatási útmutatót.
Web Dev Tools
a Web Developer Tools felhasználói felülete fontos része a webhely, például a Googlebot megtekintésének. Annak érdekében, hogy navigálhasson a konzolon, a Web Dev eszközöket külön ablakba kell helyeznie.
ne feledje, hogy a DevTools ablak ahhoz a laphoz kapcsolódik, amelyen megnyitotta. Ha bezárja ezt a lapot a Google Chrome-ban, a beállítások és a DevTools ablak is bezáródik.
ezt nagyon egyszerű megtenni, csak annyit kell tennie, hogy:
- kattintson a jobb gombbal egy weboldalra, majd kattintson az elem ellenőrzése (vagy CTRL + SHIFT + I)
- navigáljon a jobb oldalra, kattintson a 3 függőleges pontra, majd válassza a bal szélső dokkoló lehetőséget.
a Web Dev Eszközkonzol most külön ablakban van.
User-agent token
a user-agent karakterlánc – vagy szövegsor – egy módja annak, hogy az alkalmazások azonosítsák magukat a szerverekkel vagy hálózatokkal. A Googlebot szimulálásához frissítenünk kell a böngésző felhasználói ügynökét, hogy a webhely tudja, hogy mi vagyunk a Google webbejárója.
Parancsmenü
használja a Parancsmenüt (CTRL + Shift + P), és írja be a “hálózati feltételek megjelenítése” parancsot a devtools hálózati feltétel lapjának megnyitásához és a user-agent frissítéséhez.
kézikönyv
ehhez keresse meg a különálló Web Dev Tools ablakot, majd nyomja meg az Esc gombot. Ez megnyitja a konzolt.
kattintson a konzol fül bal oldalán található három kis gombra.
az opciók listájában kattintson a hálózati feltételekre. Ez megnyitja a hálózati feltételek fület a konzol fül mellett.
a hálózati feltételek lapon görgessen lefelé, majd törölje a ‘user-agent select automatically’ opciót.
a Google Chrome mostantól lehetővé teszi a böngésző felhasználói ügynök karakterláncának megváltoztatását Googlebotra vagy Googlebot Mobile-ra.
általában a Googlebot Mobile-ra állítom be, alapértelmezés szerint a mobilindexeléssel. Bár azt javaslom, hogy ellenőrizze a Google Search Console-ban, hogy melyik Googlebot feltérképezi a webhelyét leggyakrabban.
a Googlebot felhasználói ügynök automatikusan a dev beta Chrome verziót használja, nem a stabil verziót. Ez általában nem jelent problémát a webhelyek 99% – ánál, de ha szükséges, beírhatja az egyéni UA-t a stabil Chrome-ból.
most megváltoztatta a felhasználói ügynököt, zárja be a konzolt (nyomja meg ismét az ESC billentyűt).
állapot nélküli feltérképezés engedélyezése
a Googlebot állapot nélküli weboldalakat térképez fel az oldalbetöltések között.
a Google Search fejlesztői dokumentációja kimondja, hogy ez azt jelenti, hogy minden új feltérképezett oldal friss böngészőt használ, és nem használja a gyorsítótárat, a cookie-kat vagy a helyet a weboldalak felfedezéséhez és feltérképezéséhez.
a Googlebot szimulátorunknak is meg kell ismételnie, hogy hontalan (amennyire csak lehet) minden új betöltött oldalon. Ehhez le kell tiltania a gyorsítótárat, a cookie-kat és a helyet a Chrome-ban.
tiltsa le a gyorsítótárat
Parancsmenü
használja a Parancsmenüt (CTRL + Shift + P), majd írja be a “gyorsítótár letiltása” parancsot a gyorsítótár letiltásához, amikor a DevTools meg van nyitva.
Manual
a gyorsítótár letiltásához lépjen a Devtools hálózat paneljére, és ellenőrizze a gyorsítótár letiltását.
cookie-k letiltása
Parancsmenü
használja a Parancsmenüt (CTRL + Shift + P), majd írja be a “gyorsítótár letiltása” parancsot a gyorsítótár letiltásához, amikor a DevTools meg van nyitva.
kézikönyv
a Chrome-ban keresse meg a chrome://beállítások/cookie-kat. A cookie-beállításokban válassza a “harmadik féltől származó cookie-k blokkolása”lehetőséget.
hely letiltása
a Chrome-ban keresse meg a chrome://beállítások/tartalom/hely a böngészőben. Váltson a ” Kérdezzen hozzáférés előtt (ajánlott)” a “blokkolt”értékre.
a szervizmunkások letiltása
a Googlebot a szervizmunkások specifikációja alapján letiltja az interfészeket. Ez azt jelenti, hogy megkerüli a Szervizmunkást, amely gyorsítótárazhatja az adatokat, és lekéri az URL-eket a kiszolgálóról.
ehhez keresse meg az alkalmazás panelt a DevTools alkalmazásban, lépjen a szervizmunkások menüpontba, és jelölje be a ‘hálózat megkerülése’ opciót.
a letiltás után a böngésző kénytelen lesz mindig erőforrást kérni a hálózattól, nem pedig Szervizmunkást használni.
Javascript letiltása
a Googlebot bejáró nem hajt végre JavaScript-et feltérképezéskor.
a feltérképezési és renderelési alrendszereket a Javascript SEO alapok megértése útmutató és a Googlebot & Javascript: a WRS közelebbi áttekintése a TechSEO Boost 2019-ben.
a Googlebot nagyon összetett rendszer, és még ez a fenti ábra is túlegyszerűsítés. Azonban; a Googlebot robotnak először le kell töltenie, le kell töltenie és meg kell vizsgálnia egy weboldalt, függetlenül a megjelenítéstől.
fontos, hogy a Googlebot szimulátorunkban ellenőrizhessük a szerveroldali HTML-t, http állapotkódokat és erőforrásokat JavaScript nélkül.
Parancssor
használja a Parancsmenüt (CTRL + Shift + P), és írja be a “Javascript letiltása” parancsot a JavaScript gyors letiltásához.
kézikönyv
a JavaScript letiltásához a Chrome-ban keresse meg a DevTools elemet, majd kattintson a Beállítások fogaskerékre.
ezután jelölje be a’ Javascript letiltása ‘ négyzetet.
Most, amikor a Googlebot szimulátort használja, csak a kezdeti szerveroldali HTML-t fogja ellenőrizni. Ez segít jobban megérteni, hogy van-e olyan link -, tartalom-vagy HTTP-állapotkód-probléma, amely a bejáró problémáit okozza.
hálózati Panel
Végül itt az ideje konfigurálni a hálózati panelt. Ezen a területen a DevTools-ban sok időt fog tölteni Googlebotként.
a hálózat panel az erőforrások letöltésének és letöltésének ellenőrzésére szolgál. Ebben a panelen ellenőrizheti az egyes letöltött URL-ek metaadatait, http fejléceit, tartalmát stb.
azonban; mielőtt megvizsgálnánk a szerverről letöltött erőforrásokat (HTML, CSS, IMG), mint például a Googlebot, frissítenünk kell a fejléceket, hogy megjelenítsük a panelen a legfontosabb információkat.
lépjen a Devtools hálózati paneljére (most egy külön ablak). A panelen lévő táblázatban kattintson a jobb gombbal az oszlopfejlécekre, és válassza ki az alább felsorolt címsorokat, amelyeket oszlopként szeretne hozzáadni a hálózat panelen (távolítsa el a többi fel nem sorolt elemet).
rövid magyarázatot adtam az egyes címsorokra és arra, hogy miért kell őket hozzáadni.
Status
a szerverről letöltött URL https állapotkódja. A Googlebot a HTTP-állapotkód típusától függően megváltoztatja a feltérképezés viselkedését – ez az egyik legfontosabb információ, amelyet meg kell érteni az URL-ek ellenőrzésekor.
séma
megjeleníti a letöltött erőforrás nem biztonságos https:// vagy biztonságos https:// sémáját. A Googlebot előnyben részesíti a HTTPS URL-ek feltérképezését és indexelését, ezért fontos, hogy jól megértsük az oldal erőforrásai által használt sémát.
tartomány
megjeleníti azt a tartományt, ahová az erőforrásokat letöltötték. Fontos megérteni, hogy a fontos tartalom külső CDN-re, API-ra vagy aldomainre támaszkodik-e, mivel a Googlebotnak problémái lehetnek a tartalom letöltésével.
távoli cím
a Google Chrome felsorolja annak a gazdagépnek az IP-címét, ahová az erőforrásokat letöltik. Mivel a webhely feltérképezési költségvetése a gazdagép IP-címén alapul, nem pedig a domainen, fontos figyelembe venni az egyes lekért URL-ek IP-címét is.
írja be a
a kért erőforrás MIME-típusát. Fontos, hogy a fontos URL-ek a megfelelő MIME-típusúak legyenek, mivel a Googlebot különböző típusait különböző típusú tartalmak érdeklik (HTML, CSS, IMG).
Méret
a válaszfejlécek és a választest együttes mérete, a szerver által szállított módon. Fontos, hogy javítsa a webhely sebességét, mivel ez mind a felhasználók, mind a Googlebot számára gyorsabb hozzáférést biztosít a webhelyhez.
idő
a teljes időtartam, a kérelem kezdetétől a végső bájt beérkezéséig a válaszban. A kiszolgáló válasza befolyásolhatja a Googlebot feltérképezési sebességkorlátját. Ha a szerver lelassul, akkor a webbejáró kevésbé fogja feltérképezni az Ön webhelyét.
prioritás
a böngésző legjobb tippje, hogy melyik erőforrást kell először betölteni. A Googlebot feltérképezése nem így rangsorolja az URL-eket a feltérképezéshez, de hasznos lehet látni, hogy a böngésző mely erőforrásokat rangsorolja (saját heurisztikáját használva).
Utolsó módosítás
az utoljára módosított válasz HTTP-fejléc tartalmazza azt a dátumot és időpontot, amikor az Origó szerver úgy véli, hogy az erőforrást utoljára módosították. Ezt a választ a Googlebot más jelekkel kombinálva felhasználhatja a webhely feltérképezésének rangsorolására.
US IP-cím
miután frissítette a hálózati panel fejléceit a Chrome DevTools alkalmazásban, a Googlebot szimulátor majdnem készen áll.
ha azonnal használni szeretné, át kell váltania egy amerikai IP-címre.
a Googlebot feltérképezése az Amerikai Egyesült Államokból történik. Ezért mindig azt javaslom, hogy változtassa meg IP-címét az Egyesült Államokra, amikor a Googlebot szimulátort használja.
ez a legjobb módja annak, hogy megértsük, hogyan viselkedik webhelye, amikor a Googlebot meglátogatja. Például, ha egy webhely blokkolja az amerikai IP-címekkel rendelkező látogatókat, vagy földrajzi átirányítja a látogatókat a helyük alapján, ez problémákat okozhat a Google feltérképezésében és egy webhely indexelésében.
I, Googlebot Chrome
ha az IP-cím van kapcsolva, akkor készen áll, hogy menjen, és a saját Googlebot szimulátor.
ha tesztelni szeretné, hogy működik – e, menjen a angular.io vagy eventbrite.com. Ezek a webhelyek JavaScript-et igényelnek a tartalom és a linkek betöltéséhez – a JavaScript letiltásával ezek a webhelyek nem töltik be megfelelően a tartalmat a felületen.
Gyakran Ismételt Kérdések
a szimulátor csak egy lapon működik?
Igen. A Google DevTool beállításai csak a jelenleg megnyitott fülre vonatkoznak. Egy új lap megnyitásával a JavaScript letiltása és a User-agent beállításai visszaállnak.
az egyéb Chrome-alapú beállítások (cookie-k, szervizmunkások) továbbra is konfigurálva lesznek.
ez segít a JavaScript SEO hibakeresésében?
Igen ez a technika használható a JavaScript SEO problémák hibakeresésére egy webhelyen, amikor összehasonlítja a nézetforrást a renderelt HTML-vel. Bár lehet, hogy jobb kiterjesztések és eszközök erre a méretre.
minden alkalommal frissítenem kell a beállításokat?
a lap bezárása után frissítenie kell a következő beállításokat:
- JavaScript letiltása
- User-agent token frissítése
az összes többi beállítást elmentette a böngésző.
miért kell használni a Chrome Canary-t?
csak azt javaslom, hogy használja ezt, hogy megakadályozza, hogy elrontsa a Chrome böngészőt, és időt kell töltenie a beállítások között.
ha Firefoxot vagy Safarit használ, akkor csak töltse le a normál Google Chrome-ot.
ezt már beépítettem fej nélküli chrome-ba vagy más automatizáláson keresztül?
először is, szép munka! Ha olyan vagy, mint én, és nincs (jelenleg) ideje/kapacitása új kódolási nyelvek megtanulására, akkor ez a nem Kód módszer nagyszerű az induláshoz.