Formulär och sökmotor robotar
Google håller konstant på och utvecklar nya idéer för att utöka antalet sidor som de förväntas hitta. Dom har redan implementerat en hel del smarta finesser som att scanna JavaScript och Flash för att hitta länkar till nya webbplatser och idag har experimeterar dom med en ny teknik.
Under de senaste månaderna har dom försökt att följa länkar i HTML-formulär för att hitta länkar till webbplatser som Google annars inte skulle kunna hitta och indexera för användare som söker på Google. Detta gäller speciellt när dom hittar ett “FORM” element på en högkvalitativ hemsida. Google ställer troligtvis då ett antal “frågor” (sökningar) i formuläret. När det gäller textboxar kommer dom automatiskt att välja ut ord från sidan som har formuläret för att välja ut menyer, “check boxes” och “radio buttons” ur formuläret med värden som finns i koden. Genom att välja ut värden för varje val, genererar och exekverar dom för att försöka hitta nya sidor/hemsidor. OM dom då hittar sidor / siter som inte finns med i sitt index kommer det att läggas till i databasen som vilken sida som helst.
Kanske onödigt att säga men detta borde dom gjort för länge sedan. Dock är det endast ett fåtal värdefullal siter på nätet som kommer att få denna “behandling”. Googles robot (googlebot) tar alltid hänsyn till robots.txt, nofollow, och noindex riktlinjer som siteägaren satt upp. Med detta menas att om man i robots.txt har uteslutit formulär för robotar kommer man att ta hänsyn till det och inte indexera innehåll man hittar i formulär. Att tillägga är att Google endast samlar in data som är taggade med “get”-kommandot. Dom undviker formulär som kräver någon som helst användarinmatning. Som exempel undwiks alla formulär som har lösenord-taggning eller på annat sätt är kopplat till användarinformation som inloggning, användarid, kontakter mm.
De sidor som hittas på detta utökade indexeringssätt kommer inte att ske på bekostnad av de normala sidorna som redan är indexerade. Denna förändring kommer alltså inte att reducera något PageRank-värde för de andra sidorna. Detta kommer således endast att utöka antalet sidor som är indexerade för siten på Google. Förändringen kommer inte heller att påverka spindling eller rankning.
Detta experiment är till för att utöka Googles täckning över webben. HTML-formulär har länge varit en källa till mängder av innehåll som inte varit nåbar av sökmotorernas robotar tidigare. Genom att kunna spindla html-formulär (som ej är exkluderade i robots.txt) kommer Google att kulla leda användare till dokument som dom annars inte skulle få tillgång till genom användning av en sökmotor.
Om ni fann detta inlägg användbart och vill länka till den.
Kopiera koden nedan och klistra in den på er hemsida (Ctrl+C to copy)
Den kommer att se ut så här: Formulär och sökmotor robotar


