Con una mossa mirata a mantenersi più vicina al cosiddetto "Deep Web", Google ha annunciato di aver iniziato a sperimentare dei metodi per far sì che il suo motore di ricerca indicizzi anche form (ossia moduli) HTML quali drop-down box e select menu. Negli ultimi mesi Google ha provato alcune form HTML per vedere se si potevano scoprire pagine web che non potevano altrimenti essere scovate o indicizzate per gli utenti. Per le text box, i computer scelgono automaticamente le parole dal sito che contiene la form; per select menu, check box e pulsanti radio presenti sulla form, e si sceglie tra i valori dell'HTML. Avendo scelto i valori per ciascun input, si generano e si cerca di effettuare crawling degli URL che corrispondono a una possibile query che un utente può aver fatto. Se si constata che la pagina web risultante dalla query prodotta è valida, interessante e include contenuti non presenti nell' indice, è possibile inserirla così come si includerebbe qualsiasi altra pagina Web. Inoltre se un sito includerà degli strumenti per evitare di essere analizzato da un motore di ricerca, Google aderirà a tali istruzioni. Infine la società ometterà qualsiasi form che richiede l'inserimento di password o che utilizza termini comunemente associati con le informazioni personali come log-in o user ID. Le pagine Web scoperte usando il metodo di crawling potenziato, non saranno alle spese delle pagine web regolari che già fanno parte del crawl, perché questa metodologia non influirà comunque sul page ranking
Altre Info
|