. Viene definita "Spelling Alteration" (alterazione ortografia) : si tratta di una tecnica che i motori di ricerca utilizzano per ottenere risultati affidabili nelle ricerche. Permette di correggere gli errori in caso di errata digitazione, e dà modo di mostrare i sinonimi e parole alternative, permettendo di ottenere risultati migliori, nelle ricerche sui Crawler. Da quanto si vocifera, in Bing si sente la necessità di un miglioramento in questo settore, specificatamente riguardo il proprio motore di ricerca, targato Redmond, e da quanto emerso in collaborazione con Microsoft Research sono intenzionati ad offrire una ricompensa per il team che meglio svilupperà una tecnica di "alterazione ortografia" (Spelling Alteration) . Per questo motivo è stato creato uno Speller Challenge il cui l'obiettivo è quello di "sviluppare un sistema di alterazione ortografica adatto a grandi statistiche di ricerca, data mining-based web ." Tra le varie proposte, verranno scelti cinque vincitori, cui andranno vari premi in denaro, ed il primo della lista riceverà una ricompensa (non da poco) di 10.000.- Dollari Riportiamo parte del testo inerente la richiesta di Microsoft Research A common approach to spelling alteration is the noisy channel model, in which the received query (q) is treated as a noise-corrupted version of the target query (c). In this model, the spelling alteration system alters q into c and returns the latter's results. The techniques to best identify query/target pairs and best estimate these statistics are the active research problem that underlies this challenge. But that's just the foundation. Place the spelling alteration task in the context of web search, and you have another dimension to consider. The effectiveness of using a fixed lexicon is a known problem because it can lead the speller not only to miss "real word" errors but also misrecognize out-of-vocabulary tokens as errors.
Visita
|