Komponenter

Microsoft Research utvikler kart Søk etter ustrukturerte data

Perspectives on Cross-Validation

Perspectives on Cross-Validation
Anonim

Microsoft Research India har utviklet teknologi som gjør det mulig for brukere å søke på kart selv i land som India der adressene ofte ikke er strukturert.

Forskningsprosjektet kalles Robust Location Search, og en prototype av teknologien er allerede klar, sa B. Ashok, direktør for avansert utvikling og prototyping på Microsoft Research India, onsdag. Selv om det er utviklet i India, er teknologien generisk og har blitt utviklet for å bli distribuert i ethvert land som har ustrukturerte adresser, la han til.

I stedet for å se etter regler i adressen bruker algoritmen underliggende geospatiale data for å finne ut hvilken plassering Vilkårene i adressestrengen samsvarer med, sa Ashok.

[Videre lesing: Din nye PC trenger disse 15 gratis, gode programmene]

I land som India blir det ofte beskrevet en plassering i en adresse ved sitt romlige forhold for eksempel nær eller motsatt et landemerke, i stedet for en formell, hierarkisk adressestruktur bestående av et gatenummer, gatenavn, by, stat og postnummer.

Svært ofte kan samme sted ha en annen adresse eller en henvisning til et annet landemerke, sa Ashok. Den lokale postmannen vet hvordan man skal levere brev basert på disse ustrukturerte adressene, men slike ustrukturerte data utgjør en utfordring for programvare som brukes til kartsøk, la han til.

Kommersielle kartleggingstjenester, inkludert de av Google, Yahoo og Microsoft, ble opprinnelig utformet for land som USA, som har strukturerte adresser, men de kan ikke være like gode når de jobber med ustrukturerte adresser, sier Ashok.

Forskerlaboratoriet i Bangalore er i diskusjoner for å innlemme den nye algoritmen i Microsofts Windows Live Local. > Microsoft Research India bruker en teknologi, kalt romlig skjæringspunkt, for å analysere ulike termer i adressestrengen for å finne ut plasseringen for en ustrukturert adresse som "2. Cross, 10th Main, Sadashivnagar, Bangalore."

Programvaren starter med Begrep som "2nd Cross" og "10th Main" bruker deretter gatekryssingsinformasjonen som 2. kryss krysser med 10. hoved for å identifisere alle forekomster på kartet der 2. kryss int ersects med 10th Main, sa Ashok. Neste term, Sadashivnagar, krysser med informasjonen samlet på krysset mellom 2. og 10. hoved for å komme frem til adressen adressen refererer til, la han til.

Programvaren kommer til stedet uansett hvilken rekkefølge den Vilkår presenteres i adressen, og også når samme sted har flere aliasadresser, sa Ashok. Den kan også brukes av brukere på flere språk. En forespørsel på hindi, et indisk språk, ville for eksempel oversettes til språket på kartet, og søket gjort ut fra disse betingelsene, ifølge Ashok.

Vilkår i adressen som "nær" som ikke gjør det samsvarer med data på kartet, blir også kassert, sa Ashok.