Komponenter

Velkommen til Web 3.0: Semantiske søk

Web 3.0: The Blockchain Effect | Justin Goldston | TEDxRIT

Web 3.0: The Blockchain Effect | Justin Goldston | TEDxRIT
Anonim

Den allestedsnærværende søkeordmodusen for Internett-søketeknikken er i ferd med å bli overtatt av en ny ras av semantisk søketeknologi, ifølge analytikere på forskningsfirmaet Ovum.

Mens søkeord er fortsatt den mest populære metoden, er det vanligvis ikke nøyaktig, med brukere får noen ganger opptil 30 000 treff på et søk, og deretter må man sile gjennom en liste over løst relaterte søkeordresultater for å finne relevante dokumenter.

"Dette der en ny ras av såkalte semantiske teknologier kommer inn i rammen. rangeringsalgoritmer som Googles PageRank for å forutsi relevans, semantisk søk ​​dips inn i betydningen på språket for å produsere svært relevante søkeresultater, "ifølge en rapport utgitt av Ovum-analytikerne Mike Davis og Madan Sheina.

Bemerkelsesverdig semanti c-nettleverandører utpekt av analytikerne inkluderer Expert System, Powerset, Yedda, Trovix og Hakia. Ifølge forfatterne økte bevisstheten om semantisk søk ​​da Microsoft plukket opp to semantiske søkeselskaper Powerset og Zoomix.

I Expert System er applikasjonen Cogito designet rundt prinsippene om menneskelig forståelse for å tillate innhold til forstås på den måten som forfatteren hadde til hensikt å være. Dette er noe som søkeordssøket ignorerer.

"Et Google-søk etter ordet 'jaguar' ville trekke opp innhold rundt dyret og bilen. Semantisk søk ​​ville se ikke bare på søkeordet, men også andre ord rundt det som" jungelen 'eller' salong 'for å skille de to betydningen, sier forfatterne.

Dybere analyse

Foruten semantisk søk ​​finnes det andre former, inkludert heuristikk og ontologi, lingvistikk og tekstutvinning, og statistisk. Ekspert System hevder imidlertid at disse tilnærmingene faller kort, og adresserer bare de morfologiske og grammatiske aspektene ved analyse.

Andre søkemotorer rammer ofte en murvegg når det gjelder dyp analyse. For eksempel når en heuristisk drevet søkemotor ser to adjektiver i en setning, pleier det å vaske dem ut og score setningen som nøytral fordi den ikke har noen forståelse for hvor de to separate adjektiver peker.

Til sammenligning ser det semantiske søket ut i begge setninglogikken - hvordan ord i en setning relaterer seg til hverandre - og semantisk analyse - forstå konteksten til søkeord.

Når et begrep er tvetydig, noe som betyr at det kan ha flere betydninger, for eksempel bark, er det nødvendig med semantisk analyse på de andre ordene som vikler rundt den for å gi den sin sanne betydning og kontekst.

En leksikalsk database

Ingeniører fra Expert Systems sier at Cogito kan gå den ekstra milen fordi den har et semantisk nettverk - en leksikalsk database som gir en kunnskapsrepresentasjon av orddefinisjoner og deres relasjoner. Det henter Webster's ordbok i en minne-database - bestående av 350 000 ord og 2,8 millioner relasjoner.

"Expert Systemets semantiske nettverk fokuserer også på vanlige ord. Det er forskjellig fra de fleste ontologiske tilnærminger som omhandler innpakning av mening og kontekst rundt spesialiserte innhold, for eksempel vitenskapelige termer, og hoppe over vanlige ord som utgjør 90 prosent av alt innhold, sier Ovum-forfatterne.

Men semantisk søk ​​er fortsatt riddled med "mye teoretisk skudd, men lite ekte substans eller bevis på at det fungerer bedre enn dagens søkeknologi.

"Semantiske nettverk er vanskelig å bygge og ikke alle er like. Det er usannsynlig at semantiske teknologier noensinne vil kunne gi 100 prosent presisjon i analysen og resultatene. Videre er det fortsatt spørsmålstegn ved potensielle klare prestasjonsproblemer med semantiske søk som spiser flere behandlingssykluser. "