Google ændrer 10 procent af deres søgealgoritme

google-411231_960_720 (1)
Google er i øjeblikket ved at udføre en ændring af sin core search algoritme, som de siger kunne ændre rangordningen for resultater for så mange som en ud af ti forespørgsler. Denne er baseret på avanceret teknik til behandling af native sprog (NLP) udviklet af Google selv og anvendt på deres søgeprodukt i løbet af de sidste 10 måneder.

I hovedtræk hævder Google, at det forbedrer resultaterne ved at have en bedre forståelse af, hvordan ord forholder sig til hinanden i en sætning. Som et eksempel diskuterede Google på en briefing med journalister i går, om deres søgealgoritme analyserer betydningen af følgende sætning: “Can you get medicine for someone pharmacy?”

Den gamle Google-søgealgoritme behandlede den sætning som en "pose med ord" ifølge Pandu Nayak, Google-ansat og VP for search. Så algoritmen så på de vigtige ord, medicin og apotek, og returnerede simpelthen lokale resultater som et outcome. Den nye algoritme var i stand til at forstå konteksten af ordene "someone" for at konkludere, at det var et spørgsmål om, hvorvidt du kunne hente en andens recept - og dette resulterede i de rigtige resultater.

Den justerede algoritme er baseret på BERT, der står for “Bidirectional Encoder Representations from Transformers” Hvert ord i forkortelsen, er et udtryk for kunst i NLP, men kernen er, at i stedet for at behandle en sætning som en ”pose ord”, ser BERT på ordene som en sætning som en helhed. Dette gør det muligt at indse, at ordene "for someone" ikke bør smides bort, men snarere er vigtige for meningen med sætningen.

Den måde BERT genkender, at det skal være opmærksom på disse ord, er dybest set ved selvlæring ved brug af Mad Libs. Google inddrager af engelske sætninger og fjerner tilfældigt 15 procent af ordene, så er BERT programmeret til selv at finde ud af, hvad disse ord burde være. Over tid viser den slags træning sig at være bemærkelsesværdigt effektiv til at gøre en NLP-model i stand til forstå kontekst, ifølge Jeff Dean, Googles seniormedarbejder & SVP og forskning.


Et andet eksempel, som Google citerede, var “parking on a hill with no curb.” Ordet "no" er vigtigt for denne forespørgsel, og inden implementering af BERT i søgning, gik Googles algoritmer simpelthen glip af dette.

Google forklarer, at de har frigivet ændringen af algoritmen inden for de sidste par dage, og at det skulle påvirke omkring 10 procent af de søgeforespørgsler, der er foretaget på engelsk i USA. Andre sprog og lande vil blive behandlet senere.

Alle ændringer til søgning køres gennem en række tests for at sikre, at de rent faktisk forbedrer resultater. En af disse test involverer brugen af Googles cadre – en hord af menneskelige korrekturlæsere, der træner virksomhedens algoritmer ved at bedømme kvaliteten af søgeresultaterne - Google udfører også direkte live A / B-test.

Hver enkelt forespørgsel blive ikke påvirket af BERT. BERT er bare det nyeste af mange forskellige værktøjer, som Google bruger til at rangere søgeresultater. Hvordan det hele fungerer sammen er stadig lidt af et mysterium. Visse områder af denne proces, holdes naturligvis skjult af Google for at forhindre spammere fra at udnytte systemet.

Alle, der tjener penge på webtrafik, bør tage dette til efterretning.

Når det kommer til kvaliteten af søgeresultater, forklarer Payak, at “this is the single biggest ... most positive change we’ve had in the last five years and perhaps one of the biggest since the beginning”

Du kan læse mere om Googles ændring af deres søgealgoritme her


Kilde & Image credit:

Google, CNET, Pixabay