Bartosz Mikulski

noen ganger vil vi måle hvor mye ting ligner hverandre eller hvor forskjellige de er. Det skjer ikke bare når vi bruker algoritmer som k-NN klassifisering eller clustering.

når vi måler ytelsen til enhver annen maskinlæringsalgoritme eller nevrale nettverk som returnerer en kompleks verdi som kan være » delvis korrekt.»I disse tilfellene vil vi vite hvor nær resultatet er til riktig svar.

i denne artikkelen skal jeg forklare noen avstandsmålinger. Først skal jeg begynne med beregninger basert På Minkowski-avstand fordi vi alle forstår dem intuitivt. I de kommende artiklene vil jeg også vise deg hvordan du måler «avstanden» mellom sett med verdier og avstand mellom sekvenser.

Minkowski avstand

når vi tenker på avstand, forestiller vi oss vanligvis avstander mellom byer. Det er den mest intuitive forståelsen av avstandskonseptet.Heldigvis er dette eksemplet perfekt for å forklare begrensningene I Minkowski-avstandene.

Normert vektorrom

Vi kan beregne Minkowski-avstanden bare i et normert vektorrom, som er en fancy måte å si: «i et rom hvor avstander kan representeres som en vektor som har en lengde.»

La oss begynne med å bevise at et kart er et vektorrom.Hvis vi tar et kart, ser vi at avstander mellom byer er normert vektorrom fordi vi kan tegne en vektor som forbinder to byer på kartet. Vi kan kombinere flere vektorer for å lage en rute som forbinder mer enn to byer.Nå, adjektivet » normed.»Det betyr at vektoren har sin lengde og ingen vektor har en negativ lengde. Den begrensningen er oppfylt også fordi hvis vi tegner en linje mellom byer på kartet, kan vi måle lengden.

Minkowski avstand-krav

  1. nullvektoren, 0, har null lengde; hver annen vektor har en positiv lengde.Hvis vi ser på et kart, er det åpenbart. Avstanden fra en by til samme by er null fordi vi ikke trenger å reise i det hele tatt. Avstanden fra en by til en annen by er positiv fordi vi ikke kan reise -20 km.

  2. Multiplikasjon av en vektor med et positivt tall endrer lengden uten å endre retningenvi reiste 50 km Nord. Hvis vi reiser 50 km mer i samme retning, vil vi ende opp 100 km Nord. Retningen endres ikke. Lett, ikke sant?

  3. den korteste avstanden mellom to punkter er en rett linje (Dette kalles Trekant ulikhet).Jeg tror det er selvforklarende.

Minkowski avstandstyper

Det er bare en ligning For Minkowski-avstand, men vi kan parameterisere den for å få litt forskjellige resultater.

\

Manhattan avstand

det er summen av absolutte forskjeller i alle koordinater. Det er et perfekt avstandsmål for vårt eksempel. Når vi kan bruke et kart over en by, kan vi gi retning ved å fortelle folk at de skal gå/kjøre to byblokker Nordover, ta til venstre og reise ytterligere tre byblokker. Totalt vil de reise fem byblokker, det Er Manhattan-avstanden mellom utgangspunktet og deres destinasjon.

\

Euklidisk avstand

hvis vi ser igjen på byblokkeksemplet som brukes til å forklare Manhattan-avstanden, ser vi at den reiste banen består av to rette linjer. Når vi tegner en annen rett linje som forbinder startpunktet og destinasjonen, ender vi med en trekant. I dette tilfellet kan avstanden mellom punktene beregnes ved Hjelp Av Pythagorasetningen.

\

Tsjebysjov avstand

det er det ekstreme tilfellet Av Minkowski avstand. Når vi bruker uendelig som verdien av parameteren p, ender vi med en metrisk som definerer avstand som maksimal absolutt forskjell mellom koordinater:

\

jeg lurte på hvordan den brukes i praksis, og jeg fant et eksempel. I et lager kan avstanden mellom steder representeres Som Tsjebysjov-avstand hvis en traverskran brukes fordi kranen beveger seg på begge aksene samtidig med samme hastighet.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.