Bartos Mikulski

nogle gange vil vi måle, hvor meget ting ligner hinanden, eller hvor forskellige de er. Det sker ikke kun, når vi bruger algoritmer som K-NN-klassificering eller klyngedannelse.

når vi måler ydeevnen for enhver anden maskinlæringsalgoritme eller neuralt netværk, der returnerer en kompleks værdi, der kan være “delvist korrekt.”I disse tilfælde vil vi vide, hvor tæt resultatet er på det rigtige svar.

i denne artikel vil jeg forklare et par afstandsmålinger. Først, Jeg vil starte med målinger baseret på Minkovsky afstand, fordi vi alle forstår dem intuitivt. I de kommende artikler vil jeg også vise dig, hvordan du måler “afstanden” mellem værdisæt og afstanden mellem sekvenser.

Minkovski afstand

når vi tænker på afstand, forestiller vi os normalt afstande mellem byer. Det er den mest intuitive forståelse af afstandskonceptet.Heldigvis er dette eksempel perfekt til at forklare begrænsningerne i Minkovski-afstande.

Normed vector space

vi kan kun beregne Minkovski-Afstand i et normeret vektorrum, hvilket er en fancy måde at sige: “i et rum, hvor afstande kan repræsenteres som en vektor, der har en længde.”

lad os starte med at bevise, at et kort er et vektorrum.Hvis vi tager et kort, ser vi, at afstande mellem byer er normeret vektorrum, fordi vi kan tegne en vektor, der forbinder to byer på kortet. Vi kan kombinere flere vektorer for at skabe en rute, der forbinder mere end to byer.Nu, adjektivet ” normed.”Det betyder, at vektoren har sin længde, og ingen vektor har en negativ længde. Denne begrænsning er også opfyldt, fordi hvis vi tegner en linje mellem byer på kortet, kan vi måle dens længde.

Minkovski afstand-krav

  1. nulvektoren, 0, har nul længde; hver anden vektor har en positiv længde.Hvis vi ser på et kort, er det indlysende. Afstanden fra en by til den samme by er nul, fordi vi slet ikke behøver at rejse. Afstanden fra en by til en anden by er positiv, fordi vi ikke kan rejse -20 km.

  2. multiplikation af en vektor med et positivt tal ændrer dens længde uden at ændre dens retningvi rejste 50 km nordpå. Hvis vi kører 50 km mere i samme retning, ender vi 100 km nordpå. Retningen ændres ikke. Let, ikke?

  3. den korteste afstand mellem to punkter er en lige linje (dette kaldes trekant ulighed).Jeg tror, det er selvforklarende.

Minkovski afstandstyper

der er kun en ligning for Minkovski afstand, men vi kan parametrere det for at få lidt forskellige resultater.

\

Manhattan afstand

det er summen af absolutte forskelle i alle koordinater. Det er en perfekt afstandsmåling for vores eksempel. Når vi kan bruge et kort over en by, kan vi give retning ved at fortælle folk, at de skal gå/køre to byblokke nordpå, derefter dreje til venstre og rejse yderligere tre byblokke. I alt vil de rejse fem byblokke, det vil sige Manhattan-afstanden mellem startpunktet og deres destination.

\

euklidisk afstand

hvis vi igen ser på byblokeksemplet, der bruges til at forklare Manhattan-afstanden, ser vi, at den rejste sti består af to lige linjer. Når vi tegner en anden lige linje, der forbinder startpunktet og destinationen, ender vi med en trekant. I dette tilfælde kan afstanden mellem punkterne beregnes ved hjælp af Pythagoras sætning.

\

Chebyshev afstand

det er det ekstreme tilfælde af Minkovski afstand. Når vi bruger uendelighed som værdien af parameteren p, ender vi med en metrik, der definerer afstand som den maksimale absolutte forskel mellem koordinater:

\

jeg spekulerede på, hvordan den bruges i praksis, og jeg fandt et eksempel. I et lager kan afstanden mellem placeringer repræsenteres som Chebyshev-afstand, hvis der bruges en overliggende kran, fordi kranen bevæger sig på begge akser på samme tid med samme hastighed.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.