Bartosz Mikulski

ibland vill vi mäta hur mycket saker liknar varandra eller hur olika de är. Det händer inte bara när vi använder algoritmer som k-nn-klassificering eller kluster.

när vi mäter prestanda för någon annan maskininlärningsalgoritm eller neuralt nätverk som returnerar ett komplext värde som kan vara ”delvis korrekt.”I dessa fall vill vi veta hur nära resultatet är till rätt svar.

i den här artikeln kommer jag att förklara några avståndsmätningar. Först ska jag börja med mätvärden baserade på Minkowski-avstånd eftersom vi alla förstår dem intuitivt. I de kommande artiklarna kommer jag också att visa dig hur du mäter ”avståndet” mellan uppsättningar av värden och avståndet mellan sekvenser.

Minkowski avstånd

när vi tänker på avstånd föreställer vi oss vanligtvis avstånd mellan städer. Det är den mest intuitiva förståelsen av distanskonceptet.Lyckligtvis är detta exempel perfekt för att förklara begränsningarna för Minkowski-avstånd.

normerat vektorutrymme

vi kan beräkna Minkowski-avstånd endast i ett normerat vektorutrymme, vilket är ett fint sätt att säga: ”i ett utrymme där avstånd kan representeras som en vektor som har en längd.”

låt oss börja med att bevisa att en karta är ett vektorutrymme.Om vi tar en karta ser vi att avstånd mellan städer är normerat vektorutrymme eftersom vi kan rita en vektor som förbinder två städer på kartan. Vi kan kombinera flera vektorer för att skapa en rutt som förbinder mer än två städer.Nu adjektivet ” normerade.”Det betyder att vektorn har sin längd och ingen vektor har en negativ längd. Den begränsningen uppfylls också för att om vi ritar en linje mellan städer på kartan kan vi mäta dess längd.

Minkowski avstånd-krav

  1. nollvektorn, 0, har noll längd; varannan vektor har en positiv längd.Om vi tittar på en karta är det uppenbart. Avståndet från en stad till samma stad är noll eftersom vi inte behöver resa alls. Avståndet från en stad till någon annan stad är positivt eftersom vi inte kan resa -20 km.

  2. multiplicera en vektor med ett positivt tal ändrar längden utan att ändra riktningenvi reste 50 km norrut. Om vi reser 50 km mer i samma riktning hamnar vi 100 km norrut. Riktningen ändras inte. Lätt, eller hur?

  3. det kortaste avståndet mellan två punkter är en rak linje (detta kallas triangel ojämlikhet).Jag tror att det är självförklarande.

Minkowski-avståndstyper

det finns bara en ekvation för Minkowski-avstånd, men vi kan parametrisera det för att få lite olika resultat.

\

Manhattan avstånd

det är summan av absoluta skillnader i alla koordinater. Det är ett perfekt avståndsmått för vårt exempel. När vi kan använda en karta över en stad kan vi ge riktning genom att berätta för folk att de ska gå/köra två stadsblock norrut, sväng vänster och resa ytterligare tre stadsblock. Totalt kommer de att resa fem stadsblock, det vill säga Manhattan-avståndet mellan utgångspunkten och deras destination.

\

euklidiskt avstånd

om vi tittar igen på stadsblockexemplet som används för att förklara Manhattan-avståndet ser vi att den reste vägen består av två raka linjer. När vi ritar en annan rak linje som förbinder utgångspunkten och destinationen hamnar vi med en triangel. I detta fall kan avståndet mellan punkterna beräknas med hjälp av Pythagoras teorem.

\

Chebyshev avstånd

det är det extrema fallet med Minkowski avstånd. När vi använder oändlighet som värdet på parametern p, slutar vi med en metrisk som definierar avstånd som den maximala absoluta skillnaden mellan koordinater:

\

jag undrade hur det används i praktiken och jag hittade ett exempel. I ett lager kan avståndet mellan platser representeras som Chebyshev-avstånd om en kran används eftersom kranen rör sig på båda axlarna samtidigt med samma hastighet.

Lämna ett svar

Din e-postadress kommer inte publiceras.