Bartosz Mikulski

soms willen we meten hoeveel dingen op elkaar lijken of hoe verschillend ze zijn. Het gebeurt niet alleen als we algoritmen gebruiken zoals k-NN classificatie of clustering.

wanneer we de prestaties meten van elk ander algoritme voor machine learning of neuraal netwerk dat een complexe waarde retourneert die “gedeeltelijk correct” kan zijn.”In die gevallen willen we weten hoe dicht het resultaat bij het juiste antwoord ligt.

In dit artikel ga ik een paar afstandsmetrics uitleggen. Ten eerste, ik ga beginnen met statistieken gebaseerd op Minkowski afstand Omdat we allemaal begrijpen ze intuïtief. In de komende artikelen zal ik u ook laten zien hoe u de “afstand” tussen reeksen waarden en de afstand tussen reeksen kunt meten.

Minkowski afstand

wanneer we denken aan Afstand, stellen we ons meestal afstanden tussen steden voor. Dat is het meest intuïtieve begrip van het afstandsconcept.Gelukkig is dit voorbeeld perfect voor het verklaren van de beperkingen van Minkowski afstanden.

genormeerde vectorruimte

we kunnen de afstand van Minkowski alleen berekenen in een genormeerde vectorruimte, wat een mooie manier is om te zeggen: “in een ruimte waar afstanden kunnen worden weergegeven als een vector met een lengte.”

laten we beginnen met te bewijzen dat een kaart een vectorruimte is.Als we een kaart nemen, zien we dat afstanden tussen steden genormeerde vectorruimte zijn omdat we een vector kunnen tekenen die twee steden verbindt op de kaart. We kunnen meerdere vectoren combineren om een route te creëren die meer dan twee steden verbindt.Nu, het bijvoeglijk naamwoord “normed.”Het betekent dat de vector zijn lengte heeft en geen vector een negatieve lengte heeft. Aan die beperking wordt ook voldaan, want als we een lijn tussen steden op de kaart trekken, kunnen we de lengte ervan meten.

Minkowski afstandseisen

  1. de nulvector, 0, heeft nullengte; elke andere vector heeft een positieve lengte.Als we naar een kaart kijken, is het duidelijk. De afstand van een stad naar dezelfde stad is nul omdat we helemaal niet hoeven te reizen. De afstand van een stad naar een andere stad is positief omdat we niet kunnen reizen -20 km.

  2. een vector vermenigvuldigen met een positief getal verandert zijn lengte zonder zijn richting te veranderen we reisden 50 km ten noorden. Als we nog 50 km in dezelfde richting rijden, komen we 100 km ten noorden. De richting verandert niet. Makkelijk, hè?

  3. de kortste afstand tussen twee punten is een rechte lijn (dit heet driehoek ongelijkheid).Ik denk dat het vanzelfsprekend is.

Minkowski afstandstypes

er is maar één vergelijking voor Minkowski afstand, maar we kunnen deze parametreren om iets andere resultaten te krijgen.

\

Manhattan afstand

het is de som van absolute verschillen van alle coördinaten. Het is een perfecte afstandsmaat voor ons voorbeeld. Als we een plattegrond van een stad kunnen gebruiken, kunnen we richting geven door mensen te vertellen dat ze twee Stadsblokken naar het noorden moeten lopen/rijden, dan linksaf en nog eens drie Stadsblokken reizen. In totaal zullen ze vijf Stadsblokken afleggen, dat is de Manhattan afstand tussen het startpunt en hun bestemming.

\

Euclidische afstand

als we opnieuw kijken naar het stadsblok voorbeeld gebruikt om de Manhattan afstand te verklaren, zien we dat het afgelegde pad bestaat uit twee rechte lijnen. Wanneer we een andere rechte lijn trekken die het beginpunt en de bestemming verbindt, komen we uit op een driehoek. In dit geval kan de afstand tussen de punten worden berekend met behulp van de stelling van Pythagoras.

\

Chebyshev afstand

het is het extreme geval van Minkowski afstand. Als we oneindigheid gebruiken als de waarde van de parameter p, komen we uit op een metriek die afstand definieert als het maximale absolute verschil tussen coördinaten:

\

ik vroeg me af hoe het in de praktijk wordt gebruikt en ik vond een voorbeeld. In een magazijn kan de afstand tussen locaties worden weergegeven als Chebyshev afstand als een bovenloopkraan wordt gebruikt omdat de kraan op beide assen tegelijk met dezelfde snelheid beweegt.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.