Bartosz Mikulski

Manchmal wollen wir messen, wie sehr sich die Dinge ähneln oder wie unterschiedlich sie sind. Dies geschieht nicht nur, wenn wir Algorithmen wie k-NN-Klassifizierung oder Clustering verwenden.

Wenn wir die Leistung eines anderen maschinellen Lernalgorithmus oder neuronalen Netzwerks messen, das einen komplexen Wert zurückgibt, der „teilweise korrekt“ sein kann.“ In diesen Fällen wollen wir wissen, wie nah das Ergebnis an der richtigen Antwort ist.

In diesem Artikel werde ich einige Entfernungsmetriken erläutern. Zuerst werde ich mit Metriken beginnen, die auf der Minkowski-Distanz basieren, weil wir sie alle intuitiv verstehen. In den kommenden Artikeln werde ich Ihnen auch zeigen, wie Sie den „Abstand“ zwischen Wertesätzen und den Abstand zwischen Sequenzen messen.

Minkowski Entfernung

Wenn wir über Entfernung nachdenken, stellen wir uns normalerweise Entfernungen zwischen Städten vor. Das ist das intuitivste Verständnis des Distanzkonzepts.Glücklicherweise ist dieses Beispiel perfekt, um die Einschränkungen von Minkowski-Entfernungen zu erklären.

Normierter Vektorraum

Wir können die Minkowski-Entfernung nur in einem normierten Vektorraum berechnen, was eine ausgefallene Art zu sagen ist: „In einem Raum, in dem Entfernungen als Vektor mit einer Länge dargestellt werden können.“

Beginnen wir mit dem Beweis, dass eine Karte ein Vektorraum ist.Wenn wir eine Karte nehmen, sehen wir, dass Entfernungen zwischen Städten normierter Vektorraum sind, weil wir einen Vektor zeichnen können, der zwei Städte auf der Karte verbindet. Wir können mehrere Vektoren kombinieren, um eine Route zu erstellen, die mehr als zwei Städte verbindet.Nun, das Adjektiv „normiert.“ Es bedeutet, dass der Vektor seine Länge hat und kein Vektor eine negative Länge hat. Diese Einschränkung ist auch erfüllt, denn wenn wir eine Linie zwischen Städten auf der Karte zeichnen, können wir ihre Länge messen.

Minkowski Entfernung – Anforderungen

  1. Der Nullvektor 0 hat die Länge Null; Jeder andere Vektor hat eine positive Länge.Wenn wir uns eine Karte ansehen, ist es offensichtlich. Die Entfernung von einer Stadt zur selben Stadt ist Null, weil wir überhaupt nicht reisen müssen. Die Entfernung von einer Stadt zu einer anderen Stadt ist positiv, da wir keine -20 km zurücklegen können.

  2. Multiplikation eines Vektors mit einer positiven Zahl ändert seine Länge, ohne seine Richtung zu ändernwir reisten 50 km nördlich. Wenn wir 50 km weiter in die gleiche Richtung fahren, landen wir 100 km nördlich. Die Richtung ändert sich nicht. Einfach, nicht wahr?

  3. Der kürzeste Abstand zwischen zwei beliebigen Punkten ist eine gerade Linie (dies wird als Dreiecksungleichung bezeichnet).Ich glaube, es ist selbsterklärend.

Minkowski-Entfernungstypen

Es gibt nur eine Gleichung für die Minkowski-Entfernung, aber wir können sie parametrisieren, um etwas andere Ergebnisse zu erhalten.

\

Manhattan-Entfernung

Es ist die Summe der absoluten Differenzen aller Koordinaten. Es ist ein perfektes Entfernungsmaß für unser Beispiel. Wenn wir eine Karte einer Stadt verwenden können, können wir die Richtung angeben, indem wir den Leuten sagen, dass sie zwei Stadtblöcke nach Norden laufen / fahren sollen, dann links abbiegen und weitere drei Stadtblöcke fahren sollen. Insgesamt werden sie fünf Stadtblöcke zurücklegen, dh die Manhattan-Entfernung zwischen dem Startpunkt und ihrem Ziel.

\

Euklidische Entfernung

Wenn wir uns das Beispiel des Stadtblocks zur Erklärung der Manhattan-Entfernung noch einmal ansehen, sehen wir, dass der zurückgelegte Weg aus zwei geraden Linien besteht. Wenn wir eine weitere gerade Linie zeichnen, die den Startpunkt und das Ziel verbindet, erhalten wir ein Dreieck. In diesem Fall kann der Abstand zwischen den Punkten mit dem Satz des Pythagoras berechnet werden.

\

Tschebyschew-Entfernung

Es ist der Extremfall der Minkowski-Entfernung. Wenn wir infinity als Wert des Parameters p , erhalten wir eine Metrik, die distance als maximale absolute Differenz zwischen Koordinaten definiert:

\

Ich habe mich gefragt, wie es in der Praxis verwendet wird, und ich habe ein Beispiel gefunden. In einem Lager kann der Abstand zwischen Standorten als Chebyshev-Abstand dargestellt werden, wenn ein Brückenkran verwendet wird, da sich der Kran auf beiden Achsen gleichzeitig mit der gleichen Geschwindigkeit bewegt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.