Bartosz Mikulski

A volte vogliamo misurare quanto le cose siano simili tra loro o quanto siano diverse. Succede non solo quando usiamo algoritmi come la classificazione k-NN o il clustering.

Quando misuriamo le prestazioni di qualsiasi altro algoritmo di apprendimento automatico o rete neurale che restituisce un valore complesso che può essere “parzialmente corretto.”In questi casi, vogliamo sapere quanto è vicino il risultato alla risposta corretta.

In questo articolo, ho intenzione di spiegare alcune metriche di distanza. Innanzitutto, inizierò con le metriche basate sulla distanza di Minkowski perché tutte le comprendiamo intuitivamente. Nei prossimi articoli, ti mostrerò anche come misurare la” distanza ” tra insiemi di valori e la distanza tra le sequenze.

Distanza Minkowski

Quando pensiamo alla distanza, di solito immaginiamo le distanze tra le città. Questa è la comprensione più intuitiva del concetto di distanza.Fortunatamente, questo esempio è perfetto per spiegare i vincoli delle distanze di Minkowski.

Spazio vettoriale normato

Possiamo calcolare la distanza di Minkowski solo in uno spazio vettoriale normato, che è un modo elegante di dire: “in uno spazio in cui le distanze possono essere rappresentate come un vettore che ha una lunghezza.”

Iniziamo dimostrando che una mappa è uno spazio vettoriale.Se prendiamo una mappa, vediamo che le distanze tra le città sono normate spazio vettoriale perché possiamo disegnare un vettore che collega due città sulla mappa. Possiamo combinare più vettori per creare un percorso che collega più di due città.Ora, l’aggettivo ” normed.”Significa che il vettore ha la sua lunghezza e nessun vettore ha una lunghezza negativa. Anche questo vincolo è soddisfatto perché se tracciamo una linea tra le città sulla mappa, possiamo misurarne la lunghezza.

Distanza Minkowski – requisiti

  1. Il vettore zero, 0, ha lunghezza zero; ogni altro vettore ha una lunghezza positiva.Se guardiamo una mappa, è ovvio. La distanza da una città alla stessa città è zero perché non abbiamo bisogno di viaggiare affatto. La distanza da una città a qualsiasi altra città è positiva perché non possiamo percorrere -20 km.

  2. Moltiplicando un vettore per un numero positivo cambia la sua lunghezza senza cambiare la sua direzioneabbiamo viaggiato 50 km a nord. Se percorriamo 50 km in più nella stessa direzione, finiremo 100 km a nord. La direzione non cambia. Facile, vero?

  3. La distanza più breve tra due punti qualsiasi è una linea retta (questa è chiamata disuguaglianza triangolare).Credo che sia auto-esplicativo.

Tipi di distanza Minkowski

Esiste una sola equazione per la distanza Minkowski, ma possiamo parametrizzarla per ottenere risultati leggermente diversi.

\

Manhattan distance

È la somma delle differenze assolute di tutte le coordinate. È una misura di distanza perfetta per il nostro esempio. Quando possiamo usare una mappa di una città, possiamo dare indicazioni dicendo alle persone che dovrebbero camminare/guidare due isolati a nord, quindi girare a sinistra e percorrere altri tre isolati. In totale viaggeranno cinque isolati di città, cioè la distanza di Manhattan tra il punto di partenza e la loro destinazione.

\

Distanza euclidea

Se guardiamo di nuovo l’esempio del blocco cittadino usato per spiegare la distanza di Manhattan, vediamo che il percorso percorso consiste di due linee rette. Quando disegniamo un’altra linea retta che collega il punto di partenza e la destinazione, finiamo con un triangolo. In questo caso, la distanza tra i punti può essere calcolata usando il teorema di Pitagora.

\

Distanza di Chebyshev

È il caso estremo della distanza di Minkowski. Quando usiamo infinity come valore del parametro p, finiamo con una metrica che definisce la distanza come la massima differenza assoluta tra le coordinate:

\

Mi sono chiesto come viene usato nella pratica e ho trovato un esempio. In un magazzino, la distanza tra le posizioni può essere rappresentata come distanza di Chebyshev se viene utilizzata una gru a ponte perché la gru si muove su entrambi gli assi contemporaneamente con la stessa velocità.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.