Bartosz Mikulski

A veces queremos medir cuánto cosas son similares entre sí o cuán diferentes son. No solo sucede cuando usamos algoritmos como la clasificación k-NN o la agrupación en clústeres.

Cuando medimos el rendimiento de cualquier otro algoritmo de aprendizaje automático o red neuronal que devuelve un valor complejo que puede ser «parcialmente correcto».»En esos casos, queremos saber qué tan cerca está el resultado de la respuesta correcta.

En este artículo, voy a explicar algunas métricas de distancia. Primero, voy a empezar con métricas basadas en la distancia de Minkowski porque todos las entendemos intuitivamente. En los próximos artículos, también le mostraré cómo medir la» distancia » entre conjuntos de valores y la distancia entre secuencias.

Minkowski distancia

Cuando pensamos en la distancia, generalmente imaginamos distancias entre ciudades. Esa es la comprensión más intuitiva del concepto de distancia.Afortunadamente, este ejemplo es perfecto para explicar las limitaciones de las distancias de Minkowski.

Espacio vectorial normado

Podemos calcular la distancia de Minkowski solo en un espacio vectorial normado, que es una forma elegante de decir: «en un espacio donde las distancias pueden representarse como un vector que tiene una longitud.»

Comencemos demostrando que un mapa es un espacio vectorial.Si tomamos un mapa, vemos que las distancias entre ciudades son espacio vectorial normalizado porque podemos dibujar un vector que conecta dos ciudades en el mapa. Podemos combinar múltiples vectores para crear una ruta que conecte más de dos ciudades.Ahora, el adjetivo «normativa.»Significa que el vector tiene su longitud y ningún vector tiene una longitud negativa. Esa restricción también se cumple porque si dibujamos una línea entre ciudades en el mapa, podemos medir su longitud.

Distancia Minkowski-requisitos

  1. El vector cero, 0, tiene una longitud cero; cada otro vector tiene una longitud positiva.Si miramos un mapa, es obvio. La distancia de una ciudad a la misma ciudad es cero porque no necesitamos viajar en absoluto. La distancia de una ciudad a cualquier otra ciudad es positiva porque no podemos viajar -20 km.

  2. Multiplicar un vector por un número positivo cambia su longitud sin cambiar su direcciónventamos 50 km al Norte. Si viajamos 50 km más en la misma dirección, terminaremos 100 km al Norte. La dirección no cambia. Fácil, ¿no?

  3. La distancia más corta entre dos puntos cualesquiera es una línea recta (esto se llama desigualdad triangular).Creo que se explica por sí mismo.

Minkowski distancia de tipos

sólo Hay una ecuación para la distancia de Minkowski, pero podemos parametrizar para obtener resultados ligeramente diferentes.

\

Distancia de Manhattan

Es la suma de las diferencias absolutas de todas las coordenadas. Es una medida de distancia perfecta para nuestro ejemplo. Cuando podemos usar un mapa de una ciudad, podemos dar una dirección diciéndole a la gente que deben caminar/conducir dos cuadras hacia el norte, luego girar a la izquierda y viajar otras tres cuadras. En total recorrerán cinco cuadras de la ciudad, es decir, la distancia de Manhattan entre el punto de partida y su destino.

\

Distancia euclidiana

Si miramos de nuevo el ejemplo de la manzana de la ciudad utilizado para explicar la distancia de Manhattan, vemos que el camino recorrido consiste en dos líneas rectas. Cuando dibujamos otra línea recta que conecta el punto de partida y el destino, terminamos con un triángulo. En este caso, la distancia entre los puntos se puede calcular utilizando el teorema de Pitágoras.

\

Distancia de Chebyshev

Es el caso extremo de la distancia de Minkowski. Cuando usamos infinito como el valor del parámetro p, terminamos con una métrica que define la distancia como la diferencia absoluta máxima entre coordenadas:

\

Me pregunté cómo se usa en la práctica y encontré un ejemplo. En un almacén, la distancia entre ubicaciones se puede representar como distancia de Chebyshev si se utiliza una grúa aérea porque la grúa se mueve en ambos ejes al mismo tiempo con la misma velocidad.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.