Bartosz Mikulski

às vezes queremos medir o quanto as coisas são semelhantes entre si ou o quão diferentes elas são. Isso acontece não apenas quando usamos algoritmos como classificação k-NN ou agrupamento.

quando medimos o desempenho de qualquer outro algoritmo de aprendizado de máquina ou rede neural que retorna um valor complexo que pode ser “parcialmente correto.”Nesses casos, queremos saber o quão perto o resultado Está da resposta correta.

neste artigo, vou explicar algumas métricas de distância. Primeiro, vou começar com métricas baseadas na distância de Minkowski porque todos nós as entendemos intuitivamente. Nos próximos artigos, também mostrarei como medir a” distância ” entre conjuntos de valores e distância entre sequências.

distância de Minkowski

quando pensamos na distância, geralmente imaginamos distâncias entre as cidades. Essa é a compreensão mais intuitiva do conceito de distância.Felizmente, este exemplo é perfeito para explicar as restrições das distâncias de Minkowski.

Padronizadas espaço vetorial

podemos calcular a distância de Minkowski apenas em um padronizadas espaço vetorial, que é uma maneira elegante de dizer: “em um espaço onde as distâncias pode ser representada como um vetor que tem um comprimento.”Vamos começar provando que um mapa é um espaço vetorial.Se tomarmos um mapa, vemos que as distâncias entre as cidades São espaço vetorial normalizado porque podemos desenhar um vetor que conecta duas cidades no mapa. Podemos combinar vários vetores para criar uma rota que conecte mais de duas cidades.Agora, o adjetivo ” normed.”Isso significa que o vetor tem seu comprimento e nenhum vetor tem um comprimento negativo. Essa restrição também é atendida porque, se desenharmos uma linha entre as cidades no mapa, podemos medir seu comprimento.

distância de Minkowski – requisitos

  1. O vetor de zero, 0, tem comprimento zero; todos os outros vetor positivo do comprimento.Se olharmos para um mapa, é óbvio. A distância de uma cidade para a mesma cidade é zero porque não precisamos viajar. A distância de uma cidade a qualquer outra cidade é positiva porque não podemos viajar -20 km.

  2. multiplicar um Vetor por um número positivo muda seu comprimento sem alterar sua direçãonós viajamos 50 km ao norte. Se viajarmos 50 km a mais na mesma direção, acabaremos 100 km ao norte. A direção não muda. Calma, não é?

  3. a distância mais curta entre dois pontos é uma linha reta (isso é chamado de desigualdade triangular).Eu acredito que é autoexplicativo.

Minkowski distância tipos de

só Existe uma equação para a distância de Minkowski, mas podemos parametrizar-lo para obter resultados um pouco diferentes.

\

Manhattan distance

é a soma das diferenças absolutas de todas as coordenadas. É uma medida de distância perfeita para o nosso exemplo. Quando podemos usar um mapa de uma cidade, podemos dar direção dizendo às pessoas que elas devem andar/dirigir dois quarteirões da cidade para o norte, depois virar à esquerda e viajar mais três quarteirões da cidade. No total, eles viajarão cinco quarteirões da cidade, ou seja, a distância de Manhattan entre o ponto de partida e seu destino.

\

distância Euclidiana

se olharmos novamente para o exemplo do bloco da cidade usado para explicar a distância de Manhattan, vemos que o caminho percorrido consiste em duas linhas retas. Quando desenhamos outra linha reta que conecta o ponto de partida e o destino, acabamos com um triângulo. Nesse caso, a distância entre os pontos pode ser calculada usando o teorema de Pitágoras.

\

distância de Chebyshev

é o caso extremo da distância de Minkowski. Quando usamos o infinito como o valor do parâmetro p, acabamos com uma métrica que define a distância como a diferença absoluta máxima entre as coordenadas:

\

eu me perguntei como ele é usado na prática e encontrei um exemplo. Em um armazém, a distância entre os locais pode ser representada como distância Chebyshev se um guindaste aéreo for usado porque o guindaste se move em ambos os eixos ao mesmo tempo com a mesma velocidade.

Deixe uma resposta

O seu endereço de email não será publicado.