Bartosz Mikulski

uneori vrem să măsurăm cât de multe lucruri sunt similare între ele sau cât de diferite sunt. Se întâmplă nu numai atunci când folosim algoritmi precum clasificarea k-NN sau gruparea.

când măsurăm performanța oricărui alt algoritm de învățare automată sau rețea neuronală care returnează o valoare complexă care poate fi „parțial corectă.”În aceste cazuri, vrem să știm cât de aproape este rezultatul de răspunsul corect.

în acest articol, voi explica câteva valori la distanță. În primul rând, voi începe cu valori bazate pe distanța Minkowski, deoarece le înțelegem cu toții intuitiv. În articolele viitoare, vă voi arăta, de asemenea, cum să măsurați „distanța” dintre seturile de valori și distanța dintre secvențe.

distanța Minkowski

când ne gândim la distanță, ne imaginăm de obicei distanțele dintre orașe. Aceasta este cea mai intuitivă înțelegere a conceptului de distanță.Din fericire, acest exemplu este perfect pentru a explica constrângerile distanțelor Minkowski.

spațiu vectorial normat

putem calcula distanța Minkowski doar într-un spațiu vectorial normat, care este un mod fantezist de a spune: „într-un spațiu în care distanțele pot fi reprezentate ca un vector care are o lungime.”

să începem prin a demonstra că o hartă este un spațiu vectorial.Dacă luăm o hartă, vedem că distanțele dintre orașe sunt spațiu vectorial normat, deoarece putem desena un vector care leagă două orașe pe hartă. Putem combina mai mulți vectori pentru a crea un traseu care leagă mai mult de două orașe.Acum, adjectivul ” normat.”Înseamnă că vectorul are lungimea sa și Niciun vector nu are o lungime negativă. Această constrângere este îndeplinită și pentru că dacă trasăm o linie între orașe pe hartă, îi putem măsura lungimea.

distanța Minkowski – cerințe

  1. vectorul zero, 0, are lungime zero; fiecare alt vector are o lungime pozitivă.Dacă ne uităm la o hartă, este evident. Distanța de la un oraș la același oraș este zero, deoarece nu trebuie să călătorim deloc. Distanța de la un oraș la orice alt oraș este pozitivă, deoarece nu putem parcurge -20 km.

  2. înmulțirea unui vector cu un număr pozitiv își schimbă lungimea fără a-și schimba direcțiaam călătorit 50 km nord. Dacă călătorim cu 50 km mai mult în aceeași direcție, vom ajunge la 100 km nord. Direcția nu se schimbă. Ușor, nu-i așa?

  3. cea mai scurtă distanță dintre oricare două puncte este o linie dreaptă (aceasta se numește inegalitate triunghiulară).Cred că este auto-explicativ.

tipuri de distanță Minkowski

există o singură ecuație pentru distanța Minkowski, dar o putem parametriza pentru a obține rezultate ușor diferite.

\

distanța Manhattan

este suma diferențelor absolute ale tuturor coordonatelor. Este o măsură perfectă a distanței pentru exemplul nostru. Când putem folosi o hartă a unui oraș, putem da direcție spunându-le oamenilor că ar trebui să meargă/să conducă două blocuri de oraș spre nord, apoi să facă stânga și să călătorească alte trei blocuri de oraș. În total, vor călători cinci blocuri de oraș, adică distanța Manhattan dintre punctul de plecare și destinația lor.

\

distanța euclidiană

dacă ne uităm din nou la exemplul blocului de oraș folosit pentru a explica distanța Manhattan, vedem că calea parcursă constă din două linii drepte. Când trasăm o altă linie dreaptă care leagă punctul de plecare și destinația, ajungem cu un triunghi. În acest caz, distanța dintre puncte poate fi calculată folosind teorema lui Pitagora.

\

distanța Chebyshev

este cazul extrem al distanței Minkowski. Când folosim infinitul ca valoare a parametrului p, ajungem la o metrică care definește distanța ca diferență absolută maximă între coordonate:

\

m-am întrebat cum este folosit în practică și am găsit un exemplu. Într-un depozit, distanța dintre locații poate fi reprezentată ca distanță Chebyshev dacă se folosește o macara aeriană, deoarece macaraua se deplasează pe ambele axe în același timp cu aceeași viteză.

Lasă un răspuns

Adresa ta de email nu va fi publicată.