Bartosz Mikulski

czasami chcemy zmierzyć, jak bardzo rzeczy są do siebie podobne lub jak różne są. Dzieje się tak nie tylko wtedy, gdy używamy algorytmów takich jak klasyfikacja k-NN Czy klastrowanie.

kiedy mierzymy wydajność dowolnego innego algorytmu uczenia maszynowego lub sieci neuronowej, który zwraca złożoną wartość, która może być ” częściowo poprawna.”W takich przypadkach chcemy wiedzieć, jak blisko wyniku jest prawidłowa odpowiedź.

w tym artykule wyjaśnię kilka wskaźników odległości. Najpierw zacznę od metryk opartych na odległości Minkowskiego, ponieważ wszyscy rozumiemy je intuicyjnie. W nadchodzących artykułach pokażę Ci również, jak mierzyć „odległość” między zestawami wartości i odległość między sekwencjami.

odległość Minkowskiego

kiedy myślimy o odległości, Zwykle wyobrażamy sobie odległości między miastami. Jest to najbardziej intuicyjne zrozumienie pojęcia odległości.Na szczęście ten przykład jest idealny do wyjaśnienia ograniczeń odległości Minkowskiego.

znormalizowana przestrzeń wektorowa

możemy obliczyć odległość Minkowskiego tylko w znormalizowanej przestrzeni wektorowej, co jest fantazyjnym sposobem powiedzenia: „w przestrzeni, w której odległości mogą być reprezentowane jako wektor o długości.”

zacznijmy od udowodnienia, że mapa jest przestrzenią wektorową.Jeśli weźmiemy mapę, zobaczymy, że odległości między miastami są normowaną przestrzenią wektorową, ponieważ możemy narysować wektor łączący dwa miasta na mapie. Możemy połączyć wiele wektorów, aby stworzyć trasę łączącą więcej niż dwa miasta.Przymiotnik ” znormalizowany.”Oznacza to, że wektor ma swoją długość, a żaden wektor nie ma ujemnej długości. To ograniczenie jest również spełnione, ponieważ jeśli narysujemy linię między miastami na mapie, możemy zmierzyć jej długość.

odległość Minkowskiego-wymagania

  1. wektor zerowy, 0, ma długość zerową; każdy inny wektor ma długość dodatnią.Jeśli spojrzymy na mapę, jest to oczywiste. Odległość od miasta do tego samego miasta wynosi zero, ponieważ w ogóle nie musimy podróżować. Odległość z miasta do innego miasta jest dodatnia, ponieważ nie możemy przejechać -20 km.

  2. mnożenie wektora przez liczbę dodatnią zmienia jego długość, nie zmieniając jego kierunku. Jeśli przejedziemy 50 km dalej w tym samym kierunku, skończymy 100 km na północ. Kierunek się nie zmienia. Łatwe, prawda?

  3. Najkrótsza odległość między dowolnymi dwoma punktami jest linią prostą (nazywa się to nierównością trójkąta).Uważam, że jest to oczywiste.

typy odległości Minkowskiego

istnieje tylko jedno równanie dla odległości Minkowskiego, ale możemy je sparametryzować, aby uzyskać nieco inne wyniki.

\

jest sumą bezwzględnych różnic wszystkich współrzędnych. Jest to doskonała miara odległości dla naszego przykładu. Kiedy możemy użyć mapy miasta, możemy dać kierunek, mówiąc ludziom, że powinni chodzić / jechać dwa bloki miasta na północ, a następnie skręcić w lewo i podróżować kolejne trzy bloki miasta. W sumie pokonają pięć bloków miejskich, czyli odległość Manhattanu między punktem startowym a miejscem docelowym.

\

odległość euklidesowa

jeśli przyjrzymy się jeszcze raz przykładowi bloku miasta wykorzystanemu do wyjaśnienia odległości Manhattanu, widzimy, że podróżowana ścieżka składa się z dwóch linii prostych. Gdy narysujemy kolejną prostą łączącą punkt początkowy i punkt docelowy, otrzymamy Trójkąt. W tym przypadku odległość między punktami można obliczyć za pomocą twierdzenia Pitagorasa.

\

odległość Czebyszewa

jest to skrajny przypadek odległości Minkowskiego. Kiedy używamy nieskończoności jako wartości parametru p, kończymy z metryką, która definiuje odległość jako maksymalną bezwzględną różnicę między współrzędnymi:

\

zastanawiałem się, jak to jest używane w praktyce i znalazłem jeden przykład. W magazynie odległość między lokalizacjami może być reprezentowana jako odległość Czebyszewa, jeśli używana jest Suwnica, ponieważ Suwnica porusza się po obu osiach jednocześnie z tą samą prędkością.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.