Bartosz Mikulski

někdy chceme měřit, jak moc jsou věci navzájem podobné nebo jak se liší. Stává se to nejen tehdy, když používáme algoritmy, jako je klasifikace k-NN nebo shlukování.

když změříme výkon jakéhokoli jiného algoritmu strojového učení nebo neuronové sítě, která vrací komplexní hodnotu, která může být “ částečně správná.“V těchto případech chceme vědět, jak blízko je výsledek správné odpovědi.

v tomto článku vysvětlím několik metrik vzdálenosti. Nejprve začnu s metrikami založenými na vzdálenosti Minkowského, protože jim všichni intuitivně rozumíme. V nadcházejících článcích vám také ukážu, jak měřit „vzdálenost“ mezi sadami hodnot a vzdálenost mezi sekvencemi.

Minkowského vzdálenost

když přemýšlíme o vzdálenosti, obvykle si představujeme vzdálenosti mezi městy. To je nejintuitivnější pochopení konceptu vzdálenosti.Naštěstí je tento příklad ideální pro vysvětlení omezení Minkowského vzdáleností.

normovaný vektorový prostor

můžeme vypočítat Minkowského vzdálenost pouze v normovaném vektorovém prostoru, což je efektní způsob, jak říci: „v prostoru, kde vzdálenosti mohou být reprezentovány jako vektor, který má délku.“

Začněme tím, že dokážeme, že mapa je vektorový prostor.Pokud vezmeme mapu, vidíme, že vzdálenosti mezi městy jsou normované vektorový prostor, protože můžeme nakreslit vektor, který spojuje dvě města na mapě. Můžeme kombinovat více vektorů a vytvořit tak trasu, která spojuje více než dvě města.Nyní přídavné jméno “ normed.“To znamená, že vektor má svou délku a žádný vektor nemá zápornou délku. Toto omezení je také splněno, protože pokud nakreslíme čáru mezi městy na mapě, můžeme měřit její délku.

Minkowski vzdálenost-požadavky

  1. nulový vektor, 0, má nulovou délku; každý druhý vektor má kladnou délku.Když se podíváme na mapu, je to zřejmé. Vzdálenost od města do stejného města je nulová, protože nemusíme vůbec cestovat. Vzdálenost od města do jakéhokoli jiného města je pozitivní, protože nemůžeme cestovat -20 km.

  2. vynásobením vektoru kladným číslem se změní jeho délka bez změny směru. cestovali jsme 50 km severně. Pokud budeme cestovat 50 km více stejným směrem, skončíme 100 km severně. Směr se nemění. Snadné, že?

  3. nejkratší vzdálenost mezi dvěma body je přímka (nazývá se nerovnost trojúhelníku).Věřím, že je to samozřejmé.

typy Minkowského vzdálenosti

pro Minkowského vzdálenost existuje pouze jedna rovnice, ale můžeme ji parametrizovat, abychom získali mírně odlišné výsledky.

\

Manhattanská vzdálenost

je to součet absolutních rozdílů všech souřadnic. Je to perfektní měřítko vzdálenosti pro náš příklad. Když můžeme použít mapu města, můžeme dát směr tím, že lidem řekneme, že by měli chodit / řídit dva městské bloky na sever, pak odbočit doleva a cestovat další tři městské bloky. Celkem projedou pět městských bloků, tedy vzdálenost Manhattanu mezi výchozím bodem a jejich cílem.

\

euklidovská vzdálenost

pokud se znovu podíváme na příklad městského bloku používaný k vysvětlení vzdálenosti Manhattanu, vidíme, že ujetá cesta se skládá ze dvou přímek. Když nakreslíme další přímku, která spojuje výchozí bod a cíl, skončíme trojúhelníkem. V tomto případě lze vzdálenost mezi body vypočítat pomocí Pythagorovy věty.

\

čebyševova vzdálenost

jedná se o extrémní případ Minkowského vzdálenosti. Když použijeme nekonečno jako hodnotu parametru p, skončíme s metrikou, která definuje vzdálenost jako maximální absolutní rozdíl mezi souřadnicemi:

\

přemýšlel jsem, jak se používá v praxi, a našel jsem jeden příklad. Ve skladu může být vzdálenost mezi místy reprezentována jako vzdálenost Chebyshev, pokud se používá mostový jeřáb, protože jeřáb se pohybuje na obou osách současně se stejnou rychlostí.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.