Bartosz Mikulski

néha meg akarjuk mérni, hogy a dolgok mennyire hasonlítanak egymásra vagy mennyire különböznek egymástól. Ez nem csak akkor történik meg, ha olyan algoritmusokat használunk, mint a k-NN osztályozás vagy a klaszterezés.

amikor bármely más gépi tanulási algoritmus vagy neurális hálózat teljesítményét mérjük, amely komplex értéket ad vissza, amely “részben helyes” lehet.”Ezekben az esetekben szeretnénk tudni, hogy az eredmény milyen közel áll a helyes válaszhoz.

ebben a cikkben néhány távolsági mutatót fogok elmagyarázni. Először a Minkowski-távolságon alapuló mutatókkal kezdem, mert mindannyian intuitív módon értjük őket. A következő cikkekben azt is megmutatom, hogyan kell mérni az értékkészletek közötti “távolságot” és a szekvenciák közötti távolságot.

Minkowski távolság

amikor a távolságra gondolunk, általában a városok közötti távolságokat képzeljük el. Ez a távolság fogalmának leg intuitívabb megértése.Szerencsére ez a példa tökéletes a Minkowski-távolságok korlátainak magyarázatára.

normált vektortér

Minkowski távolságát csak normált vektortérben tudjuk kiszámítani, ami divatos módon azt mondja: “egy olyan térben, ahol a távolságokat hosszú vektorként lehet ábrázolni.”

kezdjük azzal, hogy bebizonyítjuk, hogy a térkép vektortér.Ha térképet veszünk, azt látjuk, hogy a városok közötti távolságok normáltak vektortér mert rajzolhatunk egy vektort, amely két várost összeköt a térképen. Több vektort kombinálhatunk egy olyan útvonal létrehozásához, amely több mint két várost köt össze.Most, a melléknév ” normed.”Ez azt jelenti, hogy a vektornak megvan a hossza, egyetlen vektornak sincs negatív hossza. Ez a kényszer is teljesül, mert ha vonalat húzunk a városok között a térképen, meg tudjuk mérni annak hosszát.

Minkowski távolság-követelmények

  1. a nulla vektor, 0, nulla hosszúságú; minden más vektor pozitív hosszúságú.Ha megnézzük a térképet, ez nyilvánvaló. A várostól ugyanahhoz a városhoz való távolság nulla, mert egyáltalán nem kell utaznunk. A várostól bármely más városig tartó távolság pozitív, mert nem tudunk -20 km-t megtenni.

  2. a vektor pozitív számmal történő szorzása megváltoztatja annak hosszát anélkül, hogy megváltoztatná az irányát50 km-re északra utaztunk. Ha 50 km-rel többet utazunk ugyanabba az irányba, akkor 100 km-re északra jutunk. Az irány nem változik. Könnyű, nem?

  3. a két pont közötti legrövidebb távolság egy egyenes (ezt háromszög egyenlőtlenségnek nevezzük).Azt hiszem, ez magától értetődő.

Minkowski távolság típusok

csak egy egyenlet van a Minkowski távolságra, de paraméterezhetjük, hogy kissé eltérő eredményeket kapjunk.

\

Manhattan távolság

ez az összes koordináta abszolút különbségeinek összege. Tökéletes távolságmérés a példánkhoz. Amikor egy város térképét használhatjuk, akkor útmutatást adhatunk azzal, hogy azt mondjuk az embereknek, hogy sétáljanak/hajtsanak két várostömböt északra, majd forduljanak balra, és utazzanak még három várostömböt. Összesen öt várostömböt fognak megtenni, ez a manhattani távolság a kiindulási pont és a rendeltetési hely között.

\

euklideszi távolság

ha újra megnézzük a manhattani távolság magyarázatához használt városblokk példát, azt látjuk, hogy a megtett út két egyenes vonalból áll. Amikor egy másik egyenes vonalat rajzolunk, amely összeköti a kiindulási pontot és a célállomást, háromszöget kapunk. Ebben az esetben a pontok közötti távolság kiszámítható a Pitagorasz-tétel segítségével.

\

Csebisev-távolság

a Minkowski-távolság szélsőséges esete. Amikor a végtelent használjuk a P paraméter értékeként, akkor egy olyan mutatót kapunk, amely a távolságot a koordináták közötti maximális abszolút különbségként határozza meg:

\

kíváncsi voltam, hogyan használják a gyakorlatban, és találtam egy példát. Egy raktárban a helyek közötti távolság ábrázolható Csebisev távolság ha felső darut használnak, mert a daru mindkét tengelyen ugyanabban az időben, azonos sebességgel mozog.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.