Bartosz Mikulski

joskus haluamme mitata, kuinka paljon asiat muistuttavat toisiaan tai kuinka erilaisia ne ovat. Se ei tapahdu vain silloin, kun käytämme algoritmeja, kuten k-NN-luokitusta tai ryhmittelyä.

kun mitataan minkä tahansa muun koneoppimisen algoritmin tai neuroverkon suorituskykyä, joka palauttaa kompleksisen arvon, joka voi olla ” osittain oikea.”Näissä tapauksissa haluamme tietää, kuinka lähellä tulos on oikea vastaus.

selitän tässä artikkelissa muutamia etäisyysmittareita. Aloitan mittareilla, jotka perustuvat Minkowskin etäisyyteen, koska me kaikki ymmärrämme ne intuitiivisesti. Tulevissa artikkeleissa näytän myös, miten mitataan arvojen” Etäisyys ” ja sekvenssien välinen etäisyys.

Minkowskin etäisyys

kun ajattelemme etäisyyttä, kuvittelemme yleensä etäisyydet kaupunkien välillä. Se on etäisyyskäsitteen intuitiivisin ymmärrys.Onneksi tämä esimerkki on täydellinen selittämään Minkowskin etäisyyksien rajoitteet.

Normed vektoriavaruus

voimme laskea Minkowskin etäisyyden vain normedissa vektoriavaruudessa, mikä on hieno tapa sanoa: ”avaruudessa, jossa etäisyydet voidaan esittää vektorina, jolla on pituus.”

aloitetaan todistamalla, että kartta on vektoriavaruus.Jos otamme kartan, näemme, että etäisyydet kaupunkien välillä ovat normed vektoriavaruus, koska voimme piirtää vektorin, joka yhdistää kaksi kaupunkia kartalla. Voimme yhdistää useita vektoreita luodaksemme reitin, joka yhdistää enemmän kuin kaksi kaupunkia.Nyt adjektiivi ” normed.”Se tarkoittaa, että vektorilla on pituutensa eikä yhdelläkään vektorilla ole negatiivista pituutta. Tämäkin rajoitus täyttyy, koska jos piirrämme kartalle kaupunkien välisen rajan, voimme mitata sen pituuden.

Minkowskin etäisyysvaatimukset

  1. nollavektorilla 0 on nollapituus; joka toisella vektorilla on positiivinen pituus.Jos katsomme karttaa, se on selvää. Etäisyys Kaupungista samaan kaupunkiin on nolla, koska meidän ei tarvitse matkustaa lainkaan. Etäisyys Kaupungista mihin tahansa muuhun kaupunkiin on positiivinen, koska emme voi matkustaa -20 km.

  2. kertomalla vektori positiivisella luvulla muuttaa sen pituutta muuttamatta suuntaansa matkasimme 50 km pohjoiseen. Jos kuljemme 50 kilometriä enemmän samaan suuntaan, päädymme 100 kilometriä pohjoiseen. Suunta ei muutu. Helppoa,eikö?

  3. Lyhin etäisyys minkä tahansa kahden pisteen välillä on suora viiva (tätä kutsutaan Kolmioepäyhtälöksi).Mielestäni se on itsestään selvää.

Minkowskin etäisyystyypeille

on vain yksi yhtälö Minkowskin etäisyydelle, mutta voimme parametrisoida sen saadaksemme hieman erilaisia tuloksia.

\

Manhattanin etäisyys

se on kaikkien koordinaattien absoluuttisten erojen summa. Se on täydellinen etäisyyden mitta esimerkillemme. Kun Voimme käyttää kaupungin karttaa, voimme antaa suuntaa kertomalla ihmisille, että heidän pitäisi kävellä/ajaa kaksi korttelia pohjoiseen, sitten kääntyä vasemmalle ja matkustaa vielä kolme korttelia. Yhteensä he matkaavat viisi korttelia eli Manhattanin matkan lähtöpaikan ja määränpään välillä.

\

Euklidinen etäisyys

jos tarkastelemme uudelleen Manhattanin etäisyyden selittämiseen käytettyä kortteliesimerkkiä, näemme, että kulkureitti koostuu kahdesta suorasta linjasta. Kun piirrämme toisen suoran, joka yhdistää lähtöpisteen ja määränpään, päädymme kolmioon. Tällöin pisteiden välinen etäisyys voidaan laskea Pythagoraan lauseen avulla.

\

Tšebyševin etäisyys

se on Minkowskin etäisyyden ääritapaus. Kun käytämme äärettömyyttä parametrin P arvona, päädymme metriikkaan, joka määrittelee etäisyyden maksimaaliseksi absoluuttiseksi erotukseksi koordinaattien välillä:

\

ihmettelin, miten sitä käytetään käytännössä ja löysin yhden esimerkin. Varastossa paikkojen välinen etäisyys voidaan esittää Chebyshev-etäisyydeksi, jos käytetään yläpuolista nosturia, koska nosturi liikkuu molemmilla akseleilla samaan aikaan samalla nopeudella.

Vastaa

Sähköpostiosoitettasi ei julkaista.