FormareEducație și școlile secundare

Cel mai apropiat vecin metodă: exemplu de muncă

cel mai apropiat vecin metoda este cea mai ușoară clasificator metrice, care se bazează pe evaluarea similaritatea diferitelor obiecte.

obiect Analizat aparține clasei căreia îi aparțin subiecții eșantionului de formare. Să ne aflăm care este cel mai apropiat vecin. Încercați să înțeleagă această problemă complicată, exemple de tehnici diferite.

metoda ipoteză

cel mai apropiat vecin metodă poate fi considerată ca fiind algoritmul cel mai frecvent utilizate pentru clasificare. Obiectul în curs de clasificare aparține y_i de clasă, la care cel mai apropiat obiect de învățare eșantion x_i.

Specificitatea metodelor de vecinii cei mai apropiați

k cel mai apropiat vecin metoda poate îmbunătăți acuratețea clasificării. obiect Analizat face parte din aceeași clasă ca și cea mai mare parte a vecinilor săi, adică, k aproape de ea obiecte din x_i probei analizate. În rezolvarea problemelor cu două clase de numărul de vecini va fi ciudat pentru a evita o situație de ambiguitate, în cazul în care același număr de vecini vor aparține unor clase diferite.

Tehnica vecinilor suspendate

Metoda analizată-Postgresql tsvector vecinii cel mai apropiat este utilizat atunci când numărul de clase de cel puțin trei, și nu puteți utiliza un număr impar. Dar ambiguitate apare chiar și în aceste cazuri. Apoi, vecinul i-lea devine greutate w_i, care scade cu vecinul rang i. Aceasta se referă la clasa obiectului, care va avea o greutate totală maximă între vecini apropiați.

Ipoteza de compactitate

În centrul tuturor metodele de mai sus este ipoteza compactitate. Aceasta sugerează o legătură între măsura similaritatea obiectelor și apartenența la aceeași clasă. În această situație, granița dintre diferitele tipuri este o formă simplă, și de a crea clase de obiecte în spațiu zonă mobil compact. În aceste zone în analiza matematică luate pentru a înțelege un set mărginit închis. Această ipoteză nu este legată de percepția de zi cu zi a cuvântului.

Formula de bază

Să examinăm mai apropiat vecin. În cazul în care propunerea de formare de tip eșantion „obiect-răspuns» X ^ m = \ {(x_1, y_1), \ dots, (x_m, y_m) \}; în cazul în care o multitudine de obiecte pentru a defini distanța funcției \ Rho (x, x „), care este reprezentat sub forma unui model de similaritate adecvată a obiectelor prin creșterea valorii funcției scade similaritate între obiecte x, x“.

Pentru orice obiect, u va construi un eșantion de formare obiecte x_i cu creșterea distanțelor la u:

\ Rho (u, X_ {1; u}) \ leq \ rho (u, X_ {2; u}) \ leq \ cdots \ leq \ rho (u, X_ {m; u}),

unde X_ {i; u} caracterizează eșantionul de învățare obiect, care este i-lea obiect sursă vecin u. O astfel de notație și utilizarea să răspundă la vecin i-lea: y_ {i; u}. Ca rezultat, am descoperit că orice obiect u provoacă renumerotarea probă proprie.

Determinarea numărului k de vecini

cel mai apropiat vecin metodă atunci când k = 1 este capabil de a da o clasificare eronată, nu numai pe obiecte cu emisii, ci și pentru alte clase care sunt aproape.

Dacă luăm k = m, algoritmul va fi la fel de stabil și va degenera într-o valoare constantă. Acesta este motivul pentru care fiabilitatea este important să se evite indicii extreme k.

În practică, criteriul ca indicele optim k utilizat de alunecare de control.

emisiile de proiectii

Obiectele de studiu sunt în mare măsură inegale, dar printre ei sunt cei care au caracteristicile unei clase și sunt denumite standarde. La apropierea subiectului modelul ideal de probabilitate ridicată de apartenență la această clasă.

Cum rezultativen metoda de vecinii cei mai apropiați? Un exemplu poate fi vazut pe baza unor categorii periferice și non-informative ale obiectelor. Se presupune mediul dens al obiectului altor reprezentanți ai acestei clase. Când le eliminați din clasificarea eșantionare de calitate nu va avea de suferit.

Intră în un anumit număr de probe poate rafalele de zgomot care sunt „pe teren“ a unei clase. Eliminarea impact substanțial pozitiv asupra calității clasificării.

În cazul în care proba luată din uninformative și elimina obiectele de zgomot, puteți conta pe câteva rezultate pozitive, în același timp.

Prima metodă de interpolare a celui mai apropiat vecin permite clasificarea pentru a îmbunătăți calitatea, reduce cantitatea de date stocate, reduce timpul de clasificare, care este cheltuit pe alegerea următoarelor standarde.

Utilizarea probelor de ultra-mare

cel mai apropiat vecin metodă se bazează pe stocarea reală a obiectelor educaționale. Pentru a crea foarte mostre pe scară largă, care utilizează o problemă tehnică. Scopul nu este doar pentru a salva o cantitate semnificativă de informații, dar, de asemenea, în cantitatea minimă de timp pentru a avea timp pentru a găsi orice obiect u k printre cei mai apropiați vecini.

Pentru a face față acestei sarcini, sunt utilizate două metode:

  • proba subțiată, printr-un obiect de evacuare non-date;
  • utilizarea eficientă structură de date speciale și a codurilor pentru căutarea instantanee a mai apropiați vecini.

Reguli de metode de selecție

Clasificarea de mai sus a fost luată în considerare. Cel mai apropiat vecin metoda este utilizată în rezolvarea problemelor practice, care este cunoscut în prealabil distanța funcției \ Rho (x, x „). In obiecte care descriu vectorii numerice folosesc o metrică euclidiană. Această alegere nu are nici o justificare specială, dar implică măsurarea tuturor semnelor „în aceeași scală.“ În cazul în care acest factor nu este luat în considerare, atunci metrica va predomina caracteristica cu cele mai mari valori numerice.

În cazul în care există o cantitate substanțială de caracteristici, calcularea distanței ca suma abaterilor asupra simptomelor apar anumite dimensiuni serioase probleme.

În spațiul tridimensional de mare distanță unul față de altul va toate obiectele. În cele din urmă, orice probă va fi de lângă obiectul de a fi studiate k vecini. selectat un număr mic de caracteristici informative pentru a elimina această problemă. Algoritmi de calcul al estimărilor construi pe baza unor seturi diferite de semne și pentru fiecare individ a construi funcția lor de proximitate.

concluzie

Calculele matematice implică adesea utilizarea de o varietate de tehnici care au propriile lor caracteristici distinctive, avantaje și dezavantaje. Vizualizat cel mai apropiat vecin metoda poate rezolva destul de o problemă serioasă, datorită caracteristicilor obiectelor matematice. Conceptul experimental, bazat pe metoda analizată este utilizată în mod activ în inteligență artificială.

În sistemele expert nu trebuie să clasifice doar obiecte, ci arată, de asemenea, utilizatorul o explicație a clasificării în cauză. În această metodă, o explicație a acestui fenomen sunt exprimate în raport cu obiectul unei anumite clase precum și locația sa în raport cu eșantionul utilizat. specialiștii din industria juridice, geologi, medici, ia acest „precedent“ logica îl utilizează în mod activ în cercetarea lor.

Pentru a fi analizat metoda a fost cea mai fiabilă, eficientă, oferind rezultatele dorite, trebuie să ia minim cifra k, in timp ce evita, de asemenea, emisiile printre obiectele analizate. Acesta este motivul pentru care utilizarea standardelor și metoda de selecție, precum și valorile de optimizare.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 ro.atomiyme.com. Theme powered by WordPress.