Formación, Educación e da escola secundaria
Método veciño máis próximo: exemplo de traballo
o método veciño máis próximo é o clasificador métrica máis fácil que é con base na avaliación da semellanza de diferentes obxectos.
obxecto analizado pertence á clase a que pertencen temas de mostra de formación. Imos descubrir o que é o veciño máis próximo. Probe entender o asunto complicado, exemplos de técnicas diferentes.
método de hipótese
método veciño máis próximo pode ser considerado como o algoritmo máis común usado para a clasificación. pasando por clasificación obxecto pertence á y_i clase, á cal o obxecto máis próximo a aprender mostra x_i.
Especificidade dos métodos de veciños máis próximos
k método veciño máis próximo pode mellorar a precisión da clasificación. obxecto analizado pertence á mesma clase que a maior parte dos seus veciños, é dicir, k preto del obxectos da x_i mostra analizada. Na resolución de problemas con dúas clases do número de veciños será estraño para evitar unha situación de ambigüidade, se o mesmo número de veciños van pertencer a diferentes clases.
A técnica de suspensión veciños
método analizado-PostgreSQL tsvector máis próximo veciños se usa cando o número de clases, polo menos tres, e non pode usar un número impar. Pero xorde a ambigüidade, mesmo nestes casos. A continuación, o veciño i-th recibe peso w_i, que diminúe co posto veciño i. El refírese á clase de obxecto, o cal terá un peso máximo entre os veciños máis próximos.
A hipótese de compactación
No corazón de todos os métodos anteriores é a hipótese de compactación. El suxire unha conexión entre a medida da semellanza dos obxectos ea súa pertenza á mesma clase. Nesta situación, a fronteira entre os distintos tipos é unha forma sinxela, e crear clases de obxectos no espazo compacto área móbil. Baixo tales áreas en análise matemática tomado para referirse a un conxunto limitado pechado. Esta hipótese non está relacionado coa percepción cotiá da palabra.
A fórmula básica
Imos examinar máis de veciño máis próximo. A formación proposto tipo de mostra "obxecto-resposta» X ^ m = \ {(x_1, y_1), \ puntos, (x_m, Y_M) \}; unha pluralidade de obxectos para definir a distancia función \ rho (x, x '), que está representado en forma de un modelo de semellanza adecuada dos obxectos, aumentando o valor da función diminúe semellanza entre obxectos x, x.
Para calquera obxecto, u vai construír unha mostra de adestramento obxectos x_i co aumento distancias para u:
\ Rho (u, x_ {1; u}) \ leq \ rho (u, x_ {2; u}) \ leq \ cdots \ leq \ rho (u, x_ {m; u}),
onde x_ {i; u} caracteriza a mostra obxecto de aprendizaxe, que é i-th obxecto de orixe veciño u. Tal cualificación e uso de responder a i-th veciño: Y_ {i; u}. Como resultado, descubrimos que calquera obxecto u provoca renumeração propia mostra.
Determinación do número de k veciños
método veciño máis próximo cando k = 1 é capaz de dar unha clasificación incorrecta, non só en obxectos de emisións, senón tamén para outras clases que están preto.
Se tomamos k = M, o algoritmo será tan estable e vai dexenerar nun valor constante. É por iso que a fiabilidade é importante para evitar índices extremos k.
Na práctica, como criterio o índice óptimo k usado deslizante de control.
emisións de rastreios
Os obxectos de estudo son amplamente desigual, pero entre eles hai os que teñen as características dunha clase e son referidos como estándares. Na proximidade do tema para o modelo ideal da súa alta probabilidade de pertencer a esta clase.
Como rezultativen método de veciños máis próximos? Un exemplo pode ser visto na base de categorías periféricas e non informativas de obxectos. Suponse ambiente denso do obxecto outros representantes desta clase. Cando elimina-los a partir da clasificación de mostraxe da calidade non vai sufrir.
Entrar nun certo número de mostras pode ruído refachos que están "no terreo" dunha clase. Eliminar impacto substancialmente positivo na calidade da clasificación.
Se a mostra retirada dos obxectos de ruído uninformative e eliminar, pode contar con algúns resultados positivos á vez.
O primeiro método de interpolación de clasificación veciño máis próximo permite mellorar a calidade, reducir a cantidade de datos almacenados, reducir o tempo de clasificación, que é gasto coa elección dos próximos estándares.
O uso de Ultra-mostras grandes
método veciño máis próximo está baseado no almacenamento real de obxectos de aprendizaxe. Para crear mostras en escala moi grande, usando un problema técnico. O obxectivo non é só para salvar unha cantidade significativa de información, pero tamén na cantidade mínima de tempo para ter tempo para atopar calquera obxecto u k entre os veciños máis próximos.
Para xestionar esta tarefa, dous métodos son usados:
- mostra diluído través dunha obxectos non son de datos de descarga;
- estrutura eficaz de uso especial de datos e códigos para a investigación instantánea dos veciños máis próximos.
Normas de métodos de selección
A clasificación mencionado anteriormente foi considerada. Máis preto método veciño é utilizado na resolución de problemas prácticos, que é coñecido de antemán a distancia función \ rho (x, x '). En obxectos describindo vectores numéricos usar unha métrica euclidiana. Esta opción non ten xustificación especial, pero implica a medición de todos os sinais "na mesma escala." Se ese factor non é tido en conta, entón a métrica predominará recurso tendo grandes valores numéricos.
Se hai unha cantidade de recursos, calculando a distancia como a suma das desviacións sobre síntomas específicos aparecen dimensión serio problema.
No espazo dimensional alta distantes un do outro vai todos os obxectos. En definitiva, calquera mostra será xunto ao obxecto a ser estudada k veciños. seleccionou un pequeno número de recursos informativos para eliminar este problema. Algoritmos para calcular estimacións construír en base a diferentes conxuntos de sinais, e para cada individuo construír a súa función de proximidade.
conclusión
cálculos matemáticos miúdo implica o uso dunha variedade de técnicas que teñen as súas propias características distintas, vantaxes e inconvenientes. Vista método veciño máis próximo pode resolver un problema moi serio, debido ás características dos obxectos matemáticos. O concepto experimental, baseado no método de análise está a empregar activamente en intelixencia artificial.
Nos sistemas expertos é necesario non só para clasificar obxectos, pero tamén amosar ao usuario unha explicación sobre a clasificación en cuestión. Neste método, unha explicación deste fenómeno están en relación ao obxecto dunha clase particular, así como a súa situación con respecto á mostra utilizada. expertos da industria legais, xeólogos, médicos, tomar esta lóxica "precedente" usalo activamente na súa busca.
A fin de ser analizado método foi o máis fiable, eficiente, dando os resultados desexados, ten que ter un valor mínimo k, á vez, evitar as emisións entre os obxectos analizados. É por iso que o uso de estándares e método de selección, así como as métricas de optimización.
Similar articles
Trending Now