User Tools

Site Tools


Sidebar


Menunotatki:ci:feat_sel

Feature selection

General

Books

 • H. Liu, H. Motoda “Feature Selection for Knowledge Discovery and Data Mining”, Kluwer Academic Press, 2000

Search strategies

Ranking methods

 • Correlation based ranking coefficient
  • Linear Correlation Coefficient
   • Pearson Linear Correlation
  • Nonlinear correlation (usefull for regressino problems)
   • Spearmana Correlation
 • Information theory based ranking coefficient
  • Mutual Information
  • Normalized Information Gain
  • Normalized Information Gain Ratio
  • Information Gain for Class-Feature Entrophy
  • Mantaras distance
  • Weighted Joint Entropy index
 • Statistical ranking coefficient
  • Kullback–Leibler divergence
  • Hilbert Schmidt Independence Criterium
  • Chi^2 statistic

Visualization

Głównym celem metod wizualizacji jest odzwierciedlenie danych wielowymiarowych w przestrzeni jedno, dwu lub trójwymiarowej. Innymi słowy chodzi o to by zachowując wzajemne położenie punktów w przestrzeni, lub zachowując topologię wielowymiarowej przestrzeni pokazać wzajemne położeni punktów np. zachowując ich sąsiedztwo w przestrzeni którą jesteśmy w stanie zrozumieć (stą najczęściej dwa wymiary).

Distance relation preserving methods

 • MDS
 • Samona Mapping
 • PCA

Topology preserving methods

 • SOM topological maps
 • Generative Topological Maps (GTM)
notatki/ci/feat_sel.txt · Last modified: 2019/03/21 13:06 (external edit)