sbagliato il tipo di modello, per errore di regressione in 10 fold cross validation per Naive Bayes l’uso di R

Sono di applicazione 10 fold cross validation per Naive Bayes su alcuni dati di prova con 2 classi(0 e 1).
Ho seguito i passaggi qui sotto e sempre errore.

data(testdata)

attach(testdata)

X <- subset(testdata, select=-Class)

Y <- Class

library(e1071)

naive_bayes <- naiveBayes(X,Y)

library(caret)
library(klaR)

nb_cv <- train(X, Y, method = "nb", trControl = trainControl(method = "cv", number = 10))

## Error:
## Error in train.default(X, Y, method = "nb", trControl = trainControl(number = 10)) : 
## wrong model type for regression


dput(testdata)

structure(list(Feature.1 = 6.534088, Feature.2 = -19.050915, 
Feature.3 = 7.599378, Feature.4 = 5.093594, Feature.5 = -22.15166, 
Feature.6 = -7.478444, Feature.7 = -59.534652, Feature.8 = -1.587918, 
Feature.9 = -5.76889, Feature.10 = 95.810563, Feature.11 = 49.124086, 
Feature.12 = -21.101489, Feature.13 = -9.187984, Feature.14 = -10.53006, 
Feature.15 = -3.782506, Feature.16 = -10.805074, Feature.17 = 34.039509, 
Feature.18 = 5.64245, Feature.19 = 19.389724, Feature.20 = 16.450196, 
Class = 1L), .Names = c("Feature.1", "Feature.2", "Feature.3", 
"Feature.4", "Feature.5", "Feature.6", "Feature.7", "Feature.8", 
"Feature.9", "Feature.10", "Feature.11", "Feature.12", "Feature.13", 
"Feature.14", "Feature.15", "Feature.16", "Feature.17", "Feature.18", 
"Feature.19", "Feature.20", "Class"), class = "data.frame", row.names = c(NA, 
-1L))

Anche, come calculare R quadrato o AUC per questo modello

Set di dati: Ci sono 10000 record con 20 caratteristiche e Binari di classe.

Si prega di dput(testdata) se si desidera ottenere aiuto
Grazie David. Aggiunto dput(testdata) con 1 record.
Si tratta di lavorare dopo la modifica di etichette di classe (1, 0) e (sì, no)
Funziona anche dopo il cambio di etichetta, vettore Y <- come.fattore(Y)

InformationsquelleAutor Shivraj Nimbalkar | 2014-04-29

3 risposte

  1. 10

    NaiveBayes è un classificatore e, di conseguenza, la conversione di Y di un fattore o un valore booleano è il modo giusto per affrontare il problema. Originale formulazione che utilizza un classificatore strumento, ma utilizzando i valori numerici e quindi R è stato confuso.

    Quanto R-quadrato è interessato, sempre che la metrica è calcolato solo per problemi di Regressione non problemi di classificazione. Per valutare problemi di classificazione ci sono altre metriche, come Precisione e Richiamo.

    Si prega di consultare il link su wikipedia per ulteriori informazioni su questi parametri:
    http://en.wikipedia.org/wiki/Binary_classification

    InformationsquelleAutor user3585718

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *