Hauptnavigation

Wie viele Beispiele werden ben?tigt? next up previous contents
Weiter: Evaluierung mit J4.8 Algorithmus Hoch: Evaluierung Zurück: Evaluierung

Wie viele Beispiele werden ben?tigt?

Um die Leistung des A D T-Systems beurteilen zu k?nnen, ist es zuerst einmal interessant zu bestimmen, wie viele Beispiele ein Lernverfahren ben?tigt, um zufriedenstellend zu klassifizieren.

Zuerst wird die Gr??e des Hypothesenraumes berechnet. Dazu bestimmt man die Anzahl der Attribute und die Anzahl der Attributwerte. Durchschnittlich gibt es 40 Attribute, die sich wie folgt zusammensetzen. Bei den Kontrollw?rtern ohne Parameter gibt es 12 Attribute mit 2 Attributwerten und 12 mit 4 Attributwerten. Bei den Kontrollw?rtern mit Parametern gibt es im Schnitt 8 Attribute mit 2 und 8 mit 4 Attributwerten.

Die Gr??e des Hypothesenraumes berechnet sich folgenderma?en:

Attribute:

Attributwerte m1 = 2
Attribute n1 = 12
       
Attributwerte m2 = 4
Attribute n2 = 12
       
Attributwerte m3 = 2
Attribute n3 = 8
       
Attributwerte m4 = 4
Attribute n4 = 8
Hypothesenraum:


$\displaystyle \left\vert\vphantom{H}\right.$H$\displaystyle \left.\vphantom{H}\right\vert$ = m1n1 . m2n2 . m3n3 . m4n4  
$\displaystyle \left\vert\vphantom{H}\right.$H$\displaystyle \left.\vphantom{H}\right\vert$ = 28 + 12 . 48 + 12  
  = 220 . 240  
  = 260  
  = $\displaystyle \underline{1,15292 \cdot 10^{18}}$  

Die Anzahl m der mindestens ben?tigten Beispiele errechnet sich f?r PAC-Lerner nach [MORIK 2002] mit folgender Formel:

m $\displaystyle \geq$ $\displaystyle {\frac{1}{\varepsilon}}$$\displaystyle \left(\vphantom{ln(\left\vert H\right\vert) + ln\frac{1}{\delta}}\right.$ln($\displaystyle \left\vert\vphantom{H}\right.$H$\displaystyle \left.\vphantom{H}\right\vert$) + ln$\displaystyle {\frac{1}{\delta}}$$\displaystyle \left.\vphantom{ln(\left\vert H\right\vert) + ln\frac{1}{\delta}}\right)$

Setzt man den errechneten Hypothesenraum in die Formel ein,


    ln($\displaystyle \left\vert\vphantom{H}\right.$H$\displaystyle \left.\vphantom{H}\right\vert$) + ln$\displaystyle {\frac{1}{0,2}}$  
    ln(1, 15292 . 1018) + ln$\displaystyle {\frac{1}{0,2}}$ = $\displaystyle \underline{\underline{43,19827}}$  

ergibt sich, dass mindestens 43 Beispiele ben?tigt werden.


next up previous contents
Weiter: Evaluierung mit J4.8 Algorithmus Hoch: Evaluierung Zurück: Evaluierung
Christian H?ppe, christian.hueppe@web.de