|
||||||||||
| PREV CLASS NEXT CLASS | FRAMES NO FRAMES | |||||||||
| SUMMARY: INNER | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD | |||||||||
java.lang.Object | +--dataanalysis.tools.ClassifierConfigFile
Diese Klasse stellt die Methoden zur Erstellung und Benutzung einer
Konfigurationsdatei f?r einen Klassifizierer bereit.
Das Tool dbExplorerConsole benutzt diese, um Klassifikatoren bei
der Erstellung "automatisch" zu trainieren, und so dem Benutzer die
Bereitstellung der Trainingsbeispiele zu erleichtern, indem nur noch
Textdateien f?r die Erzeugung erstellt werden m?ssen.
double-Wert auf das Beispiel, so wird dieser
als Bewertung des Beispiels verwendet, ansonsten der Wert, der durch
DEFAULT festgelegt wurde.
CREATED :
gibt das Erstellungsdatum der Datei an.
DEFAULT=f :
ein double-Wert, der als Standard-Klassifikation benutzt wird.
Ist f kein g?ltiger double-Wert, so wird dieser ignoriert.
END :
bricht das Einlesen nach dieser Zeile ab.
NEEDS=x :
bezeichnet einen Namen eines ben?tigten Klassifizierers. Wird noch nicht
von newClassifier(String,ClassifierDatabase) beachtet.
NEGATIVDICT=x :
den Namen des Negativ-W?rterbuches (Stopwortliste) des Klassifizierers.
Durch dieses Schl?sselw?rt wird die Variable
Vectorizer.negativDictionariesName gesetzt.
THRESHOLD=f :
ein double-Wert, der den Threshold des Klassifizierers
festlegt.
TYPE=x :
legt den Typ des Klassifizierers fest (Klassenname).
VECTORIZER=x :
den Namen des Vektorisierers des Klassifizierers.
Durch dieses Schl?sselw?rt wird die Variable
Classifier.theVectorizerName gesetzt.
WORDDICT=x :
den Namen des Feature-W?rterbuches des Klassifizierers. Durch dieses
Schl?sselw?rt wird die Variable
Classifier.wordDictionaryName gesetzt.
| Field Summary | |
static int |
ASIS
Konstante f?r eine "asis" Beispielzeile |
(package private) java.lang.String |
classifierType
der Typ (Klassenname) diese Klassifizierers. |
static int |
COMMENT
Konstante f?r eine Kommentarzeile |
protected java.lang.String |
currentLine
Aktuell von next zur?ckgegebene Zeile. |
protected int |
currentLineNr
Zeilennummer der zuletzt von next zur?ckgegebenen
Zeile. |
protected static boolean |
DEBUG
Debug-Variable |
protected double |
defaultClassification
Die Standardbewertung der Beispiele. |
protected java.util.List |
exampleLines
In dieser Liste sind die Beispiele und die Kommentarzeilen abgespeichert. |
protected java.lang.String |
filename
Der Dateiname dieser Konfigurationsdatei |
static int |
KW_CREATED
Konstante f?r das Schl?sselwort CREATED. |
static int |
KW_DEFAULT
Konstante f?r das Schl?sselwort DEFAULT. |
static int |
KW_END
Konstante f?r das Schl?sselwort END. |
static int |
KW_NEEDS
Konstante f?r das Schl?sselwort NEEDS. |
static int |
KW_NEGATIVDICT
Konstante f?r das Schl?sselwort NEGATIVDICT. |
static int |
KW_THRESHOLD
Konstante f?r das Schl?sselwort THRESHOLD. |
static int |
KW_TYPE
Konstante f?r das Schl?sselwort TYPE. |
static int |
KW_UNKNOWN
Konstante f?r ein unbekanntes Schl?sselwort. |
static int |
KW_VECTORIZER
Konstante f?r das Schl?sselwort VECTORIZER. |
static int |
KW_WORDDICT
Konstante f?r das Schl?sselwort WORDDICT. |
static int |
LEER
Konstante f?r eine Leerzeile |
private java.util.ListIterator |
lines
Dieser Iterator wird als "Filter" benutzt. |
protected java.util.Set |
neededClassifiers
Hier sind alle Namen der ben?tigten Klassifizierer abgespeichert. |
protected java.lang.String |
negativDictName
Der Name des Negativ-W?rterbuchnamen des Vektorisierers. |
static int |
NORMAL
Konstante f?r eine normale Beispielzeile |
java.io.PrintStream |
out
legt den PrintStream fest, ?ber den die Ausgaben
bei VERBOSE=true gemacht werden. |
static java.lang.String |
packagePrefix
Packetprefix, falls die Klasse in der Datei keinen Packetpfad hat |
protected boolean |
returnComments
Legt fest, ob die Iterator-Methoden auch die Kommentarzeilen zur?ckliefern. |
(package private) double |
threshold
Der Threshold des Klassifizierers. |
protected java.lang.String |
vectorizerName
Der Name des Vectorizers f?r diesen Klassifizierer. |
boolean |
VERBOSE
Diese Variable legt fest, ob Ausgaben ?ber den Fortschritt der Klassifikatorerzeugung ?ber out gemacht werden sollen. |
protected java.lang.String |
wordDictName
Der Name des Feature-W?rterbuchnamen. |
| Constructor Summary | |
ClassifierConfigFile()
|
|
ClassifierConfigFile(boolean returnComments)
|
|
ClassifierConfigFile(java.lang.String filename)
|
|
ClassifierConfigFile(java.lang.String filename,
boolean returnComments)
|
|
| Method Summary | |
boolean |
add(java.lang.String example)
F?gt ein Beispiel an Ende dieser Konfigurationsdatei hinzu. |
boolean |
add(java.lang.String example,
double classification,
boolean asis)
F?gt ein Beispiel an Ende dieser Konfigurationsdatei hinzu. |
boolean |
addComment(java.lang.String comment)
F?gt eine Kommentarzeile an Ende dieser Konfigurationsdatei hinzu. |
boolean |
addNeededClassifier(java.lang.String name)
F?gt einen Klassifizierernamen zu der Liste der ben?tigten Klassifizierer hinzu. |
static java.lang.String |
cleanLine(java.lang.String line)
Entfernt die Bewertung, Anf?hrungszeichen und das evtl. |
boolean |
deleteNeededClassifier(java.lang.String name)
Entfernt einen Klassifizierernamen aus der Liste der ben?tigten Klassifizierer. |
double |
getClassification()
Liefert die Bewertung f?r das zuletzt von next
zur?ckgegebene Beispiel. |
java.lang.String |
getClassifierType()
Liefert den Typ (Klassenname) f?r den Klassifizierer |
double |
getDefaultClassification()
Liefert die Standardbewertung der Beispiele. |
int |
getExampleType()
Liefert die Art des Beispiels f?r das zuletzt von next
zur?ckgegebene Beispiel zur?ck. |
java.lang.String |
getFilename()
Liefert den Dateinamen, unter dem die Datei gespeichert wird. |
private static java.lang.String |
getKeywordName(java.lang.String line)
Liefert den Schl?sselwortteil aus einer Kommentarzeile. |
static int |
getKeywordType(java.lang.String line)
Liefert den Typ des Schl?sselwortes im ?bergebenen String zur?ck. |
private static java.lang.String |
getKeywordValue(java.lang.String line)
Liefert das Schl?sselwortargument aus einer Kommentarzeile. |
static int |
getLineType(java.lang.String line)
Liefert den Typ einer Zeile zur?ck. |
java.util.Iterator |
getNeededClassifiers()
Liefert einen Iterator ?ber die Namen aller ben?tigten Klassifizierer. |
java.lang.String |
getNegativDictName()
Liefert den Negativ-W?rterbuchnamen des Vektorisierers. |
double |
getThreshold()
Liefert den Wert der Variable threshold. |
java.lang.String |
getVectorizerName()
Liefert den Vectorizernamen. |
java.lang.String |
getWordDictName()
Liefert den Feature-W?rterbuchnamen. |
boolean |
hasNext()
Gibt true zur?ck, falls diese Konfigurationsdatei noch
mehr Elemente (Beispiele) hat, d.h. |
void |
loadFromFile()
L?dt die Konfigurationsdatei aus einer Datei mit dem Namen, den getFilename() zur?ckliefern w?rde. |
Classifier |
newClassifier(java.lang.String name,
ClassifierDatabase db)
Erzeugt einen neuen Klassifizierer mit den Beispielen, die in dieser Konfigurationsdatei vorhanden sind. |
java.lang.Object |
next()
Liefert das n?chste Element (Beispiel) dieser Konfigurationsdatei. |
void |
remove()
L?scht das Beispiel aus der Konfigurationsdatei, das durch den letzten Aufruf von next zur?ckgeliefert wurde. |
void |
saveToFile()
Speichert den aktuellen Stand der Konfigurationsdatei in einer Datei mit dem Namen, den getFilename() zur?ckliefern w?rde. |
void |
setClassifierType(java.lang.String v)
Setzt den Typ (Klassenname) f?r den Klassifizierer |
void |
setDefaultClassification(double v)
setzt die Standardbewertung der Beispiele. |
void |
setFilename(java.lang.String filename)
Setzt den Dateinamen, unter dem die Datei gepeichert wird. |
void |
setNegativDictName(java.lang.String v)
setzt den Negativ-W?rterbuchnamen des Vektorisierers. |
void |
setThreshold(double v)
Setzt den Wert der Variable threshold. |
void |
setVectorizerName(java.lang.String v)
setzt den Vectorizernamen. |
void |
setWordDictName(java.lang.String v)
setzt den Feature-W?rterbuchnamen. |
| Methods inherited from class java.lang.Object |
|
| Field Detail |
protected static final boolean DEBUG
public boolean VERBOSE
out gemacht werden sollen.
true.public java.io.PrintStream out
PrintStream fest, ?ber den die Ausgaben
bei VERBOSE=true gemacht werden.
System.out.public static final int LEER
public static final int NORMAL
public static final int ASIS
public static final int COMMENT
public static final int KW_UNKNOWN
public static final int KW_TYPE
TYPE.public static final int KW_DEFAULT
DEFAULT.public static final int KW_THRESHOLD
THRESHOLD.public static final int KW_NEEDS
NEEDS.public static final int KW_CREATED
CREATED.public static final int KW_VECTORIZER
VECTORIZER.public static final int KW_WORDDICT
WORDDICT.public static final int KW_NEGATIVDICT
NEGATIVDICT.public static final int KW_END
END.public static java.lang.String packagePrefix
protected java.lang.String currentLine
next zur?ckgegebene Zeile.
Der Inhalt ist noch nicht formatiert, f?hrende Leerzeichen sind
schon entfernt, Tabulator-Zeichen sind in Leerzeichen umgewandelt.protected int currentLineNr
next zur?ckgegebenen
Zeile. (-1, wenn next noch nicht aufgerufen wurde).protected java.util.List exampleLines
private java.util.ListIterator lines
protected boolean returnComments
false. Setzen ist
ausschliesslich ?ber den Konstruktor m?glich.double threshold
protected java.lang.String filename
protected double defaultClassification
protected java.lang.String vectorizerName
protected java.lang.String wordDictName
protected java.lang.String negativDictName
java.lang.String classifierType
protected java.util.Set neededClassifiers
| Constructor Detail |
public ClassifierConfigFile()
public ClassifierConfigFile(java.lang.String filename)
public ClassifierConfigFile(boolean returnComments)
public ClassifierConfigFile(java.lang.String filename,
boolean returnComments)
| Method Detail |
public boolean hasNext()
true zur?ck, falls diese Konfigurationsdatei noch
mehr Elemente (Beispiele) hat, d.h. der n?chste Aufruf von
next nicht zu einer Exception f?hren w?rde.true, falls diese Konfigurationsdatei noch mehr
Elemente (Beispiele) hat.
public java.lang.Object next()
throws java.util.NoSuchElementException
String.
public void remove()
throws java.lang.IllegalStateException
next zur?ckgeliefert wurde.next noch nicht aufgerufen wurde, oder
aber die Methode remove schon nach dem dem letzten Aufruf
der Methode next aufgerufen wurde.
public double getClassification()
throws java.util.NoSuchElementException
next
zur?ckgegebene Beispiel.next
zur?ckgegebene Beispiel oder den Wert von
defaultClassification, wenn keine Bewertung verf?gbar war.next noch nicht aufgerufen wurde, oder
die aktuelle Zeile eine Kommentarzeile ist.
public int getExampleType()
throws java.util.NoSuchElementException
next
zur?ckgegebene Beispiel zur?ck.next
zur?ckgegebene Beispiels. Es werden die Konstanten
LEER, NORMAL, ASIS und COMMENT
benutzt.next noch nicht aufgerufen wurde.public boolean add(java.lang.String example)
example - die URL des Beispiels bzw. den Beispielstring
f?r den Klassifikator.true wenn das Einf?gen erfolgreich war,
false sonst.
public boolean add(java.lang.String example,
double classification,
boolean asis)
example - die URL des Beispiels bzw. den Beispielstring
f?r den Klassifikator.classification - die Bewertung f?r dieses Beispielasis - true wenn das Beispiel "asis" eingef?gt werden
soll, false sonst.true wenn das Einf?gen erfolgreich war,
false sonst.public boolean addComment(java.lang.String comment)
comment - der Kommentartrue wenn das Einf?gen erfolgreich war,
false sonst.
public void saveToFile()
throws java.io.IOException
getFilename() zur?ckliefern w?rde.
public void loadFromFile()
throws java.io.IOException
getFilename() zur?ckliefern w?rde.public double getThreshold()
threshold.threshold.public void setThreshold(double v)
threshold.v - Wert, der der Variable threshold zugewiesen
werden soll.public java.lang.String getFilename()
public void setFilename(java.lang.String filename)
filename - der Dateiname, unter dem die Datei gepeichert wird.public double getDefaultClassification()
public void setDefaultClassification(double v)
v - Wert f?r die Standardbewertung der Beispiele.public java.lang.String getVectorizerName()
null wenn dieser noch nicht
gesetzt wurde.public void setVectorizerName(java.lang.String v)
v - Wert f?r den Vectorizernamen.public java.lang.String getWordDictName()
null wenn dieser
noch nicht gesetzt wurde.public void setWordDictName(java.lang.String v)
v - Wert f?r den Feature-W?rterbuchnamen.public java.lang.String getNegativDictName()
null wenn dieser
noch nicht gesetzt wurde.public void setNegativDictName(java.lang.String v)
v - Wert f?r den Negativ-W?rterbuchnamen des Vektorisierers.public java.lang.String getClassifierType()
public void setClassifierType(java.lang.String v)
v - den Typ (Klassenname) f?r den Klassifizierer.public boolean addNeededClassifier(java.lang.String name)
name - der Name des Klassifizierers, der ben?tigt wird.true, wenn der Name noch nicht vorhanden warfalse.public boolean deleteNeededClassifier(java.lang.String name)
name - der Name des Klassifizierers, der ben?tigt wird.true, wenn der Name noch nicht vorhanden warfalse.public java.util.Iterator getNeededClassifiers()
public Classifier newClassifier(java.lang.String name,
ClassifierDatabase db)
throws java.lang.ClassNotFoundException,
ElementExistsException
VERBOSE=true, so wird f?r jedes Beispiel,
dass zum Klassifizierer hinzugef?gt wird eine Ausgabe ?ber
out gemacht, ?ber die man den Typ und Erfolg des Beispiels
ersehen kann.name - der Name, unter dem der Klassifizierer in der Datenbank
angelegt werden soll.db - die Datenbank, in die der Klassifizierer eingef?gt werden
soll.null, wenn einer der Parameter null ist.classifierType nicht gefunden werden konnte oder
wenn ein Fehler bei der Initialisierung des Klassifizieres
aufgetreten ist.public static int getLineType(java.lang.String line)
LEER, NORMAL, ASIS und COMMENT
benutzt.LEER wenn
null ?bergeben wurde.public static int getKeywordType(java.lang.String line)
KW_UNKNOWN, KW_TYPE,
KW_DEFAULT, KW_THRESHOLD, KW_NEEDS,
KW_CREATED, KW_VECTORIZER, KW_WORDDICT,
KW_NEGATIVDICT und KW_END
unterschieden.line - die Zeile mit dem Schl?sselwort.private static java.lang.String getKeywordName(java.lang.String line)
private static java.lang.String getKeywordValue(java.lang.String line)
public static java.lang.String cleanLine(java.lang.String line)
line - der String, der bereinigt werden soll.null, wenn
null ?bergeben wurde. Wurden etwas entfernt, so wird
ein neuer String zur?ckgegeben, ansonsten der ?bergebene String.
|
||||||||||
| PREV CLASS NEXT CLASS | FRAMES NO FRAMES | |||||||||
| SUMMARY: INNER | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD | |||||||||