|
||||||||||
| PREV CLASS NEXT CLASS | FRAMES NO FRAMES | |||||||||
| SUMMARY: INNER | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD | |||||||||
java.lang.Object
|
+--dataanalysis.databases.DatabaseElement
|
+--dataanalysis.dictionaries.Dictionary
|
+--dataanalysis.dictionaries.StringBasedDictionary
unterst?tzt den Classifier bei der Klassifizierung von Texten, da das
Dictionary STOP-Listen, Synonyme etc. enth?lt.
Aber auch der Vectorizer besitzt die M?glichkeit auf das Dictionary
zuzugreifen.
Die Implementierung basiert auf dem direkten Abspeichern der Worte in
einem Baum. Daher sollte diese Version nur bei kleinen oder bei sehr
disjunkten Wortmengen benutzt werden.
Classifier,
Vectorizer, Serialized Form| Field Summary | |
private boolean |
isCaseSensitive
Legt fest, ob das Dictionary Case-sensitive ist. |
private java.util.TreeMap |
nameNumberTranslation
Dient zur schnelleren Implementierung des Vektorisierers. |
private java.util.TreeMap |
numberNameTranslation
Dient zur schnelleren Implementierung des Dictionaries. |
protected java.lang.String |
queriedWord
beinhalted das abgefragte Wort aus getFirstRelated(String). |
protected java.lang.String |
relatedWord
beinhalted das Wort, das der letzte Aufruf von getNextRelated() zurueckgeliefert hat. |
protected java.util.TreeMap |
relatedWords
beinhalted alle verwandten Woerter von queriedWord nach Aufruf von
getFirstRelated(String). |
protected java.util.Iterator |
relatedWordsIterator
dient als Iterator fuer getNextRelated(). |
private java.util.TreeMap |
wordList
Alle W?rter werden in einer TreeMap gespeichert. |
| Fields inherited from class dataanalysis.dictionaries.Dictionary |
isCaseSensitive,
lastNumber,
queriedWord,
relatedWord,
relationValue,
wordCount |
| Fields inherited from class dataanalysis.databases.DatabaseElement |
elementname |
| Constructor Summary | |
StringBasedDictionary()
Ruft einfach StringBasedDictionary(boolean) mit dem
Parameterwert false auf. |
|
StringBasedDictionary(boolean vIsCaseSensitive)
|
|
| Method Summary | |
int |
addRelation(java.lang.String word1,
java.lang.String word2,
double value)
f?gt eine Gewichtung der Beziehung zwischen zwei Eintr?gen word1 und word2 ein.Die Relationen sind nicht kommutativ. Bei der Erstellung der Beziehungen muss darauf geachtet werden, da? keine Zirkel entstehen! |
int |
addWord(java.lang.String word)
f?gt ein neues Wort word ins Lexikon ein. |
int |
count()
gibt die Anzahl der W?rter im W?rterbuch zur?ck. |
int |
deleteRelation(java.lang.String word1,
java.lang.String word2)
l?scht eine Relation zwischen den beiden Worten word1 und word2. |
int |
deleteWord(java.lang.String word)
l?scht ein Wort word aus dem Dictionary. |
java.lang.String |
getFirstRelated(java.lang.String word)
liefert das erste verwandte Wort zu word. |
java.lang.String |
getNextRelated()
gibt das n?chste verwandte Wort zu "queriedWord" zur?ck, und setzt gleichzeitig relatedWord
Ist kein weiteres Wort vorhanden, wird ein leerer String zur?ckgegeben. |
double |
getRelationValue(java.lang.String word1,
java.lang.String word2)
liefert den Wert der Relation zwischen den beiden Worten word1 und word2. |
java.lang.String |
getWord(int number)
liefert das Element number des W?rterbuches zur?ck. |
protected java.util.TreeMap |
newTreeMap()
Hilfsfunktion, um eine neue TreeMap zu erzeugen... |
int |
numberOf(java.lang.String word)
|
int |
optimize()
sorgt f?r eine Strukturierung der W?rter im W?rterbuch. |
boolean |
queryWord(java.lang.String word)
gibt zur?ck, ob das abgefragte Wort word im W?rterbuch vorhanden ist. |
double |
relatedValue()
liefert den Wert der Relation zurueck, der zwischen dem queriedWord und dem relatedWord
besteht. |
java.lang.String |
toString()
|
| Methods inherited from class dataanalysis.dictionaries.Dictionary |
newInstance |
| Methods inherited from class dataanalysis.databases.DatabaseElement |
getElementname,
logMessage,
setElementname |
| Methods inherited from class java.lang.Object |
|
| Field Detail |
private boolean isCaseSensitive
true, so werden alle internen Vergleiche ohne
Beruecksichtigung der Gross-/Kleinschreibung durchgefuehrt.protected transient java.lang.String queriedWord
getFirstRelated(String).protected transient java.lang.String relatedWord
getNextRelated() zurueckgeliefert hat.protected transient java.util.TreeMap relatedWords
queriedWord nach Aufruf von
getFirstRelated(String).protected transient java.util.Iterator relatedWordsIterator
getNextRelated().private java.util.TreeMap wordList
private java.util.TreeMap nameNumberTranslation
private java.util.TreeMap numberNameTranslation
| Constructor Detail |
public StringBasedDictionary(boolean vIsCaseSensitive)
vIsCaseSensitive - legt fest, ob im Dictionary zwischen Gross-/Kleinschreibung unterschieden wird.public StringBasedDictionary()
StringBasedDictionary(boolean) mit dem
Parameterwert false auf.| Method Detail |
public int addWord(java.lang.String word)
throws ElementExistsException
word ins Lexikon ein.word - steht f?r das Wort, das ins Lexikon eingef?gt werden soll.
public int deleteWord(java.lang.String word)
throws DictionaryWordNotFoundException
word aus dem Dictionary.word - steht f?r das Wort, das auch den W?rterbuch gel?scht werden soll.
public int addRelation(java.lang.String word1,
java.lang.String word2,
double value)
throws DictionaryWordNotFoundException
word1 und word2 ein.word1 - steht f?r den ersten Einstrag, f?r den eine Gewichtung eingef?gt werden soll.word2 - steht f?r den zweiten Eintrag, f?r den eine Gewichtung eingef?gt werden soll.value - steht f?r den Wert der Gewichtung zwischen den beiden W?rtern.
public int deleteRelation(java.lang.String word1,
java.lang.String word2)
throws DictionaryRelationNotFoundException,
DictionaryWordNotFoundException
word1 und word2.word1 - steht f?r den ersten Eintrag, f?r den die Relation gel?scht werden soll.word2 - steht f?r den zweiten Eintrag, f?r den die Relation gel?scht werden soll.public int count()
public java.lang.String getWord(int number)
number des W?rterbuches zur?ck.number - steht f?r die Position des Eintrags, der aus dem W?rterbuch gelesen werden soll.null
zurueckgeliefert.public boolean queryWord(java.lang.String word)
word im W?rterbuch vorhanden ist.word - steht f?r das Wort, f?r das ?berpr?ft werden soll, ob es im W?rterbuch vorhanden ist oder nicht.
public java.lang.String getFirstRelated(java.lang.String word)
throws DictionaryWordNotFoundException
word.
Ist kein verwandtes Wort vorhanden, wird ein leerer String zur?ckgegeben.word - steht f?r das Wort, f?r das ein n?chstes verwandtes Wort gefunden werden soll.word nicht im Dictionary vorhanden ist.public java.lang.String getNextRelated()
relatedWord
Ist kein weiteres Wort vorhanden, wird ein leerer String zur?ckgegeben.public int optimize()
protected java.util.TreeMap newTreeMap()
TreeMap, die abhaengig von der Variable
isCaseSensitive ohne oder mit dem Comparator DictionaryComparator
initialisiert wurde.
public double getRelationValue(java.lang.String word1,
java.lang.String word2)
throws DictionaryRelationNotFoundException,
DictionaryWordNotFoundException
word1 und word2.word1 - das Wort, von dem die Relation ausgeht.word2 - das Wort, zu dem die Relation zeigt.word1 und word2.public double relatedValue()
queriedWord und dem relatedWord
besteht. Existiert kein verwandtes Wort, so wird
Double.NaN zurueckgegeben.
public int numberOf(java.lang.String word)
throws DictionaryWordNotFoundException
public java.lang.String toString()
|
||||||||||
| PREV CLASS NEXT CLASS | FRAMES NO FRAMES | |||||||||
| SUMMARY: INNER | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD | |||||||||