|
||||||||||
| PREV CLASS NEXT CLASS | FRAMES NO FRAMES | |||||||||
| SUMMARY: INNER | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD | |||||||||
java.lang.Object
|
+--dataanalysis.databases.DatabaseElement
|
+--dataanalysis.dictionaries.Dictionary
|
+--dataanalysis.dictionaries.CharBasedDictionary
unterst?tzt den Classifier bei der Klassifizierung von Texten, da das
Dictionary STOP-Listen, Synonyme etc. repr?sentieren kann.
Aber auch der Vectorizer besitzt die M?glichkeit auf das Dictionary
zuzugreifen.
Classifier,
Vectorizer, Serialized Form| Field Summary | |
protected java.util.TreeMap |
currentRelated
das ist die TreeMap, auf die die Methode getNextRelated()
zugreift. |
protected java.util.Iterator |
currentRelatedIterator
das ist der Iterator, mit dem die einzelnen Elemente von currentRelated herausgesucht werden. |
protected java.util.TreeMap |
numberNameTranslation
dient zur Zuordnung der Nummern zu Worten. |
protected CharBasedDictionaryTreeNode |
wordRoot
Wurzel des Baumes |
| Fields inherited from class dataanalysis.dictionaries.Dictionary |
isCaseSensitive,
lastNumber,
queriedWord,
relatedWord,
relationValue,
wordCount |
| Fields inherited from class dataanalysis.databases.DatabaseElement |
elementname |
| Constructor Summary | |
CharBasedDictionary()
legt ein Standard-Dictionary an, indem der Konstruktor CharBasedDictionary(boolean) mit dem Parameterwert
false aufgerufen wird. |
|
CharBasedDictionary(boolean vIsCaseSensitive)
|
|
| Method Summary | |
int |
addRelation(java.lang.String word1,
java.lang.String word2,
double value)
f?gt eine Gewichtung der Beziehung zwischen zwei Eintr?gen word1 und word2 ein.Die Relationen sind nicht kommutativ. Bei der Erstellung der Beziehungen sollte der Benutzer darauf achten, keine Zirkel zu erzeugen, da das Dictionary diese nicht abfangen muss! |
int |
addWord(java.lang.String word)
f?gt ein neues Wort word ins Lexikon ein. |
int |
deleteRelation(java.lang.String word1,
java.lang.String word2)
l?scht eine Relation zwischen den beiden Worten word1 und
word2. |
int |
deleteWord(java.lang.String word)
l?scht das Wort word aus dem Dictionary. |
java.lang.String |
getFirstRelated(java.lang.String word)
liefert das erste verwandte Wort zu word. |
java.lang.String |
getNextRelated()
gibt das n?chste verwandte Wort zu "queriedWord" zur?ck. |
protected static CharBasedDictionaryTreeNode |
getNodeForWord(CharBasedDictionaryTreeNode node,
java.lang.String word,
boolean caseSensitive)
Liefert den Knoten, der das Wort word repr?sentiert, oder
null falls dieser Knoten nicht vorhanden ist.Die Methode beginnt am Knoten node und ber?cksichtigt ggf. |
double |
getRelationValue(java.lang.String word1,
java.lang.String word2)
liefert den Wert der Relation zwischen den beiden Worten word1 und word2. |
java.lang.String |
getWord(int number)
liefert das Element number des W?rterbuches zur?ck. |
int |
numberOf(java.lang.String word)
|
int |
optimize()
sorgt f?r eine Neustrukturierung des Dictionaries. |
boolean |
queryWord(java.lang.String word)
gibt zur?ck, ob das abgefragte Wort word im W?rterbuch
vorhanden ist. |
java.lang.String |
toString()
Liefert eine Stringrepr?sentation dieses Objektes. |
| Methods inherited from class dataanalysis.dictionaries.Dictionary |
count,
newInstance,
relatedValue |
| Methods inherited from class dataanalysis.databases.DatabaseElement |
getElementname,
logMessage,
setElementname |
| Methods inherited from class java.lang.Object |
|
| Field Detail |
protected CharBasedDictionaryTreeNode wordRoot
protected java.util.TreeMap numberNameTranslation
CharBasedDictionaryTreeNodeprotected transient java.util.TreeMap currentRelated
getNextRelated()
zugreift. Sie wird durch die Methoden getNextRelated() und
getFirstRelated(String) ver?ndert.protected transient java.util.Iterator currentRelatedIterator
currentRelated herausgesucht werden.| Constructor Detail |
public CharBasedDictionary()
CharBasedDictionary(boolean) mit dem Parameterwert
false aufgerufen wird.public CharBasedDictionary(boolean vIsCaseSensitive)
vIsCaseSensitive - legt fest, ob im Dictionary zwischen
Gross-/Kleinschreibung unterschieden wird. Dabei ist es der
jeweiligen Klasse ?berlassen, ob ebenfalls Unterschiede in Akzenten
ignoriert werden, wenn die Gross-/Kleinschreibung ignoriert wird.
Sollte dies geschehen, so ist dies in der Klasse zu dokumentieren!| Method Detail |
public int addWord(java.lang.String word)
throws ElementExistsException
word ins Lexikon ein. Jedes Wort
besitzt eine eindeutige Nummer im Dictionary. Durch L?schung
freiwerdene Pl?tze bzw. Nummern d?rfen nicht wieder verwendet
werden, da z.B. die Vectorizer darauf
angewiesen sind.word - steht f?r das Wort, das ins Lexikon eingef?gt werden soll.
public int deleteWord(java.lang.String word)
throws DictionaryWordNotFoundException
word aus dem Dictionary.word - steht f?r das Wort, das aus dem W?rterbuch
gel?scht werden soll.
public int addRelation(java.lang.String word1,
java.lang.String word2,
double value)
throws DictionaryWordNotFoundException
word1 und word2 ein.word1 - steht f?r den ersten Einstrag, f?r den eine Gewichtung
eingef?gt werden soll.word2 - steht f?r den zweiten Eintrag, f?r den eine Gewichtung
eingef?gt werden soll.value - steht f?r den Wert der Gewichtung zwischen den beiden
W?rtern.
public int deleteRelation(java.lang.String word1,
java.lang.String word2)
throws DictionaryRelationNotFoundException,
DictionaryWordNotFoundException
word1 und
word2.word1 - steht f?r den ersten Eintrag, f?r den die Relation
gel?scht werden soll.word2 - steht f?r den zweiten Eintrag, f?r den die Relation
gel?scht werden soll.public java.lang.String getWord(int number)
number des W?rterbuches zur?ck.number - steht f?r die Position des Eintrags, der aus
dem W?rterbuch gelesen werden soll.null zur?ckgeliefert.public boolean queryWord(java.lang.String word)
word im W?rterbuch
vorhanden ist.word - steht f?r das Wort, f?r das ?berpr?ft werden soll, ob es
im W?rterbuch vorhanden ist oder nicht.true wenn das Wort im Dictionary enthalten ist,
sonst false.
public java.lang.String getFirstRelated(java.lang.String word)
throws DictionaryWordNotFoundException
word.
Ist kein verwandtes Wort vorhanden, wird ein leerer String
zur?ckgegeben.Dictionary.queriedWord setzen!word - steht f?r das Wort, f?r das ein n?chstes verwandtes
Wort gefunden werden soll.word nicht im Dictionary
vorhanden ist.public java.lang.String getNextRelated()
Dictionary.relatedWord und
Dictionary.relationValue korrekt setzen. N?heres zu der zu erwartenden
Wertebelegung kann der Dokumentation der Variablen entnommen werden.public int optimize()
public double getRelationValue(java.lang.String word1,
java.lang.String word2)
throws DictionaryRelationNotFoundException,
DictionaryWordNotFoundException
word1 und word2.
Diese Methode darf den Wert von Dictionary.queriedWord,
Dictionary.relatedWord und Dictionary.relationValue nicht
ver?ndern!word1 - das Wort, von dem die Relation ausgeht.word2 - das Wort, zu dem die Relation zeigt.word1 und
word2.
public int numberOf(java.lang.String word)
throws DictionaryWordNotFoundException
protected static CharBasedDictionaryTreeNode getNodeForWord(CharBasedDictionaryTreeNode node,
java.lang.String word,
boolean caseSensitive)
word repr?sentiert, oder
null falls dieser Knoten nicht vorhanden ist.node und ber?cksichtigt ggf.
die Gross-/Kleinschreibung. Ist caseSensitive=false,
so wird in jedem Knoten sowohl Character.toUpperCase(c)
als auch Character.toLowerCase(c) ausprobiert.word repr?sentiert, oder
null falls dieser Knoten nicht vorhanden ist.public java.lang.String toString()
|
||||||||||
| PREV CLASS NEXT CLASS | FRAMES NO FRAMES | |||||||||
| SUMMARY: INNER | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD | |||||||||