|
||||||||||
| PREV CLASS NEXT CLASS | FRAMES NO FRAMES | |||||||||
| SUMMARY: INNER | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD | |||||||||
java.lang.Object | +--dataanalysis.docvectors.Documentvector
h?lt eine Variable bereit, die der Vectorizer bei der Vektorisierung von Dokumenten an den Classifier ?bergeben kann. Der Documentvector wird aus Platzgruenden spaerlich repraesentiert.
Vectorizer,
Classifier, Serialized Form| Field Summary | |
protected double |
cacheAbsoluteLength
speichert die Summe aller besetzten Positionen, um die Berechnung der absoluten Laenge durch absoluteLength() zu
beschleunigen. |
protected double |
cacheEuklidLength
speichert die Summe der Quadrate aller besetzten Positionen, um die Berechnung der euklischen Laenge durch euklidLength() zu
beschleunigen. |
private java.util.TreeMap |
elements
enth?lt die Elemente des Dokumentvektors. Als keys der TreeMap werden Integer benutzt, die
values sind vom Typ Double. |
private int |
theDimension
speichert die Dimension des Vektors f?r interne Zwecke. |
| Constructor Summary | |
Documentvector()
|
|
| Method Summary | |
double |
absoluteDistanceTo(Documentvector v)
berechnet die Distanz zwischen diesem und dem uebergebenen Documentvector. |
double |
absoluteLength()
berechnet die Laenge des Documentvectors in der absolut-Norm. |
void |
addElement(int position,
double value)
f?gt ein Element zum Dokumentvektor an der Stelle position hinzu. |
int |
compareTo(java.lang.Object o)
fuehrt einen Vergleich zwischen diesem und dem uebergebenen Documentvector durch. |
double |
cosineAbsoluteAngle(Documentvector v)
berechnet das absolut-Cosinusmass zwischen diesem und dem uebergebenen Documentvector. |
double |
cosineEuklidAngle(Documentvector v)
berechnet das euklidsche Cosinusmass zwischen diesem und dem uebergebenen Documentvector. |
int |
dimension()
gibt die Dimension des Dokumentvektors zur?ck. |
double |
dotProduct(Documentvector v)
berechnet das Skalarprodukt zwischen diesem und dem uebergebenen Documentvector. |
double |
euklidDistanceTo(Documentvector v)
berechnet die Distanz zwischen diesem und dem uebergebenen Documentvector. |
double |
euklidLength()
berechnet die Laenge des Documentvectors in der euklidschen Norm. |
double |
get(int pos)
Ein Alias fuer getElement(int). |
double |
getElement(int pos)
liefert den Wert des Vektors an der Stelle pos. |
java.util.Set |
getPositions()
gibt alle besetzten Positionen als Set zurueck. |
void |
normalizeAbsolute()
normalisiert den Documentvector nach der absolut-Norm |
void |
normalizeEuklid()
normalisiert den Documentvector nach der euklidschen Norm. |
void |
set(int pos,
double value)
Ein Alias fuer setElement(int,double). |
void |
setElement(int pos,
double value)
setzt den Wert des Vektors an der Stelle pos auf "value". |
java.lang.String |
toString()
|
protected void |
updateLengths()
berechnet die zwischengespeicherten Werte der euklidschen und absoluten Laenge dieses Documentvectors neu. |
| Methods inherited from class java.lang.Object |
|
| Field Detail |
private java.util.TreeMap elements
keys der TreeMap werden Integer benutzt, die
values sind vom Typ Double. Ein eigener
Comparator wird nicht ben?tigt, da Integer
Comparable sind.private int theDimension
protected transient double cacheEuklidLength
euklidLength() zu
beschleunigen.protected transient double cacheAbsoluteLength
absoluteLength() zu
beschleunigen.| Constructor Detail |
public Documentvector()
| Method Detail |
public double get(int pos)
getElement(int).public double getElement(int pos)
pos.pos - steht f?r die Position im Vektor, von der der Wert
ermittelt werden soll.
public void set(int pos,
double value)
setElement(int,double).
public void setElement(int pos,
double value)
pos auf "value".
Ist "value" 0.0, wird intern der Wert "gel?scht".pos - steht f?r die Position im Vektor, f?r die der Wert neu gesetzt werden soll.value - steht f?r den neu einzuf?genden Wert an der ?bergebenen Stelle.
public void addElement(int position,
double value)
position hinzu.pos - steht f?r die Position, an der ein neues Element in den Vektor eingef?gt werden soll.value - stellt den Wert des Elements dar, das neu eingef?gt werden soll.public int dimension()
public java.util.Set getPositions()
public double dotProduct(Documentvector v)
v - der Documentvector, mit dem das Skalarprodukt berechnet werden soll.null, so wird 0.0 zurueckgegeben.public double euklidLength()
L = sqrt(x12 + x22 + ... +
xn2)
xk : k-te Stelle dieses Documentvectors. n : Dimension dieses Documentvectors. public double absoluteLength()
L = x1 + x2 + ... + xn
xk : k-te Stelle dieses Documentvectors. n : Dimension dieses Documentvectors. protected void updateLengths()
euklidLength(),
absoluteLength()public double cosineEuklidAngle(Documentvector v)
null, oder mindestens eine Laenge 0.0, so wird 0.0
zurueckgegeben.
cv = (this.dotProduct(v))/(this.euklidLength() * v.euklidLength())
euklidLength()public double cosineAbsoluteAngle(Documentvector v)
null, oder mindestens eine Laenge 0.0, so wird 0.0
zurueckgegeben.
cv = (this.dotProduct(v))/(this.absoluteLength() * v.absoluteLength())
absoluteLength()public void normalizeEuklid()
euklidLength()public void normalizeAbsolute()
absoluteLength()public double euklidDistanceTo(Documentvector v)
null, so wird 0.0 zurueckgegeben.euklidLength()public double absoluteDistanceTo(Documentvector v)
null, so wird 0.0 zurueckgegeben.absoluteLength()public java.lang.String toString()
public int compareTo(java.lang.Object o)
throws java.lang.ClassCastException
|
||||||||||
| PREV CLASS NEXT CLASS | FRAMES NO FRAMES | |||||||||
| SUMMARY: INNER | FIELD | CONSTR | METHOD | DETAIL: FIELD | CONSTR | METHOD | |||||||||