19 - Konzentrationsmessung
Lorenzkurve
Die Merkmalsausprägungen seien sortiert: $$x_1\leq\ldots\leq x_n.$$ Weiter sei $$a_j=\frac{x_1+\ldots+x_j}{x_1+\ldots+x_n}.$$ Dann bezeichnet man die Kurve, die man durch Verbindung der \(n+1\) Punktepaare \((0,0),(1/n,a_1),\ldots,(n/n,a_n)\) erhält, als Lorenzkurve \(L(t)\), \(t\in[0,1]\).
Eigenschaften
- Minimale Konzentration: Die Merkmalssumme verteilt sich nach einer Gleichverteilung auf die \(n\) Merkmalsträger; \(x_j=s/n\), \(a_j=\frac{js/n}{s}\) für \(j=1,\ldots,n\), und die Lorenzkurve entspricht der Diagonalen \(y=x\).
- Maximale Konzentration: \(x_1=\ldots=x_{n-1}=0\), \(a_1=\ldots=a_{n-1}=0\), \(a_n=1\).
- Die Lorenzkurve ist monton steigend und konvex.
Gini-Koeffizient
Der Gini-Koeffizienz \(G\) ist definiert durch $$G=2\cdot\text{Fläche zwischen Lorenzkurve und Diagonale.}$$
Berechnungsformel
Es gilt $$G=\frac{n+1-2\sum_{j=1}^n\ a_j}{n}.$$ Bei minimaler Konzentration ist \(G=0\), bei maximaler Konzentration gilt \(G=\frac{n-1}{n}\).
Normierter Gini-Koeffizient
Der normierte Gini-Koeffizient ist gegeben durch $$G^{\ast}=\frac{n}{n-1}G,$$ mit Werten zwischen 0 und 1.
Herfindahl-Index
Der Herfindahl-Index \(H\) berechnet sich zu $$H=\sum_{i=1}^n\ p_i^2,$$ wobei $$p_i=\frac{x_i}{x_1+\ldots+x_n}$$ dem Merkmalsanteil des \(i\)-ten Merkmalsträgers entspricht.
Eigenschaften
Bei minimaler Konzentration ist \(H=1/n\), bei maximaler Konzentration gilt \(H=1\).