19 - Konzentrationsmessung

Lorenzkurve

Die Merkmalsausprägungen seien sortiert: $$x_1\leq\ldots\leq x_n.$$ Weiter sei $$a_j=\frac{x_1+\ldots+x_j}{x_1+\ldots+x_n}.$$ Dann bezeichnet man die Kurve, die man durch Verbindung der \(n+1\) Punktepaare \((0,0),(1/n,a_1),\ldots,(n/n,a_n)\) erhält, als Lorenzkurve \(L(t)\), \(t\in[0,1]\).

Eigenschaften

  • Minimale Konzentration: Die Merkmalssumme verteilt sich nach einer Gleichverteilung auf die \(n\) Merkmalsträger; \(x_j=s/n\), \(a_j=\frac{js/n}{s}\) für \(j=1,\ldots,n\), und die Lorenzkurve entspricht der Diagonalen \(y=x\).
  • Maximale Konzentration: \(x_1=\ldots=x_{n-1}=0\), \(a_1=\ldots=a_{n-1}=0\), \(a_n=1\).
  • Die Lorenzkurve ist monton steigend und konvex.

Gini-Koeffizient

Der Gini-Koeffizienz \(G\) ist definiert durch $$G=2\cdot\text{Fläche zwischen Lorenzkurve und Diagonale.}$$

Berechnungsformel

Es gilt $$G=\frac{n+1-2\sum_{j=1}^n\ a_j}{n}.$$ Bei minimaler Konzentration ist \(G=0\), bei maximaler Konzentration gilt \(G=\frac{n-1}{n}\).

Normierter Gini-Koeffizient

Der normierte Gini-Koeffizient ist gegeben durch $$G^{\ast}=\frac{n}{n-1}G,$$ mit Werten zwischen 0 und 1.

 

 

 

 

 

Herfindahl-Index

Der Herfindahl-Index \(H\) berechnet sich zu $$H=\sum_{i=1}^n\ p_i^2,$$ wobei $$p_i=\frac{x_i}{x_1+\ldots+x_n}$$ dem Merkmalsanteil des \(i\)-ten Merkmalsträgers entspricht.

Eigenschaften

Bei minimaler Konzentration ist \(H=1/n\), bei maximaler Konzentration gilt \(H=1\).