今回はローレンツ曲線
ジニ係数についてエクセルを
利用しながら説明していきます
[PR]※本サイトには、プロモーションが含まれています
合わせて読みたい | 概要 |
【統計基礎】pythonで実装!ローレンツ曲線 | pythonでローレンツ曲線を実装します |
ローレンツ曲線
ローレンツ曲線は
所得や資産などの分布の不平等を視覚化
するために用いられます。
この曲線の縦軸は
縦軸に所得の累積値
横軸に人口の累積値
をプロットします。
ローレンツ曲線は完全平等線から離れるほど不平等であることを示しているため
所得や資産の格差を視覚的に確認できる
ローレンツ曲線を実装する
今回は2011年 ~ 2014年に調査された5か国
日本, アメリカ, スウェーデン,中国,ドイツ
の所得格差をローレンツ曲線によって表現します!
どの国が経済格差があるのかな?
最初にローレンツ曲線作成手順説明していきます!
1.所得の低い順(昇順)にデータを並べる
2.いくつかの階級に分ける
→今回は各国の人口を5等分に分け5階級にする
3.各階級に対して
階級間の所得の合計金額を
全階級の所得の合計金額で割り
相対度数を計算する
次の表に各階級の相対度数(%)を纏める
今回は少数点第二位で四捨五入しているので
合計が100とは限らない
年 | 1階級 | 2階級 | 3階級 | 4階級 | 5階級 |
日本 | 5.4 | 10.7 | 16.3 | 24.1 | 43.5 |
アメリカ | 5.1 | 10.3 | 15.4 | 22.7 | 46.4 |
スウェーデン | 8.7 | 14.3 | 17.8 | 23 | 36.2 |
中国 | 5.2 | 9.8 | 14.9 | 22.3 | 47.9 |
ドイツ | 8.4 | 13.1 | 17.2 | 22.7 | 38.6 |
完全に平等な場合は各階級の所得の合計金額が
同じなので相対度数が20%となる
1階級 | 2階級 | 3階級 | 4階級 | 5階級 | |
完全平等 | 20 | 20 | 20 | 20 | 20 |
データ処理が終わったので
ローレンツ曲線を引いていきます。
エクセルでローレンツ曲線の作成
1.データをエクセルにセットする
ローレンツ曲線は縦軸が所得の累積度数なので
累積度数を計算する必要がある
2.累積度数を計算する表を用意する
3.1階級目の累積度数は1階級目の累積度数と同じ
B2~G2をB9~G9に入れる
4. B10にB2とB9を足す
4.B102のセルの外側をドラックして自動で連続データを作ります
累積度数の表が出来ました
人口の累積値を追加します
原点を通る線付き散布図で
ローレンツ曲線を作りたいので
原点を結ぶデータ0を追加する
人口と完全平等で散布図を作る
グラフのメモリの最大値が
100になるよう調整します
完全平等な時は真ん中に直線が出来ます。
次に各国のデータをグラフに追加する
グラフを右クリックデータの選択をする
データの選択からデータの追加をする
x軸に人口y軸に各国のデータの散布図を作る
どんどんデータを追加すれば完成です
ローレンツ曲線グラフ
ローレンツ曲線はすべて
完全平等曲線と一致していないので
所得格差は存在すると判断できます。
各国間で所得の不平等さ
に差があるかはローレンツ曲線が
完全平等線より離れているかで判断します
スウェーデンと中国のローレンツ曲線
を比較すると中国の方が
が完全曲線より離れているので
中国の方が不平等である
とグラフからは判断できます
完全曲線より遠い方が不平等・・
ジニ係数
不平等さをグラフで表すのがローレンツ曲線
不平等さを示す指標がジニ係数です。
ジニ係数は完全平等線と弧の形で描かれた
曲線で囲まれた面積の2倍の値で指標を取ります
0に近いほど平等
1に近いほど不平等といった判断が可能です
面積の大きさで判断
参考文献
1変数記述統計の分野
ローレンツ曲線
ジニ係数の説明より