Коэффициент Джини – что это такое простыми словами

Коэффициент Джини / примесь Джини (коэффициент Джини, примесь Джини, не путать с коэффициентом Джини, показатель степени расслоения доходов компании) является одним из методов, используемых в алгоритмах (моделях) дерева решений для вычислить, как часто случайно выбранный элемент из набора будет неправильно маркирован, если он был случайно помечен на основе распределения меток в подмножестве (другими словами, как часто случайно выбранный элемент будет неправильно распознаваться).

Коэффициент Джини показывает расстояние между распределениями целевых значений и показателями модели. Чем ниже значение этого показателя, тем лучше работает прогнозная модель.

Коэффициент используется в скоринговых моделях и машинном обучении в таких областях, как банковское кредитование, страхование, маркетинг.

Коэффициент Джини – это статистическая мера стратификации доходов или богатства компании. Он измеряется по шкале от 0 до 1, где ноль указывает на полное равенство, а один – на полное неравенство. Ноль будет в стране или регионе, где у всех одинаковый доход. Значение, равное единице, будет при условии, что человек заработал 100% денег, а остальные ничего не заработали. Однако на практике значения чаще всего находятся в диапазоне от 0,2 до 0,6.

Низкий коэффициент Джини не означает богатство или бедность в выборке в целом, а означает лишь небольшую разницу между самыми богатыми и самыми бедными. То же, но с другой стороны, касается высокой ставки.

По последним данным, Россия занимает примерно среднее значение этого показателя среди стран мира. Коэффициент Джини для России: 36,6, самый высокий в ЮАР – 62,73, самый низкий в Таджикистане – 22,45.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *