Многофакторная логистическая регрессия

Материалы » Скоринговые системы в кредитовании физических лиц » Многофакторная логистическая регрессия

Логика построения уравнения логистической регрессии аналогична построению линейной дискриминантной функции:

log(p/(1-p)) = w0 + w1x1 + w2x2 + . + wnxn,

где р - вероятность дефолта (невозврата кредита),

w - весовые коэффициенты,

х - характеристики клиента.

В результате распознавания или классификации по предъявляемому объекту - потенциальному заемщику уравнение логистической регрессии дает оценку вероятности дефолта (невозврата) кредита. Если разработчиками скоринговой системы заранее установлено определенное пороговое значение этой вероятности для разделения двух классов объектов (например, "надежный заемщик" и "проблемный заемщик"), такая конструкция будет способна в автоматическом режиме формировать вывод о допустимости или недопустимости выдачи кредита. Все регрессионные методы чувствительны к корреляции между характеристиками, поэтому в модели не должно быть сильно коррелированных независимых переменных.

Кластерный анализ <8> - это совокупность методов, позволяющих классифицировать многомерные наблюдения, объекты (заявки потенциальных заемщиков), каждый из которых описывается набором характеристик (факторов) X1, X2, ., Xm. Целью кластерного анализа является образование групп, классов сходных между собой объектов, которые принято называть кластерами. Слово "кластер" (cluster) в переводе с английского означает: сгусток, пучок, группа. Как родственные понятия в литературе используются: класс, таксон, сгущение. В скоринговых системах в качестве классов выступают в простейшем случае два: "надежные заемщики" и "проблемные заемщики". В кластерном анализе используется политетический подход, когда все группировочные признаки одновременно учитываются при отнесении субъектов наблюдения в тот или иной класс. (При комбинационных методах группировки, когда применяется монотетический подход, формирование классов идет последовательно, по признакам.) Как правило, четкие границы каждого класса не указаны, но количество их известно. При разработке скоринговых систем кластерный анализ на основе обучающей выборки позволяет построить меру (расстояние) между двумя основными классами объектов и определить "центры" каждого класса в пространстве характеристик Х1, Х2, ., Xm, то есть сформировать ключевое правило собственно для задачи скоринга: по предъявляемому объекту вычисляются расстояния до каждого из классов ("надежные заемщики" и "проблемные заемщики"), и классифицируемый объект относится к классу, расстояние до которого оказывается минимальным. Содержательным моментом является выбор вида меры (расстояния между объектами) в пространстве признаков Х1, Х2, ., Xm (они, как было показано выше, могут иметь нечисловой характер). Данный выбор должен быть осуществлен исходя из минимизации ошибок классификации объектов (заемщиков).

В методе деревьев решений сегментация (классификация) объектов осуществляется путем последовательного дробления факторного пространства Х1, Х2, ., Xm на вложенные прямоугольные области. Первый шаг - разделение по самому значимому фактору (характеристике). Последующие шаги - повторение процедуры до тех пор, пока никакой вариант последующей сегментации не даст значимого различия между соотношением объектов разных классов по сравнению с полученными ранее сегментами. Количество разветвлений, факторы, по которым в узлах дерева решений осуществляется ветвление, и пороговые значения факторов в узлах дерева решений определяются в методе автоматически.

Идея нейронных сетей возникла в результате попыток смоделировать поведение живых существ, воспринимающих действия внешней среды и обучающихся на собственном опыте. Нейронные сети дают возможность по обучающей выборке объектов (массиву данных по заемщикам с закрытыми кредитными договорами и с известным результатом погашения кредита) конструировать структуру, состоящую из нейронов и связей и предназначенную для отнесения предъявляемого объекта (потенциального заемщика) к одному из вышеназванных классов ("надежные заемщики" или "проблемные заемщики"). Применительно к скоринговым системам нейросеть рассматривается как черный ящик, содержание которого (нейроны, количество слоев нейронов, расположение нейронов по слоям, вес нейронов и т.д.) не имеет какой-либо смысловой трактовки или явного смысла.

Статьи по теме:

Анализ эффективности валютных интервенций
После распада Бреттон – Вудской системы (банки были обязаны проводить валютные интервенции для соблюдения узких пределов фиксированных курсов с использованием доллара США в качестве интернациональной валюты, поддерживая тем самым его курс ...

Экономическая работа в страховой системе
Денежный оборот страховой компании имеет свои особенности в сравнении с другими финансовыми институтами рынка и включает формирование и использование средств страхового фонда, финансирование собственных затрат по ведению страхового дела, ...

Банк международных расчетов
К старейшим международным капиталистическим финансовым институтам принадлежит Банк международных расчетов (БМР) с головной конторой в Базеле (Швейцария). Он был учрежден в 1930 г. как наднациональный банк центральных банков мира. БМР был ...