Деревья решений как вариант устранения недостатков скоринговой системы

Материалы » Анализ кредитоспособности физических лиц на примере ЗАО "Банк Русский Стандарт" » Деревья решений как вариант устранения недостатков скоринговой системы

Страница 2

2. Полученную модель используют при определении класса (Давать/Не давать кредит) вновь возникших ситуаций (поступила заявка на получение кредита).

3. При существенном изменении текущей ситуации на рынке, дерево можно перестроить, т.е. адаптировать к существующей обстановке.

Практический пример:

Для демонстрации подобной технологии в качестве исходных данных была взята выборка, состоящая из 1000 записей, где каждая запись – это описание характеристик заемщика и параметр, описывающий его поведение во время погашения ссуды. При обучении дерева использовались следующие факторы, определяющие заемщика: "N Паспорта"; "ФИО"; "Адрес"; "Размер ссуды"; "Срок ссуды"; "Цель ссуды"; "Среднемесячный доход"; "Среднемесячный расход"; "Основное направление расходов"; "Наличие недвижимости"; "Наличие автотранспорта"; "Наличие банковского счета"; "Наличие страховки"; "Название организации"; "Отраслевая принадлежность предприятия"; "Срок работы на данном предприятии"; "Направление деятельности заемщика"; "Срок работы на данном направлении"; "Пол"; "Семейное положение"; "Количество лет"; "Количество иждивенцев"; "Срок проживания в данной местности"; "Обеспеченность займа"; "Давать кредит". При этом поля: "N Паспорта", "ФИО", "Адрес", "Название организации" определены алгоритмом уже до начала построения дерева решений как непригодные по причине практической уникальности каждого из значений.

Целевым полем является поле "Давать кредит", принимающий значения "Да" и "Нет". Эти значения можно интерпретировать следующим образом: "Нет" – плотильщик либо сильно просрочил с платежами, либо не вернул часть денег, "Да" – противоположность "Нет"

Анализируя полученное дерево решений, можно сказать следующее:

1. При помощи дерева решений можно проводить анализ значащих факторов. Такое возможно благодаря тому, что при определении параметра на каждом уровне иерархии, по которому происходит разделение на дочерние узлы, используется критерий наибольшего устранения неопределенности. Таким образом, более значимые факторы, по которым проводится классификация, находятся на более близком расстоянии (глубине) от корня дерева, чем менее значимые. Например, фактор "Обеспеченность займа" более значим, чем фактор "Срок проживания в данной местности". А фактор "Основное направление расходов" значим только в сочетании с другими факторами. Еще одним интересным примером значимости различных факторов служит отсутствие в построенном дереве параметра "Наличие автотранспорта", что говорит о том, что на сегодняшний день это наличие не является определяющим при оценке кредитоспособности физического лица.

2. Можно заметить, что такие показатели как "Размер ссуды", "Срок ссуды", "Среднемесячный доход" и "Среднемесячный расход" вообще отсутствуют в полученном дереве. Данный факт можно объяснить тем, что в исходных данных присутствует такой показатель как "Обеспеченность займа", и т.к. этот фактор является точным обобщением 4 вышеописанных показателей, алгоритм построения дерева решений выбрал именно его.

Очень важной особенностью построенной модели является то, что правила, по которым определяется принадлежность заемщика к той или иной группе, записаны на естественном языке. Например, на основе построенной модели получаются следующие правила:

1. Если обеспеченность займа = Да и срок проживания в данной местности более 5.5 лет, и возраст > 19.5 лет и наличие недвижимости = Да и наличие банковского счета = Да то Давать кредит = Да (Достоверно на 98%).

2. Если обеспеченность займа = Да и срок проживания в данной местности более 5.5 лет, и наличие недвижимости = Да и количество лет > 21.5 и срок работы на данном направлении, лет <= 5.5 и пол = Муж и наличие банковского счета = Нет и основное направление расходов = одежда, продукты питания и т.п. то давать кредит = Нет

Страницы: 1 2 3

Статьи по теме:

Аналитический и синтетический учет собственного капитала
Как указано в Правилах ведения бухгалтерского учета, аналитический бухгалтерский учет в банках ведется в лицевых счетах (карточках, книгах, журналах или в электронных базах), открываемых по каждому виду учитываемых средств и ценностей, с ...

История возникновения страхования
Первые признаки страхования появились еще в античные времена. Так, по дошедшим до нас источникам в рабовладельческом обществе были соглашения, суть которых состояла в стремлении рассредоточить между всеми заинтересованными лицами риск воз ...

Страхование автотранспортных средств
Страхование рисков, связанных с эксплуатацией автотранспортных средств, объединяет многообразие видов страхования, связанных с имущественными интересами владельца или пользователя автотранспортным средством при его эксплуатации. Юридическ ...