Наверное, я скучный человек. Все рисковики скучные люди. Как и бухгалтера. Встречаются, конечно, отклонения, но на доверительном интервале (интервал, который покрывает неизвестный параметр с заданной надёжностью) в 80% они все такие.
И вот вы уже начали засыпать. Подождите, рано!
Я могу предсказать, собираетесь ли вы совершить преступление, и курс доллара на завтра! Я могу предсказать цены на нефть!
И вот вы снова со мной.
Очень многие играют такими словами, но не об этом сейчас. Мы замахнулись на куда более значимое с моей точки зрения – на оценку человека по определенным параметрам. Точнее – на оценку его кредитоспособности, но что вы подумаете о человеке, про которого скажут – у него низкий кредитный рейтинг?
Звучит почти как потеря доверия.
Считается, что существует корреляция между определенными социальными данными (наличие детей, курение, возраст, наличие высшего образования) и добросовестностью заемщика.
Т.е. дайте мне все исходные, и я смогу предсказать вам, вернет ли деньги конкретный человек. И так это и выглядит со стороны.
На самом деле (и я уже об этом писал в других изданиях) скоринговый балл позволяет предсказать как минимум со следующими допущениями: человек, живущий в той же местности, где проведена выборка (выборка = собраны данные о случаях невозврата и возврата других заемщиков), при получении суммы аналогичной выборке (а если в выборке разброс слишком сильный, принимать ее нельзя) с вероятностью в 85% (обычно так) вернет кредит в срок. Если нет – мы удивимся. Но поскольку В ОСНОВНОМ модель работает, мы и будем по ней оценивать.
Это база. Интереснее следующее (как любил Эйнштейн – без математики, мысленный эксперимент): предположим мы знаем всё о заемщике, даже исходное положение атомов в его теле. Предположим у нас есть другой такой же заемщик, который нам кредит вернул. Можем ли мы со 100% вероятностью сказать, что этот тоже вернет, если мы точно знаем как каждое положение атомов и параметры воздействуют на возвратность (мы закредитовали Содружество Вселенной, у нас есть данные о 10^15 заемщиков?
Совершенно верно!
Что верно? Вероятно можем. Но почему? Мы же все учли?
А вот оно как: существует принцип неопределённости Гейзенбе́рга, который, согласно скучной Википедии звучит так – чем точнее измеряется одна характеристика частицы, тем менее точно можно измерить вторую.
Сейчас объясню.
Чем точнее вы знаете скорость машины, на которой вы едете, тем менее точными становятся ваши координаты.
Ну а в случае с заемщиком, если принять его за точку на плоскости, очень такую жирную – возвратность станет таким расплывчатым пятном ВСЕГДА больше исходного состояния. И этого никак не изменить.
Поэтому идеального скоринга нет и не будет, хотя точность повышается с количеством принятых данных.
Но как-то оценивать надо, и мы принимаем все больше значений, хотя чем разрозненнее значения, тем больше стандартная ошибка. И в итоге больше половины времени занимает обработка данных, очистка, которая, в свою очередь, уменьшает точность прогноза отклоненных событий, и приводит ко всё большему удивлению в случае неудачи.
P.S.
А вообще проверяйте свои догадки Байесом.
Пример с Вики, чтобы было понятнее, о чем я:
2016-12-29 13:12:00
скоринг, артем, artem, риск менеджмент, парадоксы, байес, квант, риски, scoring, квантовая неопределенность