Участник:Mshvets
Материал из MachineLearning.
(2 промежуточные версии не показаны) | |||
Строка 1: | Строка 1: | ||
- | <big>Швец Михаил Юрьевич</big | + | __NOTOC__ |
- | МФТИ, ФУПМ | + | <big>Швец Михаил Юрьевич</big> |
- | Mailto: mikhail.shvets@phystech.edu | + | |
+ | '''МФТИ, ФУПМ''' | ||
+ | |||
+ | Кафедра "'''Интеллектуальные системы'''" | ||
+ | |||
+ | 174 группа | ||
+ | |||
+ | Mailto: mikhail.shvets@phystech.edu | ||
+ | |||
+ | ==Текущая работа== | ||
+ | '''Интерпретация мультимоделей при обработке социологических данных''' | ||
+ | |||
+ | Задача кредитного скоринга заключается в определении уровня кредитоспособности заемщика, подавшего заявку на кредит. Для этого используется анкета заемщика, содержащая как числовые данные (возраст, доход, время проживания в стране), так и категориальные признаки (пол, профессия). Требуется, имея историческую информацию о возвратах кредитов другими заемщиками, определить, вернет ли кредит рассматриваемый клиент. Таким образом, требуется решить задачу классификации. Так как данные могут быть разнородными (например, в случае наличия в стране разных регионов по доходу), данные могут описываться не одной, а несколькими моделями. В данной работе предлагается сравнить два метода построения мультимоделей: смеси логистических моделей и градиентный бустинг. | ||
+ | |||
+ | ==Интересующие меня статьи== | ||
+ | * [[Бустинг]], [[Алгоритм AdaBoost]] | ||
+ | * [[Логистическая_регрессия]] |
Текущая версия
Швец Михаил Юрьевич
МФТИ, ФУПМ
Кафедра "Интеллектуальные системы"
174 группа
Mailto: mikhail.shvets@phystech.edu
Текущая работа
Интерпретация мультимоделей при обработке социологических данных
Задача кредитного скоринга заключается в определении уровня кредитоспособности заемщика, подавшего заявку на кредит. Для этого используется анкета заемщика, содержащая как числовые данные (возраст, доход, время проживания в стране), так и категориальные признаки (пол, профессия). Требуется, имея историческую информацию о возвратах кредитов другими заемщиками, определить, вернет ли кредит рассматриваемый клиент. Таким образом, требуется решить задачу классификации. Так как данные могут быть разнородными (например, в случае наличия в стране разных регионов по доходу), данные могут описываться не одной, а несколькими моделями. В данной работе предлагается сравнить два метода построения мультимоделей: смеси логистических моделей и градиентный бустинг.