Участник:Pavlov99
Материал из MachineLearning.
(Различия между версиями)
(Полностью удалено содержимое страницы) |
(→Программирование) |
||
(39 промежуточных версий не показаны.) | |||
Строка 1: | Строка 1: | ||
+ | [[Изображение:Userpic.png|thumb|New Jarsey 2008]] | ||
+ | {{TOCright}} | ||
+ | ==О себе== | ||
+ | '''Павлов Кирилл Владимирович''' | ||
+ | * Студент МФТИ, ФУПМ, 674гр, | ||
+ | * Выпускник [http://shad.yandex.ru/ ШАД]'11 отделения «анализ данных» | ||
+ | * Работал в [http://yandex.ru Яндексе] | ||
+ | ==Научные интересы== | ||
+ | * Машинное обучение: классификация, регрессия, выбор моделей | ||
+ | * Оптимизация | ||
+ | * Статистика, теория вероятности | ||
+ | |||
+ | ==Программирование== | ||
+ | * Пишу на C++, Python, MATLAB/Octave, awk | ||
+ | * vim | ||
+ | * https://github.com/pavlov99 | ||
+ | |||
+ | ==Конкурсы по Data Mining== | ||
+ | * Интернет Математика 2011 (сходство изображений). | ||
+ | * http://www.heritagehealthprize.com/c/hhp | ||
+ | * http://www.data-mining-cup.de/en (2 команды от института) | ||
+ | Team name: Inst_Moscow PT_1 <br/> | ||
+ | Team ID: 0064-0630 <br/> | ||
+ | Educational institution: MIPT <br/> | ||
+ | Faculty: DMAM <br/> | ||
+ | * http://tunedit.org/challenges | ||
+ | * http://www.kaggle.com/ | ||
+ | |||
+ | ==План научной работы== | ||
+ | |||
+ | ===Презентация=== | ||
+ | *1. Постановка прикладной задачи | ||
+ | *2. Новый подход (принцип) | ||
+ | *3. Авторы, годы, названия методов | ||
+ | *4. Постановка задачи | ||
+ | *5(2) Правдоподобные параметры и функционал качества без <tex>\alpha</tex> | ||
+ | *6(2) Вероятность параметров <tex>p(w | D, A, B)</tex> и полный функционал качества | ||
+ | *7 Правдоподобие модели | ||
+ | *8(2) IRLS, оценка матрицы <tex>B</tex> | ||
+ | *9 Кратко оценка матрица <tex>A</tex> | ||
+ | *10 Итеративный алгоритм вычисления оценки параметров и гиперпараметров модели | ||
+ | *11 Оценка правдоподобия модели | ||
+ | *12(5) Графики, примеры вычисления оценок | ||
+ | *13 Многоуровневая модель, мотивация | ||
+ | *14 EM-алгоритм и разбиение выборки | ||
+ | *15 Общий функционал качества для многоуровневой модели | ||
+ | *16 Описание алгоритма | ||
+ | *17 Вычислительный эксперимент | ||
+ | *18 Результаты | ||
+ | *19 На защиту выносится (3 фразы) | ||
+ | *20 Результаты (4 публикации ВАК, Англ., ММРО, OR) | ||
+ | |||
+ | ===Обзор литературы=== | ||
+ | * Мультиколлинеарность признаков: [http://www.machinelearning.ru/wiki/index.php?title=VIF VIF(tolerance)], [http://www.machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%91%D0%B5%D0%BB%D1%81%D0%BB%D0%B8 Модель Белсли], [http://www.machinelearning.ru/wiki/index.php?title=%D0%90%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7_%D0%BC%D1%83%D0%BB%D1%8C%D1%82%D0%B8%D0%BA%D0%BE%D0%BB%D0%BB%D0%B8%D0%BD%D0%B5%D0%B0%D1%80%D0%BD%D0%BE%D1%81%D1%82%D0%B8_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29 оценка в целом] | ||
+ | * AUC + GINI | ||
+ | * Совокупный по моделям GINI, Сравнение старой и новой кривой. | ||
+ | * Basel2: pooling, model stability | ||
+ | * [bonus] Определение cut-off | ||
+ | |||
+ | ===Математика=== | ||
+ | ''Lorem ipsum dolor sit amet, consectetur adipiscing elit''. | ||
+ | |||
+ | ===Программирование=== | ||
+ | [https://github.com/pavlov99/pmll/blob/master/matlab/GetBelsley.m Метод Белсли] | ||
+ | [https://github.com/pavlov99/pmll/blob/master/matlab/GetVif.m VIF] | ||
+ | [https://github.com/pavlov99/pmll/blob/master/matlab/GetAuc.m AUC] | ||
+ | |||
+ | Вычисление полного функционала качества: графики сходимости <tex>\alpha</tex>, <tex>\beta</tex>, <tex>\eps</tex> | ||
+ | |||
+ | ==Статьи на ресурсе== | ||
+ | * [http://www.machinelearning.ru/wiki/index.php?title=EM-%D0%B0%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC_%D1%81_%D0%BF%D0%BE%D1%81%D0%BB%D0%B5%D0%B4%D0%BE%D0%B2%D0%B0%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D0%BC_%D0%B4%D0%BE%D0%B1%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D0%B5%D0%BC_%D0%BA%D0%BE%D0%BC%D0%BF%D0%BE%D0%BD%D0%B5%D0%BD%D1%82_%28%D0%BF%D1%80%D0%B8%D0%BC%D0%B5%D1%80%29 EM-алгоритм с последовательным добавлением компонент] | ||
+ | * [http://www.machinelearning.ru/wiki/index.php?title=%D0%A0%D0%B0%D0%B7%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%BA%D0%B0_%D0%B0%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC%D0%BE%D0%B2_%D1%80%D0%B0%D0%BD%D0%B3%D0%BE%D0%B2%D0%BE%D0%B9_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%B8_%D0%B4%D0%BB%D1%8F_%D0%BA%D1%80%D0%B5%D0%B4%D0%B8%D1%82%D0%BD%D0%BE%D0%B3%D0%BE_%D1%81%D0%BA%D0%BE%D1%80%D0%B8%D0%BD%D0%B3%D0%B0_%28%D0%BE%D1%82%D1%87%D0%B5%D1%82%29 разработка алгоритмов ранговой регрессии] | ||
+ | |||
+ | * [http://www.machinelearning.ru/wiki/images/e/e2/MySQL.pdf Mysql за 42 минуты] | ||
+ | * [http://www.machinelearning.ru/wiki/index.php?title=%D0%9E%D1%86%D0%B5%D0%BD%D0%BA%D0%B0_%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%BE%D0%B2_%D1%81%D0%BC%D0%B5%D1%81%D0%B8_%D0%BC%D0%BE%D0%B4%D0%B5%D0%BB%D0%B5%D0%B9 Оценка параметров смеси моделей] | ||
+ | * [http://www.machinelearning.ru/wiki/index.php?title=%D0%90%D0%BD%D0%BD%D0%BE%D1%82%D0%B0%D1%86%D0%B8%D0%B8_%D0%B3%D0%B5%D0%BD%D0%BE%D0%BC%D0%B0%2C_1D_to_F Задача аннотации генома, 1D-DNA <tex>\rightarrow </tex> DNA-function] | ||
+ | |||
+ | ==Ссылки== | ||
+ | [http://archive.ics.uci.edu/ml/datasets.html Репозиторий UCI] | ||
+ | |||
+ | [http://www.ece.cmu.edu/~koopman/essays/abstract.html How to write an abstract], [http://writing2.richmond.edu/training/project/biology/abslit.html one more] | ||
+ | |||
+ | [http://www.statmod.ru/wiki/latex:slides Beamer statmod] + [http://heather.cs.ucdavis.edu/~matloff/beamer.html обновление баз теха: sudo texhash] |
Текущая версия
|
О себе
Павлов Кирилл Владимирович
Научные интересы
- Машинное обучение: классификация, регрессия, выбор моделей
- Оптимизация
- Статистика, теория вероятности
Программирование
- Пишу на C++, Python, MATLAB/Octave, awk
- vim
- https://github.com/pavlov99
Конкурсы по Data Mining
- Интернет Математика 2011 (сходство изображений).
- http://www.heritagehealthprize.com/c/hhp
- http://www.data-mining-cup.de/en (2 команды от института)
Team name: Inst_Moscow PT_1
Team ID: 0064-0630
Educational institution: MIPT
Faculty: DMAM
План научной работы
Презентация
- 1. Постановка прикладной задачи
- 2. Новый подход (принцип)
- 3. Авторы, годы, названия методов
- 4. Постановка задачи
- 5(2) Правдоподобные параметры и функционал качества без
- 6(2) Вероятность параметров и полный функционал качества
- 7 Правдоподобие модели
- 8(2) IRLS, оценка матрицы
- 9 Кратко оценка матрица
- 10 Итеративный алгоритм вычисления оценки параметров и гиперпараметров модели
- 11 Оценка правдоподобия модели
- 12(5) Графики, примеры вычисления оценок
- 13 Многоуровневая модель, мотивация
- 14 EM-алгоритм и разбиение выборки
- 15 Общий функционал качества для многоуровневой модели
- 16 Описание алгоритма
- 17 Вычислительный эксперимент
- 18 Результаты
- 19 На защиту выносится (3 фразы)
- 20 Результаты (4 публикации ВАК, Англ., ММРО, OR)
Обзор литературы
- Мультиколлинеарность признаков: VIF(tolerance), Модель Белсли, оценка в целом
- AUC + GINI
- Совокупный по моделям GINI, Сравнение старой и новой кривой.
- Basel2: pooling, model stability
- [bonus] Определение cut-off
Математика
Lorem ipsum dolor sit amet, consectetur adipiscing elit.
Программирование
Вычисление полного функционала качества: графики сходимости , ,