Участник:Pavel Levdik/Песочница

Материал из MachineLearning.

< Участник:Pavel Levdik(Различия между версиями)
Перейти к: навигация, поиск
(Описание данных)
Текущая версия (11:35, 16 августа 2016) (править) (отменить)
 
(10 промежуточных версий не показаны.)
Строка 1: Строка 1:
-
{{TOCright}}
+
{{notice|
-
==Конкурс Avito-2016: Распознавание категории объявления==
+
'''Официальная страница конкурса'''<br/>
-
'''Конкурс по распознаванию категории объявления Avito-2016''' — это конкурс по решению прикладной задачи из области анализа изображений и текстов, проводимый при информационной поддержке 11-й Международной конференции [http://www.mmro.ru/ «Интеллектуализация обработки информации»].
+
Официальная страница конкурса теперь расположена на портале [http://dataring.ru/competitions/avito-category/ DataRing.ru].
 +
}}
-
Организаторы конкурса – компания «КЕХ еКоммерц» (сайт объявлений [http://www.avito.ru/ Avito]) и ее партнер – компания [[Форексис]]. <br/>
+
Информационные партнеры конкурса - 11-я Международная конференция [http://mmro.ru/ «Интеллектуализация обработки информации»] и [https://developer.nvidia.com/deep-learning портал компании Nvidia], посвященный Deep Learning.<br/>
-
Призовой фонд конкурса - '''500 000 рублей.'''
+
-
Для участия в конкурсе и получения доступа к данным необходимо пройти процедуру регистрации описанную в разделе [[Регистрация участников]].
+
Информационные партнеры конкурса - 11-я Международная конференция [http://mmro.ru/ «Интеллектуализация обработки информации»] и компания [http://www.nvidia.ru/page/home.html Nvidia].<br/>
-
Вопросы организаторам конкурса можно задавать по электронной почте на адрес [mailto:competitions@forecsys.ru competitions@forecsys.ru] с указанием в теме письма «Avito-2016: Вопрос».
+
-
С информацией об организаторе конкурса, правилах его проведения, количестве наград, сроках, месте и порядке их получения можно ознакомиться [[Media:Competition avito 2016 2 rules.pdf‎|здесь]].
+
Информационные партнеры конкурса - 11-я Международная конференция [http://mmro.ru/ «Интеллектуализация обработки информации»] и компания [http://www.nvidia.ru/page/home.html Nvidia] ([https://developer.nvidia.com/deep-learning тематический ресурс] Nvidia Deeplearning).<br/>
-
[[Конкурс Avito-2016: Распознавание категории объявления/Рейтинг участников|Предварительный рейтинг участников]].
+
==Письмо от Nvidia==
 +
Дополнительно специально рассказывать про NV тем кто применяет DL нет смысла, они и так без наших продуктов едва ли смогут обойтись. Однако рассказывать про DL тем кто этой технологией не пользуется – это может быть осмысленно.
 +
 +
Думаю что мы с вами могли бы быть полезны друг другу следующим образом – вы проводите конкурс для какого-то из партнеров, мы сделаем анонс этого конкурса по нашим каналам (сайт, группы, блоги, альманах, рассылка по ВУЗам…), а вы отдельно где-то в информации о конкурсе можете написать что-то типа рекомендации использовать новейшие GPU NVIDIA, или просто дать ссылку на наш портал для разработчиков посвященный DL тематике или еще что-то…
-
==Ключевые даты конкурса==
+
Вот ссылка на портал по DL : https://developer.nvidia.com/deep-learning
-
'''13 июня 2016 года''' – Старт конкурса<br />
+
(тут выложены и курсы обучения и инструменты, и ПО, и сэмплы…)
 +
 +
Лого во вложении.
 +
Текст:
 +
About NVIDIA
 +
NVIDIA (NASDAQ: NVDA) is a computer technology company that has pioneered GPU-accelerated computing. It targets the world’s most demanding users — gamers, designers and scientists — with products, services and software that power amazing experiences in virtual reality, artificial intelligence, professional visualization and autonomous cars. More information at http://nvidianews.nvidia.com/.
-
1 этап (изображения):
+
==Конкурс Avito-2016: Распознавание категории объявления==
-
:'''13 июня 2016 года''' – Старт 1 этапа<br />
+
'''Конкурс по распознаванию категории объявления Avito-2016''' — это конкурс по решению прикладной задачи из области анализа изображений и текстов, проводимый при информационной поддержке 11-й Международной конференции [http://mmro.ru/ «Интеллектуализация обработки информации»].
-
:'''до 23:59 24 июля 2016 года''' – Предоставление результатов участниками и регулярный расчет предварительного рейтинга<br />
+
-
:'''до 23:59 31 июля 2016 года''' – Определение победителей 1 этапа<br />
+
-
2 этап (изображения + заголовки):
+
-
:'''01 августа 2016 года''' – Старт 2 этапа<br />
+
-
:'''до 23:59 21 августа 2016 года''' – Предоставление результатов участниками и регулярный расчет предварительного рейтинга<br />
+
-
:'''до 23:59 28 августа 2016 года''' – Определение победителей 2 этапа<br />
+
-
3 этап (изображения + заголовки + описания + цены):
+
-
:'''29 августа 2016 года''' – Старт 3 этапа<br />
+
-
:'''до 23:59 28 сентября 2016 года''' – Предоставление результатов участниками и регулярный расчет предварительного рейтинга<br />
+
-
:'''до 23:59 02 октября 2016 года''' – Определение победителей 3 этапа<br />
+
-
==Описание задачи==
+
Организаторы конкурса – компания «КЕХ еКоммерц» (сайт объявлений [http://www.avito.ru/ Avito]) и ее партнер – компания [[Форексис]]. <br/>
-
По правилам Avito при создании объявления пользователь должен указать категорию объявления. При этом, любой человек с весьма хорошей точностью сможет определить категорию по изображению товара, заголовку, текстовому описанию и цене объявления.
+
Призовой фонд конкурса - '''500 000 рублей.'''
-
'''Цель конкурса''' – создание эффективного алгоритма определения категории объявления.
+
Для участия в конкурсе и получения доступа к данным необходимо пройти процедуру регистрации описанную в разделе [[Конкурс_Avito-2016:_Распознавание_категории_объявления#Регистрация_участников|Регистрация участников]].
 +
Вопросы организаторам конкурса можно задавать по электронной почте на адрес [mailto:competitions@forecsys.ru competitions@forecsys.ru] с указанием в теме письма «Avito-2016: Вопрос».
-
Конкурс состоит из трех последовательных этапов. На каждом этапе участникам предстоит решать задачу определения категории объявления, при этом набор признаков объявлений будет постепенно расширяться. На каждом последующем этапе зарегистрированным участникам будут доступны как дополнительные данные так и методы победителей предыдущего этапа.
+
С предыдущими конкурсами [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях|Avito-2014]], [[Конкурс_Avito-2015:_Распознавание_отклика_на_маркетинговое_предложение|Avito-2015]] и [[Конкурс_Avito-2016:_Распознавание_марки_и_модели_автомашин_на_изображениях|Avito-2016]] можно ознакомиться на соответствующих страницах.
-
Для помощи в решении первого этапа всем зарегистрированным участникам будет предоставлена методика победителя предыдущего [[Конкурс_Avito-2016:_Распознавание_марки_и_модели_автомашин_на_изображениях|конкурса]], в котором требовалось построить алгоритм распознавания марки и модели автомобиля по его изображению.
+
-
Ниже приведены примеры фотографий, заголовков, описаний и цен продаваемых товаров.
+
С информацией об организаторе конкурса, правилах его проведения, количестве наград, сроках, месте и порядке их получения можно ознакомиться [[Media:Competition avito 2016 2 rules.pdf‎|здесь]].
-
{| class="wikitable" style="text-align:center"
+
-
|'''Изображение'''
+
-
| width="25%"|[[Изображение:Avito-2016 iphone.jpg|x200px]]
+
-
| width="25%"|[[Изображение:Avito-2016 dress.jpg|x200px]]
+
-
| width="25%"|[[Изображение:Avito-2016 castle.jpg|x200px]]
+
-
| width="25%"|[[Изображение:Avito-2016 shaurma.jpg|x200px]]
+
-
|-align="left"
+
-
|'''Заголовок'''
+
-
|iPhone 5 16GB white
+
-
|Платье на выпускной
+
-
|Замок
+
-
|Павильон по продаже шаурмы в проходном месте
+
-
|-align="left"
+
-
|'''Описание'''
+
-
|Телефон в идеальном состоянии,пользовалась девушка. <br /> Обмен не предлагать.
+
-
|РБ/у один раз. <br /> Торг.
+
-
|Летний замок принцессы Софии - 2 этажа, мебель.
+
-
|Продается бизнес по продаже продуктов быстрого питания в проходном месте! Территориально м.авиамоторная...
+
-
|-align="left"
+
-
|'''Цена'''
+
-
|11 000 руб.
+
-
|2 800 руб.
+
-
|800 руб.
+
-
|200 000 руб.
+
-
|-align="left"
+
-
|'''Категория'''
+
-
|Бытовая электроника/<br />Телефоны/<br />iPhone
+
-
|Личные вещи/<br />Одежда, обувь, аксессуары/<br />Женская одежда/<br />Платья и юбки
+
-
|Личные вещи/<br />Товары для детей и игрушки/<br />Игрушки
+
-
|Для бизнеса/<br />Готовый бизнес/<br />Общественное питание
+
-
|}
+
-
<br clear="all" />
+
-
==Описание данных==
+
Если Вы хотите узнавать о новых конкурсах еще до их старта, напишите письмо на адрес [mailto:competitions@forecsys.ru competitions@forecsys.ru] с темой «Подписка».
-
Целевым признаком, который необходимо предсказать является категория объявления. Категория представляет собой 4й уровень иерархического классификатора.
+
-
'''На первом этапе''' для объявлений известны только множества их '''изображений''' (в формате .jpg, в среднем по 2.4 изображения на объявление). <br />
+
[[Конкурс Avito-2016: Распознавание категории объявления/Рейтинг участников|Предварительный рейтинг участников]].
-
'''На втором этапе''' к изображениям дополнительно предоставляются '''заголовки''' объявлений. <br />
+
-
'''На третьем этапе''' к изображениям и заголовкам дополнительно предоставляются '''описания и цены''' объявлений. <br />
+
-
 
+
-
Обучающая выборка состоит из 388 000 объявлений, классифицированных на 194 категории. Эта выборка используется участниками для настройки своих алгоритмов. На протяжении всего конкурса участники работают с одними и теми же объявлениями. На каждом этапе все имеющиеся объявления будут обогащаться дополнительными данными.
+
-
 
+
-
Контрольная выборка состоит из 194 000 объявлений. Участникам предстоит классифицировать эти объявления по категориям. Эта выборка будет использоваться для составления промежуточного и итогового рейтингов участников.
+
-
 
+
-
Текстовая информация об объектах, а также разметка обучающей выборки представлена в файлах '''train.csv/test.csv''' в следующем формате: <br />
+
-
:Id - ID объявления
+
-
:Images - все картинки для этого объявления (для обучающей выборки разбиты по папкам категорий)
+
-
:Title - заголовок объявления (выдается на 2 этапе)
+
-
:Description - описание объявления (выдается на 3 этапе)
+
-
:Price - цена, указанная в объявлении (выдается на 3 этапе)
+
-
:Target - целевая категория (число от 0 до 193, только для обучающей выборки)
+
-
 
+
-
Соответствие идентификаторов категорий их названиям, а также родительским категориям указано в файле-словаре '''categories.csv''' в следующем формате:
+
-
:category_id - ID категории
+
-
:parent_category_id - ID родительской категории
+
-
:category_name - название категории
+
-
 
+
-
Данные предоставляются после регистрации в конкурсе.
+
-
 
+
-
==Внешние данные==
+
-
Для построения и обучения своих моделей участники вправе использовать любые внешние модели и коллекции, которые разрешены к коммерческому использованию. В конце каждого этапа кандидаты на призовые места обязаны предоставить описание алгоритма, в том числе информацию об используемых внешних данных.
+
-
 
+
-
==Функционал качества алгоритма распознавания==
+
-
Для каждого объявления <tex>i</tex> точность распознавания категории <tex>q_i</tex> рассчитывается как взвешенная сумма совпадений оценок категории с истинными ответами на каждом уровне:
+
-
::<tex>q_i=0.3\cdot M_i^1+0.3\cdot M_i^2+0.2\cdot M_i^3+0.2\cdot M_i^4</tex>,
+
-
где <tex>M_i^l</tex> равно 1, если категория <tex>l</tex>-го уровня для объявления <tex>i</tex> угадана верно, иначе 0.
+
-
 
+
-
 
+
-
Таким образом, <tex>q_i=1</tex> только в том случае, если категория угадана верно вплоть до последнего уровня. <br />
+
-
Если <tex>M_i^l=0</tex>, то это автоматически означает, что <tex>M_i^{l+1}=0</tex>.
+
-
 
+
-
 
+
-
Общее качество алгоритма рассчитывается как средняя точность распознавания категории всех объявлений:
+
-
::<tex>Q=\frac{1}{N}\sum_i{q_i}</tex>,
+
-
где <tex>N</tex> - количество объвлений.
+
-
 
+
-
==Регистрация участников==
+
-
Для регистрации в конкурсе потенциальному участнику необходимо прислать письмо по электронной почте на адрес [mailto:competitions@forecsys.ru competitions@forecsys.ru] с темой «Avito-2016: Регистрация». Регистрационное письмо должно содержать никнейм участника – имя/псевдоним, которое будет отображаться в предварительном рейтинге участников, формируемом в течение первого этапа и источник информации о конкурсе. Адрес электронной почты участника используется для его идентификации.
+
-
 
+
-
Регистрация возможна в течение всего срока конкурса '''на любом этапе'''.
+
-
 
+
-
Заявкой на регистрацию в конкурсе Вы подтверждаете, что ознакомились и согласны с [[Media:Competition avito 2016 2 rules.pdf‎|Правилами конкурса]].
+
-
 
+
-
==Порядок и сроки предоставления участниками результатов==
+
-
 
+
-
Участники настраивают свои алгоритмы классификации объявлений, используя обучающую выборку.
+
-
 
+
-
Для проверки качества алгоритма и составления рейтинга результатов каждый участник отправляет файл с результатами работы алгоритма на контрольной выборке по электронной почте на адрес [mailto:competitions@forecsys.ru competitions@forecsys.ru], указав в теме письма «Конкурс Avito-2016: Результаты Никнейм участника» (письмо должно быть отправлено с того же электронного адреса, что и при регистрации участника).
+
-
 
+
-
Результаты представляются в csv-формате (образец файла будет доступен после старта конкурса). Рекомендуемый формат имени файла “YYYYMMDD_competition_avito_2016_Никнейм_участника_Results.csv”. Файл с результатами содержит два столбца с заголовками в первой строчке: в первом столбце (id) указаны идентификаторы объявлений, а во втором (label) – идентификаторы класса, к которому алгоритм сопоставил эти объявления. Пропуски и строковые значения не допускаются.
+
-
 
+
-
Два раза в неделю – '''понедельник и четверг до 23:59''' по московскому времени – заканчивается прием писем с результатами для составления очередного [[Конкурс Avito-2016: Распознавание категории объявления/Рейтинг участников|предварительного рейтинга участников]]. В течение следующего рабочего дня будет обновлен предварительный рейтинг результатов участников. Для расчета рейтинга используются результаты участника, полученные в '''последнем письме''' до указанного времени.
+
-
 
+
-
Предварительный рейтинг участников будет рассчитан по 50% объявлений контрольной выборки. Итоговый рейтинг будет рассчитан на оставшихся 50% контрольной выборки.
+
-
 
+
-
Для расчета итогового рейтинга участников будет взят последний присланный до конца соответствующего этапа результат.
+
-
 
+
-
После окончания срока приема результатов и выявления лидеров участники, претендующие на победу, предоставляют свои программы и описания алгоритмов.
+
-
 
+
-
==Процедура определения победителей и призовой фонд==
+
-
Призовой фонд конкурса - '''500 000''' рублей.
+
-
 
+
-
На каждом этапе награждаются два первых места.
+
-
 
+
-
Этап 1:
+
-
:1-е место 150 000 рублей.
+
-
:2-е место 50 000 рублей.
+
-
Этап 2:
+
-
:1-е место 100 000 рублей.
+
-
:2-е место 50 000 рублей.
+
-
Этап 3:
+
-
:1-е место 100 000 рублей.
+
-
:2-е место 50 000 рублей.
+
-
Вознаграждения указаны без учета налогов.
+
-
 
+
-
'''Победителем этапа''' (первое место) станет участник, алгоритм которого продемонстрировал наилучший результат на контрольной выборке. <br\>
+
-
'''Второе место''' займет участник, алгоритм которого продемонстрировал второй по качеству результат на контрольной выборке.
+
-
 
+
-
Информация о победителях будет опубликована на [[Конкурс Avito-2016: Распознавание категории объявления|странице конкурса]].
+
-
 
+
-
'''Воспроизводимость результата работы алгоритма''' участника с использованием предоставляемой участником программы является обязательным условием признания этого участника победителем конкурса. Предоставление организаторам необходимого ПО и помощь в воспроизведении результатов работы алгоритма является обязанностью участника. Кроме того, участник должен подготовить описание алгоритма.
+
-
 
+
-
В начале следующего этапа всем участникам станет доступна информация об основных подходах призеров предыдущего этапа, а также о всех используемых ими внешних моделях и коллекциях.
+
-
 
+
-
==Требования к программному обеспечению==
+
-
Призовое место участник может занять только в том случае, если он использовал программное обеспечение (ПО), которое не требует лицензии для коммерческого использования.
+
-
 
+
-
К ПО предъявляется требование – возможность воспроизведения организаторами результатов работы алгоритмов участников.
+
-
 
+
-
Предоставление организаторам необходимого ПО и помощь в воспроизведении результатов является обязанностью участника.
+
-
 
+
-
==Требования к описанию алгоритма распознавания==
+
-
Требуется предоставить файл формата .doc, docx или .pdf с описанием алгоритма на русском языке по следующему шаблону:
+
-
# '''Идентификация''' <br />Никнейм и адрес электронной почты участника.
+
-
# '''Аннотация''' <br />4-6 предложений, объясняющих общий подход к построению алгоритма, включающих, например, принципы генерации или отбора признаков и метод обучения.<br />
+
-
# '''Внешние данные''' <br />Список всех используемых внешних моделей и коллекций.
+
-
# '''Генерация и отбор признаков''' <br />Описание метода генерации и/или отбора признаков изображений. Список и общее описание выбранных признаков. <br />
+
-
# '''Процесс обучения'''<br />Описание деталей метода обучения, использованного для построения алгоритма. Если комбинировались или объединялись разные методы, опишите каким образом.
+
-
# '''Описание программы алгоритма''' <br />Для каждой функции:<br />
+
-
#*входные переменные
+
-
#*выходные переменные
+
-
#*что функция делает<br />
+
-
# '''Зависимости'''<br />Список зависимостей, библиотек, функций, пакетов или код других сторонних компаний, использованных для создания алгоритма.
+
-
# '''Инструкция по воспроизведению''' (аналог README файла)<br />Пошаговая инструкция для создания проекта из приведенного кода.
+
-
# '''Дополнительные комментарии и наблюдения''' <br />Любые дополнительные комментарии или наблюдения по поводу данных, алгоритма или процесса улучшения алгоритма.
+
-
# '''Графики'''<br />Графики или картинки, которые были сделаны из данных или в процессе обучения и которые показались полезными или интересными.
+
-
# '''Ссылки'''<br/> Необходимые ссылки или другие внешние источники информации.
+
-
 
+
-
==Об Avito==
+
-
[http://www.avito.ru/ Avito] является самым большим в России сайтом объявлений. Миллионы людей ежедневно заходят на портал, чтобы продать или купить практически всё, что пожелают: от цифровой техники и одежды до автомобилей и недвижимости. Объявления размещают частные лица, предприниматели и компании, поэтому на Avito.ru можно купить как бывшие в употреблении вещи, так и абсолютно новые товары.На Avito более 24 миллионов активных объявлений и каждый день огромное количество объявлений создается или изменяется.
+
-
 
+
-
Миссия Avito.ru — соединить продавцов и покупателей по всей России, изменив их повседневную жизнь к лучшему.
+
-
 
+
-
С предыдущими конкурсами [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях|Avito-2014]], [[Конкурс_Avito-2015:_Распознавание_отклика_на_маркетинговое_предложение|Avito-2015]] и [[Конкурс_Avito-2016:_Распознавание_марки_и_модели_автомашин_на_изображениях|Avito-2016]] можно ознакомиться на соответствующих страницах.
+
-
 
+
-
== Подстраницы ==
+
-
{{Служебная:Prefixindex/Конкурс Avito-2016: Распознавание категории объявления/}}
+
-
 
+
-
[[Категория:Конкурс Avito-2016]]
+

Текущая версия

Официальная страница конкурса

Официальная страница конкурса теперь расположена на портале DataRing.ru.


Информационные партнеры конкурса - 11-я Международная конференция «Интеллектуализация обработки информации» и портал компании Nvidia, посвященный Deep Learning.

Информационные партнеры конкурса - 11-я Международная конференция «Интеллектуализация обработки информации» и компания Nvidia.

Информационные партнеры конкурса - 11-я Международная конференция «Интеллектуализация обработки информации» и компания Nvidia (тематический ресурс Nvidia Deeplearning).

Письмо от Nvidia

Дополнительно специально рассказывать про NV тем кто применяет DL нет смысла, они и так без наших продуктов едва ли смогут обойтись. Однако рассказывать про DL тем кто этой технологией не пользуется – это может быть осмысленно.

Думаю что мы с вами могли бы быть полезны друг другу следующим образом – вы проводите конкурс для какого-то из партнеров, мы сделаем анонс этого конкурса по нашим каналам (сайт, группы, блоги, альманах, рассылка по ВУЗам…), а вы отдельно где-то в информации о конкурсе можете написать что-то типа рекомендации использовать новейшие GPU NVIDIA, или просто дать ссылку на наш портал для разработчиков посвященный DL тематике или еще что-то…

Вот ссылка на портал по DL : https://developer.nvidia.com/deep-learning (тут выложены и курсы обучения и инструменты, и ПО, и сэмплы…)

Лого во вложении. Текст: About NVIDIA NVIDIA (NASDAQ: NVDA) is a computer technology company that has pioneered GPU-accelerated computing. It targets the world’s most demanding users — gamers, designers and scientists — with products, services and software that power amazing experiences in virtual reality, artificial intelligence, professional visualization and autonomous cars. More information at http://nvidianews.nvidia.com/.

Конкурс Avito-2016: Распознавание категории объявления

Конкурс по распознаванию категории объявления Avito-2016 — это конкурс по решению прикладной задачи из области анализа изображений и текстов, проводимый при информационной поддержке 11-й Международной конференции «Интеллектуализация обработки информации».

Организаторы конкурса – компания «КЕХ еКоммерц» (сайт объявлений Avito) и ее партнер – компания Форексис.
Призовой фонд конкурса - 500 000 рублей.

Для участия в конкурсе и получения доступа к данным необходимо пройти процедуру регистрации описанную в разделе Регистрация участников. Вопросы организаторам конкурса можно задавать по электронной почте на адрес competitions@forecsys.ru с указанием в теме письма «Avito-2016: Вопрос».

С предыдущими конкурсами Avito-2014, Avito-2015 и Avito-2016 можно ознакомиться на соответствующих страницах.

С информацией об организаторе конкурса, правилах его проведения, количестве наград, сроках, месте и порядке их получения можно ознакомиться здесь.

Если Вы хотите узнавать о новых конкурсах еще до их старта, напишите письмо на адрес competitions@forecsys.ru с темой «Подписка».

Предварительный рейтинг участников.

Личные инструменты