Участник:Pavel Levdik/Песочница

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
Строка 1: Строка 1:
-
==Открытый конкурс на лучший демонстрационный образец технологии распознавания лиц людей==
+
{{TOCright}}
-
===[http://fpi.gov.ru/ Фонд перспективных исследований] (ФПИ) объявляет о старте открытого конкурса на лучший демонстрационный образец технологии распознавания лиц людей.===
+
==Конкурс Avito-2016: Распознавание марки и модели автомашин на изображениях==
 +
'''Конкурс по распознаванию марки и модели автомашин на изображениях Avito-2016''' — это конкурс по решению прикладной задачи из области анализа изображений, проводимый при информационной поддержке 10-й Международной конференции [http://www.mmro.ru/ «Интеллектуализация обработки информации-2014»] (ИОИ-2014), Греция, о. Крит, 4-11 октября 2014 года.
-
[[Изображение:FPI 2015 logo.jpg]]
+
Организаторы конкурса – компания [http://www.avito.ru/ Avito.ru] и ее партнер – компания [http://www.forecsys.ru/ Форексис].
-
Официальная [http://fpi.gov.ru/ страница конкурса] на сайте ФПИ.
+
Вопросы организаторам конкурса можно задавать по электронной почте на адрес [mailto:competitions@forecsys.ru competitions@forecsys.ru] с указанием в теме письма «Avito-2016: Вопрос».
-
===Конкурс проводится в три этапа:===
+
С информацией об организаторе конкурса, правилах его проведения, количестве наград, сроках, месте и порядке их получения можно ознакомиться [http://www.machinelearning.ru/wiki/images/4/4e/Avito_rules.pdf здесь].
-
* первый этап (обучение) – с 9 сентября 2015 года по 16 ноября 2015 года;
+
-
* второй этап (отборочный) – с 16 ноября 2015 года по 6 декабря 2015 года;
+
-
* третий этап (заключительный) – с 7 декабря 2015 года по 31 декабря 2015 года.
+
-
===Цели конкурса:===
+
Предварительный рейтинг участников можно посмотреть [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях/Рейтинг_участников|здесь]].
-
* поиск лучших отечественных коллективов по решению задачи распознавания лиц, запечатленных в сложных условиях;
+
-
* экспериментальная проверка программных реализаций алгоритмов распознавания лиц, запечатленных в сложных условиях;
+
-
* определение по итогам Конкурса победителя и заключение с ним договора о реализации научно-технического проекта по созданию технологии распознавания лиц, запечатленных в сложных условиях.
+
-
В ходе конкурса проводится тестирование программных решений участников на задаче распознавания и определения лиц, запечатленных в сложных условиях.
+
==Ключевые даты конкурса==
 +
'''1 октября 2014 года''' – Старт конкурса <br />
 +
'''до 23:59 4 ноября''' – Регистрация участников<br />
 +
'''до 23:59 13 ноября''' – Обучение и сбор алгоритмов участников<br />
 +
'''14 ноября''' – Предоставление контрольной выборки C и ответов для выборки B<br />
 +
'''до 23:59 18 ноября''' – Сбор результатов алгоритмов на контрольной выборке C<br />
 +
'''19 ноября – 10 декабря''' – Определение победителей и проверка на воспроизводимость результатов, публикация презентаций победителей на странице конкурса
-
===Победители и призеры конкурса:===
+
==Avito.ru==
-
* все участники третьего этапа конкурса являются призерами и награждаются дипломами;
+
[http://www.avito.ru/ Avito.ru] является самым большим в России сайтом объявлений. Миллионы людей ежедневно заходят на портал, чтобы продать или купить практически всё, что пожелают: от цифровой техники и одежды до автомобилей и недвижимости. Объявления размещают частные лица, предприниматели и компании, поэтому на Avito.ru можно купить как бывшие в употреблении вещи, так и абсолютно новые товары.
-
* победителем конкурса может стать один или несколько участников, которые войдут в кооперацию для выполнения договора на реализацию научно-технического проекта по созданию технологии биометрической идентификации личности по изображению лица в сложных условиях.
+
 +
Миссия Avito.ru — соединить продавцов и покупателей по всей России, изменив их повседневную жизнь к лучшему.
 +
На Avito.ru более 24 миллионов активных объявлений и каждый день огромное количество объявлений создается или изменяется. Эффективность Avito.ru в значительной степени зависит от качества заполнения содержания объявлений, поскольку качественные объявления позволяют покупателям оперативно находить подходящие предложения, а продавцам - продавать свои товары за считанные часы.
-
Ознакомиться с подробной информацией о регистрации участников можно на [http://fpi.gov.ru/activities/ideas/face официальном сайте Конкурса] в разделе [http://fpi.gov.ru/activities/ideas/face/request Подать заявку], с информацией о конкурсе в разделе [Материалы http://fpi.gov.ru/activities/ideas/face/docs], новости публикуются в разделе [http://fpi.gov.ru/activities/ideas/face/news Новости конкурса].
+
==Описание задачи==
 +
По правилам Avito.ru в объявлении контактная информация продавца (например, телефон, e-mail, ссылка на сайт) должна быть указана в соответствующих текстовых полях. Это позволяет организовать удобный поиск для покупателей, эффективно находить дубликаты объявлений, организовывать черные списки недобросовестных продавцов и выявлять другие нарушения. Типичным нарушением является заполнение текстовых полей объявления недействительной контактной информацией, в то же время, на изображении предоставляется актуальная информация.
-
По всем вопросам, касающимся проведения конкурса, просьба обращаться по адресу: prc@fpi.gov.ru или к Бакееву Руслану Надировичу по телефону: +7 (499) 418-00-25 доб. 707.
+
'''Цель конкурса''' – создание эффективного алгоритма распознавания изображений, содержащих контактную информацию.
-
+
Ниже приведены два примера изображений с контактной информацией.
-
Техническим партнером по организации и проведению конкурса является компания "Форексис".
+
[[Изображение:Add1.png|400px]]
 +
[[Изображение:Add2.png|250px]]
 +
<br clear="all" />
-
+
==Описание данных==
 +
Исходная выборка, '''выборка A''', содержит 41 122 изображения, классифицированных на два класса:
 +
* 1 – в изображении присутствует контактная информация (12031),
 +
* 0 – в изображении отсутствует контактная информация (29091).
 +
Выборка A используется для настройки алгоритмов участниками.
-
===Желаем удачи!===
+
Еще 10 000 изображений, '''выборка B''', являются тестовыми – ответы по ним известны только организаторам. Тестовые данные будут использоваться для составления промежуточного [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях/Рейтинг_участников|рейтинга]] участников, который обновляется [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях#.D0.AD.D1.82.D0.B0.D0.BF_.D0.BF.D0.B5.D1.80.D0.B2.D1.8B.D0.B9:_.D0.BD.D0.B0.D1.81.D1.82.D1.80.D0.BE.D0.B9.D0.BA.D0.B0_.D0.B0.D0.BB.D0.B3.D0.BE.D1.80.D0.B8.D1.82.D0.BC.D0.BE.D0.B2_.D1.80.D0.B0.D1.81.D0.BF.D0.BE.D0.B7.D0.BD.D0.B0.D0.B2.D0.B0.D0.BD.D0.B8.D1.8F|два раза в неделю]] .
-
'''9 сентября 2015 года''' — стартует [http://fpi.gov.ru/activities/ideas/face открытый конкурс на лучший образец технологии распознавания лиц людей, запечатленных в сложных условиях], проводимый при информационной поддержке 17-й Международной конференции [http://www.mmro.ru/ «Математические методы распознавания образов-2015»] (ММРО-2015), г. Светлогорск Калининградской области, 19-25 сентября 2015 года.
+
Третья выборка, '''выборка C''', – контрольная, предоставляется участникам на втором этапе конкурса и содержит 10 000 изображений. Контрольная выборка будет использоваться для определения победителей конкурса. Подробнее об [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях#.D0.AD.D1.82.D0.B0.D0.BF_.D0.BF.D0.B5.D1.80.D0.B2.D1.8B.D0.B9:_.D0.BD.D0.B0.D1.81.D1.82.D1.80.D0.BE.D0.B9.D0.BA.D0.B0_.D0.B0.D0.BB.D0.B3.D0.BE.D1.80.D0.B8.D1.82.D0.BC.D0.BE.D0.B2_.D1.80.D0.B0.D1.81.D0.BF.D0.BE.D0.B7.D0.BD.D0.B0.D0.B2.D0.B0.D0.BD.D0.B8.D1.8F|этапах]] конкурса .
-
'''Конкурс Avito-2015 ''' — это конкурс по решению прикладной задачи распознавания образов, проводимый при информационной поддержке 17-й Международной конференции [http://www.mmro.ru/ «Математические методы распознавания образов-2015»] (ММРО-17), г. Светлогорск Калининградской области, 19-25 сентября 2015 года.
+
Изображения имеют формат jpg, ответы по обучающей выборке представлены в csv-файле в формате Id, label, где Id – имя файла изображения, а label – метка класса, 0 или 1.
-
Организаторы конкурса – компания [http://www.avito.ru/ Avito] и ее партнер – компания [http://www.forecsys.ru/ Форексис].
 
-
 
-
Вопросы организаторам конкурса можно задавать в [[Обсуждение:Конкурс_Avito-2015:_Распознавание_отклика_на_маркетинговое_предложение|обсуждении ]] страницы конкурса для зарегистрированных на портале [http://www.machinelearning.ru/ MachineLearning.ru] пользователей, либо по электронной почте на адрес [mailto:competition.avito.2014@forecsys.ru competition.avito.2014@forecsys.ru] с указанием в теме письма «Конкурс Avito-2015: Вопрос».
 
-
 
-
С информацией об организаторе конкурса, правилах его проведения, количестве наград, сроках, месте и порядке их получения можно ознакомиться [https://yadi.sk/i/OViWdWcEh8aVe здесь].
 
-
 
-
[[Конкурс_Avito-2015:_Распознавание_отклика_на_маркетинговое_предложение/Рейтинг_участников|Предварительный рейтинг участников]].
 
-
 
-
==Ключевые даты конкурса==
 
-
'''8 июня 2015 года''' – Старт конкурса
 
-
 
-
'''до 23:59 10 июля 2015 года''' – Регистрация участников
 
-
 
-
'''до 23:59 17 июля 2015 года''' – Получение результатов от участников
 
-
 
-
'''20 июля – 31 июля 2015 года''' – Определение победителей и проверка на воспроизводимость результатов
 
-
 
-
'''03 августа – 14 августа 2015 года''' – Публикация презентаций победителей на странице конкурса
 
-
 
-
==Avito==
 
-
[http://www.avito.ru/ Avito] является самым большим в России сайтом объявлений. Миллионы людей ежедневно заходят на портал, чтобы продать или купить практически всё, что пожелают: от цифровой техники и одежды до автомобилей и недвижимости. Объявления размещают частные лица, предприниматели и компании, поэтому на Avito.ru можно купить как бывшие в употреблении вещи, так и абсолютно новые товары.На Avito более 24 миллионов активных объявлений и каждый день огромное количество объявлений создается или изменяется.
 
-
 
-
Миссия Avito.ru — соединить продавцов и покупателей по всей России, изменив их повседневную жизнь к лучшему.
 
-
 
-
==Описание задачи==
 
-
Avito предоставляет своим клиентам дополнительные услуги, которые позволяют клиентам существенно быстрее продавать свои товары, автомобили и объекты недвижимости за счет различных механизмов поднятия объявлений в поиске и их выделения.
 
-
Для информирования клиентов об этих услугах и стимулирования использования услуг Avito проводит маркетинговые кампании, в рамках которых клиенту сообщается информация о дополнительных услугах (например, по email и с помощью баннеров в личном кабинете на сайте) и предоставляются скидки на их использование.
 
-
Подобная реклама услуг зачастую является раздражающим фактором, поскольку существуют клиенты, которые пользуются услугами вне зависимости от того, сообщили ли им об услуге или нет, или те, кому это предложение не актуально. Проводить коммуникацию с такими клиентами не следует.
 
-
Для анализа были проведены две маркетинговые кампании, предлагающие одинаковую скидку и нацеленные на схожие сегменты, но в разное время: первая – с 09 по 28 декабря 2014 года, вторая – с 25 февраля по 23 марта 2015 года. Множества клиентов первой и второй кампаний не пересекаются.
 
-
Для оценки эффективности коммуникации, клиенты в каждой кампании были разделены на две группы – целевая (которой сообщили об услуге и скидке) и контрольная (которой ничего не сообщалось). Это разбиение является известным для первой кампании и неизвестным для второй.
 
-
 
-
'''Цель конкурса''' – создание эффективного алгоритма распознавания клиентов, которые воспользуются дополнительными услугами только после коммуникации с ними.
 
-
 
-
Ознакомиться с общим описанием проблематики Uplift modelling можно [http://en.wikipedia.org/wiki/Uplift_modelling здесь].
 
-
 
-
==Описание данных==
 
{{notice|
{{notice|
-
'''Внимание!'''<br/>
+
'''Update 08.10.2014'''<br/>
-
Ссылки на актуальные данные конкурса станут доступны после старта конкурса 08.06.2015.
+
Использование структуры id изображений в алгоритме не допускается, id изображений в контрольной выборке C будут случайными.
}}
}}
-
Для анализа доступно два блока данных: competition_avito_2015_vasuplift_data.7z и competition_avito_2015_vasuplift_behavior.7z. В первом блоке данных содержатся все формальные, а также некоторые агрегированные признаки клиентов, участвовавших в двух кампаниях. Во втором блоке содержатся данные, которые можно использовать для извлечения дополнительной информации о действиях клиентов на сайте Avito. Детальное описание исходных данных находится [https://yadi.sk/i/hIg9UASih8av3 здесь].
+
Данные можно скачать по ссылкам: <br />
 +
[http://machinelearning.ru/data/competition.avito.2014/avito_train.zip Выборка A] – папка содержит обучающие изображения в формате jpg.<br />
 +
[http://machinelearning.ru/data/competition.avito.2014/avito_test.zip Выборка B] – папка содержит тестовые изображения в формате jpg.<br />
 +
[http://machinelearning.ru/data/competition.avito.2014/avito_control.zip Выборка C] – папка содержит контрольные изображения в формате jpg.<br />
 +
[http://machinelearning.ru/data/competition.avito.2014/avito_train_labels.zip Метки классов объектов обучающей выборки] – csv-файл содержит метки классов для выборки A.<br />
 +
[[Media:Avito_test_labels.zip|Метки классов объектов тестовой выборки]] – csv-файл содержит метки классов для выборки В.
-
==Функционал качества==
+
==Функционал качества алгоритма распознавания==
-
Алгоритм распознавания ранжирует всех клиентов кампании по склонности воспользоваться дополнительными услугами только после коммуникации по убыванию склонности использовать предлагаемую услугу после коммуникации и для первых 20% клиентов самых склонных клиентов качество <tex>U</tex> алгоритма вычисляется по функционалу:
+
Качество работы алгоритмов распознавания оценивается показателем AUC – площадь под [[ROC-кривая|ROC-кривой]].
-
<tex>U=R_t-R_c\frac{N_t}{N_c}</tex>,
+
-
где
+
[http://www.mathworks.com/help/stats/perfcurve.html Реализация] функционала качества AUC в среде Matlab:
-
 
+
<pre>
-
<tex>R_t</tex> – сумма условных денег в целевой (treated) группе за период кампании,
+
[X,Y,T,AUC] = perfcurve(labels,scores,posclass);
-
 
+
</pre>
-
<tex>R_c</tex> – сумма условных денег в контрольной (control) группе за период кампании,
+
-
 
+
-
<tex>N_t</tex> – кол-во клиентов в целевой группе,
+
-
 
+
-
<tex>N_c</tex> – кол-во клиентов в контрольной группе.
+
-
 
+
-
[https://yadi.sk/d/w6CIq02zh8b3V Реализация] функционала качества на языке Python.
+
-
 
+
-
[https://yadi.sk/d/GfgsgQhXh8b5X Пример простой модели], написанный на языке Python.
+
==Регистрация участников==
==Регистрация участников==
-
Для регистрации в конкурсе потенциальному участнику необходимо до '''23:59 10 июля 2015 года''' прислать письмо по электронной почте на адрес [mailto:competition.avito.2014@forecsys.ru competition.avito.2014@forecsys.ru] с темой «Конкурс Avito-2015: Регистрация», содержащее никнейм участника – имя/псевдоним, которое будет отображаться в рейтинге участников. Адрес электронной почты участника будет использоваться для его идентификации.
+
Для регистрации в конкурсе потенциальному участнику необходимо до '''23:59 4 ноября 2014 года''' прислать письмо по электронной почте на адрес [mailto:competition.avito.2014@forecsys.ru competition.avito.2014@forecsys.ru] с темой «Регистрация», содержащее никнейм участника – имя/псевдоним, которое будет отображаться в предварительном рейтинге участников, формируемом в течение первого этапа. Адрес электронной почты участника будет использоваться для его идентификации.
-
Заявкой на регистрацию в конкурсе Вы подтверждаете, что ознакомились и согласны с [https://yadi.sk/i/OViWdWcEh8aVe Правилами конкурса].
+
Заявкой на регистрацию в конкурсе Вы подтверждаете, что ознакомились и согласны с [[Media:Avito_rules.pdf‎|Правилами конкурса]].
-
==Порядок и сроки предоставления участниками результатов==
+
==Этапы и сроки проведения конкурса==
-
Участники предоставляют результаты работы своих алгоритмов с 8 июня 2015 года и до 23:59 17 июля 2015 года.
+
Конкурс проводится в два этапа.
 +
===Этап первый: настройка алгоритмов распознавания===
 +
Первый этап проводится с момента объявления конкурса '''1 октября 2014 года''' и до '''23:59 13 ноября 2014 года'''.
-
Для проверки качества алгоритма и составления рейтинга результатов каждый участник отправляет файл с результатами работы алгоритма для второй кампании по электронной почте на адрес [mailto:competition.avito.2014@forecsys.ru competition.avito.2014@forecsys.ru], указав в теме письма «Конкурс Avito-2015: Результаты Никнейм участника» (письмо должно быть отправлено с того же электронного адреса, что и при регистрации участника).
+
На данном этапе участники, используя обучающую выборку А, настраивают свои алгоритмы классификации изображений на два класса: содержащие и не содержащие контактную информацию. Алгоритм оценивает вероятность принадлежности изображения к классу изображений, содержащих контактную информацию.
-
 
+
-
Результаты представляются в csv-формате (образец файла [https://yadi.sk/d/FaVNTWOMh8bMh здесь]). Рекомендуемый формат имени файла “YYYYMMDD_competition_avito_2015_Никнейм_участника_Results.csv”. Файл с результатами содержит два столбца с заголовками в первой строчке: в первом столбце (user_id) указаны идентификаторы клиентов второй кампании, а во втором (score) – вещественные число, ранжирующее всех клиентов второй кампании по убыванию склонности воспользоваться дополнительными услугами только после коммуникации. Пропуски и строковые значения не допускаются.
+
-
 
+
-
Два раза в неделю – '''понедельник и четверг до 23:59''' по московскому времени – заканчивается прием писем с результатами для составления очередного [[Конкурс_Avito-2015:_Распознавание_отклика_на_маркетинговое_предложение/Рейтинг_участников|предварительного рейтинга участников]]. В течение следующего рабочего дня будет обновлен предварительный рейтинг результатов участников. Для расчета рейтинга используются результаты участника, полученные в '''последнем письме''' до указанного времени.
+
-
 
+
-
Предварительный рейтинг участников будет рассчитан по 30% клиентов второй кампании (выборка A). Итоговый рейтинг будет рассчитан по 70% клиентов второй кампании (Выборка B). Разбиение клиентов второй кампании на выборки A и B участникам не раскрывается.
+
-
 
+
-
==Процедура определения победителей и призовой фонд==
+
-
'''Победителем конкурса''' (первое место) станет участник, алгоритм которого продемонстрировал наилучший результат на выборке B независимо от того, коммерческим или не коммерческим ПО пользовался участник.
+
-
 
+
-
'''Второе место''' займет участник, алгоритм которого продемонстрировал наилучший результат на выборке B среди тех участников, которые использовали только некоммерческое ПО. В случае, если первое место занял участник, использовавший только некоммерческое ПО, второе место достанется следующему участнику по оценке качества алгоритма среди тех, кто использовал только некоммерческое ПО.
+
-
 
+
-
Информация о победителях будет опубликована на странице конкурса до '''14 августа 2015 г.'''
+
-
 
+
-
'''Воспроизводимость результата работы алгоритма''' участника является обязательным условием признания этого участника победителем конкурса. Предоставление организаторам необходимого ПО и помощь в воспроизведении результатов работы алгоритма является обязанностью участника.
+
-
 
+
-
Денежная премия:
+
-
1-е место '''100 000''' рублей (без учета налогов).
+
-
2-е место '''50 000''' рублей (без учета налогов).
+
-
 
+
-
==Публикация презентаций победителей==
+
-
Победителям конкурса предоставляется возможность опубликовать презентации своих алгоритмов на странице конкурса. Презентация должна кратко и наглядно иллюстрировать подход участника к решению задачи, применяемые методы и полученные результаты. Формат и содержание презентации согласуются с организаторами.
+
-
 
+
-
==Требования к программному обеспечению==
+
-
Приветствуется, в первую очередь, использование программного обеспечения (ПО), которое не требует лицензии для коммерческого использования. Использование коммерческого ПО также допускается.
+
-
 
+
-
К ПО предъявляется одно общее требование – возможность воспроизведения организаторами результатов работы алгоритмов участников без приобретения каких-либо лицензий, например, используя тестовые версии соответствующего ПО, которые находятся в открытом доступе на сайте производителя ПО.
+
-
 
+
-
Предоставление организаторам необходимого ПО и помощь в воспроизведении результатов является обязанностью участника.
+
-
 
+
-
== Подстраницы ==
+
-
{{Служебная:Prefixindex/Конкурс_Avito-2015:_Распознавание_отклика_на_маркетинговое_предложение/}}
+
-
 
+
-
 
+
-
 
+
-
==Ключевые даты конкурса==
+
-
'''8 июня 2014 года''' – Старт конкурса <br />
+
-
'''до 23:59 10 июля''' – [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях#.D0.A0.D0.B5.D0.B3.D0.B8.D1.81.D1.82.D1.80.D0.B0.D1.86.D0.B8.D1.8F_.D1.83.D1.87.D0.B0.D1.81.D1.82.D0.BD.D0.B8.D0.BA.D0.BE.D0.B2|Регистрация]] участников<br />
+
-
'''до 23:59 17 июля''' – [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях#.D0.AD.D1.82.D0.B0.D0.BF_.D0.BF.D0.B5.D1.80.D0.B2.D1.8B.D0.B9:_.D0.BD.D0.B0.D1.81.D1.82.D1.80.D0.BE.D0.B9.D0.BA.D0.B0_.D0.B0.D0.BB.D0.B3.D0.BE.D1.80.D0.B8.D1.82.D0.BC.D0.BE.D0.B2_.D1.80.D0.B0.D1.81.D0.BF.D0.BE.D0.B7.D0.BD.D0.B0.D0.B2.D0.B0.D0.BD.D0.B8.D1.8F|Обучение и сбор]] результатов участников<br />
+
-
'''20 июля – 31 июля''' – [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях#.D0.9F.D1.80.D0.BE.D1.86.D0.B5.D0.B4.D1.83.D1.80.D0.B0_.D0.BE.D0.BF.D1.80.D0.B5.D0.B4.D0.B5.D0.BB.D0.B5.D0.BD.D0.B8.D1.8F_.D0.BF.D0.BE.D0.B1.D0.B5.D0.B4.D0.B8.D1.82.D0.B5.D0.BB.D0.B5.D0.B9_.D0.B8_.D0.BF.D1.80.D0.B8.D0.B7.D0.BE.D0.B2.D0.BE.D0.B9_.D1.84.D0.BE.D0.BD.D0.B4|Определение победителей]] и [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях#.D0.9F.D1.80.D0.BE.D1.86.D0.B5.D0.B4.D1.83.D1.80.D0.B0_.D0.BE.D0.BF.D1.80.D0.B5.D0.B4.D0.B5.D0.BB.D0.B5.D0.BD.D0.B8.D1.8F_.D0.BF.D0.BE.D0.B1.D0.B5.D0.B4.D0.B8.D1.82.D0.B5.D0.BB.D0.B5.D0.B9_.D0.B8_.D0.BF.D1.80.D0.B8.D0.B7.D0.BE.D0.B2.D0.BE.D0.B9_.D1.84.D0.BE.D0.BD.D0.B4|проверка на воспроизводимость]] результатов<br />
+
-
'''03 августа – 14 августа''' – [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях#.D0.9F.D1.83.D0.B1.D0.BB.D0.B8.D0.BA.D0.B0.D1.86.D0.B8.D1.8F_.D0.BF.D1.80.D0.B5.D0.B7.D0.B5.D0.BD.D1.82.D0.B0.D1.86.D0.B8.D0.B9_.D0.BF.D0.BE.D0.B1.D0.B5.D0.B4.D0.B8.D1.82.D0.B5.D0.BB.D0.B5.D0.B9|публикация презентаций]] победителей на странице конкурса
+
 +
Для проверки качества алгоритмов и составления предварительного рейтинга результатов участники отправляют файл с результатами на выборке B по электронной почте на адрес [mailto:competition.avito.2014@forecsys.ru competition.avito.2014@forecsys.ru], указав в теме письма «Результаты B: Никнейм участника» (письмо должно быть отправлено с того же электронного адреса, что и при регистрации участника).
 +
Результаты представляются в csv-формате (образец файла [[Media:20140930 Ivanov Results B version1.zip|''здесь'']]). Рекомендуемый формат имени файла “YYYYMMDD_Никнейм_участника_Results_B_version1.csv”. Файл с результатами содержит два столбца: в первом столбце указаны идентификаторы изображений (имена файлов), а во втором – вещественные оценки вероятностей нахождения на изображениях контактной информации. Значения оценок вероятностей должны принадлежать отрезку [0,1]. Пропуски и строковые значения не допускаются.
 +
Два раза в неделю – '''понедельник и четверг до 23:59''' по московскому времени – осуществляется прием писем с оценками вероятностей для выборки B для составления очередного предварительного рейтинга участников. В течение следующего рабочего дня будет обновлен предварительный [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях/Рейтинг_участников|рейтинг результатов]] участников. Для расчета рейтинга используются результаты участника, полученные в '''последнем письме'''.
{{notice|
{{notice|
-
'''Статья не в общественном достоянии.'''<br/>
+
'''Update 11.11.2014'''<br/>
-
Представленная здесь информация не может
+
[[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях/Рейтинг_участников|Рейтинг участников]] зафиксирован и больше не обновляется ввиду того, что уже выложены метки классов объектов тестовой выборки В.
-
использоваться без согласия автора.
+
}}
}}
-
файл с [[Конкурс_по_распознаванию_контактной_информации_на_изображениях_%28Конкурс_Avito.ru_2014%29#.D0.A2.D1.80.D0.B5.D0.B1.D0.BE.D0.B2.D0.B0.D0.BD.D0.B8.D1.8F_.D0.BA_.D0.BE.D0.BF.D0.B8.D1.81.D0.B0.D0.BD.D0.B8.D1.8E_.D0.B0.D0.BB.D0.B3.D0.BE.D1.80.D0.B8.D1.82.D0.BC.D0.B0_.D1.80.D0.B0.D1.81.D0.BF.D0.BE.D0.B7.D0.BD.D0.B0.D0.B2.D0.B0.D0.BD.D0.B8.D1.8F|описанием алгоритма]]
 
-
Правила конкурса (текст соглашения участников с организаторами) будут опубликованы в ближайшее время.
+
7 ноября 2014 года участникам предоставляется для скачивания ответы для выборки B, которые участники могут использовать для дальнейшей настройки алгоритмов.
-
Заявкой на регистрацию в конкурсе Вы подтверждаете, что ознакомились и согласны с [[Media:Avito_rules.pdf‎|Правилами конкурса]].
+
До '''23:59 13 ноября''' участники должны прислать ZIP-архив c [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях#.D0.A2.D1.80.D0.B5.D0.B1.D0.BE.D0.B2.D0.B0.D0.BD.D0.B8.D1.8F_.D0.BA_.D0.BF.D1.80.D0.BE.D0.B3.D1.80.D0.B0.D0.BC.D0.BC.D0.BD.D0.BE.D0.BC.D1.83_.D0.BE.D0.B1.D0.B5.D1.81.D0.BF.D0.B5.D1.87.D0.B5.D0.BD.D0.B8.D1.8E|файлами программы алгоритма]]. Программа алгоритма будет использована для проверки воспроизводимости результатов участника, претендующего на победу в конкурсе, на контрольной выборке C. Участники, не приславшие вовремя свои алгоритмы, не смогут претендовать на победу в конкурсе.
-
==Ключевые даты конкурса==
+
===Этап второй: применение алгоритмов на контрольной выборке C===
-
'''1 октября 2014 года''' – Старт конкурса <br />
+
Второй этап проводится с '''14 ноября''' по '''23:59 18 ноября 2014 года'''
-
'''до 4 ноября 23:59''' – Регистрация участников<br />
+
-
'''до 11 ноября 23:59''' – Обучения алгоритмов<br />
+
-
'''до 13 ноября 23:59''' – Сбор алгоритмов участников<br />
+
-
'''14 ноября''' – Предоставление контрольной выборки C и ответов для выборки B<br />
+
-
'''до 18 ноября 23:59''' – Сбор результатов алгоритмов на контрольной выборке C<br />
+
-
'''19 ноября – 9 декабря''' – Определение победителей и проверка на воспроизводимость результатов, публикация презентаций победителей на портале MachineLearning.ru
+
-
==Ключевые даты конкурса==
+
'''14 ноября 2014 года''' участникам предоставляется для скачивания контрольная выборка C.
-
'''01.10.2014''' – Старт конкурса <br />
+
-
'''до 04.11 23:59''' – Регистрация участников<br />
+
-
'''до 11.11 23:59''' – Обучения алгоритмов<br />
+
-
'''до 13.11 23:59''' – Сбор алгоритмов участников<br />
+
-
'''14.11''' – Предоставление контрольной выборки C и ответов для выборки B<br />
+
-
'''до 18.11 23:59''' – Сбор результатов алгоритмов на контрольной выборке C<br />
+
-
'''19.11 – 9.12''' – Определение победителей и проверка на воспроизводимость результатов, публикация презентаций победителей на портале MachineLearning.ru
+
-
==Новость на главной странице сайта==
+
'''С 15 ноября по 23:59 18 ноября 2014 года''' участники высылают результаты работы алгоритмов на выборке C (образец файла [[Media:20141115 Ivanov Results C version1.zip‎‎|''здесь'']]) по электронной почте на адрес [mailto:competition.avito.2014@forecsys.ru competition.avito.2014@forecsys.ru], указав в теме письма «Результаты C: Никнейм участника». Рекомендуемый формат имени файла “YYYYMMDD_Никнейм_участника_Results_C_version1.csv”.
-
'''1 октября 2014 года''' — стартует [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях|Конкурс по распознаванию контактной информации на&nbsp;изображениях Avito.ru]], проводимый при&nbsp;информационной поддержке 10-й&nbsp;Международной конференции [http://www.mmro.ru/ «Интеллектуализация обработки информации-2014»] (ИОИ-2014), Греция, о.&nbsp;Крит, 4-11&nbsp;октября&nbsp;2014&nbsp;года.
+
-
==Баннерная новость==
+
Последние присланные участником результаты до '''23:59 18 ноября 2014 года''' на контрольной выборке C будут использованы при определении победителей конкурса.
-
<!---------------------------------------------------------->
+
-
{{Раздел заглавной страницы | x=0 | y=1 |style="width:50%"| Заголовок =Конкурс по анализу изображений |Содержание=
+
-
'''1 октября 2014 года''' — стартует [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях|Конкурс по&nbsp;распознаванию контактной информации на&nbsp;изображениях]], проводимый при&nbsp;информационной поддержке 10-й&nbsp;Международной конференции [http://www.mmro.ru/ «Интеллектуализация обработки информации-2014»] (ИОИ-2014), Греция, о.&nbsp;Крит, 4-11&nbsp;октября&nbsp;2014&nbsp;года.
+
-
'''Организатор конкурса''' – самый большой в&nbsp;России сайт объявлений [http://www.avito.ru/ Avito.ru].
+
==Процедура определения победителей и призовой фонд==
 +
'''Победителем конкурса''' (первое место) станет участник, алгоритм которого продемонстрировал наилучший результат на контрольной выборке C.
-
'''Цель конкурса''' – создание эффективного алгоритма распознавания изображений, содержащих контактную информацию.
+
'''Второе место займет''' участник, алгоритм которого продемонстрировал наилучший результат на контрольной выборке C среди тех участников, которые использовали только [[Конкурс_по_распознаванию_контактной_информации_на_изображениях_%28Конкурс_Avito.ru_2014%29#.D0.A2.D1.80.D0.B5.D0.B1.D0.BE.D0.B2.D0.B0.D0.BD.D0.B8.D1.8F_.D0.BA_.D0.BF.D1.80.D0.BE.D0.B3.D1.80.D0.B0.D0.BC.D0.BC.D0.BD.D0.BE.D0.BC.D1.83_.D0.BE.D0.B1.D0.B5.D1.81.D0.BF.D0.B5.D1.87.D0.B5.D0.BD.D0.B8.D1.8E|некоммерческое ПО]]. В случае, если первое место занял участник, использовавший только некоммерческое ПО, второе место достанется следующему участнику по оценке качества алгоритма по результатам на выборке C среди тех, кто использовал только некоммерческое ПО.
-
Ознакомиться с условиями конкурса и скачать данные можно на [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях|странице конкурса]].
+
Информация о победителях будет опубликована на странице конкурса '''до 10 декабря 2014 г.'''
-
}}
+
-
==Рейтинг участников конкурса==
+
'''Воспроизводимость результата работы алгоритма''' участника с использованием присланной ранее программы алгоритма является обязательным условием признания этого участника победителем конкурса. Предоставление организаторам необходимого ПО и помощь в воспроизведении результатов работы алгоритма является обязанностью участника. Кроме того, участник должен подготовить [[Конкурс_Avito.ru-2014:_распознавание_контактной_информации_на_изображениях#.D0.A2.D1.80.D0.B5.D0.B1.D0.BE.D0.B2.D0.B0.D0.BD.D0.B8.D1.8F_.D0.BA_.D0.BE.D0.BF.D0.B8.D1.81.D0.B0.D0.BD.D0.B8.D1.8E_.D0.B0.D0.BB.D0.B3.D0.BE.D1.80.D0.B8.D1.82.D0.BC.D0.B0_.D1.80.D0.B0.D1.81.D0.BF.D0.BE.D0.B7.D0.BD.D0.B0.D0.B2.D0.B0.D0.BD.D0.B8.D1.8F|описание алгоритма]].
-
{| class="wikitable sortable" width="75%"
+
-
|-
+
Денежная премия: <br />
-
!width="50%"|Никнейм участника||width="10%"|Рейтинг||width="20%"|Дата последнего обновления
+
::1-е место '''100 000''' рублей (без учета налогов).<br />
-
|-
+
::2-е место '''50 000''' рублей (без учета налогов).
-
|Vasya||0.781||style="text-align:center"|25.09.2014
+
-
|-
+
-
|Иванов Иван||0.669||style="text-align:center"|21.09.2014
+
-
|-
+
-
|Читер||0.72||style="text-align:center"|24.09.2014
+
-
|-
+
-
|ТУЛГУ||0.612||style="text-align:center"|25.09.2014
+
-
|-
+
-
|Шадовец||0.605||style="text-align:center"|25.09.2014
+
-
|}
+
-
[[Media:Example(SET B).rar‎|''здесь'']] - просто тренировочка выкладывания файла
+
-
----
+
==Публикация презентаций победителей==
-
__TOC__
+
Победителям конкурса предоставляется возможность опубликовать презентации своих алгоритмов на странице конкурса. Презентация должна кратко и наглядно иллюстрировать подход участника к решению задачи, применяемые методы и полученные результаты. Формат и содержание презентации согласуются с организаторами.
-
==The main title==
+
-
[[Изображение:Ad1.jpg]]
+
-
===Subtitle===
+
-
====Sub-subtitle====
+
-
Text.
+
-
Continious text.<br />cut the row without new paragraph
+
-
New row
+
==Требования к программному обеспечению==
 +
Приветствуется, в первую очередь, использование программного обеспечения (ПО), которое не требует лицензии для коммерческого использования. Использование коммерческого ПО также допускается.
-
==Second title==
+
К ПО предъявляется одно общее требование – возможность воспроизведения организаторами результатов работы алгоритмов участников без приобретения каких-либо лицензий, например, используя тестовые версии соответствующего ПО, которые находятся в открытом доступе на сайте производителя ПО.
-
Text
+
-
List:
+
Предоставление организаторам необходимого ПО и помощь в воспроизведении результатов является обязанностью участника.
-
*First
+
-
**1.1
+
-
**:text of 1.1
+
-
**1.2
+
-
**:and text for this
+
-
*Second
+
-
**2.1
+
-
==Numeric list==
+
==Требования к описанию алгоритма распознавания==
-
#this must be first
+
Требуется предоставить файл формата .doc, docx или .pdf с описанием алгоритма на русском языке по следующему шаблону:
-
##this must be 1.1
+
# '''Идентификация''' <br />Никнейм и адрес электронной почты участника.
-
###this should be 1.1.1
+
# '''Аннотация''' <br />4-6 предложений, объясняющих общий подход к построению алгоритма, включающих, например, принципы генерации или отбора признаков и метод обучения.<br />
-
##1.2
+
# '''Генерация и отбор признаков''' <br />Описание метода генерации и/или отбора признаков изображений. Список и общее описание выбранных признаков. <br />
-
#Second
+
# '''Процесс обучения'''<br />Описание деталей метода обучения, использованного для построения алгоритма. Если комбинировались или объединялись разные методы, опишите каким образом.
 +
# '''Описание программы алгоритма''' <br />Для каждой функции:<br />
 +
#*входные переменные
 +
#*выходные переменные
 +
#*что функция делает<br />
 +
# '''Зависимости'''<br />Список зависимостей, библиотек, функций, пакетов или код других сторонних компаний, использованных для создания алгоритма.
 +
# '''Инструкция по воспроизведению''' (аналог README файла)<br />Пошаговая инструкция для создания проекта из приведенного кода.
 +
# '''Дополнительные комментарии и наблюдения''' <br />Любые дополнительные комментарии или наблюдения по поводу данных, алгоритма или процесса улучшения алгоритма.
 +
# '''Графики'''<br />Графики или картинки, которые были сделаны из данных или в процессе обучения и которые показались полезными или интересными.
 +
# '''Ссылки'''<br/> Необходимые ссылки или другие внешние источники информации.
-
Nice!
+
== Подстраницы ==
-
 
+
{{Служебная:Prefixindex/Конкурс Avito.ru-2014: распознавание контактной информации на изображениях/}}
-
Можно также делать смешанные списки:
+
-
*# и вкладывать их
+
-
*#* как, например,
+
-
*# здесь.
+
-
==Еще один заголовок==
+
-
:вот отступ
+
-
а тут начался абзац
+
-
 
+
-
<center>А вот в центре заголовочек тип</center>
+
-
----
+
-
линия прям как после заголовков
+
-
<p align="center">Выравнивание посердине</p>
+
-
<p align="left">Выравнивание влево.</p>
+
-
<p align="right">Выравнивание вправо.</p>
+
-
[[Статистический анализ данных (курс лекций, К.В.Воронцов)/2014/1|курс лекций Воронцова]]
+
-
 
+
-
 
+
-
Можно ссылаться на подраздел в самой статье,
+
-
указав его после «решётки»:
+
-
[[Участник:Pavel Levdik/Песочница#Subtitle|внутренняя ссылка(по странице)]].
+
-
 
+
-
Внешняя ссылка:
+
-
[http://ru.wikipedia.org Википедия]
+
-
 
+
-
[http://www.multitran.ru/c/m.exe?t=41756_1_2&s1=%E0%E1%E7%E0%F6 Мультитран]
+
-
==Подпись==
+
-
Краткая подпись: [[Участник:Pavel Levdik|Pavel Levdik]]
+
-
 
+
-
Полная подпись (предпочтительнее): — ''[[Участник:Pavel Levdik|Pavel Levdik]] 09:09, 22 сентября 2014 (MSD)''
+
-
 
+
-
Текущая дата: {{дата}}
+
-
 
+
-
Любая дата: {{дата|21|06|2009}}
+
-
 
+
-
<tex>\frac{1}{2}\sum_{i=1}^{\infty}C_i\frac{(i-1)^2}{k^i}</tex>
+
-
 
+
-
Пометка формул без автоматической нумерации:
+
-
{{eqno|1}}
+
-
::<tex>a:\: \mathbb{R}^n \to \{0,+1\}.</tex>
+
-
{{eqno|3-a}}
+
-
::<tex>a(x)=\left[w_1x_1+\cdots+w_nx_n >0\right].</tex>
+
-
Ссылки на формулы {{eqref|1}} и {{eqref|3-a}}.
+
-
----
+
-
Печать фрагмента кода:
+
-
<pre>
+
-
#include <iostream>
+
-
 
+
-
using namespace std;
+
-
 
+
-
int main()
+
-
{
+
-
int a;
+
-
cin << a;
+
-
int b = a + 4;
+
-
cout >> b;
+
-
return 0;
+
-
}
+
-
</pre>
+
-
<!-- комментарий в тексе разметки -->
+
-
==Файлы==
+
-
[[Изображение:Msu people.jpg]]
+
-
----
+
-
===pdf===
+
-
[[Media:Invite.pdf‎|PDF [198000Tб]]]
+
-
===youtube===
+
-
<videoflash>oxUoFwrJ670&list=PLcLjErvAAmmoHMUCDp6-FvqgwjyZpQJ_J|800|600</videoflash>
+
-
----
+
-
{| border="1"
+
-
|-
+
-
|Ячейка А-1
+
-
|Ячейка Б-1
+
-
|Ячейка В-1
+
-
|-
+
-
|Ячейка А-2
+
-
|Ячейка Б-2
+
-
|Ячейка В-2
+
-
|-
+
-
|Ячейка А-3
+
-
|Ячейка Б-3
+
-
|Ячейка В-3
+
-
|}
+
-
 
+
-
== Ссылки ==
+
-
[[:Категория:Открытые проблемы и полемика]]
+
-
[[:Категория:Виртуальные семинары]]
+
[[Категория:Конкурсы]]

Версия 10:16, 26 февраля 2016

Содержание

Конкурс Avito-2016: Распознавание марки и модели автомашин на изображениях

Конкурс по распознаванию марки и модели автомашин на изображениях Avito-2016 — это конкурс по решению прикладной задачи из области анализа изображений, проводимый при информационной поддержке 10-й Международной конференции «Интеллектуализация обработки информации-2014» (ИОИ-2014), Греция, о. Крит, 4-11 октября 2014 года.

Организаторы конкурса – компания Avito.ru и ее партнер – компания Форексис.

Вопросы организаторам конкурса можно задавать по электронной почте на адрес competitions@forecsys.ru с указанием в теме письма «Avito-2016: Вопрос».

С информацией об организаторе конкурса, правилах его проведения, количестве наград, сроках, месте и порядке их получения можно ознакомиться здесь.

Предварительный рейтинг участников можно посмотреть здесь.

Ключевые даты конкурса

1 октября 2014 года – Старт конкурса
до 23:59 4 ноября – Регистрация участников
до 23:59 13 ноября – Обучение и сбор алгоритмов участников
14 ноября – Предоставление контрольной выборки C и ответов для выборки B
до 23:59 18 ноября – Сбор результатов алгоритмов на контрольной выборке C
19 ноября – 10 декабря – Определение победителей и проверка на воспроизводимость результатов, публикация презентаций победителей на странице конкурса

Avito.ru

Avito.ru является самым большим в России сайтом объявлений. Миллионы людей ежедневно заходят на портал, чтобы продать или купить практически всё, что пожелают: от цифровой техники и одежды до автомобилей и недвижимости. Объявления размещают частные лица, предприниматели и компании, поэтому на Avito.ru можно купить как бывшие в употреблении вещи, так и абсолютно новые товары.

Миссия Avito.ru — соединить продавцов и покупателей по всей России, изменив их повседневную жизнь к лучшему.

На Avito.ru более 24 миллионов активных объявлений и каждый день огромное количество объявлений создается или изменяется. Эффективность Avito.ru в значительной степени зависит от качества заполнения содержания объявлений, поскольку качественные объявления позволяют покупателям оперативно находить подходящие предложения, а продавцам - продавать свои товары за считанные часы.

Описание задачи

По правилам Avito.ru в объявлении контактная информация продавца (например, телефон, e-mail, ссылка на сайт) должна быть указана в соответствующих текстовых полях. Это позволяет организовать удобный поиск для покупателей, эффективно находить дубликаты объявлений, организовывать черные списки недобросовестных продавцов и выявлять другие нарушения. Типичным нарушением является заполнение текстовых полей объявления недействительной контактной информацией, в то же время, на изображении предоставляется актуальная информация.

Цель конкурса – создание эффективного алгоритма распознавания изображений, содержащих контактную информацию.

Ниже приведены два примера изображений с контактной информацией.


Описание данных

Исходная выборка, выборка A, содержит 41 122 изображения, классифицированных на два класса:

  • 1 – в изображении присутствует контактная информация (12031),
  • 0 – в изображении отсутствует контактная информация (29091).

Выборка A используется для настройки алгоритмов участниками.

Еще 10 000 изображений, выборка B, являются тестовыми – ответы по ним известны только организаторам. Тестовые данные будут использоваться для составления промежуточного рейтинга участников, который обновляется два раза в неделю .

Третья выборка, выборка C, – контрольная, предоставляется участникам на втором этапе конкурса и содержит 10 000 изображений. Контрольная выборка будет использоваться для определения победителей конкурса. Подробнее об этапах конкурса .

Изображения имеют формат jpg, ответы по обучающей выборке представлены в csv-файле в формате Id, label, где Id – имя файла изображения, а label – метка класса, 0 или 1.


Update 08.10.2014

Использование структуры id изображений в алгоритме не допускается, id изображений в контрольной выборке C будут случайными.


Данные можно скачать по ссылкам:
Выборка A – папка содержит обучающие изображения в формате jpg.
Выборка B – папка содержит тестовые изображения в формате jpg.
Выборка C – папка содержит контрольные изображения в формате jpg.
Метки классов объектов обучающей выборки – csv-файл содержит метки классов для выборки A.
Метки классов объектов тестовой выборки – csv-файл содержит метки классов для выборки В.

Функционал качества алгоритма распознавания

Качество работы алгоритмов распознавания оценивается показателем AUC – площадь под ROC-кривой.

Реализация функционала качества AUC в среде Matlab:

[X,Y,T,AUC] = perfcurve(labels,scores,posclass);

Регистрация участников

Для регистрации в конкурсе потенциальному участнику необходимо до 23:59 4 ноября 2014 года прислать письмо по электронной почте на адрес competition.avito.2014@forecsys.ru с темой «Регистрация», содержащее никнейм участника – имя/псевдоним, которое будет отображаться в предварительном рейтинге участников, формируемом в течение первого этапа. Адрес электронной почты участника будет использоваться для его идентификации.

Заявкой на регистрацию в конкурсе Вы подтверждаете, что ознакомились и согласны с Правилами конкурса.

Этапы и сроки проведения конкурса

Конкурс проводится в два этапа.

Этап первый: настройка алгоритмов распознавания

Первый этап проводится с момента объявления конкурса 1 октября 2014 года и до 23:59 13 ноября 2014 года.

На данном этапе участники, используя обучающую выборку А, настраивают свои алгоритмы классификации изображений на два класса: содержащие и не содержащие контактную информацию. Алгоритм оценивает вероятность принадлежности изображения к классу изображений, содержащих контактную информацию.

Для проверки качества алгоритмов и составления предварительного рейтинга результатов участники отправляют файл с результатами на выборке B по электронной почте на адрес competition.avito.2014@forecsys.ru, указав в теме письма «Результаты B: Никнейм участника» (письмо должно быть отправлено с того же электронного адреса, что и при регистрации участника).

Результаты представляются в csv-формате (образец файла здесь). Рекомендуемый формат имени файла “YYYYMMDD_Никнейм_участника_Results_B_version1.csv”. Файл с результатами содержит два столбца: в первом столбце указаны идентификаторы изображений (имена файлов), а во втором – вещественные оценки вероятностей нахождения на изображениях контактной информации. Значения оценок вероятностей должны принадлежать отрезку [0,1]. Пропуски и строковые значения не допускаются.

Два раза в неделю – понедельник и четверг до 23:59 по московскому времени – осуществляется прием писем с оценками вероятностей для выборки B для составления очередного предварительного рейтинга участников. В течение следующего рабочего дня будет обновлен предварительный рейтинг результатов участников. Для расчета рейтинга используются результаты участника, полученные в последнем письме.


Update 11.11.2014

Рейтинг участников зафиксирован и больше не обновляется ввиду того, что уже выложены метки классов объектов тестовой выборки В.


7 ноября 2014 года участникам предоставляется для скачивания ответы для выборки B, которые участники могут использовать для дальнейшей настройки алгоритмов.

До 23:59 13 ноября участники должны прислать ZIP-архив c файлами программы алгоритма. Программа алгоритма будет использована для проверки воспроизводимости результатов участника, претендующего на победу в конкурсе, на контрольной выборке C. Участники, не приславшие вовремя свои алгоритмы, не смогут претендовать на победу в конкурсе.

Этап второй: применение алгоритмов на контрольной выборке C

Второй этап проводится с 14 ноября по 23:59 18 ноября 2014 года

14 ноября 2014 года участникам предоставляется для скачивания контрольная выборка C.

С 15 ноября по 23:59 18 ноября 2014 года участники высылают результаты работы алгоритмов на выборке C (образец файла здесь) по электронной почте на адрес competition.avito.2014@forecsys.ru, указав в теме письма «Результаты C: Никнейм участника». Рекомендуемый формат имени файла “YYYYMMDD_Никнейм_участника_Results_C_version1.csv”.

Последние присланные участником результаты до 23:59 18 ноября 2014 года на контрольной выборке C будут использованы при определении победителей конкурса.

Процедура определения победителей и призовой фонд

Победителем конкурса (первое место) станет участник, алгоритм которого продемонстрировал наилучший результат на контрольной выборке C.

Второе место займет участник, алгоритм которого продемонстрировал наилучший результат на контрольной выборке C среди тех участников, которые использовали только некоммерческое ПО. В случае, если первое место занял участник, использовавший только некоммерческое ПО, второе место достанется следующему участнику по оценке качества алгоритма по результатам на выборке C среди тех, кто использовал только некоммерческое ПО.

Информация о победителях будет опубликована на странице конкурса до 10 декабря 2014 г.

Воспроизводимость результата работы алгоритма участника с использованием присланной ранее программы алгоритма является обязательным условием признания этого участника победителем конкурса. Предоставление организаторам необходимого ПО и помощь в воспроизведении результатов работы алгоритма является обязанностью участника. Кроме того, участник должен подготовить описание алгоритма.

Денежная премия:

1-е место 100 000 рублей (без учета налогов).
2-е место 50 000 рублей (без учета налогов).

Публикация презентаций победителей

Победителям конкурса предоставляется возможность опубликовать презентации своих алгоритмов на странице конкурса. Презентация должна кратко и наглядно иллюстрировать подход участника к решению задачи, применяемые методы и полученные результаты. Формат и содержание презентации согласуются с организаторами.

Требования к программному обеспечению

Приветствуется, в первую очередь, использование программного обеспечения (ПО), которое не требует лицензии для коммерческого использования. Использование коммерческого ПО также допускается.

К ПО предъявляется одно общее требование – возможность воспроизведения организаторами результатов работы алгоритмов участников без приобретения каких-либо лицензий, например, используя тестовые версии соответствующего ПО, которые находятся в открытом доступе на сайте производителя ПО.

Предоставление организаторам необходимого ПО и помощь в воспроизведении результатов является обязанностью участника.

Требования к описанию алгоритма распознавания

Требуется предоставить файл формата .doc, docx или .pdf с описанием алгоритма на русском языке по следующему шаблону:

  1. Идентификация
    Никнейм и адрес электронной почты участника.
  2. Аннотация
    4-6 предложений, объясняющих общий подход к построению алгоритма, включающих, например, принципы генерации или отбора признаков и метод обучения.
  3. Генерация и отбор признаков
    Описание метода генерации и/или отбора признаков изображений. Список и общее описание выбранных признаков.
  4. Процесс обучения
    Описание деталей метода обучения, использованного для построения алгоритма. Если комбинировались или объединялись разные методы, опишите каким образом.
  5. Описание программы алгоритма
    Для каждой функции:
    • входные переменные
    • выходные переменные
    • что функция делает
  6. Зависимости
    Список зависимостей, библиотек, функций, пакетов или код других сторонних компаний, использованных для создания алгоритма.
  7. Инструкция по воспроизведению (аналог README файла)
    Пошаговая инструкция для создания проекта из приведенного кода.
  8. Дополнительные комментарии и наблюдения
    Любые дополнительные комментарии или наблюдения по поводу данных, алгоритма или процесса улучшения алгоритма.
  9. Графики
    Графики или картинки, которые были сделаны из данных или в процессе обучения и которые показались полезными или интересными.
  10. Ссылки
    Необходимые ссылки или другие внешние источники информации.

Подстраницы

Конкурс Avito.ru-2014: распознавание контактной информации на изображениях/Рейтинг участников
Личные инструменты