MachineLearning:Концепция ресурса

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м
Строка 2: Строка 2:
== Цели создания Ресурса MachineLearning.Ru ==
== Цели создания Ресурса MachineLearning.Ru ==
-
* Сконцентрировать информацию о достижениях ведущих российских научных школ в области [[машинное обучение|машинного обучения]] и [[интеллектуальный анализ данных|интеллектуального анализа данных]].
+
* Сконцентрировать информацию о достижениях научных школ России и стран СНГ в области [[машинное обучение|машинного обучения]] и [[интеллектуальный анализ данных|интеллектуального анализа данных]].
* Способствовать обмену опытом, накоплению и распространению научных знаний в этой области.
* Способствовать обмену опытом, накоплению и распространению научных знаний в этой области.
* Предоставить площадку для виртуальных научных семинаров и обсуждений.
* Предоставить площадку для виртуальных научных семинаров и обсуждений.
* Предоставить доступ к [[Полигон алгоритмов|распределенной системе тестирования алгоритмов классификации и прогнозирования]].
* Предоставить доступ к [[Полигон алгоритмов|распределенной системе тестирования алгоритмов классификации и прогнозирования]].
-
 
== Научные направления ==
== Научные направления ==
-
* [[Машинное обучение]] (machine learning) — теория, подходы и методы обучения по прецедентам:
+
* [[:Категория:Машинное обучение|Машинное обучение]] (machine learning) — теория, подходы и методы обучения по прецедентам:
-
** [[классификация]] (classification);
+
** [[:Категория:Классификация|классификация]] (classification);
-
** [[кластеризация]] (clustering);
+
** [[:Категория:Кластеризация|кластеризация]] (clustering);
-
** [[Регрессионный анализ|регрессия]] (regression);
+
** [[:Категория:Регрессионный анализ|регрессия]] (regression);
-
** [[прогнозирование]] (forecasting).
+
** [[:Категория:Прогнозирование|прогнозирование]] (forecasting).
-
* [[Интеллектуальный анализ данных]] (data mining) — методы анализа больших объёмов информации, в которых используется обучение по прецедентам:
+
* [[:Категория:Интеллектуальный анализ данных|Интеллектуальный анализ данных]] (data mining) — методы анализа больших объёмов информации, в которых используется обучение по прецедентам:
** [[добыча знаний]] (knowledge discovery in databases);
** [[добыча знаний]] (knowledge discovery in databases);
** [[анализ изображений|анализ]], [[распознавание изображений|распознавание]] и [[понимание изображений|понимание]] изображений (image analysis, recognition & understanding);
** [[анализ изображений|анализ]], [[распознавание изображений|распознавание]] и [[понимание изображений|понимание]] изображений (image analysis, recognition & understanding);
Строка 24: Строка 23:
* [[Анализ данных]] — теория, подходы и методы анализа данных, в которых не используется обучение по прецедентам:
* [[Анализ данных]] — теория, подходы и методы анализа данных, в которых не используется обучение по прецедентам:
-
** [[прикладная статистика]] (applied statistics);
+
** [[:Категория:Прикладная статистика|прикладная статистика]] (applied statistics);
-
** [[обработка сигналов]] (signal processing);
+
** [[:Категория:Обработка сигналов|обработка сигналов]] (signal processing);
** [[обработка изображений|обработка]] и [[синтез изображений|синтез]] изображений (image analysis & synthesis);
** [[обработка изображений|обработка]] и [[синтез изображений|синтез]] изображений (image analysis & synthesis);
** [[поиск информации]] (information retrieval).
** [[поиск информации]] (information retrieval).
-
* [[Прикладные задачи]] и [[Прикладные системы|системы]] анализа данных (applications) — приложения машинного обучения и анализа данных в различных предметных областях:
+
* [[:Категория:Прикладные задачи анализа данных|Прикладные задачи]] и [[:Категория:Прикладные системы анализа данных|системы]] анализа данных (applications) — приложения машинного обучения и анализа данных в различных предметных областях:
** [[:Категория:приложения в биоинформатике|приложения в биоинформатике]];
** [[:Категория:приложения в биоинформатике|приложения в биоинформатике]];
** [[:Категория:приложения в медицине|приложения в медицине]];
** [[:Категория:приложения в медицине|приложения в медицине]];
Строка 36: Строка 35:
** [[:Категория:приложения в технике|приложения в технике]].
** [[:Категория:приложения в технике|приложения в технике]].
-
Приветствуется уточнение списка направлений участниками проекта.
+
Выше приведён примерный список направлений.
 +
Тематическая иерархия Ресурса начинается в корневой категории [[:Категория:Научные направления|научные направления]] и будет постоянно уточняться всеми участниками проекта.
== Для кого предназначен Ресурс ==
== Для кого предназначен Ресурс ==
-
Аудитория ресурса — русскоязычная, включающая следующие уровни:
+
Аудитория Ресурса — русскоязычная, включающая следующие уровни:
* Эксперты по анализу данных. Для них публикуются работы, чтение которых требует профессиональных знаний.
* Эксперты по анализу данных. Для них публикуются работы, чтение которых требует профессиональных знаний.
-
* Эксперты в прикладных областях. Для них публикуется [[:Категория:Энциклопедия анализа данных|энциклопедия анализа данных]], рекомендации по практическому применению методов анализа данных, примеры решённых прикладных задач.
+
* Эксперты в прикладных областях. Для них публикуется [[:Категория:Энциклопедия анализа данных|энциклопедия анализа данных]], рекомендации по практическому применению методов анализа данных, примеры решённых [[:Категория:Прикладные исследования|прикладных задач]].
-
* Руководители, которым адресованы статьи по стратегии применения интеллектуальных продуктов в бизнесе.
+
* Руководители, которым адресованы статьи по стратегии применения интеллектуальных продуктов в бизнесе, производстве и других сферах.
-
* Студенты, аспиранты, преподаватели, использующие ресурс в образовательных целях.
+
* Студенты, аспиранты, преподаватели, использующие Ресурс в образовательных целях.
== Принципы построения Ресурса ==
== Принципы построения Ресурса ==
=== Открытость ===
=== Открытость ===
-
* Содержимое ресурса создаётся научным сообществом и является общественным достоянием. Статьи публикуются под открытым лицензионным соглашением [http://ru.wikipedia.org/wiki/FDL GNU FDL].
+
* Содержимое Ресурса создаётся научным сообществом и является общественным достоянием. Статьи публикуются под открытым лицензионным соглашением [http://ru.wikipedia.org/wiki/FDL GNU FDL].
* Создатели Ресурса (научная школа академика РАН [[Журавлёв, Юрий Иванович|{{S|Ю. И. Журавлёва}}]] и чл.-корр. РАН [[Рудаков, Константин Владимирович|К. В. Рудакова]]) осуществляют его техническую поддержку и продвижение, но не определяют его содержимое и не претендуют на право обладания Ресурсом.
* Создатели Ресурса (научная школа академика РАН [[Журавлёв, Юрий Иванович|{{S|Ю. И. Журавлёва}}]] и чл.-корр. РАН [[Рудаков, Константин Владимирович|К. В. Рудакова]]) осуществляют его техническую поддержку и продвижение, но не определяют его содержимое и не претендуют на право обладания Ресурсом.
Строка 54: Строка 54:
Ресурс строится по принципам [http://ru.wikipedia.org Википедии — свободной энциклопедии] и обладает всеми её основными возможностями и преимуществами:
Ресурс строится по принципам [http://ru.wikipedia.org Википедии — свободной энциклопедии] и обладает всеми её основными возможностями и преимуществами:
* каждый пользователь ресурса может создать или изменить страницу (статью) или [[MachineLearning:Категоризация|раздел (категорию)]] в любое время, в любом месте, располагая только доступом в Интернет;
* каждый пользователь ресурса может создать или изменить страницу (статью) или [[MachineLearning:Категоризация|раздел (категорию)]] в любое время, в любом месте, располагая только доступом в Интернет;
-
* любая статья или категория может быть включена в любое количество категорий, что позволяет гибко выстраивать структуру ресурса;
+
* любая статья или категория может быть включена в любое количество категорий, что позволяет гибко выстраивать структуру Ресурса;
* история всех правок сохраняется в системе, любую правку можно отменить, любые две версии статьи можно сравнить;
* история всех правок сохраняется в системе, любую правку можно отменить, любые две версии статьи можно сравнить;
* с каждой статьёй связана страница обсуждения;
* с каждой статьёй связана страница обсуждения;
-
* пользователи могут размещать информацию о себе на страницах участников, однако, в отличие от Википедии, участник не имеет права модифицировать личные страницы других участников.
 
=== Отличия от Википедии ===
=== Отличия от Википедии ===
Строка 63: Строка 62:
* тематика Википедии практически не ограничена — тематика Ресурса охватывает только области знания, связанные с анализом данных;
* тематика Википедии практически не ограничена — тематика Ресурса охватывает только области знания, связанные с анализом данных;
* Википедия создаётся широким кругом энтузиастов, в основной массе не являющихся экспертами — Ресурс является профессиональным и создаётся специалистами в области анализа данных;
* Википедия создаётся широким кругом энтузиастов, в основной массе не являющихся экспертами — Ресурс является профессиональным и создаётся специалистами в области анализа данных;
-
* статьи Википедии обязаны быть достаточно популярными и базироваться только на признанных источниках — статьи Ресурса могут быть специальными, полемическими, учебными, содержать данные незавершенных исследований, исходные коды алгоритмов и программ.
+
* статьи Википедии обязаны быть достаточно популярными и базироваться только на признанных источниках — статьи Ресурса могут быть специальными, полемическими, учебными, содержать данные незавершенных исследований, исходные коды алгоритмов и программ;
 +
* любой участник Википедии имеет право модифицировать личные страницы других участников — здесь эта возможность запрещена.
-
В то же время, не исключается возможность обмена материалами с Википедией и другими сетевыми энциклопедиями.
+
Имеющиеся отличия не исключают возможность обмена материалами с Википедией и другими сетевыми энциклопедиями.
-
=== Многофункциональность ===
+
=== Широкие возможности ===
-
* Ресурс создаётся с целью концентрации научного знания и различных форм научного общения в едином рабочем пространстве. В перспективе значительная часть рабочего времени учёного может проходить на страницах ресурса. Здесь можно жить читать, писать, общаться, думать и вдохновляться. Чтобы это действительно стало так, ресурс должен быть '''{{S|(1) наполнен полезной информацией}}''' и '''{{S|(2) популярен и признан научной общественностью}}'''. Второе невозможно без первого, а эффективное выполнение первого невозможно без второго. Становление такого Ресурса — это постепенный процесс.
+
* С технической точки зрения MediaWiki даёт только одну ключевую возможность совместно править страницы Ресурса. Однако это позволяет не только создавать общедоступную энциклопедию, но и организовывать совместную работу научных групп, вести обмен информацией по текущим исследованиям, находить и привлекать новых заинтересованных участников в свои проекты.
-
* Основные категории Ресурса (см. [[Шаблон:Заглавная страница Основные категории|полный перечень]]):
+
* Основные категории Ресурса, поддерживающее наполнение энциклопедической составляющей Ресурса:
-
** [[:Категория:Научные конференции|научные конференции]] — страницы конференций, способные выполнять функции официальных сайтов конференций; на них могут размещаться объявления, текущая информация, материалы конференций;
+
-
** [[:Категория:Виртуальные семинары|виртуальные семинары]] — страницы, предназначенные для ведения научных дискуссий и обмена информацией по текущим исследованиям;
+
** [[:Категория:Энциклопедия анализа данных|энциклопедия анализа данных]] — терминологические, популярные и обзорные статьи;
** [[:Категория:Энциклопедия анализа данных|энциклопедия анализа данных]] — терминологические, популярные и обзорные статьи;
** [[:Категория:Инструменты и технологии|инструменты и технологии]] — статьи по инструментальным средствам для автоматизации научной деятельности и решения задач анализа данных;
** [[:Категория:Инструменты и технологии|инструменты и технологии]] — статьи по инструментальным средствам для автоматизации научной деятельности и решения задач анализа данных;
 +
** [[:Категория:Теоретические исследования|теоретические]] и [[:Категория:Прикладные исследования|прикладные]] исследования — статьи об оригинальных исследованиях.
 +
 +
* Основные категории Ресурса (см. [[Шаблон:Заглавная страница Основные категории|полный перечень]]), поддерживающие различные формы научного общения:
 +
** [[:Категория:Научные конференции|научные конференции]] — страницы конференций, способные выполнять функции официальных сайтов конференций; на них могут размещаться объявления, текущая информация, материалы конференций;
 +
** [[:Категория:Виртуальные семинары|виртуальные семинары]] — страницы, предназначенные для ведения научных дискуссий и обмена информацией по текущим исследованиям;
 +
** [[:Категория:Публикации|публикации]] — страницы, посвящённые обсуждению статей, книг, диссертаций, отчётоы {{S|и т. д.}};
** [[:Категория:Конкурсы|конкурсы]] — открытые конкурсы по решению задач интеллекуального анализа данных;
** [[:Категория:Конкурсы|конкурсы]] — открытые конкурсы по решению задач интеллекуального анализа данных;
-
** [[:Категория:Публикации|публикации]] — статьи, книги, методические пособия, диссертации {{S|и т. д.}};
+
** [[:Категория:Учебные курсы|учебные курсы]] — страницы учебных курсов, которые не исключают совместную работу преподавателей и студентов над содержимым отдельных страниц;
** [[:Категория:Страницы участников|страницы участников]] — персональные страницы, на которых участники могут размещать информацию о себе, своих научных интересах, публикациях, проектах.
** [[:Категория:Страницы участников|страницы участников]] — персональные страницы, на которых участники могут размещать информацию о себе, своих научных интересах, публикациях, проектах.
-
* Значительная часть работы учёного может вестись на страницах Ресурса:
+
* Итак, значительная часть работы учёного может вестись на страницах Ресурса:
** поиск научной информации и новых идей;
** поиск научной информации и новых идей;
** установление научных контактов, образование научных сообществ;
** установление научных контактов, образование научных сообществ;
Строка 90: Строка 94:
** контроль за выполнением студенческих работ.
** контроль за выполнением студенческих работ.
-
== Перспектива ==
+
== Перспективы ==
-
В перспективе Ресурс может стать тем местом, где предельно оперативно концентрируется информация о последних разработках и достижениях в области [[машинное обучение|машинного обучения]] и [[интеллектуальный анализ данных|интеллектуального анализа данных]].
+
* Благодаря Ресурсу научное знание становится общедоступным практически в момент его появления.
-
Это именно тот инструментарий, который позволит делать научное знание общедоступным практически в момент его появления.
+
* Ресурс может стать тем местом, где предельно оперативно концентрируется информация о последних разработках и достижениях в области [[машинное обучение|машинного обучения]] и [[интеллектуальный анализ данных|интеллектуального анализа данных]].
 +
* Значительная часть рабочего времени учёного может проходить на страницах Ресурса. Здесь можно жить — читать, писать, общаться, думать и вдохновляться. Чтобы это действительно стало так, Ресурс должен быть во-первых, наполнен полезной информацией, во-вторых, популярен и признан научной общественностью. Второе без первого невозможно, а первое без второго неэффективно. Становление такого Ресурса — постепенный (итерационный) процесс.
== Поддержка проекта ==
== Поддержка проекта ==

Версия 07:04, 5 апреля 2008

MachineLearning.Ru — русскоязычный информационно-аналитический профессиональный ресурс по интеллектуальному анализу данных и машинному обучению.

Содержание

Цели создания Ресурса MachineLearning.Ru

Научные направления

Выше приведён примерный список направлений. Тематическая иерархия Ресурса начинается в корневой категории научные направления и будет постоянно уточняться всеми участниками проекта.

Для кого предназначен Ресурс

Аудитория Ресурса — русскоязычная, включающая следующие уровни:

  • Эксперты по анализу данных. Для них публикуются работы, чтение которых требует профессиональных знаний.
  • Эксперты в прикладных областях. Для них публикуется энциклопедия анализа данных, рекомендации по практическому применению методов анализа данных, примеры решённых прикладных задач.
  • Руководители, которым адресованы статьи по стратегии применения интеллектуальных продуктов в бизнесе, производстве и других сферах.
  • Студенты, аспиранты, преподаватели, использующие Ресурс в образовательных целях.

Принципы построения Ресурса

Открытость

  • Содержимое Ресурса создаётся научным сообществом и является общественным достоянием. Статьи публикуются под открытым лицензионным соглашением GNU FDL.
  • Создатели Ресурса (научная школа академика РАН Ю. И. Журавлёва и чл.-корр. РАН К. В. Рудакова) осуществляют его техническую поддержку и продвижение, но не определяют его содержимое и не претендуют на право обладания Ресурсом.

Сходство с Википедией

Ресурс строится по принципам Википедии — свободной энциклопедии и обладает всеми её основными возможностями и преимуществами:

  • каждый пользователь ресурса может создать или изменить страницу (статью) или раздел (категорию) в любое время, в любом месте, располагая только доступом в Интернет;
  • любая статья или категория может быть включена в любое количество категорий, что позволяет гибко выстраивать структуру Ресурса;
  • история всех правок сохраняется в системе, любую правку можно отменить, любые две версии статьи можно сравнить;
  • с каждой статьёй связана страница обсуждения;

Отличия от Википедии

Имеются концептуальные отличия от Википедии, из-за которых данный Ресурс не может быть частью Википедии:

  • тематика Википедии практически не ограничена — тематика Ресурса охватывает только области знания, связанные с анализом данных;
  • Википедия создаётся широким кругом энтузиастов, в основной массе не являющихся экспертами — Ресурс является профессиональным и создаётся специалистами в области анализа данных;
  • статьи Википедии обязаны быть достаточно популярными и базироваться только на признанных источниках — статьи Ресурса могут быть специальными, полемическими, учебными, содержать данные незавершенных исследований, исходные коды алгоритмов и программ;
  • любой участник Википедии имеет право модифицировать личные страницы других участников — здесь эта возможность запрещена.

Имеющиеся отличия не исключают возможность обмена материалами с Википедией и другими сетевыми энциклопедиями.

Широкие возможности

  • С технической точки зрения MediaWiki даёт только одну ключевую возможность — совместно править страницы Ресурса. Однако это позволяет не только создавать общедоступную энциклопедию, но и организовывать совместную работу научных групп, вести обмен информацией по текущим исследованиям, находить и привлекать новых заинтересованных участников в свои проекты.
  • Основные категории Ресурса, поддерживающее наполнение энциклопедической составляющей Ресурса:
  • Основные категории Ресурса (см. полный перечень), поддерживающие различные формы научного общения:
    • научные конференции — страницы конференций, способные выполнять функции официальных сайтов конференций; на них могут размещаться объявления, текущая информация, материалы конференций;
    • виртуальные семинары — страницы, предназначенные для ведения научных дискуссий и обмена информацией по текущим исследованиям;
    • публикации — страницы, посвящённые обсуждению статей, книг, диссертаций, отчётоы и т. д.;
    • конкурсы — открытые конкурсы по решению задач интеллекуального анализа данных;
    • учебные курсы — страницы учебных курсов, которые не исключают совместную работу преподавателей и студентов над содержимым отдельных страниц;
    • страницы участников — персональные страницы, на которых участники могут размещать информацию о себе, своих научных интересах, публикациях, проектах.
  • Итак, значительная часть работы учёного может вестись на страницах Ресурса:
    • поиск научной информации и новых идей;
    • установление научных контактов, образование научных сообществ;
    • работа с литературой, коллекционирование ссылок, реферирование и обсуждение статей;
    • совместное ведение черновых записей;
    • документирование и обсуждение результатов текущих исследований;
    • проведение семинаров и дискуссий с коллегами, находящимися как в других городах, так и в соседней комнате;
    • обмен исходными кодами программ и алгоритмов;
    • размещение в широком доступе учебных материалов: лекций, заданий, практикумов;
    • контроль за выполнением студенческих работ.

Перспективы

  • Благодаря Ресурсу научное знание становится общедоступным практически в момент его появления.
  • Ресурс может стать тем местом, где предельно оперативно концентрируется информация о последних разработках и достижениях в области машинного обучения и интеллектуального анализа данных.
  • Значительная часть рабочего времени учёного может проходить на страницах Ресурса. Здесь можно жить — читать, писать, общаться, думать и вдохновляться. Чтобы это действительно стало так, Ресурс должен быть во-первых, наполнен полезной информацией, во-вторых, популярен и признан научной общественностью. Второе без первого невозможно, а первое без второго неэффективно. Становление такого Ресурса — постепенный (итерационный) процесс.

Поддержка проекта

Создание и развитие Ресурса MachineLearning.Ru поддержано Российским фондом фундаментальных исследований (проект № 07-07-00372) и компанией Forecsys.

История

  • 2007, 3 октября. Концепция Ресурса MachineLearning.Ru анонсирована на Всероссийской конференции ММРО-13.
  • 2008, 5 февраля. Ресурс открыт для общего доступа и подготовлен к массовому наполнению.

Полный архив новостей Ресурса MachineLearning.Ru.

Адреса

Ресурс MachineLearning.Ru доступен по адресам www.machinelearning.ru и recognition.su.

Личные инструменты