Частичное обучение
Материал из MachineLearning.
м |
|||
(2 промежуточные версии не показаны) | |||
Строка 1: | Строка 1: | ||
'''Частичное обучение''' (semi-supervised lerning) — один из методов [[машинное обучение|машинного обучения]], использующий при обучении как размеченные, так и неразмеченные данные. | '''Частичное обучение''' (semi-supervised lerning) — один из методов [[машинное обучение|машинного обучения]], использующий при обучении как размеченные, так и неразмеченные данные. | ||
- | |||
- | |||
- | |||
Обычно используется небольшое количество размеченных и значительный объём неразмеченных данных. | Обычно используется небольшое количество размеченных и значительный объём неразмеченных данных. | ||
Частичное обучение является компромисом между [[обучение без учителя|обучением без учителя]] (без каких-либо размеченных обучающих данных) и [[обучение с учителем|обучением с учителем]] (с полностью размеченным набором обучения). | Частичное обучение является компромисом между [[обучение без учителя|обучением без учителя]] (без каких-либо размеченных обучающих данных) и [[обучение с учителем|обучением с учителем]] (с полностью размеченным набором обучения). | ||
Строка 20: | Строка 17: | ||
== Ссылки == | == Ссылки == | ||
- | [http://en.wikipedia.org/wiki/Semi-supervised_learning Wikipedia: Semi-supervised learning] | + | *[http://en.wikipedia.org/wiki/Semi-supervised_learning Wikipedia: Semi-supervised learning] |
== Категории == | == Категории == | ||
[[Категория: Машинное обучение]] | [[Категория: Машинное обучение]] |
Текущая версия
Частичное обучение (semi-supervised lerning) — один из методов машинного обучения, использующий при обучении как размеченные, так и неразмеченные данные. Обычно используется небольшое количество размеченных и значительный объём неразмеченных данных. Частичное обучение является компромисом между обучением без учителя (без каких-либо размеченных обучающих данных) и обучением с учителем (с полностью размеченным набором обучения). Было замечено, что неразмеченные данные, будучи использованными совместно с небольшим количеством размеченных данных, могут обеспечить значительный прирост качества обучения. Под качеством обучения подразумевается некий функционал качества, например, среднеквадратичная ошибка. Сбор размеченных данных для задачи обучения зачастую требует, чтобы квалифицированный эксперт вручную классифицировал объекты обучения. Затраты, связанные с процессом разметки, могут сделать построение полностью размеченного набора прецедентов невозможным, в то время как сбор неразмеченных данных сравнительно недорог. В подобных ситуациях ценность частичного обучения сложно переоценить.
Примером частичного обучения может послужить сообучение: два или более обучаемых алгоритма используют один и тот же набор данных, но каждый при обучении использует различные — в идеале некоррелированные — наборы признаков объектов.
Альтернативный подход заключается в моделировании совместного распределения признаков и меток. В таком случае для неразмеченых данных метки могут трактоваться как пропущенные данные. Для построения оценки максимального правдоподобия обычно используется EM-алгоритм.