MachineLearning:Категоризация

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (ключ сортировки)
(дополнение, викификация)
Строка 89: Строка 89:
Похожий подход используется и для других статей, так например — в Википедии может быть несколько статей посвящённых разновидностям телевидения: [[Аналоговое телевидение]], [[Цифровое телевидение]]. Достаточно логично и привычно для многих читателей, если все они будут стоять на букву Т вместе с основной статьёй, посвящённой телевидению. В этом случае ключ сортировки будет представлять из себя нечто подобное: <nowiki>{{DEFAULTSORT:Телевидение, аналоговое}}</nowiki>. -->
Похожий подход используется и для других статей, так например — в Википедии может быть несколько статей посвящённых разновидностям телевидения: [[Аналоговое телевидение]], [[Цифровое телевидение]]. Достаточно логично и привычно для многих читателей, если все они будут стоять на букву Т вместе с основной статьёй, посвящённой телевидению. В этом случае ключ сортировки будет представлять из себя нечто подобное: <nowiki>{{DEFAULTSORT:Телевидение, аналоговое}}</nowiki>. -->
-
<!-- == Организация категорий ==
+
== Организация категорий ==
-
 
+
<!-- === Большие категории ===
-
=== Большие категории ===
+
Если категория большая, она делится на несколько страниц. Страница, озаглавленная, к примеру, «Персики—Померанцы», отображает все подкатегории, статьи и изображения с именами, расположенными по алфавиту между этими словами. Несколько путано выглядит то, что отображается только количество статей и подкатегорий, входящих в данный диапазон, а не общее их число в категории. Секция описания категории повторяется на всех страницах.
Если категория большая, она делится на несколько страниц. Страница, озаглавленная, к примеру, «Персики—Померанцы», отображает все подкатегории, статьи и изображения с именами, расположенными по алфавиту между этими словами. Несколько путано выглядит то, что отображается только количество статей и подкатегорий, входящих в данный диапазон, а не общее их число в категории. Секция описания категории повторяется на всех страницах.
-
Чтобы начать просмотр списка с какого-то определённого названия, используйте [[URL]] вида: http://ru.wikipedia.org/w/index.php?title=Категория:Персоналии:Россия&from=Писатели_России
+
Чтобы вынести все подкатегории (до 200 максимум) на первую страницу, используйте специфичный ключ сортировки, например, знак пробела или «*»: «<nowiki>[[</nowiki>Категория:''Имя категории''| <nowiki>]]</nowiki>» (ключ сортировки — то, что указано после вертикальной черты; в данном случае — пробел). -->
-
 
+
-
Чтобы вынести все подкатегории (до 200 максимум) на первую страницу, используйте специфичный ключ сортировки, например, знак пробела или «*»: «<nowiki>[[</nowiki>Категория:''Имя категории''| <nowiki>]]</nowiki>» (ключ сортировки — то, что указано после вертикальной черты; в данном случае — пробел).
+
-
 
+
-
Примеры больших категорий:
+
-
* с большим количеством статей: [[:Категория:Персоналии по годам рождения]]
+
-
* с большим количеством изображений: [[w:Category:Public domain images]]
+
-
=== Списочные категории ===
+
<!-- === Списочные категории ===
Списочные категории ([[:Категория:Списки]] и её подкатегории) — служебный раздел иерархии категорий, в который должны включаться только списочные статьи ('''основное содержание''' которых составляет список ссылок на другие статьи), название которых обычно (но не всегда) начинается со слова «Список…». Эти категории всегда '''дополняют''', а не заменяют категории «основных» тематических разделов.
Списочные категории ([[:Категория:Списки]] и её подкатегории) — служебный раздел иерархии категорий, в который должны включаться только списочные статьи ('''основное содержание''' которых составляет список ссылок на другие статьи), название которых обычно (но не всегда) начинается со слова «Список…». Эти категории всегда '''дополняют''', а не заменяют категории «основных» тематических разделов.
Строка 109: Строка 102:
Все статьи, содержащие списки, в том числе списки, оформленные в виде таблиц, помимо основной (тематической) категории, следует вносить в категорию [[:Категория:Списки]], или какую-либо из её подкатегорий (например, [[Список рек Словакии]] — в категорию [[:Категория:Списки:География]]).
Все статьи, содержащие списки, в том числе списки, оформленные в виде таблиц, помимо основной (тематической) категории, следует вносить в категорию [[:Категория:Списки]], или какую-либо из её подкатегорий (например, [[Список рек Словакии]] — в категорию [[:Категория:Списки:География]]).
-
Не следует включать в ветку «Списки» целиком категории, содержащие '''не только''' списочные статьи.
+
Не следует включать в ветку «Списки» целиком категории, содержащие '''не только''' списочные статьи. -->
-
 
+
-
=== Словари (глоссарии) терминов ===
+
-
Статьи, содержащие словари (глоссарии) терминов должны включаться в категорию [[:Категория:Словари в Википедии]].
+
=== Ссылки на категории в тексте ===
=== Ссылки на категории в тексте ===
Строка 118: Строка 108:
=== Существующие категории ===
=== Существующие категории ===
-
Список всех категорий, присутствующих в русской части Википедии, вы можете увидеть здесь — [[Служебная:Categories]]. Тут отображены все категории, включая и те, которые содержат подкатегории или страницы, но не имеют текста описания (то есть их страница не была отредактирована, на неё просто создали ссылку). В этом случае ссылки на эти страницы будут выглядеть как ссылки на
+
Список всех категорий, присутствующих в русской части Википедии, вы можете увидеть здесь — [[Служебная:Categories]]. Тут отображены все категории, включая и те, которые содержат подкатегории или страницы, но не имеют текста описания (то есть их страница не была отредактирована, на неё просто создали ссылку). В этом случае ссылки на эти страницы будут выглядеть как ссылки на несуществующие страницы (обычно помечаются красным цветом) и вести прямо на страницу редактирования. Во избежание этих осложнений рекомендуется хотя бы заглянуть на страницу категории, в которую вы поместили свою статью, и добавить ссылку на категорию порядком выше.
-
несуществующие страницы (обычно помечаются красным цветом) и вести прямо на
+
-
страницу редактирования. Во избежание этих осложнений рекомендуется хотя бы
+
-
заглянуть на страницу категории, в которую вы поместили свою статью, и добавить
+
-
ссылку на категорию порядком выше.
+
=== Слежение за внесением страниц в категорию ===
=== Слежение за внесением страниц в категорию ===
Строка 141: Строка 127:
В «Ссылках сюда» отображаются только ссылки на страницу категории, не на страницы, включённые в неё.
В «Ссылках сюда» отображаются только ссылки на страницу категории, не на страницы, включённые в неё.
-
До версии MediaWiki 1.4 так же обрабатывались и «Связанные правки».
+
«Связанные правки» отображают изменения на страницах, входящих в категории (согласно с текущей страницей категории, то есть исключая потенциально внесённые и включая потенциально удалённые страницы, связанные с изменением присутствующих в них шаблонов путём внесения/удаления в них тэга категории):
-
 
+
-
Однако, начиная с версии 1.4, «Связанные правки» отображают изменения на
+
-
страницах, входящих в категории (согласно с текущей страницей категории, то есть
+
-
исключая потенциально внесённые и включая потенциально удалённые страницы,
+
-
связанные с изменением присутствующих в них шаблонов путём внесения/удаления в
+
-
них тэга категории):
+
* для подкатегорий: только изменения в их секции описания;
* для подкатегорий: только изменения в их секции описания;
* для изображений (страниц описания изображений): аналогично.
* для изображений (страниц описания изображений): аналогично.
При этом ''не'' отображаются изменения в страницах, ссылки на которые внесены в описательную секцию категории. Пути обхода данной проблемы:
При этом ''не'' отображаются изменения в страницах, ссылки на которые внесены в описательную секцию категории. Пути обхода данной проблемы:
-
* Вынести секцию описания в отдельный шаблон. Тэги категорий (всё равно не оказывающие влияния на «Связанные правки») лучше не вносить в шаблоны, потому что на страницах их надкатегорий шаблон будет отображаться вместе с прочими внесёнными туда статьями. Имеются ли в шаблоне [[Википедия:Интервики|интервики]]-ссылки (любого типа) или нет — неважно, потому что данный шаблон не будет использоваться где-либо ещё.
+
* Вынести секцию описания в отдельный шаблон. Тэги категорий (всё равно не оказывающие влияния на «Связанные правки») лучше не вносить в шаблоны, потому что на страницах их надкатегорий шаблон будет отображаться вместе с прочими внесёнными туда статьями.
* Использовать «Связанные правки» страницы, вызывающей категорию как шаблон: <nowiki>{{:Категория:</nowiki>''Имя категории''}}; в эту страницу будет включён только раздел описания. Для этой цели создаётся специальная страница, которая может обслуживать несколько категорий. Однако, данная страница будет отображаться на страницах «надкатегорий» каждой из использованных категорий.
* Использовать «Связанные правки» страницы, вызывающей категорию как шаблон: <nowiki>{{:Категория:</nowiki>''Имя категории''}}; в эту страницу будет включён только раздел описания. Для этой цели создаётся специальная страница, которая может обслуживать несколько категорий. Однако, данная страница будет отображаться на страницах «надкатегорий» каждой из использованных категорий.
Обычно (если не использовать «Наблюдение за страницей») изменения на страницах обсуждения не отображаются.
Обычно (если не использовать «Наблюдение за страницей») изменения на страницах обсуждения не отображаются.
-
 
-
=== Заголовки в списке изображений ===
 
-
Как уже упоминалось, по умолчанию отображаются первые 20 символов имени изображения, дополненные троеточием, если произошло усечение.
 
-
Это может быть весьма неудобно, например [[commons:Category:William-Adolphe Bouguereau]]
 
-
содержит большое количество картин, озаглавленных в виде «William-Adolphe Bouguereau (1825—1905) — (название)», однако все они отображаются как «William-Adolphe Boug…» (см. последнюю секцию категории).
 
-
 
-
Полное имя изображения можно увидеть лишь во всплывающей подсказке и в строке
 
-
состояния браузера, причём вместо некоторых символов будут отображаться их
 
-
коды, например, «%28» вместо "(".
 
-
 
-
Таким образом, поиск нужной картины по её имени в данном списке весьма затруднён.
 
-
Возможно, следует именовать изображения более простым образом: "Bouguereau, ", а затем название картины (до тех пор, пока в MediaWiki не появится средств, решающих эту проблему).
 
=== Дерево категорий ===
=== Дерево категорий ===
Строка 186: Строка 154:
<categorytree style="float:right; clear:all; margin-left:1ex; border:1px solid gray; padding:0.7ex; background-color:white;">Всё</categorytree>
<categorytree style="float:right; clear:all; margin-left:1ex; border:1px solid gray; padding:0.7ex; background-color:white;">Всё</categorytree>
|}
|}
-
 
-
Эта функциональность обеспечивается специальным [[mw:Manual:Extensions|расширением]] MediaWiki — [[mw:Extension:CategoryTree|CategoryTree]].
 
-
 
-
=== Разворачивание категорий ===
 
-
На МетаВики проходит дискуссия по поводу возможности разворачиваемых страниц
 
-
категорий. То есть на странице категории cмогли бы отображаться ссылки на статьи её
 
-
подкатегорий, подподкатегорий и т. д. См. [[m:Category flatten]] и
 
-
[http://bugzilla.wikimedia.org/show_bug.cgi?id=1497 здесь].
 
== Проблемы с категориями ==
== Проблемы с категориями ==
Строка 201: Строка 161:
Но может возникнуть проблема с кэшированием — если поменять категорию у шаблона, то категория у включающих этот шаблон страниц поменяется только после выполнения каких-либо правок этих страниц (не обязательно при этом что-либо менять, то есть операция правки может быть чисто формальной).
Но может возникнуть проблема с кэшированием — если поменять категорию у шаблона, то категория у включающих этот шаблон страниц поменяется только после выполнения каких-либо правок этих страниц (не обязательно при этом что-либо менять, то есть операция правки может быть чисто формальной).
-
 
+
<!--
-
Более подробно этот вопрос рассмотрен в статье «[[Википедия:Механизм шаблонов#Тэг категории в шаблоне. Проблема с кэшированием|механизм шаблонов]]».
+
Более подробно этот вопрос рассмотрен в статье «[[Википедия:Механизм шаблонов#Тэг категории в шаблоне. Проблема с кэшированием|механизм шаблонов]]». -->
=== Захламление категорий ===
=== Захламление категорий ===
Строка 208: Строка 168:
* Всегда удаляйте тэг категории при копировании текста;
* Всегда удаляйте тэг категории при копировании текста;
* При включении [[Википедия:механизм шаблонов|шаблона]], присутствующего в категории, не пользуйтесь его возможностями по установке категорий. Грамотно сделанные шаблоны позволяют выключить установку внешних категорий передачей параметра <code>|nocat=1</code>. Для прочих шаблонов применяйте «subst:» или ручное копирование тела шаблона, затем удаляйте тэг категории.
* При включении [[Википедия:механизм шаблонов|шаблона]], присутствующего в категории, не пользуйтесь его возможностями по установке категорий. Грамотно сделанные шаблоны позволяют выключить установку внешних категорий передачей параметра <code>|nocat=1</code>. Для прочих шаблонов применяйте «subst:» или ручное копирование тела шаблона, затем удаляйте тэг категории.
-
-->
+
 
== Служебные страницы ==
== Служебные страницы ==
* [[Служебная:CategoryTree|Дерево категорий]]
* [[Служебная:CategoryTree|Дерево категорий]]

Версия 13:27, 8 марта 2008

Категоризация — это процесс структирования схожих статей по темам. Категории (наряду со списками, обзорными шаблонами и др.) помогают читателям находить информацию, даже в тех случаях, когда они не знают, как искомая тема называется, или сомневаются в том, что она вообще присутствует на страницах Ресурса. Сами категории внешне представляют из себя оглавления, где их содержание отсортировано по алфавиту.

Категоризация должна помогать читателям ориентироваться в материалах Ресурса. При этом количество категорий для отдельных статей должно быть разумным и оправданным. Названия категорий должны быть нейтральными и узнаваемыми.

Содержание

Добавление статьи в категорию

Статья из любого пространства имён может быть включена в любую категорию путём добавления тега-ссылки на страницу категории, образованного добавлением к имени категории ключевого слова Категория:, например:

[[Категория:Классификация]] 

Это соответствует ссылке на соответствующую страницу категории, располагающуюся в пространстве имён категорий.

Страница может быть внесена больше чем в одну категорию — нужно просто добавить несколько тегов. При просмотре отредактированной страницы эти ссылки отображаются не в основном тексте, а на полях страницы, в позиции, жёстко заданной используемой темой оформления (внизу при использовании Monobook, справа вверху — при использовании Стандартное). В противоположность автоматической сортировке списков категорий (см. ниже), список категорий на странице располагается в порядке следования соответствующих тегов.

Общие положения

Категории как один из ключевых способов организации информации Ресурса следует добавлять ко всем типам страниц, но при этом есть некоторые ограничения по форме и обьёму категоризации.

Для статей

Статьи являются основным содержанием Ресурса и грамотная категоризация очень важна для них. Наличие хотя бы одной категории в статье обязательно, по нескольким причинам: во-первых, это чуть ли не единственный способ найти информацию, не зная, как называется искомая статья, во-вторых, это значительно ускоряет внесение статьи в индекс поисковых систем, что опять увеличивает доступность статьи для читателей, ну и в-третьих, категоризация сама по себе — очень удобный способ структурирования, организации просмотра и поиска информации.

При этом есть определённые ограничения на количество категорий, в которые может быть внесена статья. Следует использовать наиболее конкретные категории. Если статья подходит по смыслу для категории А и её подкатегории Б, то её, как правило, следует включать только в Б. Исключением может быть тот случай, когда статья значима и для всей категории А (как правило, это обзорные статьи).

Страница категории

Новые категории могут быть созданы и исправлены так же, как и обычные страницы,

Страница категории состоит из нескольких частей:

  • текст описания, который может быть отредактирован так же как и любая другая страница;
  • автоматически создаваемый список подкатегорий и их количество; если подкатегории отсутствуют, то данный раздел не отображается;
  • автоматически создаваемый список страниц, включённых в данную категорию, кроме подкатегорий и изображений; их количество, называемое «числом статей»; если категория пуста, то отображается заголовок и строка «Категория пуста»
  • автоматически создаваемый список изображений с картинками предпросмотра (подсчёт количества не ведётся); если имя изображения длиннее 20 символов, оно обрезается и дополняется троеточием; в отличие от второй и третьей секции, рубрикации по первым буквам имени не происходит; также отсутствует подзаголовок, отделяющий этот раздел от раздела статей.

Данные списки содержат только ссылки на соответствующие страницы, для изображений даётся также ссылка на страницу описания.

Для подкатегорий

Если страница, внесённая в категорию, сама является категорией, она образует подкатегорию.

Например, вы можете редактировать Категория:Конференции и добавить в неё ссылку на Категория:Мероприятия. Категория «Конференции» станет подкатегорией категории Мероприятия».

Если для статей основополагающее правило «если что-то существенное в статье относится к теме такой-то категории, то статью следует поставить в эту категорию», то для подкатегорий правила несколько иные.

Подкатегории следует подбирать так, чтобы во всём дереве каждой категории не было ни одной статьи, которая к ней не относится. Таким образом, категория А может стать подкатегорией в категории Б только в том случае, если все её статьи и подкатегории всех уровней не выходят за рамки категории Б.


«Красные» категории

Наличие «красных» (ещё не созданных) категорий в статье в общем случае не является причиной их удаления. Причинами удаления категорий (как уже существующих, так и «красных») из статьи могут являться:

  • ошибки в названии категории или несоответствие принятым стандартам именования категорий в данном разделе — такие названия должны исправляться (не обязательно на уже существующие категории)
  • несоответствие названия категории тематике статьи
  • наличие более узкой категории в данной ветке, более точно соответствующей тематике статьи — в этом случае категория уточняется.
  • наличие в статье одновременно более общей и более узкой категорий из одной и той же ветки — в этом случае более общая категория из статьи удаляется.

Во всех остальных случаях категория должна быть оставлена.

Сортировка в категориях

Как уже было сказано выше, статьи в категориях сортируются в алфавитном порядке.

Порядок сортировки

Порядок сортировки в категориях идёт в соответствии с ASCII:

./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_'abcdefghijklmnopqrstuvwxyz{|}~

Пробел находится в начале данной последовательности. Буквы кириллического алфавита располагаются после данной последовательности и сортируются в соответствии с юникод-кодами:

АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЫЪЭЮЯабвгдежзийклмнопрстуфхцчшщьыъэюяЁё

Ключ сортировки

Для сортировки статей в категориях используются ключи сортировки. Есть два способа сортировки при помощи ключей:

  1. Добавление {{DEFAULTSORT:ключ сортировки}} устанавливает ключ сортировки по умолчанию для всех категорий, в которую входит статья;
  2. Добавление, [[Категория:Название категории|ключ сортировки]] в статье устанавливает сортировку для отдельно взятой категории.

Нет необходимости использовать ключ сортировки в тех случаях, когда название статьи состоит из одного слова, а также тогда, когда первое слово в заголовке и является ключевым.

Иногда требуется вынести статью в самое начало категории (как например в случае с обзорной статьёй) — для этого используйте специальный ключ сортировки, например, знак пробела или «*»: «[[Категория:Имя категории| ]]» (ключ сортировки — то, что указано после вертикальной черты; в данном случае — пробел).

Конкретные особенности

Большинство статей не требуют использования ключа сортировки, к тем же которые требуют, следует подходить с осторожностью. Прежде чем вставлять ключ сортировки, следует спросить себя, на какую букву средний человек обычно станет искать ту или иную статьи, и только выяснив этот вопрос, можно приступать к действиям.


Организация категорий

Ссылки на категории в тексте

Если вы хотите просто сослаться на категорию, не добавляя в неё текущую страницу, добавьте двоеточие (:) в начале ссылки: [[:Категория:Имя_категории]].

Существующие категории

Список всех категорий, присутствующих в русской части Википедии, вы можете увидеть здесь — Служебная:Categories. Тут отображены все категории, включая и те, которые содержат подкатегории или страницы, но не имеют текста описания (то есть их страница не была отредактирована, на неё просто создали ссылку). В этом случае ссылки на эти страницы будут выглядеть как ссылки на несуществующие страницы (обычно помечаются красным цветом) и вести прямо на страницу редактирования. Во избежание этих осложнений рекомендуется хотя бы заглянуть на страницу категории, в которую вы поместили свою статью, и добавить ссылку на категорию порядком выше.

Слежение за внесением страниц в категорию

Используя «Связанные правки», любой может найти страницы, недавно внесённые в категорию путём добавления в них соответствующего тэга или тэга шаблона, внесённого в категорию. Добавление страниц путём внесения тэга директории в используемый ими шаблон отслеживается непрямым образом: можно отследить изменения шаблона, а затем найти страницы, его использующие. При этом отображаются страницы, потенциально присутствующие в категории.

«Ссылки сюда»: сходства и различия

Категории напоминают страницу «Ссылки сюда», дополненную и расширенную.

Однако «Ссылки сюда» содержит ссылки, связь которых с основной страницей может быть весьма слаба, в то время как в одну категорию обычно помещают страницы сходной тематики.

Тестовые страницы, страницы пользователей и прочие обычно не вносятся в категории, дабы избежать их захламления, в то время как простые ссылки на страницы (которые можно отследить, используя «Ссылки сюда») достаточно безобидны.

Категории автоматически сортируются по алфавиту, в то время как «Ссылки сюда» сортируются периодически, во время пересборки таблицы ссылок в базе данных.

«Ссылки сюда» могут содержать не более 500 страниц. Категории могут быть гораздо больше.

Применение страниц «Ссылки сюда» и «Связанные правки» к категориям

В «Ссылках сюда» отображаются только ссылки на страницу категории, не на страницы, включённые в неё.

«Связанные правки» отображают изменения на страницах, входящих в категории (согласно с текущей страницей категории, то есть исключая потенциально внесённые и включая потенциально удалённые страницы, связанные с изменением присутствующих в них шаблонов путём внесения/удаления в них тэга категории):

  • для подкатегорий: только изменения в их секции описания;
  • для изображений (страниц описания изображений): аналогично.

При этом не отображаются изменения в страницах, ссылки на которые внесены в описательную секцию категории. Пути обхода данной проблемы:

  • Вынести секцию описания в отдельный шаблон. Тэги категорий (всё равно не оказывающие влияния на «Связанные правки») лучше не вносить в шаблоны, потому что на страницах их надкатегорий шаблон будет отображаться вместе с прочими внесёнными туда статьями.
  • Использовать «Связанные правки» страницы, вызывающей категорию как шаблон: {{:Категория:Имя категории}}; в эту страницу будет включён только раздел описания. Для этой цели создаётся специальная страница, которая может обслуживать несколько категорий. Однако, данная страница будет отображаться на страницах «надкатегорий» каждой из использованных категорий.

Обычно (если не использовать «Наблюдение за страницей») изменения на страницах обсуждения не отображаются.

Дерево категорий

Существует тэг «categorytree», который позволяет на любой странице включить в текст динамически изменяющийся фрагмент дерева категорий.

Пример использования:

Текст

<categorytree>Всё</categorytree>

<categorytree style="float:right; clear:all; margin-left:1ex; border:1px solid gray; padding:0.7ex; background-color:white;">Всё</categorytree>

Результат

Проблемы с категориями

Кэширование

Если шаблон включается в категорию, то в указанную категорию помещается не только шаблон, но и все страницы, включающие его, поэтому удобно использовать шаблоны для рубрикации статей.

Но может возникнуть проблема с кэшированием — если поменять категорию у шаблона, то категория у включающих этот шаблон страниц поменяется только после выполнения каких-либо правок этих страниц (не обязательно при этом что-либо менять, то есть операция правки может быть чисто формальной).

Захламление категорий

Ссылки с тестовых пользовательских и тому подобных страниц захламляют категории. Поэтому рекомендованы следующие ограничения при копировании:

  • Всегда удаляйте тэг категории при копировании текста;
  • При включении шаблона, присутствующего в категории, не пользуйтесь его возможностями по установке категорий. Грамотно сделанные шаблоны позволяют выключить установку внешних категорий передачей параметра |nocat=1. Для прочих шаблонов применяйте «subst:» или ручное копирование тела шаблона, затем удаляйте тэг категории.

Служебные страницы

См. также

Личные инструменты