MachineLearning:Категоризация

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (Захламление категорий: ссылка)
м (Порядок сортировки: викификация)
Строка 60: Строка 60:
=== Порядок сортировки ===
=== Порядок сортировки ===
-
Порядок сортировки в категориях идёт в соответствии с [[ASCII]]:
+
Порядок сортировки в категориях идёт в соответствии с ASCII:
./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_'abcdefghijklmnopqrstuvwxyz{|}~
./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_'abcdefghijklmnopqrstuvwxyz{|}~

Версия 22:17, 9 марта 2008

Категоризация — это процесс структирования схожих статей по темам. Категории (наряду со списками, обзорными шаблонами и др.) помогают читателям находить информацию, даже в тех случаях, когда они не знают, как искомая тема называется, или сомневаются в том, что она вообще присутствует на страницах Ресурса. Сами категории внешне представляют из себя оглавления, где их содержание отсортировано по алфавиту.

Категоризация должна помогать читателям ориентироваться в материалах Ресурса. При этом количество категорий для отдельных статей должно быть разумным и оправданным. Названия категорий должны быть нейтральными и узнаваемыми.

Содержание

Добавление статьи в категорию

Статья из любого пространства имён может быть включена в любую категорию путём добавления тега-ссылки на страницу категории, образованного добавлением к имени категории ключевого слова Категория:, например:

[[Категория:Классификация]] 

Это соответствует ссылке на соответствующую страницу категории, располагающуюся в пространстве имён категорий.

Страница может быть внесена больше чем в одну категорию — нужно просто добавить несколько тегов. При просмотре отредактированной страницы эти ссылки отображаются не в основном тексте, а на полях страницы, в позиции, жёстко заданной используемой темой оформления (внизу при использовании Monobook, справа вверху — при использовании Стандартное). В противоположность автоматической сортировке списков категорий (см. ниже), список категорий на странице располагается в порядке следования соответствующих тегов.

Общие положения

Категории как один из ключевых способов организации информации Ресурса следует добавлять ко всем типам страниц, но при этом есть некоторые ограничения по форме и обьёму категоризации.

Для статей

Статьи являются основным содержанием Ресурса и грамотная категоризация очень важна для них. Наличие хотя бы одной категории в статье обязательно, по нескольким причинам: во-первых, это чуть ли не единственный способ найти информацию, не зная, как называется искомая статья, во-вторых, это значительно ускоряет внесение статьи в индекс поисковых систем, что опять увеличивает доступность статьи для читателей, ну и в-третьих, категоризация сама по себе — очень удобный способ структурирования, организации просмотра и поиска информации.

При этом есть определённые ограничения на количество категорий, в которые может быть внесена статья. Следует использовать наиболее конкретные категории. Если статья подходит по смыслу для категории А и её подкатегории Б, то её, как правило, следует включать только в Б. Исключением может быть тот случай, когда статья значима и для всей категории А (как правило, это обзорные статьи).

Страница категории

Новые категории могут быть созданы и исправлены так же, как и обычные страницы,

Страница категории состоит из нескольких частей:

  • текст описания, который может быть отредактирован так же как и любая другая страница;
  • автоматически создаваемый список подкатегорий и их количество; если подкатегории отсутствуют, то данный раздел не отображается;
  • автоматически создаваемый список страниц, включённых в данную категорию, кроме подкатегорий и изображений; их количество, называемое «числом статей»; если категория пуста, то отображается заголовок и строка «Категория пуста»
  • автоматически создаваемый список изображений с картинками предпросмотра (подсчёт количества не ведётся); если имя изображения длиннее 20 символов, оно обрезается и дополняется троеточием; в отличие от второй и третьей секции, рубрикации по первым буквам имени не происходит; также отсутствует подзаголовок, отделяющий этот раздел от раздела статей.

Данные списки содержат только ссылки на соответствующие страницы, для изображений даётся также ссылка на страницу описания.

Для подкатегорий

Если страница, внесённая в категорию, сама является категорией, она образует подкатегорию.

Например, вы можете редактировать Категория:Конференции и добавить в неё ссылку на Категория:Мероприятия. Категория «Конференции» станет подкатегорией категории Мероприятия».

Если для статей основополагающее правило «если что-то существенное в статье относится к теме такой-то категории, то статью следует поставить в эту категорию», то для подкатегорий правила несколько иные.

Подкатегории следует подбирать так, чтобы во всём дереве каждой категории не было ни одной статьи, которая к ней не относится. Таким образом, категория А может стать подкатегорией в категории Б только в том случае, если все её статьи и подкатегории всех уровней не выходят за рамки категории Б.


«Красные» категории

Наличие «красных» (ещё не созданных) категорий в статье в общем случае не является причиной их удаления. Причинами удаления категорий (как уже существующих, так и «красных») из статьи могут являться:

  • ошибки в названии категории или несоответствие принятым стандартам именования категорий в данном разделе — такие названия должны исправляться (не обязательно на уже существующие категории)
  • несоответствие названия категории тематике статьи
  • наличие более узкой категории в данной ветке, более точно соответствующей тематике статьи — в этом случае категория уточняется.
  • наличие в статье одновременно более общей и более узкой категорий из одной и той же ветки — в этом случае более общая категория из статьи удаляется.

Во всех остальных случаях категория должна быть оставлена.

Сортировка в категориях

Как уже было сказано выше, статьи в категориях сортируются в алфавитном порядке.

Порядок сортировки

Порядок сортировки в категориях идёт в соответствии с ASCII:

./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_'abcdefghijklmnopqrstuvwxyz{|}~

Пробел находится в начале данной последовательности. Буквы кириллического алфавита располагаются после данной последовательности и сортируются в соответствии с юникод-кодами:

АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЬЫЪЭЮЯабвгдежзийклмнопрстуфхцчшщьыъэюяЁё

Ключ сортировки

Для сортировки статей в категориях используются ключи сортировки. Есть два способа сортировки при помощи ключей:

  1. Добавление {{DEFAULTSORT:ключ сортировки}} устанавливает ключ сортировки по умолчанию для всех категорий, в которую входит статья;
  2. Добавление, [[Категория:Название категории|ключ сортировки]] в статье устанавливает сортировку для отдельно взятой категории.

Нет необходимости использовать ключ сортировки в тех случаях, когда название статьи состоит из одного слова, а также тогда, когда первое слово в заголовке и является ключевым.

Иногда требуется вынести статью в самое начало категории (как например в случае с обзорной статьёй) — для этого используйте специальный ключ сортировки, например, знак пробела или «*»: «[[Категория:Имя категории| ]]» (ключ сортировки — то, что указано после вертикальной черты; в данном случае — пробел).

Конкретные особенности

Большинство статей не требуют использования ключа сортировки, к тем же которые требуют, следует подходить с осторожностью. Прежде чем вставлять ключ сортировки, следует спросить себя, на какую букву средний человек обычно станет искать ту или иную статьи, и только выяснив этот вопрос, можно приступать к действиям.


Организация категорий

Ссылки на категории в тексте

Если вы хотите просто сослаться на категорию, не добавляя в неё текущую страницу, добавьте двоеточие (:) в начале ссылки: [[:Категория:Имя_категории]].

Существующие категории

Список всех категорий, присутствующих в русской части Википедии, вы можете увидеть здесь — Служебная:Categories. Тут отображены все категории, включая и те, которые содержат подкатегории или страницы, но не имеют текста описания (то есть их страница не была отредактирована, на неё просто создали ссылку). В этом случае ссылки на эти страницы будут выглядеть как ссылки на несуществующие страницы (обычно помечаются красным цветом) и вести прямо на страницу редактирования. Во избежание этих осложнений рекомендуется хотя бы заглянуть на страницу категории, в которую вы поместили свою статью, и добавить ссылку на категорию порядком выше.

Слежение за внесением страниц в категорию

Используя «Связанные правки», любой может найти страницы, недавно внесённые в категорию путём добавления в них соответствующего тэга или тэга шаблона, внесённого в категорию. Добавление страниц путём внесения тэга директории в используемый ими шаблон отслеживается непрямым образом: можно отследить изменения шаблона, а затем найти страницы, его использующие. При этом отображаются страницы, потенциально присутствующие в категории.

«Ссылки сюда»: сходства и различия

Категории напоминают страницу «Ссылки сюда», дополненную и расширенную.

Однако «Ссылки сюда» содержит ссылки, связь которых с основной страницей может быть весьма слаба, в то время как в одну категорию обычно помещают страницы сходной тематики.

Тестовые страницы, страницы пользователей и прочие обычно не вносятся в категории, дабы избежать их захламления, в то время как простые ссылки на страницы (которые можно отследить, используя «Ссылки сюда») достаточно безобидны.

Категории автоматически сортируются по алфавиту, в то время как «Ссылки сюда» сортируются периодически, во время пересборки таблицы ссылок в базе данных.

«Ссылки сюда» могут содержать не более 500 страниц. Категории могут быть гораздо больше.

Применение страниц «Ссылки сюда» и «Связанные правки» к категориям

В «Ссылках сюда» отображаются только ссылки на страницу категории, не на страницы, включённые в неё.

«Связанные правки» отображают изменения на страницах, входящих в категории (согласно с текущей страницей категории, то есть исключая потенциально внесённые и включая потенциально удалённые страницы, связанные с изменением присутствующих в них шаблонов путём внесения/удаления в них тэга категории):

  • для подкатегорий: только изменения в их секции описания;
  • для изображений (страниц описания изображений): аналогично.

При этом не отображаются изменения в страницах, ссылки на которые внесены в описательную секцию категории. Пути обхода данной проблемы:

  • Вынести секцию описания в отдельный шаблон. Тэги категорий (всё равно не оказывающие влияния на «Связанные правки») лучше не вносить в шаблоны, потому что на страницах их надкатегорий шаблон будет отображаться вместе с прочими внесёнными туда статьями.
  • Использовать «Связанные правки» страницы, вызывающей категорию как шаблон: {{:Категория:Имя категории}}; в эту страницу будет включён только раздел описания. Для этой цели создаётся специальная страница, которая может обслуживать несколько категорий. Однако, данная страница будет отображаться на страницах «надкатегорий» каждой из использованных категорий.

Обычно (если не использовать «Наблюдение за страницей») изменения на страницах обсуждения не отображаются.

Дерево категорий

Существует тэг «categorytree», который позволяет на любой странице включить в текст динамически изменяющийся фрагмент дерева категорий.

Пример использования:

Текст

<categorytree>Всё</categorytree>

<categorytree style="float:right; clear:all; margin-left:1ex; border:1px solid gray; padding:0.7ex; background-color:white;">Всё</categorytree>

Результат

Проблемы с категориями

Кэширование

Если шаблон включается в категорию, то в указанную категорию помещается не только шаблон, но и все страницы, включающие его, поэтому удобно использовать шаблоны для рубрикации статей.

Но может возникнуть проблема с кэшированием — если поменять категорию у шаблона, то категория у включающих этот шаблон страниц поменяется только после выполнения каких-либо правок этих страниц (не обязательно при этом что-либо менять, то есть операция правки может быть чисто формальной).

Захламление категорий

Ссылки с тестовых пользовательских и тому подобных страниц захламляют категории. Поэтому рекомендованы следующие ограничения при копировании:

  • Всегда удаляйте тэг категории при копировании текста;
  • При включении шаблона, присутствующего в категории, не пользуйтесь его возможностями по установке категорий. Грамотно сделанные шаблоны позволяют выключить установку внешних категорий передачей параметра |nocat=1. Для прочих шаблонов применяйте «subst:» или ручное копирование тела шаблона, затем удаляйте тэг категории.

Служебные страницы

См. также

Личные инструменты