Обсуждение MachineLearning:Публикации и библиографии
Материал из MachineLearning.
Основные требования к организации библиографий в MachineLearning.Ru
- Для каждой публикации отводится отдельная страница публикации. Это обычная страница, за исключением того, что с ней связана библиографическая запись, текст которой автоматически генерируется по набору полей.
- Поля библиографической записи:
- авторы;
- название публикации;
- название периодического издания, сборника или конференции;
- том и номер журнала;
- диапазон страниц (для статей) или количество страниц (для книг, диссертаций, отчётов);
- год издания;
- редакторы издания;
- город и название издательства;
- ссылка на исходный текст: URL или загруженный документ;
- язык публикации;
- ISBN или ISSN;
- добавочный текст.
- Типы публикаций:
- книга;
- статья (в журнале, сборнике статей, сборнике трудов конференции);
- диссертация;
- отчёт;
- электронный документ (загруженный сюда, размещённый в Интернете, URL);
- другое.
- Текст библиографической записи с правильным оформлением, максимально приближенным к ГОСТ 7.80-2000, должен генерироваться автоматически по набору полей.
- Должна быть возможность на любой странице в списке литературы указать только название страницы публикации, и генерируемый текст библиографической записи будет вставлен в этом месте автоматически.
- Должна быть возможность автоматически сгенерировать на странице публикации описание библиографической записи в формате BibTeX.
- Типичная структура страницы публикации:
- форма ввода полей библиографической записи; желательно предусмотреть возможность ввода описания библиографической записи целиком в формате BibTeX;
- генерируемое описание библиографической записи в формате BibTeX;
- аннотация — необязательный раздел;
- реферат — необязательный раздел;
- перевод (возможно, только некоторых фрагментов) — необязательный раздел;
- ссылки — необязательный раздел;
- категории.
- Категоризация публикаций производится с помощью стандартного механизма категорий. Предполагается, что названия категорий будут совпадать с названиями основных тематических категорий Ресурса, но к ним в конце будет приписываться
(публикация)
. - Должны быть предусмотрены следующие виды категоризации:
- по тематике;
- по авторам;
- по годам;
- по типам публикации;
- по изданиям (журналам);
- Категории по авторам предлагается именовать
Фамилия И. О. (публикации)
. - При категоризации по авторам необходимо решить проблему неоднозначности. Участники наверняка будут вводить одного и того же автора по-разному (Knuth D. или Donald Knuth или D.E.Knuth). Даже если предусмотреть стандартный формат ввода (допустим, Фамилия И. О.), останется неоднозначность с переводом (кто бы мог подумать, что Siegel, Сиджел и Зигель — один и тот же человек). Почти идеальное решение: чтобы в поле автора по мере ввода фамилии показывался выпадающий список с вариантами выбора; если нужного варианта ещё нет, участник может ввести свой. Нужно ли запоминать полные имена или всегда ограничиваться инициалами (в BibTeX'е предусмотрены оба варианта)? Если будет такой список, то выбор редактора издания должен производиться из этого же списка. Проблема: если всё же предусматривать ввод полных имён (Фамилия, Имя1 Имя2), то участник, первым вводящий фамилию данного автора, может знать только инициалы. Потом автора придётся переименовывать... Кошмар!
P.S. Наверное, надо было написать всё это на странице MachineLearning:ToDo. Но сейчас она имеет такой вид (понятный только Andrew) что править её как-то боязно...
К.В.Воронцов 02:50, 23 марта 2008 (MSK)
Подходят ли для этого стандартные механизмы шаблонов и категорий?
Это, конечно, попытка использовать инструмент не по назначению… и всё же:
Допустим, что страница публикации реализована как шаблон без параметров. Что это даёт:
- Чтобы сослаться на публикацию из любой статьи, достаточно ввести в списке литературы (или в любом месте)
{{Публикация:Название публикации}}
- Участник сам придумывает Название публикации как заголовок страницы при её создании. Это по-своему неплохо. Вид заголовков публикаций можно стандартизовать, например, так: 'Фамилия первого автора. Год. Название публикации.'. Это очень распространённая нотация при именовании электронных публикаций. Задаёт статью почти однозначно. Если неоднозначно (что бывает редко), можно приписать в конце что угодно: аббревиатуру журнала, конференции, техрепорта.
- В описание публикации (шаблона!) вставляем шаблон
{{книга|...}}
. Всё остальное содержимое страницы с аннотациями, рефератами и проч. обрамляем тагамиnoinclude
, аналогично комментариям и докоментациям к обычным шаблонам. Можно создать подстраницу как в случае с{{doc}}
, но это может оказаться сложновато, и участники нас не поймут. - Для категоризации публикаций вручную добавляем категории по тематике, авторам, годам, конференциям, изданиям. Не забываем к именам всех этих категорий приписывать слово
(публикации)
.
ENJOY! Почти вся функциональность реализована без утомительного засти… программирования.
Преимущества:
- Почти нет трудозатрат. Это можно сделать сразу, а не через год.
- Очень уж руки чешутся поскорее начать работу с библиографиями.
Недостатки:
- Много неавтоматизированной ручной работы, появятся публикации вне категорий, дубликаты авторов и журналов, искажённые названия статей в заголовках. Но если делать автоматизированную систему поддержки публикаций, эти же проблемы останутся, просто для них придётся искать сложные навороченные решения.
- Слово
Шаблон:
категорически не подходит как начало заголовка. Можно ли создать ещё одни namespace, по функциональности эквивалентный шаблонам (кстати, без параметров — может, это облегчит задачу?), но называемыйПубликация:
? - Шаблон
{{книга|...}}
надо существенно доработать, в идеале приблизив по функциональности к BibTeX’овским записям. Если переименовать поля (в author, title, year, и т. д.) и сделать так, чтобы параметры шаблона принимались в кавычках, будет почти полная совместимость с бибтехом.
Простые решения — красивые решения! — К.В.Воронцов 16:23, 29 марта 2008 (MSK)