Обсуждение MachineLearning:Публикации и библиографии

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (Подходят ли для этого стандартные механизмы шаблонов и категорий?)
(ответ)
Строка 1: Строка 1:
== Основные требования к организации библиографий в MachineLearning.Ru ==
== Основные требования к организации библиографий в MachineLearning.Ru ==
-
* Для каждой публикации отводится отдельная ''страница публикации''. Это обычная страница, за исключением того, что с ней связана ''библиографическая запись'', текст которой автоматически генерируется по набору полей.
+
* Для каждой публикации отводится отдельная ''страница публикации''. Это обычная страница, за исключением того, что с ней связана ''библиографическая запись'', текст которой автоматически генерируется по набору полей.
* '''Поля''' ''библиографической записи'':
* '''Поля''' ''библиографической записи'':
** авторы;
** авторы;
Строка 15: Строка 15:
** ISBN или ISSN;
** ISBN или ISSN;
** добавочный текст.
** добавочный текст.
-
* '''Типы публикаций''':
+
* '''Типы публикаций''':
-
** книга;
+
** книга;
-
** статья (в журнале, сборнике статей, сборнике трудов конференции);
+
** статья (в журнале, сборнике статей, сборнике трудов конференции);
-
** диссертация;
+
** диссертация;
-
** отчёт;
+
** отчёт;
** электронный документ (загруженный сюда, размещённый в Интернете, URL);
** электронный документ (загруженный сюда, размещённый в Интернете, URL);
** другое.
** другое.
* ''Текст библиографической записи'' с правильным оформлением, максимально приближенным к ГОСТ 7.80-2000, должен генерироваться автоматически по набору полей.
* ''Текст библиографической записи'' с правильным оформлением, максимально приближенным к ГОСТ 7.80-2000, должен генерироваться автоматически по набору полей.
-
* Должна быть возможность на любой странице в списке литературы указать только название ''страницы публикации'', и генерируемый ''текст библиографической записи'' будет вставлен в этом месте автоматически.
+
* Должна быть возможность на любой странице в списке литературы указать только название ''страницы публикации'', и генерируемый ''текст библиографической записи'' будет вставлен в этом месте автоматически.
* Должна быть возможность автоматически сгенерировать на ''странице публикации'' описание ''библиографической записи'' в формате BibTeX.
* Должна быть возможность автоматически сгенерировать на ''странице публикации'' описание ''библиографической записи'' в формате BibTeX.
* '''Типичная структура''' ''страницы публикации'':
* '''Типичная структура''' ''страницы публикации'':
Строка 33: Строка 33:
** ссылки — необязательный раздел;
** ссылки — необязательный раздел;
** категории.
** категории.
-
* '''Категоризация публикаций''' производится с помощью стандартного механизма категорий. Предполагается, что названия категорий будут совпадать с названиями основных тематических категорий Ресурса, но к ним в конце будет приписываться <code> (публикация)</code>.
+
* '''Категоризация публикаций''' производится с помощью стандартного механизма категорий. Предполагается, что названия категорий будут совпадать с названиями основных тематических категорий Ресурса, но к ним в конце будет приписываться <code> (публикация)</code>.
* Должны быть предусмотрены следующие виды категоризации:
* Должны быть предусмотрены следующие виды категоризации:
** по тематике;
** по тематике;
Строка 41: Строка 41:
** по изданиям (журналам);
** по изданиям (журналам);
* Категории по авторам предлагается именовать <code>Фамилия И. О. (публикации)</code>.
* Категории по авторам предлагается именовать <code>Фамилия И. О. (публикации)</code>.
-
* При категоризации по авторам необходимо решить проблему неоднозначности. Участники наверняка будут вводить одного и того же автора по-разному (Knuth D. или Donald Knuth или D.E.Knuth). Даже если предусмотреть стандартный формат ввода (допустим, {{S|Фамилия И. О.}}), останется неоднозначность с переводом (кто бы мог подумать, что Siegel, Сиджел и Зигель — один и тот же человек). '''Почти идеальное решение''': чтобы в поле автора по мере ввода фамилии показывался выпадающий список с вариантами выбора; если нужного варианта ещё нет, участник может ввести свой. Нужно ли запоминать полные имена или всегда ограничиваться инициалами (в BibTeX'е предусмотрены оба варианта)? Если будет такой список, то выбор редактора издания должен производиться из этого же списка. '''Проблема:''' если всё же предусматривать ввод полных имён ({{S|Фамилия, Имя1 Имя2}}), то участник, первым вводящий фамилию данного автора, может знать только инициалы. Потом автора придётся переименовывать... Кошмар!
+
* При категоризации по авторам необходимо решить проблему неоднозначности. Участники наверняка будут вводить одного и того же автора по-разному (Knuth D. или Donald Knuth или D.E.Knuth). Даже если предусмотреть стандартный формат ввода (допустим, {{S|Фамилия И. О.}}), останется неоднозначность с переводом (кто бы мог подумать, что Siegel, Сиджел и Зигель — один и тот же человек). '''Почти идеальное решение''': чтобы в поле автора по мере ввода фамилии показывался выпадающий список с вариантами выбора; если нужного варианта ещё нет, участник может ввести свой. Нужно ли запоминать полные имена или всегда ограничиваться инициалами (в BibTeX’е предусмотрены оба варианта)? Если будет такой список, то выбор редактора издания должен производиться из этого же списка. '''Проблема:''' если всё же предусматривать ввод полных имён ({{S|Фамилия, Имя1 Имя2}}), то участник, первым вводящий фамилию данного автора, может знать только инициалы. Потом автора придётся переименовывать… Кошмар!
-
P.S. Наверное, надо было написать всё это на странице [[MachineLearning:ToDo]]. Но сейчас она имеет такой вид (понятный только Andrew) что править её как-то боязно...
+
P.S. Наверное, надо было написать всё это на странице [[MachineLearning:ToDo]]. Но сейчас она имеет такой вид (понятный только Andrew) что править её как-то боязно…
-
[[Участник:Vokov|К.В.Воронцов]] 02:50, 23 марта 2008 (MSK)
+
[[Участник:Vokov|К. В. Воронцов]] 02:50, 23 марта 2008 (MSK)
== Подходят ли для этого стандартные механизмы шаблонов и категорий? ==
== Подходят ли для этого стандартные механизмы шаблонов и категорий? ==
Строка 68: Строка 68:
'''Проблемы:'''
'''Проблемы:'''
* Слово <code>Шаблон:</code> категорически не подходит как начало заголовка. Можно ли создать ещё одни namespace, по функциональности эквивалентный шаблонам (кстати, без параметров — может, это облегчит задачу?), но называемый <code>Публикация:</code>?
* Слово <code>Шаблон:</code> категорически не подходит как начало заголовка. Можно ли создать ещё одни namespace, по функциональности эквивалентный шаблонам (кстати, без параметров — может, это облегчит задачу?), но называемый <code>Публикация:</code>?
-
* Страницы <code>Публикация:</code> должны или не должны рассматриваться как статьи, т.е. увеличивать счётчик, попадать в список новых статей, и т.д.?
+
* Страницы <code>Публикация:</code> должны или не должны рассматриваться как статьи, то есть увеличивать счётчик, попадать в список новых статей, и т. д.?
* Шаблон <code><nowiki>{{книга|...}}</nowiki></code> надо существенно доработать, в идеале приблизив по функциональности к BibTeX’овским записям. Если переименовать поля (в author, title, year, и т. д.) и сделать так, чтобы параметры шаблона принимались в кавычках, будет почти полная совместимость с бибтехом.
* Шаблон <code><nowiki>{{книга|...}}</nowiki></code> надо существенно доработать, в идеале приблизив по функциональности к BibTeX’овским записям. Если переименовать поля (в author, title, year, и т. д.) и сделать так, чтобы параметры шаблона принимались в кавычках, будет почти полная совместимость с бибтехом.
-
Простые решения — красивые решения! — [[Участник:Vokov|К.В.Воронцов]] 16:23, 29 марта 2008 (MSK)
+
Простые решения — красивые решения! — [[Участник:Vokov|К. В. Воронцов]] 16:23, 29 марта 2008 (MSK)
 +
: Начнем с конца, чтобы охладить пыл: ''Для любой самой сложной задачи всегда существует простое неправильное решение'' :). Дальше. Шаблоны здесь не причем. Заводим неймспейс '''Публикация'''. Все страницы в этом неймспейсе имеют стандартизованный вид — как записи в базе данных. Пример (правда из другой области) можно посмотреть здесь [http://ru.rodovid.org/]. Сейчас с Андреем думаем как это реализовать.
 +
: Кроме того, надо сделать скрипты-конверторы для перевода наборов статей из неймспейса Публикации в списки в нужных форматах. С именованием статей в принципе согласен. В статистике проблем нет — будем учитывать отдельной строкой. Шаблон {{Tl|Книга}} — временное решение, которое применяется для оформления. --[[Участник:Yury Chekhovich|Yury Chekhovich]] 00:25, 30 марта 2008 (MSK)

Версия 21:25, 29 марта 2008

Основные требования к организации библиографий в MachineLearning.Ru

  • Для каждой публикации отводится отдельная страница публикации. Это обычная страница, за исключением того, что с ней связана библиографическая запись, текст которой автоматически генерируется по набору полей.
  • Поля библиографической записи:
    • авторы;
    • название публикации;
    • название периодического издания, сборника или конференции;
    • том и номер журнала;
    • диапазон страниц (для статей) или количество страниц (для книг, диссертаций, отчётов);
    • год издания;
    • редакторы издания;
    • город и название издательства;
    • ссылка на исходный текст: URL или загруженный документ;
    • язык публикации;
    • ISBN или ISSN;
    • добавочный текст.
  • Типы публикаций:
    • книга;
    • статья (в журнале, сборнике статей, сборнике трудов конференции);
    • диссертация;
    • отчёт;
    • электронный документ (загруженный сюда, размещённый в Интернете, URL);
    • другое.
  • Текст библиографической записи с правильным оформлением, максимально приближенным к ГОСТ 7.80-2000, должен генерироваться автоматически по набору полей.
  • Должна быть возможность на любой странице в списке литературы указать только название страницы публикации, и генерируемый текст библиографической записи будет вставлен в этом месте автоматически.
  • Должна быть возможность автоматически сгенерировать на странице публикации описание библиографической записи в формате BibTeX.
  • Типичная структура страницы публикации:
    • форма ввода полей библиографической записи; желательно предусмотреть возможность ввода описания библиографической записи целиком в формате BibTeX;
    • генерируемое описание библиографической записи в формате BibTeX;
    • аннотация — необязательный раздел;
    • реферат — необязательный раздел;
    • перевод (возможно, только некоторых фрагментов) — необязательный раздел;
    • ссылки — необязательный раздел;
    • категории.
  • Категоризация публикаций производится с помощью стандартного механизма категорий. Предполагается, что названия категорий будут совпадать с названиями основных тематических категорий Ресурса, но к ним в конце будет приписываться (публикация).
  • Должны быть предусмотрены следующие виды категоризации:
    • по тематике;
    • по авторам;
    • по годам;
    • по типам публикации;
    • по изданиям (журналам);
  • Категории по авторам предлагается именовать Фамилия И. О. (публикации).
  • При категоризации по авторам необходимо решить проблему неоднозначности. Участники наверняка будут вводить одного и того же автора по-разному (Knuth D. или Donald Knuth или D.E.Knuth). Даже если предусмотреть стандартный формат ввода (допустим, Фамилия И. О.), останется неоднозначность с переводом (кто бы мог подумать, что Siegel, Сиджел и Зигель — один и тот же человек). Почти идеальное решение: чтобы в поле автора по мере ввода фамилии показывался выпадающий список с вариантами выбора; если нужного варианта ещё нет, участник может ввести свой. Нужно ли запоминать полные имена или всегда ограничиваться инициалами (в BibTeX’е предусмотрены оба варианта)? Если будет такой список, то выбор редактора издания должен производиться из этого же списка. Проблема: если всё же предусматривать ввод полных имён (Фамилия, Имя1 Имя2), то участник, первым вводящий фамилию данного автора, может знать только инициалы. Потом автора придётся переименовывать… Кошмар!

P.S. Наверное, надо было написать всё это на странице MachineLearning:ToDo. Но сейчас она имеет такой вид (понятный только Andrew) что править её как-то боязно…

К. В. Воронцов 02:50, 23 марта 2008 (MSK)

Подходят ли для этого стандартные механизмы шаблонов и категорий?

Это, конечно, попытка использовать инструмент не по назначению… и всё же:

Допустим, что страница публикации реализована как шаблон без параметров. Что это даёт:

  • Чтобы сослаться на публикацию из любой статьи, достаточно ввести в списке литературы (или в любом месте)
{{Публикация:Название публикации}}
  • Участник сам придумывает Название публикации как заголовок страницы при её создании. Это по-своему неплохо. Вид заголовков публикаций можно стандартизовать, например, так: 'Фамилия первого автора. Год. Название публикации.'. Это очень распространённая нотация при именовании электронных публикаций. Задаёт статью почти однозначно. Если неоднозначно (что бывает редко), можно приписать в конце что угодно: аббревиатуру журнала, конференции, техрепорта.
  • В описание публикации (шаблона!) вставляем шаблон {{книга|...}}. Всё остальное содержимое страницы с аннотациями, рефератами и проч. обрамляем тагами noinclude, аналогично комментариям и докоментациям к обычным шаблонам. Можно создать подстраницу как в случае с {{doc}}, но это может оказаться сложновато, и участники нас не поймут.
  • Для категоризации публикаций вручную добавляем категории по тематике, авторам, годам, конференциям, изданиям. Не забываем к именам всех этих категорий приписывать слово (публикации).

ENJOY! Почти вся функциональность реализована без утомительного засти… программирования.

Преимущества:

  • Почти нет трудозатрат. Это можно сделать сразу, а не через год.
  • Очень уж руки чешутся поскорее начать работу с библиографиями.

Недостатки:

  • Много неавтоматизированной ручной работы, появятся публикации вне категорий, дубликаты авторов и журналов, искажённые названия статей в заголовках. Но если делать автоматизированную систему поддержки публикаций, эти же проблемы останутся, просто для них придётся искать сложные навороченные решения.

Проблемы:

  • Слово Шаблон: категорически не подходит как начало заголовка. Можно ли создать ещё одни namespace, по функциональности эквивалентный шаблонам (кстати, без параметров — может, это облегчит задачу?), но называемый Публикация:?
  • Страницы Публикация: должны или не должны рассматриваться как статьи, то есть увеличивать счётчик, попадать в список новых статей, и т. д.?
  • Шаблон {{книга|...}} надо существенно доработать, в идеале приблизив по функциональности к BibTeX’овским записям. Если переименовать поля (в author, title, year, и т. д.) и сделать так, чтобы параметры шаблона принимались в кавычках, будет почти полная совместимость с бибтехом.

Простые решения — красивые решения! — К. В. Воронцов 16:23, 29 марта 2008 (MSK)

Начнем с конца, чтобы охладить пыл: Для любой самой сложной задачи всегда существует простое неправильное решение :). Дальше. Шаблоны здесь не причем. Заводим неймспейс Публикация. Все страницы в этом неймспейсе имеют стандартизованный вид — как записи в базе данных. Пример (правда из другой области) можно посмотреть здесь [1]. Сейчас с Андреем думаем как это реализовать.
Кроме того, надо сделать скрипты-конверторы для перевода наборов статей из неймспейса Публикации в списки в нужных форматах. С именованием статей в принципе согласен. В статистике проблем нет — будем учитывать отдельной строкой. Шаблон {{Книга}} — временное решение, которое применяется для оформления. --Yury Chekhovich 00:25, 30 марта 2008 (MSK)
Личные инструменты