Написание отчётов и статей (рекомендации)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м (См. также: опечатка в ссылке)
(Литература: убрал {{stub}})
Строка 301: Строка 301:
* ''С. С. Кутателадзе.'' Russian→English in Writing. Советы эпизодическому переводчику. Изд. 7-е, исправл. и допол. — Новосибирск: Институт математики им. С.Л.Соболева Сибирского отделения РАН, 2007. — 196 с.
* ''С. С. Кутателадзе.'' Russian→English in Writing. Советы эпизодическому переводчику. Изд. 7-е, исправл. и допол. — Новосибирск: Институт математики им. С.Л.Соболева Сибирского отделения РАН, 2007. — 196 с.
-
{{Stub}}
 
[[Категория:Рекомендации для студентов]]
[[Категория:Рекомендации для студентов]]

Версия 16:18, 10 апреля 2010

Содержание

Приведённые ниже рекомендации по подготовке статей, отчётов, квалификационных работ адресованы, главным образом, студентам и аспирантам.

Введение

Во всем мире научные статьи пишут по определенным канонам, выработанным многими поколениями учёных. Традиции в данном случае необходимы для того, чтобы разные люди без дополнительных усилий понимали друг друга. Чем жёстче требования к терминологии, языку, форме подаче материала, оформлению, тем меньше читатель отвлекается на второстепенные детали, тем быстрее он сможет понять основную суть работы. Пренебрегать этими традициями — значит быть неадекватным в глазах сообщества.

Всякая научная статья преследует одновременно две цели:

  • донести основные идеи автора до широкой аудитории так, чтобы не-специалисты в данной узкой теме смогли понять основные идеи, затратив на это минимум времени;
  • представить детальное изложение полученных результатов так, чтобы небольшое число узких специалистов смогли их понять, перепроверить, развить и применить.

О том, как писать научные статьи именно в области машинного обучения, здорово рассказано в заметке Пэта Лэнгли Crafting Papers on Machine Learning. К отчетам, курсовым и выпускным работам изложенные там соображения тоже относятся в полной мере.

Типичная структура научной статьи

Аннотация

Краткое описание темы исследования и основного результата, одним абзацем на 5–15 строк, без формул, без ссылок на литературу, без узкоспециальных терминов.

Цель аннотации: обозначить в общих чертах, о чем работа. Прочитав аннотацию в течение минуты, не-специалист в данной узкой теме должен понять, интересна ли ему эта работа, и стоит ли читать дальше.

Аннотация собирается в последнюю очередь путем легкой модификации ключевых фраз (наиболее важных и удачно сформулированных) из введения и заключения.

Введение

Во введении рассказывается, где возникает данная задача, и почему ее решение так важно. Вводится на неформальном уровне минимум терминов, необходимый для понимания постановки задачи. Приводится краткий анализ источников информации (литературный обзор): как эту задачу решали до сих пор, в чем недостаток этих решений, и что нового предлагает автор. Формулируются цели исследования. В конце введения даётся краткое содержание работы по разделам; при этом отмечается, какие подходы, методы, алгоритмы предлагаются автором впервые. При упоминании ключевых разделов кратко формулируются основные результаты и наиболее важные выводы.

Цель введения: дать достаточно полное представление о выполненном исследовании и полученных результатах, понятное широкому кругу специалистов. Большинство читателей прочтут именно введение и, быть может, заключение. Во введении автор решает сложную оптимизационную проблему: как сообщить только самое важное, потратив минимум времени читателя, да так, чтобы максимум читателей поняли, о чём вообще идёт речь.

Введение лучше писать напоследок, так как в ходе работы обычно происходит переосмысление постановки задачи. Если же введение писать, когда работа еще не готова, задача усложняется вдвойне. В конце обычно приходит понимание, что всё получилось совсем не так, как планировалось в начале, и исходный вариант введения всё равно придётся переписывать. Кстати, к таким «потерям» надо относиться спокойно — в хорошей работе почти каждый абзац многократно переделывается до неузнаваемости.

Определения и обозначения

Формальная постановка задачи. Для известных понятий желательно придерживаться стандартных обозначений. Общепринятые термины вводятся словом «называется». Термины, придуманные самим автором, вводятся словами «назовём» или «будем называть». Обычно этот раздел заканчивается формальной постановкой задачи.

Именно с этого раздела стоит начинать писать статью.

Известные результаты

Перечисляются подходы, методы, факты, на которые существенно опирается данная работа, но которые могут быть не известны широкому кругу читателей. Здесь ссылки на литературу обязательны. Теоремы только формулируются, но не доказываются.

Цели данного раздела. Во-первых, сделать статью самодостаточной — дать необходимый минимум информации тем читателям, которые не очень хорошо ориентируются в теме, но желают поближе познакомиться именно с данной работой. Во-вторых, облегчить сопоставление полученных автором результатов с ранее известными.

Новые подходы и результаты

Один или несколько разделов — основные результаты, полученные автором. Собственно, ради их опубликования и пишется весь текст. Теоремы приводятся с доказательствами.

Вычислительный эксперимент

Описывается прикладная задача, параметры анализируемых данных (например, сколько объектов, сколько признаков, и каких они типов), параметры эксперимента (например, как производился скользящий контроль). Результаты экспериментов представляются в виде таблиц и графиков. Объясняется точный смысл всех обозначений на графиках, строк и столбцов в таблицах. Приводятся выводы: в какой степени результаты экспериментов согласуются с теорией? Достигнут ли желаемый результат? Обнаружены ли какие-либо факты, не нашедшие объяснения, и которые нельзя списать на «грязный» эксперимент?

Цель данного раздела: продемонстрировать, что предложенная теория работает на практике; показать границы её применимости; рассказать о новых экспериментальных фактах. Чисто теоретические работы могут не содержать данного раздела (не работает, ну и не надо — зато теория красивая). Кстати, теоретики имеют право не догадываться, где, кому и когда их теории пригодятся.

Обсуждения и выводы

Основные отличия предложенных методов от известных ранее. В чем их преимущества? Каковы границы их применимости? Какие проблемы удалось решить, а какие остались открытыми? Какие возникли новые постановки задач?

Заключение или основные результаты

В квалификационных работах последний раздел нужен для того, чтобы конспективно перечислить основные результаты, полученные лично автором. Результатами, в частности, являются:

  • Предложен новый подход к…
  • Разработан новый метод…, позволяющий…
  • Доказан ряд теорем, подтверждающих (опровергающих), что…
  • Экспериментально показано, что…

Цель данного раздела: доказать квалификацию автора. Даже беглого взгляда на заключение должно быть достаточно, чтобы стало ясно: автору удалось решить актуальную, трудную, ранее не решённую задачу, предложенные автором решения обоснованы и проверены.

Кстати, в отзывах и рецензиях это выражается примерно такими словами: «работа удовлетворяет всем требованиям, предъявляемым к [бакалаврским, магистерским, дипломным, кандидатским — ненужное вычеркнуть] диссертациям; автор достоин присуждения ему звания [бакалавра, магистра, и т.д.]».

Благодарности

Ссылки на гранты; реже — благодарности коллегам, подсказавшим важные идеи.

Литература

Дурным тоном считается:

  • ссылаться на работы только одного-двух авторов (например, себя или шефа);
  • ссылаться на слишком малое число работ;
  • ссылаться только на очень старые работы;
  • ссылаться на работы, которых автор ни разу не видел;
  • вообще ни на что не ссылаться.

Некоторые принципы и приёмы ясного изложения

Время читателя — ценнейший ресурс

Эталоном неясного изложения будем считать «казённый язык» — сухой, скучный, трудно понимаемый, но при этом формально абсолютно корректный (бесспорно, существуют образцы ещё более ужасного изложения; однако здесь обсуждается проблема, как из хорошего сделать лучшее). «Казённым» стилем обычно пишутся законы, руководства и инструкции. В советские времена в таком стиле писали газеты. Таким стилем все ещё пишут некоторые ученые… Но это неправильно.

Автор должен стремиться экономить время читателей хотя бы потому, что он один, а читателей много.

Краткость — сестра таланта

Фразы должны быть короткими. В каждой фразе должна быть ровно одна мысль. В русской фразе (кстати, как и в английской) самое важное слово, значимость которого хочется подчеркнуть особо, ставится последним. Обратите внимание на положение слов «особо» и «последним» в предыдущей фразе. Теперь ясно, что имеется в виду?

Наблюдение: в «казенных» текстах фразы длинные, содержат по несколько мыслей, и наиболее значимое слово прячется в середине.

Не надо пытаться сказать одну мысль несколькими разными способами. Нужно оставить только один, самый лучший, способ.

Наблюдение: в гуманитарных текстах (например, в Библии) делается наоборот — одна и та же мысль повторяется многократно, но в разных формах. Чтобы каждый смог осознать её в той форме, которая лично ему ближе.

В техническом тексте нет необходимости украшать содержание разнообразием форм, так как его цель — передача знания, а не ощущения.

Комментирование формул

Текст, содержащий формулы, должен оставаться в целом понятным, если его читать, просто пропуская все формулы. Это означает, что каждая формула должна сопровождаться комментарием, объясняющим её содержательный смысл, или поясняющим, чем она интересна, или для чего она будет нужна в дальнейшем.

Наблюдение. Математики делятся на две категории. «Алгебраисты» быстро понимают и хорошо запоминают формулы. «Геометры» предпочитают понимать содержательный смысл высказываний. Алгебраисты более формальны, геометры — более интуитивны. Первые быстрее воспринимают язык формул, вторые предпочитают воспринимать идеи, вникая в технические подробности только в случае необходимости.

Автор должен позаботиться о том, чтобы его текст был понятен и той, и другой категории читателей, то есть дошёл до максимально широких слоев профессионального сообщества.

Простота и постоянство обозначений

Система обозначений должна быть проста (не перегружена) и не меняться по ходу изложения.

Наблюдение. Всегда можно найти способ избежать тройных индексов, например, ввести вспомогательное подмножество.

В английском алфавите достаточно букв, чтобы приписать им фиксированные роли. Например, если договорились, что x_ii-й объект, то лучше не использовать букву x и индекс i для чего-либо, кроме объектов. Тогда читатель быстро привыкает к обозначениям основных понятий, и уже не будет отвлекаться на то, чтобы вернуться выше и разобраться, в данном случае i глобален (тот самый, что был использован при введении обозначений в самом начале), или он снова в десятый раз поменял смысл.

Наблюдение. Лучший способ заставить человека потратить на изучение отчёта втрое больше времени — всё время менять обозначения, а индексы и аргументы функций вводить «ненадолго» и ниже произвольным образом менять их смысл. Тогда читатель будет тратить основное время на то, чтобы понять, что есть что, и легко пропустит десяток действительно серьёзных ляпов. Автор должен быть готов к тому, что читатель расценит такой текст как оскорбление или попытку сознательного сокрытия истинного положения дел.

Неформальные объяснения и интерпретации

Формальное изложение (гипотезы, определения, леммы, теоремы, следствия, замечания) должно перемежаться неформальными объяснениями, интерпретациями, замечаниями, примерами, апеллирующими к интуиции и здравому смыслу. Однако оформляться это должно так, чтобы читатель сразу понял: «вот тут закончились доказательства и начались интерпретации». В англоязычных статьях в этом месте принято вставлять раздел Discussion (обсуждение).

Наблюдение. Эпоха чисто формальных текстов в прикладной математике ушла в прошлое. Их понимание требует в несколько раз больших затрат времени. Темп жизни вырос, и если статью не удается понять за пару часов, то вернуться к ней уже не будет возможности. Однако любой результат можно изложить понятно. Этому можно и нужно научиться.

Основные идеи текста должны быть в целом понятны, если целиком пропускать доказательства. Вывод: если внутри доказательства спрятана важная идея, то её обсуждение стоит вынести за пределы доказательства. Например, можно разбить доказательство на леммы.

Структуризация

Изложение основной части должно быть структурировано, то есть разбито на блоки (параграфы, разделы). Каждый блок должен решать более-менее обособленную задачу. В начале блока должно быть объявлено, зачем она решается, и почему она решается именно так. Чтобы ответить на вопрос «зачем», надо вспомнить общую цель всего исследования. Чтобы ответить на вопрос «почему так», надо сделать обзор литературы.

Наблюдение. В маргинальных исследованиях вопросы «зачем» и «почему так» либо не ставятся, либо на них даются невнятные (неконкретные, слишком философские) ответы.

Каждый раздел, независимо от уровня и объема, строится по одному и тому же сценарию. В начале неформально объясняется постановка задачи и её роль во всем исследовании (или в объемлющем разделе). В заключении неформально объясняется, что получилось, и как это интерпретировать. Если в следующих разделах полученный результат будет улучшен, об этом стоит упомянуть. Средняя часть может быть целиком формальной.

Важный принцип: изложение в целом должно быть понятным, если средние части во всех разделах целиком опустить.

Жёсткая последовательность

Каждая следующая фраза должна вытекать непосредственно из предыдущей. Слишком жестко? Тогда хотя бы 95% фраз. Следить за линейной логикой изложения на порядок менее утомительно, чем за перескоками с темы на тему. Резкая смена темы должна оформляться в явном виде как новый параграф, раздел, подраздел.

Любой термин или обозначение должны быть введены до первого использования, даже если они общеупотребительны. Это вроде бы очевидно, но по неопытности трудно уследить за каждой закорючкой.

Наблюдение. В учебниках и хороших книгах таких грубых ошибок не бывает — благодаря тому, что эти тексты десятки раз вычитываются авторами, рецензентами и редакторами.

Глаголы

За точность смысла отвечают глаголы. Тщательный подбор одного единственного глагола иногда способен заменить пару строк простанных комментариев. Старайтесь не употреблять слишком абстрактных глаголов является, имеется, позволяет, поддерживает, применяется, и т.п. Это легкомысленная расточительность такого ценного ресурса, как глаголы. Ведь в каждой фразе глагол только один.

Наблюдение: «казенные» тексты напичканы абстрактными глаголами.

Семь раз прочти, один раз отправь

На самом деле семь раз — это мало. Обычно студент, пишущий свою первую курсовую или статью, не отдаёт себе отчёта в том, сколько ляпов будет сделано по невнимательности. Почти в каждой фразе! Это нормально, людям свойственно ошибаться. Ещё многим людям свойственно не замечать собственных ошибок. Поэтому стадию внимательного вычитывания ни в коем случае пропускать нельзя.

Рекомендация: в конце работы над статьёй запланируйте посвятить целый день многократному внимательному прочтению своего труда. Где-то будут пропущены формулы или целые фразы. Это не пустяк! Поставьте себя на место незнакомого читателя и осознайте факт: научный текст легко может оказаться целиком непонятным из-за одной единственной ошибки. Где-то можно перестроить фразу и сказать получше. Или покороче. Где-то можно упростить обозначения или вообще избавиться от лишних закорючек. Иногда чисто формальное упрощение неожиданно подсказывает идею более изящного доказательства. К вечеру Ваш текст начнёт Вам нравиться, и Вы поймёте, что день прожит не зря. Не лишайте себя этого кайфа!

Дело техники

Для оформления научных статей, отчётов, квалификационных работ, учебных курсов, книг рекомендуется освоить систему компьютерной вёрстки LaTeX.

  • Памятка по установке и использованию MiKTeX и WinEdt.
  • LaTeX в примерах (pdf) — сборник примеров, помогающий довольно быстро освоить LaTeX в объеме, достаточном для написания первой статьи.

Статья на английском

Это отдельная большая тема для разговора, а краткие рекомендации такие.

  • Перед написанием собственного текста обязательно прочтите несколько канонических обзоров по Вашей теме, чтобы «пропитаться» правильными терминами, мотивациями, оборотами речи, конструкциями английских фраз — они не такие, как в русском языке!
  • Обязательно прочтите книги Сосинского или Кутателадзе (а лучше обе), даже если Вы считаете, что хорошо знаете язык. Первая даёт простую методику, которая позволит сразу приступить к делу; вторая книга глубже и потребует более тщательного изучения. Если совсем кратко, основные рекомендации таковы:
    • не переводите текст с русского на английский, а рассказывайте содержание вашей работы по-английски;
    • в каждой фразе придерживайтесь жёсткого порядка: подлежащее → сказуемое → дополнение;
    • используйте математические клише, которые даются в этих двух книгах;
  • Введение, где больше всего «человеческой речи», пишите в последнюю очередь. Начинать лучше с вводной части, где даются формальные определения. Тогда к моменту написания введения необходимая терминология и обороты речи уже будут «загружены в оперативную память».
  • Если какое-то словосочетание вызывает сомнения, поищите его в Google вместе с возможными вариантами. Часто ли оно употребляется в научных текстах, особенно по Вашей тематике? Не совпадает ли оно с чем-нибудь неподходящим или даже неприличным? Поиск подходящих отрывков фраз в Интернете — это долгий, но верный способ написать хороший текст даже при посредственном владении языком. Как обычно, приходится выбирать — время или качество — что Вам дороже.

См. также

Ссылки

Литература

  • Pat Langley. Crafting Papers on Machine Learning. ICML 2001.
  • А. Б. Сосинский. Как написать математическую статью по-английски. — М.: Изд-во «Факториал Пресс», 2000. — 112 с. ISBN 5-88688-032-1.
  • С. С. Кутателадзе. Russian→English in Writing. Советы эпизодическому переводчику. Изд. 7-е, исправл. и допол. — Новосибирск: Институт математики им. С.Л.Соболева Сибирского отделения РАН, 2007. — 196 с.
Личные инструменты