понедельник, 30 сентября 2013 г.

Эссе: первые впечатления.

Добрый вечер. Итак, прежде, чем вы займетесь проверкой работ, хочу вам предложить небольшой иллюстрированный обзор одной из работ. Сразу скажу, что выбрал эту работу просто потому, что она мне первой попалась и содержала достаточно иллюстраций к тем тезисам, которые я хочу до вас донести. Это ни в коем случае не критика автора на фоне других блестящих работ -- я даже все еще не просмотрел и ожидать, что приведенный пример такой единственный, у меня поводов нет. Будем считать, что вам просто забыли рассказать за те две недели "БЖД", что такое академическая этика, цитирование и пользоваться внешними источниками. Самое время освоить и применить уже в следующей работе.

Сразу скажу, что всеми любимый Антиплагиат -- абсолютно бестолковый для оценки заимствований ресурс и, если вы там увидели высокую оценку своего творения, -- это вообще ничего не значит. Об этом и о том, как ваша работа выглядит со стороны, читаем под катом.


Текст не оформлен, написан "с листа", так что мои извинения за возможные ляпы.

К письменным работам студентов существуют варьирующиеся в зависимости от предмета или преподавателя требования, но всегда заявляется требование об аутентичности. При этом ни студенты, ни, зачастую, преподаватели не в состоянии сформулировать, что это такое и показать на примере, “что такое хорошо и что такое плохо”. Далее мы разберём одну работу, которая попала в этот обзор не по причине своего выдающегося в каком-либо смысле качества, а просто она была первой и содержит достаточно примеров, чтобы по ним написать небольшой иллюстрированный обзор, в целом же она не уникальна и многие студенты узнают свой стиль написания работ. Так же, этот обзор не претендует на всесторонний охват -- и автор и читатели наверняка вспомнят другие “методы и средства”, применяемые в написании курсовых, дипломных и прочих работ. Приведенный пример рассмотрим именно с позиций отношения к источникам.
По полученным работам можно сделать следующие наблюдения, касающиеся как их сожержания, так и формы. Для работ не указываются названия и авторы, но будут приводиться скриншоты из MS Word для иллюстрации.

Источники, цитирование и заимствование

Читая работы студентов, можно сделать вывод о том, что они просто не подозревают о том, что возможны иные способы создания текстовых работ, кроме копирования текста и, сделав над собой усилие, расстановки ссылок на источники. Но источники не вдохновения или справочной информации, подтверждающие авторитетность приведенных данных, а источники самого текста. При этом система Антиплагиат выдаёт высокие показатели аутентичности для большинства работ -- действительно, они не скачаны из базы рефератов, они взяты из выдачи поисковой системы по запросу, содержащему ключевые слова из названия темы.
Кратко разберем способы идентификации заимствований в работах.

1. Выборочная проверка на заимствования

Задолго до повсеместного установления моды на проверку работ на Антиплагиате (и, как следствие, всеобщего успокоения по поводу их аутентичности), автором применялся простой, но довольно действенный способ идентификации происхождения текста: раз студенты ищут тексты в поисковых системах и вставляют фрагменты найденных страниц (статей) в свои работы, то выборочная проверка в обратном порядке тоже должна работать.  Берём фрагмент из середины абзаца длиною 5-7 слов, вставляем в поисковую строку:
Рис. 1. Выделение фрагмента в тексте документа
Рис. 2. Поиск выделенного фрагмента в Google
Поскольку поисковые системы неплохо адаптируются к произвольной замене порядка слов и другим нехитрым приёмам, то этот метод остаётся эффективным и в случае “предварительной обработки” текста. Проверим: поставим кавычки и заменим часть букв латинскими (слова с заменёнными буквами подчёркиваются в браузере, как неизвестные словарю):
Рис. 3. Изменение запроса для маскировки заимствования (подмена латиницей, дополнение кавычками).
Разумеется, более вдумчивое изменение текста будет лучше скрывать его происхождение и, по крайней мере, потребует уменьшения длины запроса, а, следовательно, повышения количества нерелевантных нашей задаче результатов.

2. Элементы разметки, выдающие copy-paste

Текст нужно просматривать в режиме включённых символов разметки (¶), тогда выявляются некоторые удивительные решения автора: например, часть абзацев отбита “ентером”, тогда при выравнивании по ширине последняя строка абзаца заканчивается там, где ей и полагается, а новый абзац подчиняется установленным правилами отступам, но другая часть абзацев содержит знак перевода строки, а абзацный отступ сделан табуляцией (рис. 4)
Рис. 4.  Символы разметки, нехарактерные для набора в текстовом редакторе.
Абзацный отступ, как правило, не используется на веб-страницах и вообще является анахроничным элементом машинописной типографики, в которой не было других доступных средств выделения абзацев, в современной практике приняты отбивки после абзацев, но ГОСТ требует машинописного стиля. Появление “разрыва строки” в скопированном с веб-страниц тексте объясняется очень просто: многие редакторы WYSIWYG используют тег <br /> вместо тега <p> или <div> для создания нового абзаца, а <br /> -- это и есть разрыв строки (break).
Такие же “друзья копипастера” -- неразрывные пробелы и знаки мягкой расстановки переносов, о существовании которых мало кто знает и уж тем более -- использует.
Тег “&nbsp”, часто встречающийся в HTML-документах, созданных визуальными редакторами, переносится в Word в виде неразрывного пробела (коим и является), отображается в виде кружка на середине высоты строчных символов на месте точки, обычно обозначающей пробел.
Знак мягкой расстановки переноса -- это обычный след работы программы оптического распознавания текстов (Abbyy FineReader).

3. Ссылки в тексте

Многие сайты, особенно энциклопедического содержания, изобилуют гиперссылками в тексте. Иногда они выделены явно, но иногда при форматировании в текстовом редакторе выделение может пропасть и выявить гиперссылку в документе визуально можно только при наведении на неё мыши. Такие ссылки обычно ведут на статьи на том же сайте (характерно для энциклопедий, построенных на движке Wikimedia, в первую очередь -- для Wikipedia) и содержат определения тех слов, на которых установлена ссылка. Разумеется, если автор сам писал текст и расставил ссылки, то он бы уделил внимание их оформлению, если весь остальной текст оформлен по правилам (есть список источников и на него проставлены сноски).
Разберём один абзац текста:
Рис. 5. Текст, содержащий ссылки, скрытые форматированием.
Казалось бы, где здесь ссылки? Вот автор написал всё сам и даже на источник сослался. А теперь посмотрим на него же, но с включенным отображением кодов полей (toggle field code для выделенного фрагмента):
Рис. 6. Отображение кодов полей в том же тексте.
Фрагмент на рисунках 5 и 6 взят из одной работы и в принципе отражают степень её аутентичности -- автор приведенной в пример работы искренне и честно копировал тексты и ставил на них ссылки, хотя даже здесь мы видим хитрый ход, к которому прибегают студенты для повышения весомости своих ссылок: на Рис. __ видна сноска на источник №5, это печатная книга:
Рис. 7. Источник, который автор работы вероятнее всего никогда не читал.
Можно уверенно интересоваться содержанием, например, страницы 39 -- студент эту книгу в глаза не видел, а сослался на источник, указанный в статье в Wikipedia, откроем наиболее вероятную статью (Цвет):
Рис. 8. Оригинал текста с рис. 5-6.
Здесь подобной ссылки не обнаруживаем, поэтому ищем её в поисковой системе:
Рис. 9. Поиск источника, указанного в списке.
На рисунке далеко не вся выдача, но понятно, что ссылка взята из реферативного материала одной из этих статей, тем более, что эти сайты фигурируют в остальных фрагментах текста представленной работы.

4. Внезапные отклонения в узкоспециальные области

Теоретически, студент, проводящий самостоятельное исследование, может увлечься темой, стоящей в стороне от основной, и раскрыть её -- вполне логичное развитие исследования, если нет жестких ограничений на границы предметной области. Но в общем случае такие отходы могут быть следствием копирования без осмысления:
Рис. 10. Отличающийся по теме текст.
Взятый из середины абзаца текст заметно отличается по рассматриваемой области от предшествовавшего ему и к тому не было никаких переходов. Очевидно, такой реверанс от теории цветовосприятия в сторону радиоэлектроники должен иллюстрировать применение методов рассматриваемых теорий в технике, что было бы уместно, но следующие 2 страницы просто продолжают изложение в том же духе, после чего изложение возвращается к прежнему руслу. Вставку несложно найти и выделить в общем объёме -- терминология отличается.
Следует отдать должное, в рассмотренной работе соблюдено единтство стиля, лица, рода и времени. При копировании из менее строгих источников встречаются перемены пола автора (встречается речь от первого лица с глагольными окончаниями то мужского, то женского рода, действие при этом ведется то в будущем, то в прошлом).
Возвращаясь к оценке работ “Антиплагиатом”: рассмотренная работа получила оценку “91% авторского текста”, хотя очевидно, что мы видели компиляцию из открытых и очевидных источников. Отчёт системы выглядит следующим образом:
Рис. 11. Отчёт системы Антиплагиат.
Из отчёта можно предположить, что система Антиплагиат полагается исключительно на базу рефератов и свои оценки ставит из предположения, что других источников, кроме рефератов, студенты не знают и не используют. Довольно спорный подход, хотя выявление заимствований никак нельзя назвать сложной задачей. Трудоёмкой для ручной проверки -- да, но не технически сложной.

1 комментарий:

  1. Дочитал ваши работы, составил себе мнение об общем уровне. Оценки вы сами себе поставите, а вот статьи из представленных работ сделать будет сложно: большинство работ -- это повторение общеизвестных фактов, а не систематизация и обобщение с собственными выводами, как предлагалось. Зато я понял, как формулировать задание на 2 эссе. Надеюсь, вы осознаете, что тут зачем и почему и примете к сведению возможные пути развития.

    ОтветитьУдалить