Мустакимов Вячеслав - GPT студентам. 580 промптов способных решить любую проблему. Промпт-инжиниринг для написания исследований, от плана до списка литературы, решения задач, генерации исследовательских идей, ускорения рутинных процессов, успешного и честного прохождения антиплагиат вуз стр 2.

Шрифт
Фон

В 2010 г. идея скоростного написания научных исследований получила свое развитие с новой силой. «СерчИнформ» не только предлагал возможность разнообразного поиска в локальных файлах, но и реализовывал функцию «поиска похожих»  поиск больших текстов на основании маленьких. Используя продукт СерчИнформ, мы научились извлекать необходимые данные из текстовых неструктурированных массивов, добавляя к заимствованиям библиографическую запись. Это позволяло компилировать теоретические разделы исследований за считанные часы. Генезис антиплагиата, который РУ, несколько замедлил развитие компилятивной технологии, поскольку все тексты, извлекаемые из любой электронной библиотеки, были плагиатом. В 2015 г. мы начали работы по автоматизации процесса перефразирования текстов, с целью повышения их уникальности, рис. 3. Чистовое решение было найдено в 2020 году, представлено Интернет-общественности в 2021 г., в виде проекта КонтрПлагиат.



Рисунок 3  Перефразирование, рерайт, перепечатывание текста «другими словами»


КонтрПлагиат, академическая нейронная сеть. Цель проекта  повышение уникальности академических текстов методом глубокого перефразирования (рерайтинг), перегенерация текстов (копирайтинг).

В 2022 г. КонтрПлагиат научился работать с файлами, имеющими сложную структуру  текст, математический аппарат, таблицы, рисунки, подстрочный ссылочный аппарат.

В 2023 г. Антиплагиат РУ вывел на рынок решение  детектор генеративных текстов, созданных с помощью больших языковых моделей (LLM). На следующий день КонтрПлагиат объявил, что умеет работать с большими текстами, имеющими статус: «Внимание, документ подозрительный: в документе присутствует сгенерированный текст».

Этот статус КонтрПлагиат убирает благодаря перефразированию и компилятивным умениям, доставшимся в наследство от НИОО «ГУМАНИТАРИЙ», рис. 4.



Рисунок 4  Генеративный текст, созданный с помощью GPT, «ДО» и «ПОСЛЕ» очеловечивания КонтрПлагиат


Как видно из краткого исторического экскурса, проблема скоростного написания исследовательских работ не нова, борьба с плагиатом в той или иной форме ведется почти два десятилетия, появление GPT заметно оживило этот процесс, наполнив академическую среду паническими настроениями. Паникуют все, профессорско-преподавательский состав, который захлестнула волна генеративных работ. Студенты, которые сгенерировали примитивные работы и не могут пройти проверку в антиплагиат версии ВУЗ.

Большие языковые модели (LLM) приходят к нам надолго и проникают во все инструментальные среды, интерфейсы, приложения и практики. Правильным, по нашему мнению, является не запрет их применения, а приобретение навыков их использования в исследовательской деятельности, что снижает рутинную составляющую и дает достаточно времени для творческого процесса.

Примером применения ИИ GPT и КонтрПлагиат выступает данное пособие, которое обобщает практический опыт и рассматривает процесс написания исследований с точки зрения  как упростить, а не с позиции классической методологии  как усложнить.

1.2. Антиплагиат  игровая или экспертная система?

За долгие годы наблюдения за тысячами отчетов антиплагиат ВУЗ мы выявили ряд интересных моментов:

 Не смотря на наличие модуля шаблонных фраз, антиплагиат определяет их не корректно, например относит к цитированию, рис. 5 и 6.



Рисунок 5  Шаблонные фразы определяются как цитирование?



Рисунок 6  Антиплагиат считает шаблонные фразы цитированием


 Одно слово и фраза из двух слов может быть плагиатом, рис. 79.



Рисунок 7  Некорректное определение плагиата в тексте



Рисунок 8  Некорректное определение плагиата в тексте



Рисунок 9  Некорректное определение плагиата в тексте


 Зачастую антиплагиат бездоказателен, вас обвиняют в плагиате, но не показывают источник плагиата, на скрине рис 10, плагиат  фраза «этих операций», переход по ссылке 22, рис. 11, ведет на целую статью, которая, вероятно, содержит фразу «этих операций».



Рисунок 10  Внешняя ссылка антиплагиата


 Модуль цитирования работает не корректно, путая фразы из Конституции РФ с шаблонными фразами;



Рисунок 11  Текст конституционной статьи  шаблонная фраза?


 Титульные листы, заголовки работы, названия ВУЗов и кафедр, фамилии научных руководителей на титульном листе, оглавление  плагиат, рис. 12 и 13.



Рисунок 12  Заголовки  плагиат



Рисунок 13  Оглавление  плагиат


 Целостная фраза может быть на 50% цитированием, а на 50% плагиатом, хотя, правильней отнести ее к цитированию из белого источника, рис. 14.



Рисунок 14  Разрыв при идентификации фразы


 Вас обвиняют в плагиате, указывают источник, рис. 15.



Рисунок 15  Целостное понятие цитирование-плагиат


 Внешняя ссылка ведет на пустую страницу, рис. 16, это называется  отсутствие доказательности при обвинении в плагиате, сколько таких, указывающих в пустоту ссылок, в миллиардном индексе?



Рисунок 16  Антиплагиат дает ссылку на пустую страницу


С началом работы модуля поиска генеративного текста антиплагиат начал чудить, отчет, который хранится на сервере меняет свои показания, рис. 1720.



Рисунок 17  Отчет Антиплагиат от 07.06.2023  10:14:19



Рисунок 18  Отчет Антиплагиат от 07.06.2023  10:14:19, спустя 1 час



Рисунок 19  Отчет Антиплагиат от 27.06.2023  08:51:39



Рисунок 20  Отчет Антиплагиат от 27.06.2023  08:51:39, спустя 1 сутки


Студенты, которые приобрели платные проверки за 472 рубля могли видеть в своих отчетах, что генеративной является нумерация страниц, рис. 21 и 22. Технически Антиплагиат прав, нумерация проставляется в Word автоматически, но как вернуть деньги за некорректную проверку?



Рисунок 21  Нумерация страниц отнесена Антиплагиатом к генеративному тексту ИИ



Рисунок 22  Нумерация страниц отнесена Антиплагиатом к генеративному тексту ИИ


Антиплагиат берет на себя смелость относить текст, написанный человеком к генеративному, рис. 23.



Рисунок 23  Человеческий текст отнесен к генеративному


Ну а это наш любимый скриншот, пустая страница  это генеративный текст, рис. 24.



Рисунок 24  Пустая страница  это генеративный текст


Мы не разбираем результаты проверок конкретных работ, как правило это не делают и преподаватели высшей школы. Единственный критерий оценки студенческих работ в ВУЗах и это не единичный случай  показатель уникальности. В некоторых ВУЗах такой подход узаконен, на оценку «отлично»  75% оригинальности, на оценку «хорошо»  65%.

Против студента играет системная организация, в виде правил ВУЗа и машинно-алгоритмической мощи коммерческого сервиса. Тексты некоторых работ, не содержат достаточного количества изменяемого текста, но от студентов требуют «отжать» показатель уникальности, поэтому приходится перефразировать устоявшиеся в научном мире термины, определения и цитаты. Вероятно, это «натягивание уникальности» не совсем то, что можно связать с академическим подходом.

Если против студентов начали играть нейросети, о применении которых заявил антиплагиат, то справедливо дать студентам аналогичные средства, дабы сражение шло в равных весовых категориях.

1.3. Метод шинглов в повышении уникальности текстов

Шингл (далее  Ш)  последовательность количества слов (2, 3, 4, 5 и т.д.), используемая в алгоритме проверки уникальности текста, рис. 25. Уникальность проверяется путем сравнения текста источника с текстом, который был перефразирован. Данную сверку можно проводить локально, используя бесплатный продукт AntiPlagiarism.NET.

Ваша оценка очень важна

0
Шрифт
Фон

Помогите Вашим друзьям узнать о библиотеке

Скачать книгу

Если нет возможности читать онлайн, скачайте книгу файлом для электронной книжки и читайте офлайн.

fb2.zip txt txt.zip rtf.zip a4.pdf a6.pdf mobi.prc epub ios.epub fb3