У статті проведене дослідження програмних засобів за допомогою яких можна здійснити перевірку тексту на плагіат. Визначено найкращі альтернативи для виявлення запозичень у наукових роботах.
In articlehad been done research of software by means of which you can use to verify the text for plagiarism. Аlso defined the best alternative for the detection of borrowing in scientific investigations.
Головною вимогою при написанні наукового тексту є його унікальність. Перевірка текстового контенту здійснюється за допомогою програмних засобів. Завдяки таким програмам можна здійснити перевірку тексту на унікальність. Для перевірки наукових робіт на унікальність, потрібно використовувати таке програмне забезпечення, яке буде чітко вказувати які частини запозичення тексту було використано, та з яких джерел, щоб дійсно можна було перевірити чи був плагіат. Для цього важливим є аналіз основних, найбільш вживаних програм та он-лайн сервісів, які будуть об’єктом нашого дослідження, і обрати декілька найкращих, за допомогою яких можна провести перевірку наукових робіт.
Аналіз останніх досліджень та публікацій. Питання авторських прав досліджувалися багатьма авторами. Провідними роботами з цієї тематики є праці: В.Я. Іонаса, О.С. Іоффе, В.І. Серебровського, О.Д. Святоцького, Г.Ф. Шершеневича. Ґрунтовними працями сучасних дослідників є роботи: С.О. Глотова, В.В. Коноваленка, Л.Г. Максимова, А.П. Панкєєва, І.В. Порало, І.М. Рассолова, Т.І. Стексової, Р.В. Шарапова, Е.В. Шарапової, О.О. Штефан та інших. Проте, у роботах даних авторів не достатньо розглядалося питання плагіату. Лише кілька останніх років, коли проблема стала серйознішою українські та російські науковці Й. Богдан, І. Порало, Я. Гилинський наполегливо почали досліджувати проблему плагіату. Т. М. Вахонєва розглядала плагіат як різновид порушення авторських прав за законодавством, Г.З. Ефимова, М.Н. Кичерова розглядали причини академічного шахрайства як соціального феномену, причини поділяли за рівнями прояву.
Метою публікації є аналіз сучасних сервісів та програмного забезпечення, що надають можливість перевіряти текстовий матеріал на унікальність.
Виклад основного матеріалу дослідження. Плагіат – це цілеспрямований процес навмисного привласненнята оприлюднення результатів наукової чи творчої діяльності інших людей. У системі вищої освіти у якості пересічних заходів боротьби з компіляцією відпрацьована досить широка методична база. Одним із сучасних напрямків боротьби є виявлення плагіату за допомогою комп’ютерних програм. На сьогоднішній день існує небагато програмних засобів, які допоможуть встановити відсоток унікальності тексту. Тому при виборі програм зверталася увага на те, щоб вони підтримували українську та російську мови, легко встановлювалася і щоб до них був вільний доступ.
Програми, які були обрані для тестування: Сopyscape, Antiplagiat.ru, EtxtАнтиплагіат, Плагіата.НЕТ, Іstio, DoubleContentFinder, AdvegoPlagiatus, Plagiarism-DetectorPersonal, DupeFreePro, Детектор плагіату, Viper, APE Боротьба с Web-плагіатом, DupeCopDesktop, Рasteit.ru, CompareSuite, CognitiveTextAnalyzer.
Програма www.copyscape.com [9] – безкоштовний сервіс, який перевіряє контент українською, російською та англійськими мовами, який поданий в глобальній мережі Інтернет. Перевірити текст, який написаний, але не викладений на будь-якому ресурсі не вдасться.
У вікно потрібно скопіювати адресу сторінки яку потрібно перевірити, і через кілька хвилин буде результат. Для перевірки наукових робіт які є в електронному варіанті, недоцільно використовувати даний сервіс. Для перевірки на унікальність наукові роботи потрібно викладати на веб-сайти, створити електронний блог.
Програма www.antiplagiat.ru [8] – безкоштовний сервіс, за допомогою якого можна перевірити унікальність тексту. Перевірку можна провести двома способами: перший – це скачати програму і встановити її на свій комп’ютер; і друга – скористатись Онлайн-сервісом. Скопіювавши текст у віконце сервісу, натискаємо кнопку «Проверить», і текст буде перевірятись на унікальність. Тестування онлайн-сервісу показало на 15% більше унікального тексту, ніж програми. Отже, можна зробити висновок про низьку якість роботи онлайн-сервісу.
Програма EtxtАнтиплагіат хороша тим, що у ній можна перевіряти написані тексти, всі сторінки потрібного сайту, та вести пакетну перевірку всіх файлів з папки. Пакетна перевірка дозволяє завантажити до програми EtxtАнтиплагіат папку з файлами для одночасної перевірки. Для того, щоб не завантажувати файлів по одному, існує пакетна перевірка. Для перевірки тексту потрібно вставити його у віконце сервісу, і натиснути кнопку «Перевірити на унікальність». Програма працює добре, хоча трохи повільно. Одна наукова робота на 34 сторінки формату doc. перевірялася більше години. Інтерфейс зрозумілий і зручний, не унікальний текст розпізнаний, результат виглядає правдоподібно. З допомогою цієї програми можна перевіряти наукові тексти на унікальність.
Програма Плагіата.НЕТ – безкоштовна, розрахована для пошуку в Інтернеті часткових або повних копій текстових документів. Програма показує ступінь унікальності тексту у відсотках і джерела тексту. Це дає змогу одразу перевірити звідки були взяті запозичення. Програма включає можливість перевіряти сторінки в Інтернеті та друкований текст. Не унікальний текст, тобто плагіат, по закінченню перевірки виділяється іншим кольором. Після завершення перевірки програма «Плагиата.НЕТ» показує час протягом якого здійснювалася перевірка. Ми перевіряли наукову роботу студентів, яка складалася із 34 сторінок протягом 57 хвилин та 54 сек. Програма підтримує формати RTF, DOC, DOCX – можливість роботи з документами Microsoft Word, Microsoft WordPad та інших редакторів. Визначення плагіату відбувається на основі даних двох пошукових систем – Яндекс і Google. Програма є дуже зручно та швидко встановлюється. Вона працює добре, текст перевіряється і вказується початкове джерело, результат хороший. Отже, з допомогою цієї програми можна перевіряти наукові роботи.
Програма http://istio.com/ [10] – безкоштовний он-лайн сервіс для перевірки на унікальність. Текст вставляється у віконце з назвою «Текст для аналізу» і натискається кнопка «Пошук копій». Перевірка унікальності тексту російською мовою здійснюється дуже добре, але для перевірки текстів написаних українською мовою програма не розрахована.
Ще одна програма, яка існує для перевірки унікальності – DoubleContentFinder. Працювати у ній доволі легко – необхідно вибрати один із трьох способів перевірки: перевірка сторінки (вказується URL), вставка з буфера обміну і завантаження файлу з текстом. Уразі не унікальності контенту, буде показано список адрес, з яких були взяті запозичення.
У новому вікні з’явиться сторінка з посиланнями на дубльований контент. Однією з переваг цього сервісу є те, що можна перевірити орфографію та здійснити аналіз тексту: визначити кількість слів, слова, що вживаються в тексті найчастіше та ін. Програма дуже проста у використанні, звіт у вигляді відповідей: «текст унікальний», «текст не унікальний». Навіть з найменшим відсотком не унікальності тексту звіт буде «текст не унікальний». Нам потрібна програма, яка буде у відсотковому відношенню зазначити унікальність перевіреної роботи, тому цю програму ми використовувати не будемо.
Програма AdvegoPlagiatus – перевіряє контент і показує сайти, на яких були збіги матеріалу. Вона показує унікальність тексту у відсотках. За принципом роботи майже не відрізняється від програми «Антиплагіат», хоча «Антиплагіат» має більше можливостей. Текст який перевіряється у AdvegoPlagiatus ділиться на фрази, а потім відбувається пошук подібних фраз в Інтернеті через пошукові машини. Якщо фраза знайдена в Інтернеті, то вона вважається неоригінальною й підсвічується жовтим виділенням. Схожих фраз в Інтернеті можна знайти багато, але це не значить що був факт плагіату. Дана програма не спроможна правильно оцінити унікальність, тому її не варто використовувати.
Програма Plagiarism-Detector Personal – це ідеальне рішення щодо запобігання плагіату. Це персональний сервісний додаток, розроблений для ефективного виявлення, звітності та запобігання плагіату. Програма має простий інтерфейс, роботу можна почати відразу після установки Plagiarism-Detector на комп’ютер. Підтримує обробку документів у пакетному режимі, тобто декілька робіт одночасно. Установка програми є платною, тому її використання буде не легкодоступним.
Програма DupeFreePro – виявляє ступінь схожості текстів та дозволяє перевіряти ступінь унікальності тексту. Функція перевірки текстів на унікальність реалізована не досить добре, і не завжди показує точний результат. За допомогою DupeFreePro з легкістю можна порівнювати декілька текстів між собою на схожість. Ця особливість програми дає можливість використовувати її викладачами у ВУЗах для перевірки своєї бази студентських робіт по роках, і дізнаватися чи використовують студенти наукові роботи своїх попередників. Для нашого дослідження використання програми буде недоцільним, оскільки нам потрібно визначити рівень унікальності текстів.
Детектор плагіату – програма, з допомогою якої можна здійснювати пошук однакових фрагментів тексту, тобто плагіату в мережі Інтернет. Після встановлення програма сканує вибраний текст і показує джерела з яких були взяті запозичення. Пошук не унікального тексту можна здійснювати не лише в Інтернеті, а й на комп’ютері, або на чітко вказаних змінних носіях. Користування цією програмою є платним.
Viper–додаток спочатку сканує документи, а потім перевіряє їх на унікальність. За допомогою Viper можна перевіряти текст на багатьох сайтах та у пресі, яка опублікована в мережі Інтернет. Пошук плагіату може бути здійснений ще на локальному диску комп’ютера. Також програма може перевіряти одночасно два документи і виявити їх рівень схожості. Однаковий текст, який є в обох документах підсвічується іншим кольором, тобто показуються скомпільовані частини. Viper – є платною програмою.
Програма APE Боротьба с Web-плагіатом – виявляє сайти, які запозичують чужі авторські тексти. Для цього додаток замінює у вихідних текстах деякі російські символи на англійські. Зовні це не помітно, але якщо хто-небудь захоче скопіювати чужі тексти і розмістити їх у себе на сайті – знайти злодія програма зможе дуже швидко. Підтримується робота як з файлами, так і з буфером обміну. Користувач може самостійно визначати, які символи варто замінювати, а які – ні. Крім того, програма може автоматично додавати в кінці абзаців потрібні користувачу HTML-теги або будь-який інший текст. Також є можливість заміни символу згідно з його порядковому номеру в кодах ASCII. APE Боротьба с Web-плагіатом також є платною у використанні.
Платна програма DupeCopDesktop порівнює декілька текстів між собою і виявляє їх відсоток схожості і відмінності та шукає плагіат у глобальній мережі Інтернет з відображенням відсотку унікальності тексту. Також DupeCopDesktop відображає кількість слів у тексті та ключові слова. Для визначення схожості текстів між собою DupeCopDesktop може працювати без підключення до Інтернету.
Сервіс www.pasteit.ru [12] перевіряє контент на унікальність (плагіат) по трьох різних пошукових системах Яндекс, Rambler і Google. Важливою відмінністю цього інструменту від інших являється його платність. Десять раз на день можна скористатисяпрограмою, більше – доведеться сплатити 1 руб за кожен пошук. Також це сервіс вимагає розміщення тексту, що перевіряється, на якому-небудь хостингу, тому перевірити контент, тільки що написаний не вдасться.
Програма CompareSuite- не лише виявляє схожість в текстах, але і порівнює файли і папки. CompareSuite випускається у вигляді стандартної і професійної версії. За допомогою стандартної версії програми можливе порівняння таких типів файлів, як Adobe PDF, файлів Word, Excel та веб-сторінок. CompareSuite – не типовий інструмент для порівняння, тому що він може бути використаний для різних типів порівняння – посимвольного, послівного і за ключовими словами. Одна з головних відмінностей в тому, що він дозволяє використовувати різні методи порівняння. Тому завжди можна дізнатися, в якому аспекті файли схожі, а в якому – відмінні. Програма вміє порівнювати також графічні та звукові файли, що безумовно є корисним доповненням до програми. Програма порівнює файли великих розмірів і навіть в архівах. CompareSuite випускається у вигляді стандартної і професійної версії. Професійна версія додатково підтримує елементи необхідні для порівняння файлів і папок розташованих на FTP, дає можливість створення коментарів до файлів і документів, роблячи зручною, наприклад, спільну роботу над написанням тексту в команді. Серйозним недоліком CompareSuite є його занадто висока ціна: 70$ за стандартну і 140$ за професійну версію.
Система автоматичного виявлення плагіату в текстах CognitiveTextAnalyzer, яку представила компанія Cognitive Technologies. Принцип роботи CognitiveTextAnalyzer полягає в наступному. У систему вводиться досліджуваний текст. Далі, CognitiveTextAnalyzer проводить синтаксичний, семантичний і структурний розбір і аналіз тексту, усуває синтаксичні і семантичні неоднозначності і виявляє близько сотні характеристик, властивих даному тексту. Точна кількість характеристик залежить від об’єму тексту і різноманітності конструкцій, що зустрічаються в тексті. Швидкість розбору тексту на сучасному офісному комп’ютері складає 450-500 сторінок тексту в хвилину. В порівняні з іншими програмами ця програма працює дуже швидко.
У прес-службі Cognitive говорять, що на відміну від існуючих систем перевірки на плагіат, що використовують стандартні ознаки, CognitiveTextAnalyzer враховує структурні зв’язки, підлеглість одних конструкцій іншим в рамках пропозиції. Виділені зв’язки інваріантні до перестановки абзаців і пропозицій усередині тексту, контекстній заміні слів.Як показали дослідження, ці характеристики демонструють високу статистичну стійкість в застосуванні до творів конкретного автора. Це дозволяє порівнювати текстові твори, отримувати кількісні оцінки їх близькості і з високою статистичною достовірністю судити про приналежність перу того або іншого автора[11]. Єдиним недоліком програми є те, що вона перевіряє тексти лише російською та англійською мовами.
Висновки. Проведений аналіз програм для виявлення плагіату показав що сучасні засоби перевірки тексту на плагіат не досконалі, існує багато програм для виявлення плагіату, але вони не є універсальними та легкодоступними, часто платними у використанні. Аналіз показав, що найкращими програмами є Плагиата.НЕТ, eTXTАнтиплагіат. За допомого цих систем можна перевіряти наукові роботи і виявляти відсотки запозичень із чужих праць. Програми дозволяють боротися зі світовою тенденцією копіювання чужих робіт, і не поширювати явище крадіжки інтелектуальної власності. Використовуючи такі програмні засоби під час оцінювання студентських робіт, можна отримати обґрунтований висновок про самостійність роботи студентів.
Список використаних джерел та літератури
- Великий тлумачний словник сучасної української мови [Текст] / За ред. В.Т. Бусел. – К.: Ірпінь: ВТФ «Перун». – 2005. – 1728 с.
- Гилинський, Я. Тотальний плагіат как норма российской научной жизни [Електронний ресурс] / Я. Гилинський. – Режим доступу: http://sartraccc.ru/i.php?oper=read_file&filename=Pub/gilinsky(17-10-07).htm. – Назва з екрану.
- Заимствования и плагиат. Накипь и ржавчина в науке [Електронний ресурс]. – Режим доступу: http://trv-science.ru/2009/12/22/sonin-tabl/. – Назва з екрану.
- Пархомов, В.А. Плагиат как угроза модернизации экономики. [Текст] / В.А. Пархомов. – Иркутск, 2010. – 141 с.
- Порало, І.В. Інтелектуальний капітал України в полоні плагіату [Текст] / І.В. Порало. // Теорія і практика управління соціальними системами: філософія, психологія, педагогіка, соціологія. – 2009. – № 4. – 194 с.
- Проверка текстов на плагиат: мастер-класс копирайтера [Електронний ресурс]. – Режим доступу: http://work.free-lady.ru/proverka-tekstov-na-plagiat-master-klass-kopirajtera/. – Назва з екрану.
- Тест на плагіат студентських робіт – престижно і непрактично плагиат [Електронний ресурс]. – Режим доступу: http://vidido.ua/index.php/pogliad/article/test_na_plagiat_students_kih_robit_-_prestizhno_i_nepraktichno/. / – Назва з екрану.
- Antiplagiat [Електронний ресурс]. – Режим доступу: www.antiplagiat.ru./ – Назва з екрану.
- Copyscape [Електронний ресурс]. – Режим доступу:http://www.copyscape.com/./ – Назва з екрану.
- Istio [Електронний ресурс]. – Режим доступу: http://istio.com/./ – Назва з екрану.
- Cognitive Technologies представляє Систему автоматичного аналізу та порівняння текстів[Електронний ресурс]. – Режим доступу: http://iukraine.runwww.iukraine.ru/2011/12/19/cognitive_technologies_predstavlya_sistemu_avtomatichnogo_analzu_ta_porvnyannya_tekstv.html. /– Назва з екрану.
- Pasteit [Електронний ресурс]. – Режим доступу:www.pasteit.ru. / – Назва з екрану.