Dzięki JSA uwidaczniają się problemy nieznane, gdy tego systemu nie było. Dzisiaj wielu z nas zastanawia się, skąd tyle podobieństw w pracach dyplomowych. A odpowiedź jest prosta: one tam zawsze były, tylko nie były widoczne. Z dr. Andrzejem Sobeckim z Politechniki Gdańskiej rozmawia Tomasz Jurczak
Tomasz Jurczak: Od 1 stycznia polskie uczelnie weryfikują pod kątem plagiatu prace składane do obrony w Jednolitym Systemie Antyplagiatowym*. Jak sprawdzały je do tej pory?
Dr Andrzej Sobecki: Były inne rozwiązania, między innymi system Plagiat.pl. Na polski rynek próbowała też wejść amerykańska firma Turnitin – to bardzo dobry system, ale niedostosowany do naszych realiów językowych i rodzaju prac, jakie generujemy w kraju. Mieliśmy też system Genuino, ale był dostępny bardzo krótko.
Wreszcie mieliśmy też do wyboru Otwarty System Antyplagiatowy OSA, system stworzony przez organizacje zrzeszające Międzyuniwersyteckie Centrum Informatyzacji (MUCI), Instytut Podstaw Informatyki PAN oraz Poznańskie Centrum Superkomputerowo-Sieciowe. Poza tym uczelnie tworzyły własne rozwiązania, jak na przykład SOWI Politechniki Gdańskiej. Niestety, skuteczność tych systemów była limitowana bazami referencyjnymi, stosowanymi algorytmami i ograniczonymi zasobami.
Jednolity System Antyplagiatowy (JSA) sprawnie pokonał wymienione trudności, tworząc swoje algorytmy od podstaw, budując ogromną bazę referencyjną, czyli Ogólnopolskie Repozytorium Pisemnych Prac Dyplomowych, i wykorzystując zasoby naukowych klastrów komputerowych dostępnych w kraju.
Do momentu powstania i wdrożenia JSA uczelnie w Polsce sporadycznie wykorzystywały tego typu rozwiązania, szczególnie działające na taką skalę. Wejście z takim systemem do uczelni było dobrą decyzją, bo to nie tylko wprowadzenie narzędzia do porównywania fragmentów tekstów, ale także początek ujednolicania procesu obrony prac i definiowania standardów tego, co uznajemy za plagiat. Dziś wciąż wielu uczestników tego procesu myli pojęcia podobieństwa z plagiatem, a nasze uczelnie nie mają doświadczenia w wykorzystaniu systemów podobnych do JSA.
Z czego mogą wynikać podobieństwa, o których pan mówi?
W każdej dyscyplinie stosuje się różne źródła, odmienne są standardy pisania prac. To poważny problem, na który często zwracaliśmy uwagę: zdarzają się dyscypliny, w których jest sporo podobnej tematyki lub niektóre materiały są wręcz identyczne. Na przykład w przypadku prac z architektury będą zmieniały się tylko opisywane budynki, reszta materiału bazuje bowiem na ustawach czy rozporządzeniach.
Przed wdrożeniem JSA analiza antyplagiatowa prowadzona była na zbiorze ograniczonym do dokumentów znanych wybranemu promotorowi
Mamy też prace typowo inżynieryjne, gdzie są projekty budowlane. Stąd wynika ważny aspekt dostępu do źródeł. Prace w takich dziedzinach charakteryzuje zazwyczaj wysoki poziom podobieństwa, który wynika głównie z szablonu opisowego lub metodologii obliczeń używanych przez studentów. Ponadto tworzonych jest wiele prac opisowych, które dotyczą podobnej tematyki i muszą niejednokrotnie opisywać te same pojęcia, na przykład prawo popytu, podaży czy bilans finansowy przedsiębiorstwa.
Korzysta pan z JSA na co dzień. Jaki jest?
Jest jednym z lepszych systemów informatycznych, jakie w ogóle powstały z myślą o wspieraniu procesów na uczelniach. Należy podkreślić, że w pierwszym roku funkcjonowania osiągnął bardzo dużą dojrzałość w porównaniu do tych systemów, które już gdzieś działają na rynku. Docierają też do mnie głosy, że wiele osób, porównując na przykład raporty z JSA z Plagiat.pl, wskazuje na wyższość tego pierwszego ze względu na dużą bazę referencyjną.
Z mojej perspektywy wygląda to tak, jeżeli mam tematy bardzo zmienne, czyli nie powtarzam tematyki, wymuszam na studentach pracę, w której oni sami wyszukują źródła, komentują je i nie są to rzeczy łatwe do odnalezienia w internecie – to te prace w JSA osiągają poziom do 5 proc. PRP**. Co więcej, w momencie gdy mamy prace dyplomowe realizowane w ramach współpracy z przemysłem, to osiągają one najczęściej podobieństwa na poziomie nawet 0 czy 1 procent. To są prace wykonywane na podstawie źródeł i opracowań dostępnych w firmach, a nie na zasobach przedstawionych studentom podczas zajęć czy spotkań na uczelni.
Czyli da się pisać prace unikalne niemal w 100 procentach?
Oczywiście. Takie studenckie tłumaczenia, że tego się nie da inaczej opisać, bo to taka dziedzina, a nie inna, to pierwsza reakcja, z jaką my jako eksperci od systemów antyplagiatowych się zderzamy. Często, kiedy zarzucamy komuś, że w jego pracy są zbyt duże podobieństwa w stosunku do innej, wynika to z faktu, że student jest prowadzony za rękę i na przykład otrzymał wzór pracy dyplomowej dotyczącej podobnej tematyki. Mając taki wzór, student zaczyna się nie tyle inspirować, ile po prostu przepisywać. Tylko że równie często zapomina oznaczyć przepisaną treść jako cytowanie.
Co jest najważniejsze dla uczelni, by skutecznie wykrywać plagiaty?
Przede wszystkim standaryzacja procedur i metod postępowania. W celu wykrycia podobieństwa między pracami dyplomowymi trzeba posiadać referencyjną bazę dyplomów. Ważne jest również, aby prace dyplomowe były przesyłane do ministerstwa w ściśle określonym czasie. Taka standaryzacja, jaką JSA na swój sposób wymusza, jest bardzo potrzebna.
Jakość tego systemu oceniam wysoko. Przeszedł już swoje stress testy w środowisku rzeczywistym i mimo kilku potknięć nie spowodował tak dużych opóźnień, do jakich dochodziło w przypadku systemów komercyjnych.
Efektywność też jest w jego przypadku na właściwym poziomie. A jeżeli chodzi o czułość, to pozostaje pytanie, co chcemy uzyskać. Czy chcemy mieć taki system, który inteligentnie podejmie za nas decyzję i będzie wszystko robił sam? A może potrzebujemy narzędzia do przeszukiwania zbiorów danych? Bo w systemach antyplagiatowych chodzi głównie o to, by zbudować efektywny indeks dużych zbiorów danych, przeszukać je w ciągu kilku minut i wygenerować odpowiedź. System powinien odpowiadać na pytanie, czy jeden fragment jest podobny do drugiego. Następnie ekspert może oceniać, czy jest podstawa do uznania pracy za plagiat, czy też ta praca ma autorski charakter. Podobieństwo dwóch fragmentów nie jest jednoznaczne z tym, że nastąpił plagiat.
Coś by pan do tego systemu dodał?
Warto by pomyśleć o inteligentnym wykluczaniu źródeł, które powtarzają się w kolejnych pracach z danej dyscypliny. Bo taka sytuacja to nie może być przypadek. Wiele komentarzy w pracach o podobnej tematyce będzie do siebie podobnych. Na przykład analiza finansowa jakiegoś przedsiębiorstwa nie będzie wykonana w sposób innowacyjny, lecz zostanie stworzona w oparciu o istniejące normy prawne i standardy, a studenci będą się powoływali na te same twierdzenia z literatury przedmiotu.
Można by zatem pewne elementy wykluczać automatycznie, ewentualnie na życzenie użytkownika dołączać je do takiego raportu. Rolą promotora jest, by to od siebie odróżniać i, powiedzmy, przepuszczać dalej tego typu prace mimo 60-procentowego podobieństwa w stosunku do innych źródeł. Odpowiedzialność promotorów w tym przypadku jest bardzo mocno akcentowana. Takiej oceny na razie nie przeprowadza żaden system antyplagiatowy.
W systemach amerykańskich jest taka funkcja jak macierz oceny. Jeżeli zdefiniujemy kryteria, które stosujemy podczas oceny, to system może nam automatycznie wyliczyć przybliżoną ocenę końcową, która prawdopodobnie należy się danej pracy. My jeszcze tego nie stosujemy.
Czym w rzeczywistości ma być JSA dla uczelni?
JSA jest narzędziem dla promotorów, a nie wyrocznią wskazującą plagiat czy jego brak. Nawiążę tu do dwóch problemów często spotykanych na uczelniach, które wykorzystywały Plagiat.pl czy inne rozwiązania.
Kiedy jeździłem na konferencje i propagowaliśmy rozwiązania antyplagiatowe, pokazywaliśmy inny sposób myślenia niż ten charakteryzujący firmy działające na rynku. Wskazywaliśmy, że system antyplagiatowy to jest miernik, jak miernik prądu. On ci nie powie: uważaj, musisz zrobić to albo tamto. Miernik wskazuje: tu jest prąd, ma takie napięcie, takie natężenie, taki jest opór tego elementu. To ty jesteś ekspertem, więc podejmij decyzję na podstawie tego, co wskazuje miernik. Decyzja będzie najczęściej zależeć od kontekstu, w jakim dokonywany jest pomiar.
System antyplagiatowy to jest miernik, jak miernik prądu, który wskazuje: tu jest prąd, ma takie napięcie, takie natężenie, taki jest opór tego elementu. To ty jesteś ekspertem, więc podejmij decyzję na podstawie tego, co wskazuje miernik
Druga sprawa to popularne na niektórych uczelniach uproszczenia dotyczące na przykład procedury oceny raportów podobieństwa wygenerowanych dla prac dyplomowych. Dla ułatwienia tego procesu definiowano dwa lub trzy wskaźniki, określało się ich zakresy, a następnie na tej podstawie oceniało. Jeśli praca była w zakresie „od do”, to można było podjąć określoną decyzję, na przykład zaakceptować pracę. I mieliśmy czarno-białą sytuację. Ze względu na dużą liczbę dyplomantów takie uproszczenia były stosowane, gdyż skracają czas potrzebny na analizę raportu podobieństwa.
A drugi problem?
To uproszczenia, które wciąż pokutują na uczelniach, związane z procedurami obrony prac dyplomowych. Oceniający chcieliby prostego narzędzia, prostej instrukcji mówiącej: jeżeli to, to zrób to. Tyle że podczas oceny pracy powinna działać logika rozmyta, a nie zerojedynkowa. Tu nie ma czarno-białych sytuacji. Tu wszystko jest szare. To od nas zależy, czy jako eksperci potrafimy stwierdzić, czy student mógł zaproponować samodzielnie określone hipotezy, czy je po prostu przepisał.
Jaki maksymalny poziom podobieństwa do innych źródeł może mieć praca, by nie została uznana za plagiat?
Tego się nie da sztywno określić. W zasadzie sam model JSA trochę przełamuje spekulacje, czy wynik 10-15 procent daje pewność, że praca jest autorska. Bo nie musi dawać. Mieliśmy przypadki, gdzie ten wskaźnik był niższy, wynosił na przykład 20 procent, ale okazało się, że student wykorzystał komentarze i badania, które okazały się parafrazą innej pracy dyplomowej, obronionej rok wcześniej. Więc ten wskaźnik nie był w sumie wysoki, a wyszło podobieństwo, które dyskwalifikowało tę pracę.
Z drugiej strony mamy prace z dziedziny bardziej humanistycznej, gdzie te wskaźniki są wyższe. Wynika to jednak z tego, że zdarza się duża kompilacja dokumentów, więc mamy czasem 70 procent podobieństwa. Co zrobić z taką prącą? Odrzucić ją czy zaakceptować? Jeżeli te fragmenty są prawidłowo zacytowane i widzimy, że student zdaje sobie sprawę, iż to nie jest jego fragment, to w naszej gestii pozostaje ocena, czy poziom części napisanej samodzielnie świadczy o wiedzy autora i autorskim charakterze pracy dyplomowej.
Jakieś przykłady?
Zjawiska popytu czy podaży nie opisze pan samodzielnie, bo one zostały już określone, postępowanie w sprawie procedur upadłościowych też skądś trzeba pobrać. Można wskazać pewne kwestie, których studenci nie wymyślą. W pracach dyplomowych na KUL-u źródłem będzie głównie Biblia, to z niej czerpie się cytaty. Pozostaje więc pytanie, czy myśl zawarta w pracy, na przykład te 10-15 procent tekstu, wystarczy, by uznać całą pracę za zgodną z wymogami.
Czyli wszystko zależy od ustawienia reguł?
Tak. Pytanie, czy chcemy mieć system, który podejmuje decyzje za nas, a my tylko te decyzje przyjmujemy, czy też elastycznie podchodzimy do każdej sytuacji.
Niektórzy utyskują, że w JSA brakuje źródeł, na przykład internetowych.
W każdym systemie antyplagiatowym możemy wskazać, że nie ma takich źródeł, jakie są nam potrzebne. System jest ograniczony do tych dokumentów, które zna. Uważam JSA za sukces w procesie wykrywania podobieństwa w pracach dyplomowych, bo na tym poziomie, na którym on je wykrywa, praktycznie żaden system na rynku nie jest w stanie zrobić czegoś podobnego. Analiza źródeł internetowych jest obecnie realizowana w oparciu o kopię polskich stron internetowych. Jednak wiele źródeł polskojęzycznych jest również dostępnych na serwerach zagranicznych i mogą one zostać pominięte podczas analizy.
Pytanie, czy chcemy mieć system, który podejmuje decyzje za nas, a my tylko te decyzje przyjmujemy, czy też elastycznie podchodzimy do każdej sytuacji
Kolejnym problemem jest efektywność przeszukiwania Internetu. Gdyby ten proces był prosty, to obecnie mielibyśmy na rynku więcej dobrych silników wyszukiwania, a nie jedynie Google czy Bing.
Czy przez JSA pracownicy uczelni mają więcej pracy?
Zanim rozpoczęliśmy wdrażania systemu SOWI, w kraju funkcjonował model, w którym prace dyplomowe mogła wgrywać do systemu tylko wskazana na uczelni lub wydziale osoba. Następnie tylko ona mogła analizować raporty z prac dyplomowych i wysyłać informacje, czy pracę można zaakceptować, czy też nie. Teraz proszę sobie odpowiedzieć na pytanie, ile to wszystko trwało. Jedna osoba odpowiedzialna za przetwarzanie wszystkich prac tworzonych na wydziale lub uczelni.
Taka sytuacja oznaczała dodatkowe etaty, obciążenia finansowe uczelni itp. Nowy model pozwala różnym specjalistom na wydziałach równolegle prowadzić proces analizy prac dyplomowych.
Czyli promotor ma więcej pracy.
Promotor w okresie prowadzenia prac dyplomowych i tak musi kontrolować, czy dana praca nie zawiera naruszeń, czy student poprawnie zacytował źródła itp. Dogłębna analiza takiej pracy bez narzędzia, które wspomagałoby nas w przeszukiwaniu baz dyplomów, artykułów czy z książek, trwałaby jeszcze dłużej.
Dzięki JSA uwidaczniają się problemy nieznane, gdy tego systemu nie było. Dzisiaj wielu z nas zastanawia się, skąd tyle podobieństw w pracach dyplomowych. A odpowiedź jest prosta: one tam zawsze były, tylko nie były widoczne. Różnica polega na tym, że do tej pory ocena autorskiego charakteru pracy dyplomowej dokonywana była w krótszym czasie ze względu na ograniczony zasób informacji, a teraz mamy dodatkowe źródła informacji i musimy je uwzględnić podczas tej oceny. Nie możemy obwiniać systemu za to, że wskazuje potencjalne podobieństwa. Ręczna analiza każdej pracy dyplomowej i porównanie jej z tysiącami dokumentów znajdujących się w repozytorium prac dyplomowych trwałaby znacznie dłużej niż analiza końcowego raportu podobieństwa. Przed wdrożeniem JSA ręczna analiza prowadzona była na zbiorze ograniczonym do dokumentów znanych wybranemu promotorowi.
Jak dziś wygląda analiza pracy pod kątem plagiatu?
Na naszej uczelni wszystkie prace, które osiągnęły wskaźnik podobieństwa powyżej 20 procent, wymagają kontrasygnaty pełnomocnika rektora. Konsultując się z promotorami, decydujemy wspólnie, czy dana praca może być przyjęta i czy promotor ma wszystkie informacje pozwalające podjąć właściwą decyzję.
Dzięki JSA jestem w stanie podejmować jakąkolwiek polemikę z promotorem – w końcu nie jestem specjalistą w każdej dziedzinie. W wygenerowanym raporcie widzę zaznaczone pasaże tekstu, zapoznaję się z treścią pracy oraz szukam wskazanych w raporcie źródeł, a także analizuję cytowania. I pytam promotora: Czy to zapożyczenie lub ten fragment jest dopuszczalny w waszej dziedzinie? Czy ta literatura jest poprawnie wskazana? Czy tu nie brakuje jakichś elementów? W ciągu roku promotor prowadzi około dziesięciu prac dyplomowych i moim zdaniem wraz ze wzrostem doświadczenia jest on w stanie sprostać walidacji raportów dla tych prac.
Algorytm JSA jest skuteczny?
Pytanie, o którym algorytmie mówimy. W systemach antyplagiatowych algorytmów jest zazwyczaj kilka, a czasem kilkanaście. Mamy oddzielny algorytm do indeksowania dokumentu, inny do wydobywania fraz kluczowych, kolejny do przeszukiwania repozytoriów w poszukiwaniu tych fraz kluczowych, jeszcze inny do porównywania dokumentów wyselekcjonowanych ze zbioru z dokumentem, który w danej chwili sprawdzamy.
Jeżeli chodzi o algorytm przeszukiwania repozytorium, to system działa bardzo dobrze i znajduje dokumenty źródłowe mimo braku identycznych fragmentów. Sprawność algorytmu porównywania treści w przypadku JSA odznacza się wysoką skutecznością, ponieważ nie sprawdza on zdań litera po literze. Znane są metody oszukiwania obecnych systemów antyplagiatowych – to wynika po prostu z logiki działania algorytmów używanych w tych systemach. Algorytm, który działa w JSA, jest dość nieczuły na wiele takich praktyk stosowanych w internecie, jak na przykład parafrazowanie treści oryginalnego dokumentu, stosowanie synonimów czy zmiana szyku zdania.
Nadal jednak wiele rozwiązań antyplagiatowych nie identyfikuje treści przedstawionej w formie obrazów. Dlatego istotne jest właściwe kontrolowanie dokumentu umieszczanego w JSA. Należy zwrócić uwagę, czy możliwe jest skopiowanie treści z dokumentu napisanego przez studenta. Tyle że to jest powszechny model przetwarzania dokumentów w systemach antyplagiatowych, ponieważ obecnie nie wykonuje się automatycznego OCR [optycznego rozpoznawania znaków] na zamieszczonych w pracy zdjęciach.
Czy sztuczna inteligencja mogłaby pomóc w stworzeniu idealnego systemu antyplagiatowego? Jak by pan sobie go wyobrażał?
Ważne byłoby opracowanie metod skracających czas potrzebny na analizę raportu – czy to pochodzącego z JSA, czy innego systemu antyplagiatowego. Myślę, że udałoby się to zrobić. Algorytm musiałby się jednak nauczyć danej dziedziny – nauczyć się roli promotora i eksperta ds. systemów antyplagiatowych, czyli tego, jak się ocenia pracę z konkretnej dziedziny. Do tego potrzebna byłaby analiza oceny prac już obronionych, analiza samych ocen, nauczenie się, co jest eliminowane przy takim sprawdzaniu, czego nie uwzględniamy. To jednak byłoby bardzo trudne.
Dla skrócenia czasu analizy raportu łatwiej byłoby znaleźć i wyselekcjonować źródła, które jesteśmy w stanie pominąć, bo wiemy, że będą się w pracy pojawiały – a nie wpływają na ocenę tego, czy dana praca to plagiat, czy nie. Uwolniłoby nas to przy okazji od wielu problemów z podobieństwem prac. Jednym z rozwiązań doraźnych, które można zastosować, jest wyświetlanie jednego rodzaju raportu, w którym pomijane są fragmenty oznaczone w pracy jako cytowania. Wymagałoby to ustalenia metod cytowania, które są dopuszczalne. Innym rozwiązaniem jest prosta ankieta, w której promotor podczas oceny wyników raportu zaznaczałby literaturę wskazaną w pracy dyplomowej jako akceptowaną. Wynikiem udzielenia odpowiedzi na takie pytanie byłoby ukrycie pasaży, które odwołują się do wybranej literatury. Pytaniem otwartym pozostaje, taki zestaw reguł byłby uniwersalny w skali kraju, czy tylko ograniczałby się do prac dyplomowych określonego opiekuna.
W systemach antyplagiatowych algorytmów jest zazwyczaj kilka, a czasem kilkanaście. Mamy oddzielny algorytm do indeksowania dokumentu, inny do wydobywania fraz kluczowych, kolejny do przeszukiwania repozytoriów w poszukiwaniu tych fraz kluczowych, jeszcze inny do porównywania dokumentów wyselekcjonowanych ze zbioru z dokumentem, który w danej chwili sprawdzamy
Pytanie, czy to wina systemu, że praca zawiera wiele fragmentów podobnych do innych źródeł.
Oczywiście, to bardzo ważna sprawa. Studenci powinni udowodnić w swoich pracach dyplomowych, że znają literaturę przedmiotu. Problem leży gdzie indziej. Jeżeli promotor dopuszcza do tego, że student dysponuje kompletem materiałów, które opracowali inni studenci, i pozwala z nich korzystać, to siłą rzeczy praca będzie pełna treści podobnych do tych umieszczonych w pracach napisanych wcześniej – przekazanych studentowi. Winę za to, że analiza raportu trochę trwa, po części ponoszą wszyscy: autor – bo chce napisać coś możliwie szybko; promotor – bo ma wielu dyplomantów i nie może każdemu poświęcić tyle czasu, ile by chciał, i system antyplagiatowy – bo nie zna realiów rynku i pokazuje wszystko, co algorytmy uznają za podobne do wcześniej opublikowanych dokumentów. Czas weryfikacji zależy od tych trzech elementów, nie tylko od systemu. On tylko pokazuje stan rzeczywisty.
Czy JSA uwzględnia wystarczająco dużo źródeł?
Każdemu systemowi można zarzucić, że nie ma wystarczającej liczby źródeł, nie ma mocnej bazy referencyjnej na tyle, by pozwalała zweryfikować każdą pracę. Albo że jego źródła nie uwzględniają tych w języku angielskim. Tyle że jeśli jakaś praca jest napisana po polsku, to co nam da to, że baza jest anglojęzyczna?
Może tak być, że system nie odpowiada potrzebom danej dziedziny, więc trzeba wprowadzić jakieś zmiany. Pytanie, czy się da. Ministerstwo ma narzędzia do tego, obecnie funkcjonują przecież zbiory naukowe, które są udostępniane uczelniom, pytanie, czy da się je wykorzystać. To jest zarzut, który powiela się od lat: ten system nie zna aktów prawnych, tamten nie zna norm budowlanych, a ów – obowiązujących standardów. Wraz z rozwojem systemu antyplagiatowego, na przykład JSA, można dodać do niego każdą bazę referencyjną. Obecnie każda uczelnia w Polsce może dodać do JSA własną bazę referencyjną dokumentów, ale niewiele podmiotów skorzystało dotychczas z tej opcji.
Skoro mamy dobry system, to walka z plagiatami powinna być skuteczniejsza.
Niestety, w Polsce jesteśmy wciąż bardzo pobłażliwi, jeśli chodzi o plagiaty. Czasem pojawiają się nawet głosy oburzenia, że system pokazał nam tak dużo, a powinien mniej. Często promotor czy eksperci na uczelniach zastanawiają się, czy daną pracę, która zawiera podobieństwa, a jednocześnie reprezentuje wysoki poziom merytoryczny, uznać za plagiat – a wielu wymaga, by system zrobił to automatycznie. Uważam, że jeśli student uzasadni, po co i skąd wziął zapożyczenia, odpowiednio je zacytuje, a w samej pracy jest wymagany element autorski, to taką pracę należy przepuścić. Po roku działania JSA na naszej uczelni widzimy, że istnieją dziedziny, w których 20 procent podobieństwa pracy dyplomowej jest już dyskwalifikujące, ale są również takie, dla których te 20 procent stanowi pewną normę. Wynika to z tematyki, wykorzystywanych standardów, kopiowania aktów prawnych itd.
Jak pan widzi przyszłość takich systemów w Polsce?
Wszystko zależy od ludzi. Myślę, że pójdziemy w stronę uściślenia i ustandaryzowania procesu oceny – czy to poprzez materiały dodatkowe dodawane do systemu, czy przez instrukcje, czy narzędzia powalające na wzmacnianie systemu, uczenie się sposobu działania i oceny danego promotora. Przede wszystkim musimy wyedukować studentów – ale też nauczyć promotorów, jak postępować, gdy na uczelni pojawia się system antyplagiatowy.
Bo najważniejsze pytanie brzmi: Czy to będzie rozwój ludzi, czy systemu? Na ten moment JSA spełnia oczekiwania, które były w nim pokładane. Wiele innych rozwiązań po kilku latach na rynku miało niższą skuteczność niż JSA w pierwszym roku funkcjonowania. Jego efektywność jest bardzo duża, wykonywanie takich analiz, jakie on wykonuje, w skali całego kraju na tym poziomie skuteczności uważam za sukces. Jego autorzy stworzyli naprawdę udany produkt.
Jednak pamiętajmy, że działanie każdego systemu opiera się na współpracy z ludźmi. Może należałoby przygotować krótką książkę, instrukcję mówiącą, jak postępować z raportem antyplagiatowym – i dać tę książkę promotorom?
Dostrzega pan jakieś zagrożenia?
Tak, jeśli chodzi o kwestie prawne. Proszę sobie wyobrazić, że uczelnia korzysta z systemu, który wskazuje, że dana praca ma wysoki stopień podobieństwa, jednak zostaje dopuszczona do obrony. A potem w tej opublikowanej już pracy elementy swoich publikacji znajduje ich pierwotny autor. Do kogo zwróci się z pretensjami w kwestii praw autorskich? Do studenta, którego być może nie ma już na uczelni ani w Polsce? Nie, taka osoba zwróci się bezpośrednio do uczelni. To są problemy prawne, z którymi uczelnie będą się borykać już wkrótce. JSA jest jednym z narzędzi, które mają chronić uczelnie przed tego typu problemami.
*Jednolity System Antyplagiatowy powstał w Laboratorium Inżynierii Lingwistycznej działającym w Ośrodku Przetwarzania Informacji – Państwowym Instytucie Badawczym w Warszawie. OPI PIB jest wydawcą portalu sztucznainteligencja.org.pl.
**PRP – Procentowy Rozmiar Podobieństwa. Tak opisywał go współtwórca JSA Marek Kozłowski w rozmowie z nami: „System wykrywa odsetek pasaży tekstu w badanej pracy podobnych do pasaży w innych pracach. Jeśli więc wykryłem w pracy trzy rozłączne pasaże, a każdy ma 30 znaków, to mam w sumie 90 znaków wykrytych pasaży. Dzielę to przez rozmiar całej pracy (całkowitą liczbę znaków) i otrzymuję PRP. Czyli wskaźnik tego, ile tekstu mojej pracy pochodzi z innych prac”.
Dr Andrzej Sobecki jest adiunktem w Katedrze Architektury Systemów Komputerowych na Wydziale Elektroniki, Telekomunikacji i Informatyki Politechniki Gdańskiej i pełnomocnikiem rektora do spraw stosowania systemów antyplagiatowych.