Wyszukiwanie:
|
|
Sortowanie:
|
|
|
Bibliografia Publikacji Pracowników PK (50021) | Inne bazy bibliograficzne (15019) Architektura i Sztuka Krakowa (2298) | Historia i Ludzie PK – baza w przygotowaniu (0) | Konferencje Krynickie - Referaty (7776) LXVII Konferencja Naukowa, 2022 (41) | LXVI Konferencja Naukowa, 2020 (67) | LXV Konferencja Naukowa, 2019 (58) | LXIV Konferencja Naukowa, 2018 (139) | LXIII Konferencja Naukowa, 2017 (136) | LXII Konferencja Naukowa, 2016 (150) | LXI Konferencja Naukowa, 2015 (145) | LX Konferencja Naukowa, 2014 (190) | LIX Konferencja Naukowa, 2013 (110) | LVIII Konferencja Naukowa, 2012 (168) | LVII Konferencja Naukowa, 2011 (111) | LVI Konferencja Naukowa, 2010 (130) | LV Konferencja Naukowa, 2009 (108) | LIV Konferencja Naukowa, 2008 (161) | LIII Konferencja Naukowa, 2007 (161) | LII Konferencja Naukowa, 2006 (123) | LI Konferencja Naukowa, 2005 (113) | L Konferencja Naukowa, 2004 (165) | XLIX Konferencja Naukowa, 2003 (125) | XLVIII Konferencja Naukowa, 2002 (137) | XLVII Konferencja Naukowa, 2001 (154) | XLVI Konferencja Naukowa, 2000 (140) | XLV Konferencja Naukowa, 1999 (161) | XLIV Konferencja Naukowa, 1998 (140) | XLIII Konferencja Naukowa, 1997 (153) | XLII Konferencja Naukowa, 1996 (164) | XLI Konferencja Naukowa, 1995 (173) | XL Konferencja Naukowa, 1994 (151) | XXXIX Konferencja Naukowa, 1993 (148) | XXXVIII Konferencja Naukowa, 1992 (117) | XXXVII Konferencja Naukowa, 1991 (125) | XXXVI Konferencja Naukowa, 1990 (109) | XXXV Konferencja Naukowa, 1989 (150) | XXXIV Konferencja Naukowa, 1988 (177) | XXXIII Konferencja Naukowa, 1987 (195) | XXXII Konferencja Naukowa, 1986 (190) | XXXI Konferencja Naukowa, 1985 (180) | XXX Konferencja Naukowa, 1984 (143) | XXIX Konferencja Naukowa, 1983 (141) | XXVIII Konferencja Naukowa, 1982 (120) | XXVII Konferencja Naukowa, 1981 (160) | XXVI Konferencja Naukowa, 1980 (169) | XXV Konferencja Naukowa, 1979 (177) | XXIV Konferencja Naukowa, 1978 (143) | XXIII Konferencja Naukowa, 1977 (120) | XXII Konferencja Naukowa, 1976 (143) | XXI Konferencja Naukowa, 1975 (132) | XX Konferencja Naukowa, 1974 (151) | XIX Konferencja Naukowa, 1973 (131) | XVIII Konferencja Naukowa, 1972 (112) | XVII Konferencja Naukowa, 1971 (120) | XVI Konferencja Naukowa, 1970 (116) | XV Konferencja Naukowa, 1969 (75) | XIV Konferencja Naukowa, 1968 (114) | XIII Konferencja Naukowa, 1967 (100) | XII Konferencja Naukowa, 1966 (106) | XI Konferencja Naukowa, 1965 (81) |
| Niepublikowane prace naukowe pracowników PK (1994-2012) (4941) |
|
Typy zasobów
Jednostki PK
Tematyka bazy Historia i Ludzie PK
Opcje
| | Krzysztof Rzecki System gromadzenia i przetwarzania dokumentów tekstowych celem rozpoznawania podobieństw (plagiatów) w opracowaniach akademickich typ: niepublikowana praca | |
|
|
Wariant tytułu | | Collecting and processing text documents system for text documents similarity measurements investigation (plagiarism detection) in academic essays | Rok ukończenia pracy | | 2008 | Jednostka wykonująca | | Politechnika Krakowska Instytut Teleinformatyki |
Rodzaj pracy | | naukowa | Klasyfikacja PKT | | [412521] Programy i oprogramowanie użytkowe. Biblioteki programów [412700] Przetwarzanie danych. Przygotowanie danych [415200] Banki danych [412500] Oprogramowanie komputera [410000] Informatyka | Słowa kluczowe autorskie | | Przetwarzanie języka naturalnego Korpus języka polskiego Lematyzacja Stop-słowa Plagiat Natural language processing Polish language corpora Lemmatization Stop-words Plagiat | Abstrakt | | Zbudowano kilka różnych tematycznie korpusów z tekstami w języku polskim o łącznej wielkości przekraczającej 120 mln słów. Zaimplementowano i przetestowano algorytmy tokenizacji tekstu do postaci ... więcejZbudowano kilka różnych tematycznie korpusów z tekstami w języku polskim o łącznej wielkości przekraczającej 120 mln słów. Zaimplementowano i przetestowano algorytmy tokenizacji tekstu do postaci umożliwiającej dalszą obróbkę. Zaimplementowano algorytmy przetwarzania tekstu (w tym nowatorskie wyznaczanie stop-słów oraz lematyzacja) pozwalających na wielopoziomowe porównywanie. Zbadano własności oraz korelacje wskaźników wyrażających podobieństwo w tekstach na różnych etapach przetwarzania (w tym nowatorski wskaźnik podobieństwa). Zgromadzono rzeczywiste prace studenckie i zbadano opracowane algorytmy. Zaprojektowano i zbudowano system gromadzenia, przetwarzania i badania dokumentów tekstowych.
A number of different Polish language corpora of the total size of over 120 mln words were built. Tokenization algorithms to make texts available for future processing were implemented. Text processing ... więcejA number of different Polish language corpora of the total size of over 120 mln words were built. Tokenization algorithms to make texts available for future processing were implemented. Text processing algorithms (including innovative stop-words selection and lemmatization) enabling a multilevel text comparison were implemented. Correlations of coefficients used to calculate similarities in text documents on various processing levels (including innovative similarity coefficient) were examined. Actual students' essays were collected to examine the implemented algorithms. Computer system to collect, process and compare text documents was designed and built. |
|