Wyszukiwanie:
|
|
Sortowanie:
|
|
|
Bibliografia Publikacji Pracowników PK (50021) | Inne bazy bibliograficzne (15019) Architektura i Sztuka Krakowa (2298) | Historia i Ludzie PK – baza w przygotowaniu (0) | Konferencje Krynickie - Referaty (7776) LXVII Konferencja Naukowa, 2022 (41) | LXVI Konferencja Naukowa, 2020 (67) | LXV Konferencja Naukowa, 2019 (58) | LXIV Konferencja Naukowa, 2018 (139) | LXIII Konferencja Naukowa, 2017 (136) | LXII Konferencja Naukowa, 2016 (150) | LXI Konferencja Naukowa, 2015 (145) | LX Konferencja Naukowa, 2014 (190) | LIX Konferencja Naukowa, 2013 (110) | LVIII Konferencja Naukowa, 2012 (168) | LVII Konferencja Naukowa, 2011 (111) | LVI Konferencja Naukowa, 2010 (130) | LV Konferencja Naukowa, 2009 (108) | LIV Konferencja Naukowa, 2008 (161) | LIII Konferencja Naukowa, 2007 (161) | LII Konferencja Naukowa, 2006 (123) | LI Konferencja Naukowa, 2005 (113) | L Konferencja Naukowa, 2004 (165) | XLIX Konferencja Naukowa, 2003 (125) | XLVIII Konferencja Naukowa, 2002 (137) | XLVII Konferencja Naukowa, 2001 (154) | XLVI Konferencja Naukowa, 2000 (140) | XLV Konferencja Naukowa, 1999 (161) | XLIV Konferencja Naukowa, 1998 (140) | XLIII Konferencja Naukowa, 1997 (153) | XLII Konferencja Naukowa, 1996 (164) | XLI Konferencja Naukowa, 1995 (173) | XL Konferencja Naukowa, 1994 (151) | XXXIX Konferencja Naukowa, 1993 (148) | XXXVIII Konferencja Naukowa, 1992 (117) | XXXVII Konferencja Naukowa, 1991 (125) | XXXVI Konferencja Naukowa, 1990 (109) | XXXV Konferencja Naukowa, 1989 (150) | XXXIV Konferencja Naukowa, 1988 (177) | XXXIII Konferencja Naukowa, 1987 (195) | XXXII Konferencja Naukowa, 1986 (190) | XXXI Konferencja Naukowa, 1985 (180) | XXX Konferencja Naukowa, 1984 (143) | XXIX Konferencja Naukowa, 1983 (141) | XXVIII Konferencja Naukowa, 1982 (120) | XXVII Konferencja Naukowa, 1981 (160) | XXVI Konferencja Naukowa, 1980 (169) | XXV Konferencja Naukowa, 1979 (177) | XXIV Konferencja Naukowa, 1978 (143) | XXIII Konferencja Naukowa, 1977 (120) | XXII Konferencja Naukowa, 1976 (143) | XXI Konferencja Naukowa, 1975 (132) | XX Konferencja Naukowa, 1974 (151) | XIX Konferencja Naukowa, 1973 (131) | XVIII Konferencja Naukowa, 1972 (112) | XVII Konferencja Naukowa, 1971 (120) | XVI Konferencja Naukowa, 1970 (116) | XV Konferencja Naukowa, 1969 (75) | XIV Konferencja Naukowa, 1968 (114) | XIII Konferencja Naukowa, 1967 (100) | XII Konferencja Naukowa, 1966 (106) | XI Konferencja Naukowa, 1965 (81) |
| Niepublikowane prace naukowe pracowników PK (1994-2012) (4941) |
|
Typy zasobów
Jednostki PK
Tematyka bazy Historia i Ludzie PK
Opcje
| | Krzysztof Rzecki System gromadzenia i przetwarzania dokumentów tekstowych celem rozpoznawania podobieństw (plagiatów) w opracowaniach akademickich typ: niepublikowana praca | |
|
|
Wariant tytułu | | Collecting and processing text documents system for text documents similarity measurements investigation (plagiarism detection) in academic essays | Rok ukończenia pracy | | 2007 | Jednostka wykonująca | | Politechnika Krakowska Instytut Teleinformatyki |
Rodzaj pracy | | naukowa | Klasyfikacja PKT | | [412521] Programy i oprogramowanie użytkowe. Biblioteki programów [412700] Przetwarzanie danych. Przygotowanie danych [415200] Banki danych [412500] Oprogramowanie komputera [410000] Informatyka | Słowa kluczowe autorskie | | Przetwarzanie języka naturalnego Korpus języka polskiego Lematyzacja Stop-słowa Plagiat Natural language processing Polish language corpora Lemmatization Stop-words Plagiat | Abstrakt | | Zostały zaprojektowane, zaimplementowane i uruchomione dwa systemy gromadzące teksty, tworząc bazę stanowiącą korpus tekstów w języku polskim. Pierwszy zawiera ponad 50 tys. opracowań akademickich ... więcejZostały zaprojektowane, zaimplementowane i uruchomione dwa systemy gromadzące teksty, tworząc bazę stanowiącą korpus tekstów w języku polskim. Pierwszy zawiera ponad 50 tys. opracowań akademickich i uczniów szkół średnich w przetworzonej do formatu tekstowego postaci o łącznej objętości prawie 500 MB. Drugi system zawiera ponad 280 tys. notatek prasowych o łącznej objętości czystego tekstu ponad 1,2 GB. Zaprojektowane, zaimplementowane i przetestowane na zebranych tekstach zostały własne algorytmy tokenizacji, sprawdzania pisowni, bezkontekstowej lematyzacji i eliminacji stop-słów, które w dalszych badaniach będą wykorzystane wielopoziomowemu porównywaniu dokumentów.
There were projected, implemented and run two database systems that collect text files and create huge corpora for polish language. First of them consists of over 50 thousands academic essays by now in ... więcejThere were projected, implemented and run two database systems that collect text files and create huge corpora for polish language. First of them consists of over 50 thousands academic essays by now in text format and takes over 500 MB. Second one consists of over 280 thousands news and takes over 1,2 GB disk space. There were projected, implemented and tested on those corpora algorithms to tokenize, lemmatize (no-contextual) and eliminate stop-words that will be used in comparing text documents. |
|