Wyszukiwanie:
tytuł, autor
wszędzie

Sortowanie:


Bibliografia Publikacji Pracowników PK (50021)
Inne bazy bibliograficzne (15019)
    Architektura i Sztuka Krakowa (2298)
    Historia i Ludzie PK – baza w przygotowaniu (0)
    Konferencje Krynickie - Referaty (7776)
    Niepublikowane prace naukowe pracowników PK (1994-2012) (4941)


Typy zasobów

Jednostki PK

Tematyka bazy Historia i Ludzie PK

Opcje

Krzysztof Rzecki

System gromadzenia i przetwarzania dokumentów tekstowych celem rozpoznawania podobieństw (plagiatów) w opracowaniach akademickich

typ: niepublikowana praca

 

Wariant tytułu Collecting and processing text documents system for text documents similarity measurements investigation (plagiarism detection) in academic essays
Rok ukończenia pracy 2008
Jednostka wykonująca Politechnika Krakowska Instytut Teleinformatyki

tematyka
Rodzaj pracy naukowa
Klasyfikacja PKT [412521] Programy i oprogramowanie użytkowe. Biblioteki programów
[412700] Przetwarzanie danych. Przygotowanie danych
[415200] Banki danych
[412500] Oprogramowanie komputera
[410000] Informatyka
Słowa kluczowe autorskie Przetwarzanie języka naturalnego
Korpus języka polskiego
Lematyzacja
Stop-słowa
Plagiat
Natural language processing
Polish language corpora
Lemmatization
Stop-words
Plagiat
Abstrakt
Zbudowano kilka różnych tematycznie korpusów z tekstami w języku polskim o łącznej wielkości przekraczającej 120 mln słów. Zaimplementowano i przetestowano algorytmy tokenizacji tekstu do postaci ... więcej

A number of different Polish language corpora of the total size of over 120 mln words were built. Tokenization algorithms to make texts available for future processing were implemented. Text processing ... więcej

odnośniki





© 2009 - 2023 Biblioteka Politechniki Krakowskiej http://www.biblos.pk.edu.pl/