Wyszukiwanie:
tytuł, autor
wszędzie

Sortowanie:


Bibliografia Publikacji Pracowników PK (50021)
Inne bazy bibliograficzne (15019)
    Architektura i Sztuka Krakowa (2298)
    Historia i Ludzie PK – baza w przygotowaniu (0)
    Konferencje Krynickie - Referaty (7776)
    Niepublikowane prace naukowe pracowników PK (1994-2012) (4941)


Typy zasobów

Jednostki PK

Tematyka bazy Historia i Ludzie PK

Opcje

Krzysztof Rzecki

System gromadzenia i przetwarzania dokumentów tekstowych celem rozpoznawania podobieństw (plagiatów) w opracowaniach akademickich

typ: niepublikowana praca

 

Wariant tytułu Collecting and processing text documents system for text documents similarity measurements investigation (plagiarism detection) in academic essays
Rok ukończenia pracy 2007
Jednostka wykonująca Politechnika Krakowska Instytut Teleinformatyki

tematyka
Rodzaj pracy naukowa
Klasyfikacja PKT [412521] Programy i oprogramowanie użytkowe. Biblioteki programów
[412700] Przetwarzanie danych. Przygotowanie danych
[415200] Banki danych
[412500] Oprogramowanie komputera
[410000] Informatyka
Słowa kluczowe autorskie Przetwarzanie języka naturalnego
Korpus języka polskiego
Lematyzacja
Stop-słowa
Plagiat
Natural language processing
Polish language corpora
Lemmatization
Stop-words
Plagiat
Abstrakt
Zostały zaprojektowane, zaimplementowane i uruchomione dwa systemy gromadzące teksty, tworząc bazę stanowiącą korpus tekstów w języku polskim. Pierwszy zawiera ponad 50 tys. opracowań akademickich ... więcej

There were projected, implemented and run two database systems that collect text files and create huge corpora for polish language. First of them consists of over 50 thousands academic essays by now in ... więcej

odnośniki





© 2009 - 2023 Biblioteka Politechniki Krakowskiej http://www.biblos.pk.edu.pl/