Zadania – PK (2022)
Piotr Potiopa
(zestaw nr 8)
Zadanie
Korzystając z książki „Pan Tadusz” w formacie txt wykonaj następujące
zadania:
1.
Wybierz z pliku 30 wyrażeń złożonych z kilku
słów (od 3 do 9 słów) i zapisz je w oddzielnym pliku o nazwie corrections.txt – każde wyrażenie w
oddzielnej linii.
2.
Zmodyfikuj wyrażenia w pliku corrections.txt tak aby dla niektórych
zmienić kolejność słów, a przy niektórych wyrzucić niektóre słowa.
3.
Skonstruuj algorytm LCS (Longest Common
Subsequence Similarity) badąjcy, które wyrażenia z pliku słów zmodyfikowanych są wyrażeń
są najbardziej podobne do poszczególnych
linii z oryginalnego pliku z całym analizowanym tekstem.
4.
zbuduj procedurę która wypisze zbliżone wyrażenia
do wyrażeń zapisanych w pliku corrections.txt
dla zadanego progu podobieństwa (parametr
alpha).
Przydatne
linki:
https://en.wikipedia.org/wiki/Longest_common_subsequence_problem