Zadania – PK (2022)

Piotr Potiopa (zestaw nr 8)

Zadanie

Korzystając z książki „Pan Tadusz” w formacie txt wykonaj następujące zadania:

1.    Wybierz z pliku 30 wyrażeń złożonych z kilku słów (od 3 do 9 słów) i zapisz je w oddzielnym pliku o nazwie corrections.txt – każde wyrażenie w oddzielnej linii.

2.    Zmodyfikuj wyrażenia w pliku corrections.txt tak aby dla niektórych zmienić kolejność słów, a przy niektórych wyrzucić niektóre słowa.

3.    Skonstruuj algorytm LCS (Longest Common Subsequence Similarity) badąjcy, które wyrażenia z pliku słów zmodyfikowanych są wyrażeń są najbardziej podobne do poszczególnych linii z oryginalnego pliku z całym analizowanym tekstem.

4.    zbuduj procedurę która wypisze zbliżone wyrażenia do wyrażeń zapisanych w pliku corrections.txt dla zadanego progu podobieństwa (parametr alpha).

Przydatne linki:
https://en.wikipedia.org/wiki/Longest_common_subsequence_problem