Polish Studies Newsletter

Event

Date of the event: 11.01.2016 g.13:00
Added on: 06.01.2016

Referat "Ekstrakcja terminologii z tekstów w języku polskim – program TermoPL" (Małgorzata Marciniak, Agnieszka Mykowiecka, Piotr Rychlik)

Type of the event:
Meeting

Referat zostanie wygłoszony w ramach połączonego Seminarium Instytutu Podstaw Informatyki PAN i seminarium „Przetwarzanie języka naturalnego” 11.01.2016 r. o godz. 13.00 w siedzibie Instytutu przy ul. Jana Kazimierza 5 w Warszawie.

Podczas seminarium omówione zostaną zagadnienia ekstrakcji terminologii z korpusów tekstów w języku polskim oraz przedstawią program TermoPL, w którym zaimplementowane zostały zaproponowane rozwiązania. W omawianych pracach stosują oni metodę C-value, która ustala istotność terminów na podstawie ich częstości i liczby kontekstów. Metoda ta uwzględnia terminy zagnieżdżone – czyli takie, które są zawarte w dłuższych terminach. Niekiedy prowadzi to do ekstrakcji niepoprawnych semantycznie fraz (np. 'giełda papierów', 'USG jamy'). W celu eliminacji tego typu terminów autorzy referatu zaproponowali metodę, która w procesie wyodrębniania zagnieżdżonych fraz kieruje się siłą powiązań między słowami.

Information

Added on:
6 January 2016; 13:42 (Mariola Wilczak)
Edited on:
6 January 2016; 13:42 (Mariola Wilczak)
We use cookie files to make the use of our website more convenient for our users. If you do not wish cookie files to be saved on your hard drive, please change the settings of your browser. Read about our cookie policy.