Событие
VIII cykl wykładów i warsztatów: CLARIN-PL w praktyce badawczej
Centrum Technologii Językowych CLARIN-PL zaprasza do wzięcia udziału w warsztatach wszystkich naukowców, dydaktyków, doktorantów i studentów zainteresowanych wykorzystaniem metod maszynowego przetwarzania języka naturalnego w badaniach humanistycznych i społecznych.
Warunkiem wzięcia udziału w warsztatach jest wypełnienie formularza rejestracyjnego.
Warsztaty mają charakter bezpłatny, nie jest wymagane wcześniejsze doświadczenie w pracy z narzędziami służącymi do przetwarzania języka.
Warsztaty skierowane są głównie do osób, które chciałyby w swoich badaniach wykorzystać aplikacje i zasoby oferowane przez konsorcjum CLARIN-PL.
Tematyka zajęć warsztatowych będzie dotyczyła między innymi:
- tworzenia, udostępniania i zarządzania korpusami tekstowymi (repozytorium DSpace, platforma Next Cloud, system Inforex, Korpusomat),
- charakterystyki oraz sposobu wykorzystania cyfrowych zasobów leksykalnych (wielki słownik relacyjny Słowosieć, Słowosieć dwujęzyczna, słownik walencyjny Walenty),
- zagadnień związanych z korpusami równoległymi i konwersacyjnymi (Spokes, Paralela, wielojęzyczne korpusy równoległe),
- wykorzystania cyfrowych narzędzi służących do wydobywania informacji z tekstu, tworzenia analiz stylometrycznych, grupowania tekstów, ustalania autorstwa, przygotowywania prostych statystyk (LEM, WebSty, Liner2),
- narzędzi i zasobów do przetwarzania mowy; korpusów, segmentacji, rozpoznawania, analizy i transkrypcji mowy,
- planowania badań z obszaru nauk humanistycznych i społecznych wykorzystujących przetwarzanie języka naturalnego,
- innych aspektów przetwarzania języka naturalnego, które zostaną zgłoszone w formularzach rejestracyjnych przez uczestników.
Ostateczny termin rejestracji to 13 czerwca 2018 roku. Po tym czasie organizatorzy przeprowadzą kwalifikację zgłoszeń (jeśli osób zgłoszonych będzie więcej niż miejsc), której wyniki zostaną przekazane zainteresowanym osobom najpóźniej 14 czerwca.
Organizatorami warsztatów są Centrum Technologii Językowych CLARIN-PL i Politechnika Wrocławska, Wydział Informatyki i Zarządzania.
Więcej informacji na temat działalności CLARIN-PL można znaleźć na stronie www.clarin-pl.eu. W zakładce „mediateka” dostępne są materiały z dotychczasowych warsztatów.
Информация
Смотреть также
IV cykl wykładów i warsztatów: CLARIN-PL w praktyce badawczej. Cyfrowe narzędzia do analizy języka w naukach humanistycznych i społecznych
Organizatorzy:
Konferencja "CLARIN-PL – polska infrastruktura badawcza dla nauk społecznych i humanistycznych" oraz Premiera Słowosieci 3.0 emo i enWordNet 1.0
Polskie konsorcjum naukowe CLARIN-PL serdecznie zaprasza w dniach 25-27 kwietnia 2016 roku na Politechnikę Wrocławską na konferencję "CLARIN-PL - polska infrastruktura badawcza dla nauk społecznych i humanistycznych" oraz na premierę Słowosieci 3.0 i enWordNet 3.1.
CLARIN-PL-Biz – technologie językowe dla nauki i biznesu II
Konsorcjum CLARIN-PL (Wspólne zasoby językowe i infrastruktura technologiczna) zaprasza na konferencję on-line „CLARIN-PL-Biz – technologie językowe dla nauki i biznesu II”, która odbędzie się 24-25 czerwca 2021 r. na platformie Zoom. Podczas konferencji zaprezentowane zostaną projekty badawcze realizowane przez naukowców, przedsiębiorców, przedstawicieli administracji oraz instytucji pozarządowych, których liderzy skorzystali z infrastruktury CLARIN-PL. Przedstawiciele konsorcjum zaprezentują również najnowsze funkcje i zasoby wypracowane w ramach rozwoju infrastruktury.
Generowanie szablonów parafraz dla języka polskiego przy użyciu korpusu równoległego / W ramach seminarium „Przetwarzanie języka naturalnego”
W ramach seminarium „Przetwarzanie języka naturalnego” (Instytut Podstaw Informatyki PAN, ul. Jana Kazimierza 5, Warszawa, sala na parterze) 19 maja br. o godz. 10:15 Kamil Kędzia i Konrad Krulikowski (Uniwersytet Warszawski) wygłoszą referat "Generowanie szablonów parafraz dla języka polskiego przy użyciu korpusu równoległego". W ramach projektu CLARIN-PL przygotowano oprogramowanie służące generowaniu parafraz dla języka polskiego. Jego twórcy zaprezentują jego działanie na wybranych przykładach. Przybliżą również wykorzystaną metodę zespołu Ganitkevitch i in. (2013), która posłużyła jej autorom do stworzenia ogólnodostępnego zasobu Paraphrase Database (PPDB). Omówią także jej rozszerzenie służące do znajdowania szablonów parafraz, czy zastosowane podejście do wyzwań charakterystycznych dla języka polskiego. Dodatkowo przedstawią sposób mierzenia jakości parafraz.