PL EN
Technologie przetwarzania tekstu polskiego zorientowane na potrzeby bezpieczeństwa publicznego

Kierownik projektu:

  • Prof. dr hab. Zygmunt Vetulani - Uniwersytet im. Adama Mickiewicza w Poznaniu

Kierownicy podprojektów:

  • Prof. dr hab. inż. Andrzej Dziech (AGH, KT)
  • Prof. dr hab. Wiesław Lubaszewski (AGH, KI)
  • Prof. dr hab. Zygmunt Vetulani (UAM, ZLISI)

Instytucje realizujące projekt:

Uniwersytet im. Adama Mickiewicza w Poznaniu, Wydział Matematyki i Informatyki, Zakład Lingwistyki Informatycznej i Sztucznej Inteligencji (ZLISI) Akademia Górniczo-Hutnicza w Krakowie, Wydział Elektrotechniki, Automatyki, Informatyki i Elektroniki, Katedra Informatyki (KI) oraz Katedra Telekomunikacji (KT)

Cel projektu:

Celem projektu jest technologii języka naturalnego i technologii informacji na potrzeby systemów informatycznych, w których automatyczne przetwarzanie języka polskiego służy podniesieniu poziomu bezpieczeństwa publicznego.

Opis projektu:

Do realizacji wybrane zostały 3 pilotowe aplikacje, za które odpowiedzialne są odpowiednio ww. instytucje współrealizujące projekt. Aplikacje te (Tematy 1, 2 i 3) wymagają uzupełnienia istniejących luk technologicznych w zakresie narzędzi i cyfrowych zasobów językowych (Temat 4), co jest niezbędnym warunkiem powodzenia wszelkich dalszych przedsięwzięć w zakresie zastosowań technologii języka czy to w zakresie bezpieczeństwa, czy w innych dziedzinach.

  • Temat 1 - Komunikacja człowieka z systemem informatycznym w warunkach kryzysowych przy użyciu języka naturalnego (system POLINT-112) (UAM).
  • Temat 2 - Inteligentna wyszukiwarka akt sądowych na podstawie doświadczeń z zakresu przetwarzania kopiowanego tekstu i jego archiwizacji (AGH, KT).
  • Temat 3 - System monitorowania polskojęzycznej informacji w Internecie dla potrzeb analizy kryminalnej (AGH, KI).
  • Temat 4 - Budowa i rozbudowa niezbędnych elektronicznych narzędzi informatyczno-lingwistycznych (AGH; UAM).

Przewidywane wymierne efekty projektu:

Prototyp systemu wspomagania systemów komunikacji (typu „telefon 112”) przetwarzającego informację przekazywaną w języku naturalnym (SMS, w dalszej perspektywie głos), ze szczególnym uwzględnieniem zarządzania kryzysowego w warunkach imprez masowych (typu Euro 2012) (Temat 1).

Prototyp wyszukiwarki akt sądowych szukającej obiektów tekstowych i graficznych na podstawie opisu sytuacyjnego albo z użyciem słów kluczowych (Temat 2).

System monitorowania polskojęzycznej informacji w Internecie dla potrzeb analizy kryminalnej (Temat 3).

Generyczne zasoby inżynierii języka polskiego (Temat 4): słowniki maszynowe, korpusy tematyczne, ontologie typu WordNet (PolNet) i ontologie specjalistyczne, gramatyki i parsery, algorytmy przetwarzania tekstu (wyszukiwanie, klasyfikacja, algorytmy „watermarkingu”).