Success Stories

CESAR

CESAR

CIP - Information Communication Technologies Policy Support Programme (ICT-PSP)

Project Type: Pilot Action

Tytuł Projektu:

Zasoby Językowe Europy Środkowej i Południowej



objective_pl:

Celem projektu CESAR jest udostępnienie zasobów i narzędzi językowych, niezbędnych do rozwoju technologii przetwarzania języka, takich jak tłumaczenia maszynowe, czy rozpoznawanie mowy i ekstrakcja informacji dla języka polskiego, węgierskiego, słowackiego, bułgarskiego, chorwackiego i serbskiego.



Opis Projektu:

Skuteczność technologii przetwarzania języków naturalnych w ogromnej mierze zależy od dostępności przydatnych, gotowych do użycia i powszechnie dostępnych elektronicznych zasobów i narzędzi. Większość dostępne obecnie zasobów i narzędzi do przetwarzania języków zostało opracowanych z myślą o doraźnych potrzebach pojawiających się w ramach konkretnych projektów, co oznacza, że możliwość ich ponownego wykorzystania pozostawiają sporo do życzenia. Doraźnie tworzone narzędzia i zasoby trudno jest zaadoptować do nowych zadań ze względu na ich niski poziom interoperacyjności oraz niejasny status prawny.

Projekt CESAR, będący częścią ogólnoeuropejskiej sieci META-NET, stawia sobie za zadanie ulepszenie, aktualizację, standaryzację, oraz połączenie szerokiego zbioru narzędzi i zasobów potrzebnych do przetwarzania języków naturalnych. Narzędzia te w znaczący sposób uzupełnią otwartą infrastrukturę językową w Europie. Członkowie konsorcjum CESAR mają szerokie doświadczenia w dziedzinie technologii językowych, nabyte między innymi w ramach inicjatyw takich jak TELRI, czy też CLARIN.

Zasoby opracowane w ramach projektu są istotne dla dalszego rozwoju technologii przetwarzania języków i pozostaną w użyciu na długo po zakończeniu projektu z pełnym wsparciem ze strony ośrodków biorących udział w projekcie. Jako istotne elementy wspólnego rynku cyfrowego będą one dostępne zarówno bezpośrednio u uczestników projektu, jak też poprzez specjalną platformę cyfrową META-SHARE wspieraną przez ogólnoeuropejską sieć META-NET.



Rezultaty projektu:

W ramach projektu udostępnionych zostanie szereg narzędzi i zasobów potrzebnych do przetwarzania języka polskiego, węgierskiego, chorwackiego i serbskiego, bułgarskiego oraz słowackiego. Wśród udostępnionych narzędzi znajdą się mono- oraz wielojęzyczne bazy języka mówionego, korpusy językowe, słowniki i leksykony elektroniczne oraz specjalistyczne moduły przetwarzania języka takie jak segmentatory, analizatory morfologiczne oraz parsery składniowe. W zależności od uwarunkowań technicznych, zasoby te będą udostępniane bezpośrednio przez partnerów, oraz za pośrednictwem specjalnej platformy cyfrowej META-SHARE.

Poza pracami technicznymi, wymiernym wynikiem projektu będzie również mobilizacja środowiska naukowego oraz biznesowego w zakresie upowszechnienia roli technologii językowych wśród głównych instytucji oraz interesariuszy, mediów oraz opinii publicznej.



PROJECT DETAILS

Project website: http://www.meta-net.eu/projects/cesar/

Project starts:
2011-02-01
Total Project Value:
4.16 mln. €
Project ends:
2013-01-31
EU grant:
2.08 mln. €
Funding to Poland:
0.47 mln. €

POLISH PARTICIPANTS


Profesor Adam Przepiórkowski
Instytut Podstaw Informatyki, Polska Akademia Nauk
Partner
dr Piotr Pęzik
Uniwersytet Łódzki
Address: Address:
ul. Ordona 21
01-237 Warszawa , Poland
Telephone:
Email: adamp@ipipan.waw.pl
Strona www: http://www.ipipan.eu/
ul. Narutowicza 65
90-131 Łódź, Poland
Telephone:
Email: piotr.pezik@gmail.com
Strona www: http://www.uni.lodz.pl

PARTNERS

1

Hungarian Academy of Sciences

COORDINATOR
Hungary
2.

Institute of Computer Science Polish Academy of Sciences

Poland
3.

University of Łódź

Poland
4.

University of Zagreb

Poland
5.

University of Belgrade

Serbia
6.

Pupin Institute

Serbia
7.

Institute for Bulgarian Language

Bulgaria
8.

Slovak Academy of Sciences

Slovakia

Date added: 2011-06-01 21:28:55    Hits: 511
RSS Feeds