Badania i rozwój
CZĘŚĆ BADAWCZO-ROZWOJOWA PROJEKTU
CK STOS zapewnia najnowocześniejsze warunki prowadzenia projektów B+R, łącząc naukę i biznes
Dzięki zrealizowanej inwestycji możliwe będą badania ogniskujące się na integracji technologii informacyjnych: Chmury Obliczeniowej (CC – Cloud Computing), Internetu Rzeczy (IoT – Internet of Things), Danych Masowych (Big Data) oraz Sztucznej Inteligencji (AI – Artificial Intelligence). Z uwagi na charakter gromadzonych danych, prowadzone badania będą posiadały wysoki stopień interdyscyplinarności, zaś ich innowacyjnością będzie metodologia wytwarzania usług SMART, zorientowanych na analizę ogromnych zbiorów danych.
To także będzie sprzyjać nawiązywaniu współpracy podmiotów poszukujących różnych rozwiązań i podmiotów oferujących wielorakie rozwiązania, w celu weryfikacji podejść oraz realizacji innowacyjnych rozwiązań.
głównych obszarów prac badawczych
6
1
Interdyscyplinarność i transdyscyplinarność
Rozwiązywanie złożonych problemów wymaga różnych podejść wynikających z przyjętego zakresu rozważań jak i integracji dostępnej wiedzy. Stąd wyróżniamy badania multi-, inter- oraz trans-dyscyplinarne.
dowiedz się więcej
Problemy multidyscyplinarne dotyczą całego zakresu badań związanych z jedną lub wieloma dyscyplinami nauki, przy czym badania te są ze sobą luźno powiązane. Z kolei badania interdyscyplinarne i transdyscyplinarne akcentują wysoki stopień zależności wyników badań, zarówno w jednej, jak i w wielu dyscyplinach. Wyjaśnia to rysunek, w którym szeroki i wąski zakres badań może być kojarzony z jedną dyscypliną lub nawet z całą dziedziną, natomiast stopień integracji jest tym większy im prowadzone badania w danej dyscyplinie wymagają szerszego wykorzystania wyników badań z innych dyscyplin. Przykładem transdyscyplinarnego podejścia może być rozwiązywanie problemów służby zdrowia, które wymagają uwzględnienia postępu nie tylko w medycynie, ale również w takich naukach jak: informatyka, ekonomia czy zarzadzanie. Warto podkreślić, że integracja kluczowych technologii wymaga również takiego podejścia. Największym wyzwaniem jest wysoka integracja badań dotyczących różnych dziedzin, która stanowi najwyższy stopień transdyscyplinarności.
Zalety podejścia transdyscyplinarnego:
- Bliskość realnych, życiowych problemów.
- Łatwość adaptacji do praktyki.
- Integracja badaczy z różnych dziedzin pomimo różnorodności pojęć – ich znaczenia i złożoności opisu.
- Możliwość rozwiązywania skomplikowanych problemów przy wykorzystaniu obliczeń wielkiej skali.
- Rozumienie świata jako całości.
2
Integracja technologii
Wytwarzanie współczesnych usług i aplikacji wymaga podejścia trans-dyscyplinarnego, co w konsekwencji prowadzi do konieczności jednoczesnego uwzględnienia możliwości kluczowych technologii informatycznych.
dowiedz się więcej
Współczesna usługa IT wykorzystuje dostępne dane i wiedzę, które przetwarza w chmurze obliczeniowej wykorzystując algorytmy analizy danych masowych oraz sztucznej inteligencji. W ten sposób pozyskujemy nową wiedzę poprzez dostęp do źródeł danych – IoE, gromadzenia i unifikacji danych (BD) jak i ich analizy i wydobywana wiedzy (CC, AI). Co więcej, tego typu usługi stanowią podstawę budowy przeróżnych scenariuszy realizacji złożonych przedsięwzięć wspomagających ludzkie działanie. Dlatego tak istotne jest opracowanie współczesnych metod inżynierii oprogramowania umożliwiających skuteczne projektowanie i wytwarzanie takich usług, jak też adekwatnych scenariuszy działań łańcuchów tychże usług. Tego typu kompetencje stanowią podstawę działania CK STOS. Poniżej zaakcentowano rozwój chmury obliczeniowej oraz metod inżynierii oprogramowania.
Rozwój chmury obliczeniowej TASKcloud
Celem tego zadania jest ciągły rozwój chmury obliczeniowej zarówno co do wielkości dostępnych zasobów, jak też możliwości funkcjonalnych architektury warstwowej: IaaS, PaaS oraz SaaS, w celu wypracowania efektywnego środowiska do wytwarzania i wykonywania usług IT. Zwiększenie zasobów obliczeniowych wiąże się z zakupem superkomputera w ramach projektu CK STOS. Dalsze możliwości zwiększenia obliczeń (procesory graficzne oraz systemy pamięci masowej) nastąpią w ramach innych realizowanych przez CI TASK projektach. Możliwości funkcjonalne wynikać będą z wykorzystania oprogramowania otwartego, związanego z poszczególnymi warstwami chmury obliczeniowej.
Rozwój metod inżynierii oprogramowania wytwarzania usług chmurowych
Wykorzystanie usług informatycznych do budowy aplikacji wymaga dalszego rozwoju metodologii SOSE (Service Oriented Software Engineering), inżynierii oprogramowania zorientowanej na usługi inteligentne. Przy czym należy uwzględnić wykorzystanie zarówno metod obliczeń o wysokiej wydajności (HPC), jak też algorytmów sztucznej inteligencji (AI) oraz paradygmatów chmur obliczeniowych CC). Istotne też będzie gromadzenie i wykorzystanie odpowiednich danych dziedzinowych (IoT), interdyscyplinarnych, a także przyjęcie standardowych interfejsów usług umożliwiających tworzenie scenariuszy działań aplikacji. Wymaga to integracji różnych technologii takich jak: HPC, IoT, CC oraz AI. Tego typu podejście będzie testowane poprzez wykonanie kilku demonstratorów aplikacji, które są podane w opisie budowy aplikacji.
3
Wytwarzanie usług SMART
Rozwój metody SOSE (Service Oriented Software Engineering) prowadzi do wytwarzania usług typu SMART. Ich akronim wskazuje na podstawowe własności takich usług.
dowiedz się więcej
Rozwój metody SOSE (Service Oriented Software Engineering) oraz chmury obliczeniowej TASKcloud, a także opracowanie efektywnych metod analizy dużych zbiorów danych stworzą sprzyjające warunki do wytwarzania inteligentnych usług typu SMART. Usługi SMART wykorzystują wiedzę z różnych, nawet odległych od siebie dziedzin badawczych oraz inteligentnie reagują na zmiany kontekstu. Akronim SMART definiuje cechy charakterystyczne tych usług, takie jak:
- S określa usługi „Samodoskonalące się”, tzn. adaptujące się do zmieniających się warunków otoczenia;
- M wskazuje na usługi „Maksymalnie wydajne i bezpieczne”, zapewniające możliwość wiarygodnego działania w czasie rzeczywistym;
- A to usługi „Analizujące ogromne zbiory danych”;
- R, to dodatkowy aspekt usług, „Rozwijające nową wiedzę”;
- T podkreśla aspekt praktyczny – „Tworzone na potrzeby użytkowników”.
Spełnienie powyższych wymagań zapewnia szeroką użyteczność usług SMART w wielu dziedzinach życia ludzkiego.
4
Serwerownia CI TASK
Budowana serwerownia zawiera 7 komór, z czego każda może być niezależnie wyposażana w infrastrukturę techniczną, w zależności od potrzeb, instalowanych tam różnego typu serwerów obliczeniowych czy serwerów danych.
dowiedz się więcej
W skład serwerowni spełniającej wymagania bezpieczeństwa przynajmniej dla TIER III/IV wchodzić będą:
- 2 małe komory: sieciowa oraz archiwizatorów taśmowych;
- 4 komory dla komputerów dużej mocy obliczeniowej;
- 1 komora tzw. „bezpieczny bunkier” do długotrwałego przechowywania danych.
Infrastruktura wytworzona i zakupiona w ramach projektu CK STOS będzie innowacyjna i całkowicie unikatowa w skali kraju, zarówno w zakresie samej infrastruktury budowlanej i przyjętych rozwiązań technicznych i technologicznych (systemy zasilania, chłodzenia, gaszenia), a także w zakresie wyposażenia (w tym superkomputera i serwerów danych) oraz dostępnych mocy obliczeniowych i możliwości archiwizacji danych. W ramach tego projektu częściowo wyposażone zostaną trzy komory. Pozostałe będą systematyczne uzupełniane w zależności od wymagań innych projektów realizowanych przez CI TASK.
Docelowe parametry serwerów komputerowych (na rok 2023) to:
PFlops docelowej mocy obliczeniowej
InfiniBand (komunikacja wewnętrzna) wyniesie co najmniej 100 Gb/s
pamięć RAM rzędu 4-8 GB na rdzeń
Zakłada się rozbudowę możliwości superkomputera w następujących etapach:
- Specyfikacja infrastruktury sprzętowej i oprogramowania superkomputera zakupowanego w ramach różnych projektów finansujących takie przedsięwzięcia.
- Przygotowanie infrastruktury technicznej, niezbędnej do instalacji wyspecyfikowanego superkomputera w ramach tych projektów.
- Przygotowanie procedury przetargowej wraz z przeprowadzeniem przetargu łączonego z zakupami tego typu w innych centrach obliczeniowych.
- Sfinalizowanie procedury przetargowej i zakup superkomputera, jego
instalacja i uruchomienie w środowisku docelowym.
5
Aplikacje
Prezentacja usług SMART i aplikacji rozwijanych w ramach projektu CK STOS w obszarach morskich (trasa żeglugi), medycznych (rozpoznawanie chorób) i społecznych (rozprzestrzenianie się epidemii).
dowiedz się więcej
a. Monitoring Obszarów Turystycznych
Głównym zadaniem jest zakup, montaż i uruchomienie na infrastrukturze sieciowej firmy Chopin Telewizja Kablowa Sp. z.o.o (CTK) 15 sond (5 CTK+10 PG)) do monitorowania parametrów środowiska tj.: temperatury powietrza, poziomu hałasu, prędkości wiatru, temperatury wody, zapewniających lepszą jakość obrazu oraz uruchomienie usługi zdalnej dostarczającej tego typu informacji dla zainteresowanej społeczności. Problemy do rozwiązania dotyczą:
- Wyboru miejsca lokalizacji sond – plaże pomorskie, ewentualnie blisko pomostów,
- Gromadzenia dodatkowych informacji o pogodzie, w tym temperaturze wody,
- Sporządzenia sprawozdania z instalacji i testów użyteczności zastosowanych urządzeń,
- Dołączenia monitorowanej informacji na stronie internetowej związanej z tymi rejonami (nadmorski24.pl),
- Promocja projektu CK STOS w ramach banerów reklamowych firmy.
b. Problemy Logistyki Morskiej
Głównym zadaniem jest wytworzenie aplikacji/usługi dotyczącej: „Planowania trasy żeglowania w zmiennych warunkach morskich”. Aplikacja przeznaczona jest to wykorzystania przez amatorów żeglarstwa jak i profesjonalnych żeglarzy do planowania trasy żeglugi przy uwzględnieniu:
- Wyboru miejsca oraz okresu żeglowania,
- Uwzględnienie warunków żeglowania, w tym: pogody, parametrów wiatru czy poziomu falowania morza,
- Zadanego celu żeglowania: przepłynięcie określonej trasy z zapewnieniem wymaganego komfortu żeglowania, poziomu bezpieczeństwa czy optymalnego czasu żeglugi.
- Możliwości optymalizacji kodu i wykonania aplikacji w środowisku równoległym na chmurze obliczeniowej TASKcloud.
- Udostępnienie aplikacji zainteresowanym stronom.
Przykład planowanej trasy jest następujący:
c. Zastosowanie sztucznej inteligencji w medycynie
Głównym zadaniem jest wykonanie aplikacji/usługi dotyczącej: „Wykorzystania usług inteligentnych do analizy obrazowań medycznych w diagnostyce chorób społecznych”. Aplikacja przeznaczona jest do analizy różnego typu obrazowań danych medycznych w celu rozpoznawania anomalii chorobowych:
1. Gromadzenie, selekcja i oznaczanie wiarygodnych danych medycznych.
2. Opracowanie algorytmu sztucznej inteligencji do analizy zgromadzonych danych.
3. Podanie przykładów rozpoznawania anomalii oraz ich graficzna prezentacja.
4. Przygotowanie aplikacji rozpoznających zmiany chorobowe.
5. Zapewnienie dostępu i wykonania aplikacji w środowisku równoległym na chmurze obliczeniowej TASKCloud.
Widok aorty po podaniu kontrastu
Wizualizacja tętniaka aorty
d. Rozwój epidemii COVID-19 z w różnych regionach Polski
Głównym zadaniem jest wykonanie aplikacji/usługi dotyczącej: „Analizy danych masowych dotyczących COVID -19 z uwzględnieniem specyfiki województw” oraz dokonanie wybranych analiz wykorzystujących środowisko BigData:
1. Wybór parametrów opisujących epidemię COVID-19 (szybkość wzrostu zachorowań, konieczność leczenia szpitalnego, śmiertelność) oraz charakterystyk specyficznych dla regionu: gęstość zaludnienia, typ gospodarki, poziom technologicznego rozwoju, aktywność społeczna, procent osób zaszczepionych, itp.
2. Wykorzystanie technologii Big Data do utworzenia repozytorium danych z pkt.1 w chmurze obliczeniowej TASKCloud.
3. Projekt i implementacja usług badających korelacje między parametrami epidemii COVID-19 oraz parametrami regionalnych charakterystyk.
4. Przebadanie wybranych korelacji dla wybranych województw Polski.
5. Sformułowanie zasad rozwoju epidemii w poszczególnych regionach.
Analiza korelacji pomiędzy gęstością zaludnienia, a przypadkami wirusa COVID-19 zarejestrowanymi dla poszczególnych województw
Przedstawienie wykorzystania aplikacji JupyterHub dostępnej w ramach chmury obliczeniowej TASKcloud do wizualizacji danych statystycznych, pobranych z Bazy Danych Lokalnych Głównego Urzędu Statystycznego
Heatmapa, przykład
6
Analiza dużych zbiorów danych
Zagospodarowanie coraz większej ilości generowanych danych jest wyzwaniem współczesności i sprowadza się wielu nowych rozwiązań typu Big Data.
dowiedz się więcej
Big Data to olbrzymia ilość danych cyfrowych, niezbędna do zdobywania nowej informacji lub wiedzy koniecznej do podejmowania poprawnych decyzji, czy wypracowania właściwych rekomendacji. W tym celu muszą być wskazane adekwatne źródła danych, odpowiednie zasady ich gromadzenia i przechowywania, a także właściwe algorytmy ich analizy (patrz rysunek). Popularne technologie Big Data oferują takie platformy jak: Jupiter, Hadoop czy Spark; bazy np. SQL (magazyny) typu Cassandra czy Mango DB; strumieniowe przetwarzanie danych Kafka czy Flink; zaś wsparcie uczenia maszynowego: Keros czy Tensorflow. Istotna jest też wizualizacja analizowanych danych, która ułatwia ich zrozumienie oraz upraszcza interpretację.
Lawinowy wzrost ilości gromadzonych danych, a także wzrost złożoności rozwiązywanych problemów IT, wymaga nowych rozwiązań technologicznych W szczególności zapewnienia bezpiecznego dostępu do źródeł danych (IoE) oraz do wydajnych sieci komputerowych (transfer danych), jak też do dużych mocy obliczeniowych (superkomputery i chmury obliczeniowe). Budowa usług SMART wymaga wykorzystania algorytmów sztucznej inteligencji zapewniających skalowalność obliczeń, a także przyjaznych środowisk ich wytwarzania. Przykładem interdyscyplinarnego podejścia jest współpraca CI TASK z firmą Chopin Telewizja Kablowa sp. z o.o. (Partnera Projektu), w ramach której dokona się wspólnego zakupu i modyfikacji sond pozwalających na przekazywanie obrazu i szerokiego zakresu parametrów środowiska, tym samym stworzenie indywidualnie dostosowywanego wirtualnego obrazu stanu środowiska przyrodniczego ze szczególnym uwzględnieniem obszarów atrakcyjnych turystycznie. Będzie to demonstrator związany z badaniami nad obszarem Internetu Rzeczy (IoT), z wykorzystaniem nowej infrastruktury badawczo-pomiarowej typu LoRaWAN (szczegóły w zakładce Aplikacje). Z kolei ze względu na wagę technologii Big Data, zostanie w CI TASK utworzony nowy dział zajmujący się tego typu problematyką.