
Projekty i granty koła
Data Science Club
- archiwum i wyniki
Członkowie koła poza organizacją cyklicznych warsztatów (nasz kanał Youtube tutaj) aktywnie realizują projekty wydziałowe oraz wnioskują o kolejne: politechniczne IDUB oraz ministerialne.
Obecnie realizowane projekty to:

Grant wydziałowy (I miejsce), 15000 PLN
Okres realizacji: 1/11/2021- 30/10/2022
Skład zespołu realizującego projekt:
- Paweł Żak (180308)
- Damian Fiłonowicz (171902)
- Uladzislau Hryvacheuski (191919)
- Marcin Tyszkiewicz (180500)
- Kacper Kędzierski (180012)
- Dawid Bach (184629)
Cel projektu:
Stworzenie prototypu bazy danych zawierającej informacje o ofertach mieszkań w całej Polsce, wykonanie statystycznej analizy i wizualizacji tych danych oraz propozycja specyfikacji modelu uczenia maszynowego przewidującego ceny tych mieszkań na podstawie ważących cech.
Zrealizowanie wyznaczonych wyżej celi przy użyciu technologii chmurowych.
Zakres projektu:
- zrozumienie dziedziny, którą zajmuje się projekt
- zbadanie dostępnych źródeł danych
- zebranie danych
- weryfikacja danych
- czyszczenie danych
- szkolenia z metod uczenia maszynowego
- szkolenia z przetwarzania dużej ilości danych
- wybranie modeli uczenia maszynowego
- testowanie modeli
- dobieranie hyper parametrów testowanych modeli
- wizualizacja efektów pracy
- analiza statystyczna danych
Planowane, wymierne efekty projektu:
- Prototyp bazy danych ofert mieszkań w Polsce
- Wnioski z przeprowadzonej analizy statystycznej rynku nieruchomości w Polsce
- Specyfikacja modelu szacującego ceny mieszkań z dokładnością 5%

Grant IDUB "Technetium" (I miejsce), 24750 PLN
Okres realizacji: 1/05/2022- 31/04/2023
Skład zespołu realizującego projekt:
- Paweł Żak (180308)
- Uladzislau Hryvacheuski (191919)
- Julia Malinowska (184270)
- Konstancja Piksa (170863)
Cel projektu:
Celem projektu jest przekrojowe modelowanie oceny zdolności kredytowej gospodarstw domowych poprzez naśladowanie praktyk głównych kredytodawców, wykorzystując dostępne informacje z mikrodanych LIS Cross-National Data Center w Luksemburgu. LIS jest największą dostępną bazą danych dochodowych zharmonizowanych mikrodanych zebranych od około 50 krajów w Europie, Ameryce Północnej, Ameryce Łacińskiej, Afryce, Azji i Australazji w ciągu pięciu ostatnich dekad. Zharmonizowane we wspólnych ramach zestawy danych LIS zawierają informacje dotyczące gospodarstw domowych i osób w zakresie dochodów z pracy, dochodów kapitałowych, zabezpieczenia społecznego i prywatnych transferów, podatków i składek, demografii, zatrudnienia i wydatków. W bazach Luxembourg Income Study Database (LIS) oraz Luxembourg Wealth Study Database (LWS) ograniczenia kredytowe oraz sama ocena kredytowa gospodarstw domowych mogą zostać zidentyfikowane i oszacowane.
Planowane, wymierne efekty projektu:
- warsztaty z praktyki scoringu kredytowego – w języku R oraz oprogramowaniu Stata, logując się zdalnie wprost do bazy danych LIS oraz LWS poprzez interfejs Lissy, manipulując realnymi mikrodanymi
- nauka programowania wieloetapowych analiz w języku R, tworzenia i publikowania profesjonalnych raportów analitycznych, korzystania z mikrodanych wejściowych w zewnętrznych bazach

Grant IDUB Plutonium, 85295,50 PLN
Okres realizacji: 1/05/2022- 30/04/2024
Skład zespołu realizującego projekt:
- Paweł Żak
- Paulina Leszczełowska
- Damian Fiłonowicz
- Krystian Opała
- Bohdan Tsynalievskyi
- Konstancja Piksa
- Miłosz Wójcik
- Jakub Kukowski
- Szymon Cimiński
- Kacper Guzewicz
- Dawid Bach
- Kacper Kędzierski
- Michał Ganczarenko
- Lilianna Czaniecka
- Dawid Mielewczyk
- Marcin Kyć
- Konrad Marciniak
- Wojciech Białek
- Julian Wacławik
- Piotr Jarmoszewicz
- Marcin Tyszkiewicz
- Jan Droździecki
- Uladzislau Hryvacheuski
- Wojciech Wicki
Cel projektu:
Zamysłem projektu jest zebranie danych o nieruchomościach w Polsce przy użyciu nowoczesnych metod web scrapingu (metoda wyciągania danych ze stron internetowych). Za źródła posłużą nam polskie strony internetowe związane z nieruchomościami np. otodom.pl, olx.pl czy gumtree.pl oraz inne regionalne internetowe biura nieruchomości w całej Polsce.
Wyżej wyznaczone cele zostaną zrealizowane przy użyciu technologii chmurowych.
Zakres projektu:
- zrozumienie dziedziny, którą zajmuje się projekt
- zbadanie dostępnych źródeł danych
- zebranie danych
- weryfikacja danych
- czyszczenie danych
- szkolenia z metod uczenia maszynowego
- szkolenia z przetwarzania dużej ilości danych
- wybranie modeli uczenia maszynowego
- testowanie modeli
- dobieranie hyper parametrów testowanych modeli
- wizualizacja efektów pracy
- analiza statystyczna danych
Planowane, wymierne efekty projektu:
- Celem całego przedsięwzięcia jest przygotowanie członków koła zarówno do dalszej edukacji w wybranych przez siebie dziedzinach jak i na rynek pracy. Naszym zdaniem zaprezentowanie naszych odkryć w dwóch formach - publikacji naukowej oraz aplikacji internetowej - pozwoli nam w pełni wykorzystać potencjał zebranego zespołu oraz efektywniej reprezentować akademickie środowisko Politechniki Gdańskiej niż w przypadku samej publikacji.