ISTRAŽIVANJE PODATAKA 1

I smer

Ova stranica je posvećena kursu Istraživanje podataka 1 na 3. godini osnovnih studija na studijskom programu Informatika.

Nastavne teme:

  • Tipovi i kvalitet podataka
  • Mere sličnosti
  • Priprema podataka
    • izdvajanje i vizuelizacija karakteristika podataka
    • čišćenje podataka
    • redukcija dimenzionalnosti podataka
  • Klasifikacija podataka
    • stabla odlučivanja i slučajne šume
    • k najbližih suseda
    • Naivni Bajesovski klasifikator
    • metod potpornih vektora
    • mere kvaliteta modela
    • obrada teksta
    • rad sa nebalansiranim klasama
  • Algoritmi klasterovanja
    • klasterovanje zasnovano na gustini
    • hijerarhijsko klasterovanje
  • Pravila pridruživanja

Predmetni nastavnici:

Asistenti:

Završni ispit

  • Praktični deo: 40 poena (2.5h, prag 50%)
    • U slučaju ponovnog izlaska na praktični deo ispita, poništavaju se prethodno ostvareni poeni na praktičnom delu ispita.
  • Teorijski deo: 60 poena (prag: 30 poena) koji se može polagati na dva načina:
    • u redovnim ispitnim rokovima, nakon položenog praktičnog dela
      • položeni praktični deo važi do prvog izlaska na teorijski deo ispita
      • teorijski deo ispita se može polagati u istom ispitnom roku kao praktični deo ili u bilo kom narednom roku u akademskoj 2025/26. godini
    • polaganjem 4 testa po 15 poena na predavanjima tokom semestra
      • svaki test će se raditi pismeno, trajaće oko 15 minuta i imaće 3 ili 4 teorijska pitanja
      • testovi će se okvirno održati u 4., 7., 10. i poslednjoj nedelji semestra, a tačan termin biće objavljen na predavanjima
      • testovi se ne mogu nadoknaditi. Ukoliko neki od testova propustite ili niste zadovoljni uspehom, možete izaći na teorijski deo ispita u nekom od ispitnih rokova
      • teorijski deo položen preko testova važi tokom cele akademske godine, čak i ako student ne položi praktični deo ispita ili nije zadovoljan uspehom na praktičnom delu i želi da polaže ovaj deo ponovo
Da bi se ispit položio, neophodno je u zbiru imati najmanje 51 poen.

Primeri praktičnog dela ispita

Literatura

Korisni linkovi:

Svi materijali sa vežbi nalaze se u GitHub repozitorijumu na sledećem linku.

Nedelja 1

Nedelja 2

Nedelja 3

Nedelja 4

Nedelja 5

Nedelja 6

Nedelja 7

Nedelja 8

Nedelja 9

Nedelja 10

Nedelja 11

Nedelja 12

Nedelja 13

  • Vežbanje za ispit

Anketa o kursu Istraživanje podataka 1

Molimo vas da popunite anonimnu anketu na ovoj adresi. Vaši odgovori će pomoći u daljem unapređivanju kursa.

Rezultati četvrtog teorijskog testa

Rezultate četvrtog teorijskog testa možete pogledati ovde. Studenti zainteresovani za uvid u radove za 1. tok mogu doći u sredu, 24.6. u 12h na Studentski trg, a za 2. tok se mogu javiti mejlom predmetnom profesoru.

22. 6. 2026.

Raspored za 4. teorijski test

Raspored polaganja 4. teorijskog testa možete pogledati ovde. Mole se studenti da:
  • polažu u terminu i u učionici koji su za njih predviđeni rasporedom polaganja. Ukoliko nekome više odgovara drugi termin, može se zameniti sa koleginicom ili kolegom iz tog termina. Nema potrebe da o tome obaveštavate predmetne profesore.
  • ukoliko nisu na spisku, polažu u 2.grupi (od 11:45) u sali 706.
  • budu ispred učionice 10 minuta ranije.
  • ponesu indeks.

17. 6. 2026.

4. teorijski test

Četvrti teorijski test će biti održan u četvrtak, 18.6. u terminu predavanja. Planirano je da test bude održan na početku 1. časa (11:15 za oba toka) i da traje 20 minuta. U slučaju većeg broja prijavljenih biće organizovano više grupa a eventualni raspored po grupama će biti objavljen blagovremeno na stranici predmeta.

Četvrti test će uključiti poglavlja 12, 13 i 14 iz skripte.

Mole se studenti zainteresovani da izađu na 4. test da se upišu u ovu tabelu najkasnije do 16.6. u 14h.

7. 6. 2026.

Rezultati trećeg teorijskog testa

Rezultate trećeg teorijskog testa možete pogledati:
  • ovde, za 1. tok. Radovi se mogu pogledati u utorak, 2.6. od 19h na Studentskom trgu ili u četvrtak, 11.6. u pauzama između predavanja.
  • ovde, za 2. tok. Radovi se mogu pogledati u pauzama između predavanja.

2. 6. 2026.

Raspored za 3. teorijski test

Raspored polaganja 3. teorijskog testa možete pogledati ovde. Obratite pažnju da će se vreme polaganja razlikovati od ranije zbog gostujućeg predavanja kompanije Bosch, pa tako prva grupa počinje u 12:30 a druga u 13h. Mole se studenti da:
  • polažu u terminu i u učionici koji su za njih predviđeni rasporedom polaganja. Ukoliko nekome više odgovara drugi termin, može se zameniti sa koleginicom ili kolegom iz tog termina. Nema potrebe da o tome obaveštavate predmetne profesore.
  • ukoliko nisu na spisku, polažu u 2.grupi (od 13:00) u sali 706.
  • budu ispred učionice 10 minuta ranije.
  • ponesu indeks.

26. 5. 2026.

3. teorijski test

Treći teorijski test će biti održan u četvrtak, 28.5. u terminu predavanja. Planirano je da test bude održan nakon gostujućeg predavanja (oko 12:30) i da traje 20 minuta. U slučaju većeg broja prijavljenih biće organizovano više grupa a eventualni raspored po grupama će biti objavljen blagovremeno na stranici predmeta.

Treći test će uključiti potpoglavlja 7.2, 7.3 i poglavlja 8, 9, 10 i 11 iz skripte.

Mole se studenti zainteresovani da izađu na 3. test da se upišu u ovu tabelu najkasnije do 26.5. u 14h.

21. 4. 2026.

Nadoknada vežbi za grupe 3i1a i 3i1b

Vežbe neće biti održane 18.05. i 19.05. Časovi će biti nadoknađeni unapred, u subotu 16.05. 12-14h online, putem Webex platforme. Link za pristup Webex sastanku: https://matf.webex.com/meet/nevena_ciric.

14. 5. 2026.

Rezultati drugog teorijskog testa

Rezultate drugog teorijskog testa možete pogledati ovde. Radovi se mogu pogledati na pauzama između predavanja predmetnih profesora.

13. 5. 2026.

Gostujuće predavanje

U okviru kursa Istraživanje podataka 1 će tokom maja biti održana dva gostujuća predavanja predstavnika kompanije Bosch, u kojima će biti predstavljen njihov projekat "Glas korisnika" (Voice of the Consumer).

Projekat ima za cilj sticanje uvida u korisničko zadovoljstvo analizom recenzija i ocena korisnika na Bosch Power Tools e-commerce platformama tokom kupovine i korišćenja Bosch alata. Obrada podataka uključuje primenu algoritama za aspect-based sentiment analizu, evaluaciju kvaliteta podataka, praćenje zadovoljstva korisnika i podršku blagovremenoj reakciji.

Predavanja će biti održana 14. i 28. maja u terminu prvog časa predavanja iz Istraživanja podataka 1, u 11:15, u sali 706.

Plan predavanja

14.5.2026
  1. Opis projekta
    • Poslovni zahtevi: omogućiti korisnicima unutar Boscha višedimenzionalni uvid u kvalitet proizvoda kao podršku odlukama
    • Tehnički izazovi: obrada 30M+ recenzija iz heterogenih izvora i pouzdan klasifikacioni model za ekstrakciju sentimenta po aspektima
  2. Data Engineering
    • Prikupljanje korisničkih recenzija i uticaj heterogenosti izvora na podatke
    • Pregled cloud infrastrukture i radnog okruženja (Azure, Databricks, ADF) kroz primere iz pipeline-a
    • Distribuisana obrada u Sparku (DAG-ovi, lazy evaluation, narrow vs. wide transformacije)
    • Optimizacije: broadcasting i raspoređivanje API poziva
  3. Uvod u sentiment analizu i pregled pristupa (uvod u naredno predavanje)
28.5.2026
  1. Primena metoda istraživanja podataka
    • Klasifikacija recenzija u unapred definisane kategorije/aspekte korišćenjem LLM-ova
    • Fine-tuning modela
    • Evaluacija modela i praćenje performansi
  2. Vizuelizacija i analitički uvid u podatke

Predavači

Aleksa Milenković radi u kompaniji Bosch na poziciji Data Scientist-a. Ima 8 godina iskustva u IT industriji i sektoru digitalizacije. Završio je softversko inženjerstvo na Elektrotehničkom fakultetu (2021), a prethodno Matematičku gimnaziju.

Dr Luka Antonić takođe radi u kompaniji Bosch na poziciji Data Scientist-a. Završio je osnovne i master studije na Fizičkom fakultetu (smer teorijska fizika), a potom doktorske studije na Technion – Israel Institute of Technology (2025). Ima 6 godina iskustva u istraživačkom radu.

Predavanje je otvoreno za sve studente.

11. 5. 2026.

Raspored za 2. teorijski test

Raspored polaganja 2. teorijskog testa možete pogledati ovde. Mole se studenti da:
  • polažu u terminu i u učionici koji su za njih predviđeni rasporedom polaganja. Ukoliko nekome više odgovara drugi termin, može se zameniti sa koleginicom ili kolegom iz tog termina. Nema potrebe da o tome obaveštavate predmetne profesore.
  • ukoliko nisu na spisku, polažu u 2.grupi (od 11:45) u sali 706.
  • budu ispred učionice 10 minuta ranije.
  • ponesu indeks.

6. 5. 2026.

Raspored za 2. teorijski test

Raspored polaganja 2. teorijskog testa možete pogledati ovde. Mole se studenti da:
  • polažu u terminu i u učionici koji su za njih predviđeni rasporedom polaganja. Ukoliko nekome više odgovara drugi termin, može se zameniti sa koleginicom ili kolegom iz tog termina. Nema potrebe da o tome obaveštavate predmetne profesore.
  • ukoliko nisu na spisku, polažu u 2.grupi (od 11:45) u sali 706.
  • budu ispred učionice 10 minuta ranije.
  • ponesu indeks.

6. 5. 2026.

2. teorijski test

Drugi teorijski test će biti održan u četvrtak, 7.5. u terminu predavanja. Planirano je da test bude održan na početku 1. časa (11:15 za oba toka) i da traje 20 minuta. U slučaju većeg broja prijavljenih biće organizovano više grupa a eventualni raspored po grupama će biti objavljen blagovremeno na stranici predmeta.

Drugi test će uključiti poglavlja 5, 6 i potpoglavlje 7.1 iz skripte.

Mole se studenti zainteresovani da izađu na 2. test da se upišu u ovu tabelu najkasnije do 5.5. u 14h.

30. 4. 2026.

Rezultati prvog teorijskog testa

Rezultate prvog teorijskog testa možete pogledati: Radovi se mogu pogledati na pauzama između predavanja predmetnih profesora.

17. 4. 2026.

Nadoknada vežbi za grupu 3i1b

Čas vežbi koje nije održan zbog Uskršnjih praznika biće nadoknađen u sredu 22.04. 14-16h u učionici N201.

17. 04. 2026.

Raspored za 1. teorijski test

Raspored polaganja 1. teorijskog testa možete pogledati ovde. Mole se studenti da:
  • polažu u terminu i u učionici koji su za njih predviđeni rasporedom polaganja. Ukoliko nekome više odgovara drugi termin, može se zameniti sa koleginicom ili kolegom iz tog termina.
  • budu ispred učionice 10 minuta ranije.
  • ponesu indeks.

15. 4. 2026.

1. teorijski test

Prvi teorijski test će biti održan u četvrtak, 16.4. u terminu predavanja. Planirano je da test bude održan na početku 1. časa (11:15 za oba toka) i da traje 15 minuta. U slučaju većeg broja prijavljenih biće organizovano više grupa a eventualni raspored po grupama će biti objavljen blagovremeno na stranici predmeta.

Prvi test će uključiti prva tri poglavlja iz skripte. Što se tiče poglavlja 4 i 5, informacija o njihovom uključivanju u prvi test će biti objavljena naredne nedelje nakon završenih predavanja. Prvi test će uključiti prva četiri poglavlja iz skripte: Uvod u istraživanje podataka, Podaci, Mere sličnosti i različitosti, Priprema podataka.

Mole se studenti zainteresovani da izađu na 1. test da se upišu u ovu tabelu najkasnije do 13.4. u 14h.

2. 4. 2026.

Časovi vežbi za 3i1b u drugoj nedelji nastave

Vežbe će umesto u regularnom terminu biti održane u sredu 01.04. 14-16h u učionici N201.

23. 03. 2026.

Početak letnjeg semestra

Svim studentima želimo lep i uspešan početak letnjeg semestra!

23. 03. 2026.

Matematički fakultet, Univerzitet u Beogradu
školska 2025/26. godina