Šifra predmeta:
358B2
Naziv predmeta:
Statistika i napredna obrada podataka u biohemiji

Školska godina:

2023/2024.

Uslovi pohađanja:

Nema uslova

ESPB:

6

Vrsta studija:

master akademske studije

Studijski program:

Biohemija: 1. godina, zimski semestar, izborni (E51B2), teorijsko-metodološki predmet

Nastavnik:

dr Filip Lj. Andrić
vanredni profesor, Hemijski fakultet, Studentski trg 12-16, Beograd

Saradnici:

Fond časova:

Nedeljno: dva časa predavanja + dva časa teorijskih vežbi (2+2+0)

Ciljevi:

Cilj kursa je da studenta upozna sa elementima statistike i napredne obrade podataka u biohemiji kroz jasan, razumljiv i praktičan način. Kako se u biohemijskoj praksi pored osnovnih statističkih tehnika koje omogućavaju bazičnu obradu podataka i imaju snažno uporište u kontroli kvaliteta i dobroj laboratorijskoj praksi, u sve većoj meri susreću tehnike optimizacije eksperimentalnih uslova i obrade multivarijantnih podataka, to je cilj kursa da osnovne statističke i hemometrijske koncepte predstavi pre svega na razumljiv i intuitivan način, odstupajući od rigoroznog matematičkog objašnjavanja. Posebna pažnja je posvećena definisanju i rešavanju konkretnih primera i problema koji se javljaju u praksi.

Ishod:

Nakon ovog kursa student bi trebalo da bude osposobljen da kroz individualan rad na računaru: koristi softverske pakete za osnovnu statističku i naprednu obradu podataka u biohemiji, pravilno prikazuje rezultate merenja, ispravno odabira i primenjuje statističke testove značajnosti, shvata koncepte metoda multivarijantne analize, koristi tehnike optimizacije eksperimentalnih uslova, izvodi zaključke i tumači rezultate obrade podataka.

Oblici nastave:

Predavanja, kolokvijumi. Predavanja se izvode u računarskoj učionici uz demonstraciju primera na odgovarajućim softverima.

Vannastavne aktivnosti:

Literatura:

Osnovna literatura:

  1. James N. Miller, Jane C. Miller: Statistics and Chemometrics for Analytical Chemistry, 6th ed., Pearson Education Ltd., Harlow, 2010.
  2. B. Dawson, R. G. Trapp: Basic and Clinical Biostatistics, Lange Medical Books/McGraw-Hill Companies Inc., New York, 2004.
  3. J. W. Kuzma, S. E. Bohnenblust: Basic statistics for the health science, McGraw-Hill Companies Inc., New York, 2005.
  4. Richard G. Brereton: Chemometrics: Data Analysis for the Laboratory and Chemical Plant, Wiley, 2003.

Pomoćna literatura:

  • Materijal za predavanja sa teorijskim osnovama i rešenim primerima iz prakse.

Dodatni materijal:

  Nastavne obaveze i način ocenjivanja

Predavanja:

10 poena (2 časa nedeljno)

Program rada:

  1. Uvod - Zašto statistika u Biohemiji?
    Problemi u biohemijskim merenjima. Šta je statistika? Kako nam statistika pomaže da razdvojimo relevantne informacije od statističkog šuma.
  2. Merenja u biohemiji i prikazivanje rezultata merenja
    Promenljive i tipovi promenljivih, histogrami, linijski grafici, rasuti grafici, tabelarno prikazivanje, mere lokacije i mere rasipanja, greške merenja, tačnost, preciznost, propagacija grešaka, značajne cifre, zaokruživanje brojeva i ispravno prikazivanje rezultata merenja.
  3. Teorija verovatnoće i osnovne raspodele verovatnoće
    Verovatnoća, raspodela verovatnoće i raspodela gustine verovatnoće, populacija, statistički uzorak, normalna raspodela, Studentova raspodela, Fišerova raspodela, hi-kvadrat raspodela.
  4. Parametrijski testovi značajnosti u slučaju kontinualnih obeležja
    Statističko testiranje, nulta i alternativna hipoteza, pojmovi značajnosti i poverenja, snaga, konzervativnost i osetljivost statističkog testa, jednosmerno i dvosmerno testiranje, spoljašnje vrednosti, testiranje odstupanja od normalne raspodele, poređenje dva statistički nezavisna uzorka, poređenje dva statistički zavisna uzorka, poređenje varijansi dva statistička uzorka, poređenje više statistički nezavisnih uzoraka, jednofaktorska i dvofaktorska analiza varijanse, post hoc testovi značajnosti: Fišerov, Tukijev i Šefeov model.
  5. Parametrijski testovi značajnosti u slučaju diskretnih obeležja
    Frekvencije opservacija, tabele kontigencije, hi-kvadrat test, Fišerov egzaktni test, Meknemarov test.
  6. Izvod iz neparametrijskih testova značajnosti
    Značajnost razlike referentne i srednje vrednosti, poređenje statistički zavisnih i nezavisnih skupova podataka, poređenje višestrukih skupva podataka, trendovi u podacima - test predznaka, test predznaka i ranga, Men-Vitni U-test, test homogenog niza, Kruskal-Valisova i Fridmanova analiza varijanse.
  7. Korelacija i regresija
    Korelacija kao mera povezanosti između promenljivih, Pirsonov, Spirmanov, Kendalov i Kruskalov korelacioni koeficijent, statistička značajnost korelacije. Linearno i nelinarno modelovanje, metod najmanjih kvadrata, analiza varijanse i hi-kvadrat test kao načini provere kvaliteta modela, koeficijenti modela i njihove greške, greške izvedenih rezultata iz koeficijenata modela.
  8. Osnovni koncepti kontrole kvaliteta i dobre laboratorijske prakse
    Faze analitičkog postupka, uzorkovanje i formiranje reprezentativnog uzorka, osnovni principi dobre laboratorijske prakse, program garancije kvaliteta, parametri validacije i verifikacije analitičkih metoda, interne i eksterne metode kontrole kvaliteta (kontrolne karte, međulaboratorijska ispitivanja, kolaborativne studije.
  9. Eksperimentalni dizajn i optimizacija
    Faktori i njihovi uticaj na ishod eksperimenta. Dizajn eksperimenata i matrica dizajna. Planiranje eksperimenata prema šemama faktorskog, centralno-složenog i Boks-Benkenovog dizajna. Konstrukcija matematičkog modela. Značajnost faktora i njihovih interakcija. Optimizacija eksperimentalnih uslova primenom metode površine odgovora.
  10. Eksplorativna analiza multivarijantnih podataka
    Multivarijantni podaci. Uvod u eksplorativnu analizu multivarijantnih podataka. Analiza glavne komponente i hijerarhijska klasterska analiza.

Teorijske vežbe:

0 poena (2 časa nedeljno)

Program rada:

  1. Uvod u softverske pakete za statističku i naprednu obradu podataka.
  2. Grafičko i tabelarno prikazivanje rezultata merenja, izračunavanje osnovnih elemenata deskriptivne statistike, procena greške i merne nesigurnosti, propagacija merne nesigurnosti, značajne cifre, pravila zaokruživanja i ispravno prikazivanje rezultata merenja.
  3. Upoznavanje sa osnovnim konceptima verovatnoće, teorijskim i praktičnim aspektima binomne, Gausove, log-normalne, Studentove, Fišerove, i hi-kvadrat raspodele.
  4. Detekcija nestandardnih opservacija. Provera tačnosti rezultata merenja, poređenje rezultata merenja prema parametrima rasipanja, poređenje aritmetičkih sredina dva nezavisna skupa podataka, poređenje uporednih skupova merenja, poređenje više statistički nezavisnih rezultata merenja. Ispitivanje uticaja različitih faktora na ishod biohemijskih procesa.
  5. Poređenje kategorijskih parametara. Konstrukcija tabela kontigencije. Primena hi-kvadrat testa, Fišerovog egzaktnog testa i Meknemarovog testa.
  6. Neparametrijski pristupi u: poređenju referentne vrednosti sa skupom ponovljenih merenja, poređenju nezavisnih i zavisnih skupova merenja, poređenju višestrukih skupova merenja, detekciji prisustva trendova u podacima.
  7. Kalibracija i konstruisanje lineranih i krivolinijskih regresionih modela. Procena greške modela, njegove kompleksnosti, grešaka očitane vrednosti i vrednosti koji proističu iz regresionih koeficijenata.
  8. Elementi kontrole i osiguranja kvaliteta. Procena osnovnih parametara validacije i verifikacije analitičkih metoda u biohemiji - preciznosti, tačnosti, linearnosti, radnog opsega, granice detekcije i kvantifikacije. Kontrolne karte za srednje vrednosti i opsege. Procena merne nesigurnosti. Uloga kolaborativnih studija i međulaboratorijskih testova uspešnosti u proceni parametara verifikacije.
  9. Odabir i analiza faktorskih eksperimenata. Konstrukcija plana eksperimenata prema centralnom-složenom i Boks-Benkenovom modelu. Konstrukcija regresionih modela, procena uticaja faktora i njihovih interakcija i odabir optimalnih eksperimentalnih uslova u biohemijskim i biotehnološkim procesima.
  10. Tretman multivarijantnih podataka. Upoznavanje sa praktičnim aspektima analize glavne komponente i tumačenjem dijagrama skorova i loadingova. Izvođenje hijerarhijske klasterske analize i tumačenje dendrograma objekata i varijabli.

Kolokvijumi:

30 poena

Pismeni ispit:

60 poena