Шифра предмета:
358B2
Назив предмета:
Статистика и напредна обрада података у биохемији

Школска година:

2023/2024.

Услови похађања:

Нема услова.

ЕСПБ:

6

Врста студија:

мастер академске студије

Студијски програм:

Биохемија: 1. година, зимски семестар, изборни (E51B2), теоријско-методолошки предмет

Наставник:

др Филип Љ. Андрић
ванредни професор, Хемијски факултет, Студентски трг 12-16, Београд

Сарадници:

Фонд часова:

Недељно: два часа предавања + два часа теоријских вежби (2+2+0)

Циљеви:

Циљ курса је да студента упозна са елементима статистике и напредне обраде података у биохемији кроз јасан, разумљив и практичан начин. Како се у биохемијској пракси поред основних статистичких техника које омогућавају базичну обраду података и имају снажно упориште у контроли квалитета и доброј лабораторијској пракси, у све већој мери сусрећу технике оптимизације експерименталних услова и обраде мултиваријантних података, то је циљ курса да основне статистичке и хемометријске концепте представи пре свега на разумљив и интуитиван начин, одступајући од ригорозног математичког објашњавања. Посебна пажња је посвећена дефинисању и решавању конкретних примера и проблема који се јављају у пракси.

Исход:

Након овог курса студент би требало да буде оспособљен да кроз индивидуалан рад на рачунару: користи софтверске пакете за основну статистичку и напредну обраду података у биохемији, правилно приказује резултате мерења, исправно одабира и примењује статистичке тестове значајности, схвата концепте метода мултиваријантне анализе, користи технике оптимизације експерименталних услова, изводи закључке и тумачи резултате обраде података.

Облици наставе:

Предавања, колоквијуми. Предавања се изводе у рачунарској учионици уз демонстрацију примера на одговарајућим софтверима.

Ваннаставне активности:

Литература:

Основна литература:

  1. James N. Miller, Jane C. Miller: Statistics and Chemometrics for Analytical Chemistry, 6th ed., Pearson Education Ltd., Harlow, 2010.
  2. B. Dawson, R. G. Trapp: Basic and Clinical Biostatistics, Lange Medical Books/McGraw-Hill Companies Inc., New York, 2004.
  3. J. W. Kuzma, S. E. Bohnenblust: Basic statistics for the health science, McGraw-Hill Companies Inc., New York, 2005.
  4. Richard G. Brereton: Chemometrics: Data Analysis for the Laboratory and Chemical Plant, Wiley, 2003.

Помоћна литература:

  • Материјал за предавања са теоријским основама и решеним примерима из праксе.

Додатни материјал:

  Наставне обавезе и начин оцењивања

Предавања:

10 поена (2 часа недељно)

Програм рада:

  1. Увод - Зашто статистика у Биохемији?
    Проблеми у биохемијским мерењима. Шта је статистика? Како нам статистика помаже да раздвојимо релевантне информације од статистичког шума.
  2. Мерења у биохемији и приказивање резултата мерења
    Променљиве и типови променљивих, хистограми, линијски графици, расути графици, табеларно приказивање, мере локације и мере расипања, грешке мерења, тачност, прецизност, пропагација грешака, значајне цифре, заокруживање бројева и исправно приказивање резултата мерења.
  3. Теорија вероватноће и основне расподеле вероватноће
    Вероватноћа, расподела вероватноће и расподела густине вероватноће, популација, статистички узорак, нормална расподела, Студентова расподела, Фишерова расподела, хи-квадрат расподела.
  4. Параметријски тестови значајности у случају континуалних обележја
    Статистичко тестирање, нулта и алтернативна хипотеза, појмови значајности и поверења, снага, конзервативност и осетљивост статистичког теста, једносмерно и двосмерно тестирање, спољашње вредности, тестирање одступања од нормалне расподеле, поређење два статистички независна узорка, поређење два статистички зависна узорка, поређење варијанси два статистичка узорка, поређење више статистички независних узорака, једнофакторска и двофакторска анализа варијансе, post hoc тестови значајности: Фишеров, Тукијев и Шефеов модел.
  5. Параметријски тестови значајности у случају дискретних обележја
    Фреквенције опсервација, табеле контигенције, хи-квадрат тест, Фишеров егзактни тест, Мекнемаров тест.
  6. Извод из непараметријских тестова значајности
    Значајност разлике референтне и средње вредности, поређење статистички зависних и независних скупова података, поређење вишеструких скупва података, трендови у подацима - тест предзнака, тест предзнака и ранга, Мен-Витни У-тест, тест хомогеног низа, Крускал-Валисова и Фридманова анализа варијансе.
  7. Корелација и регресија
    Корелација као мера повезаности између променљивих, Пирсонов, Спирманов, Кендалов и Крускалов корелациони коефицијент, статистичка значајност корелације. Линеарно и нелинарно моделовање, метод најмањих квадрата, анализа варијансе и хи-квадрат тест као начини провере квалитета модела, коефицијенти модела и њихове грешке, грешке изведених резултата из коефицијената модела.
  8. Основни концепти контроле квалитета и добре лабораторијске праксе
    Фазе аналитичког поступка, узорковање и формирање репрезентативног узорка, основни принципи добре лабораторијске праксе, програм гаранције квалитета, параметри валидације и верификације аналитичких метода, интерне и екстерне методе контроле квалитета (контролне карте, међулабораторијска испитивања, колаборативне студије.
  9. Експериментални дизајн и оптимизација
    Фактори и њихови утицај на исход експеримента. Дизајн експеримената и матрица дизајна. Планирање експеримената према шемама факторског, централно-сложеног и Бокс-Бенкеновог дизајна. Конструкција математичког модела. Значајност фактора и њихових интеракција. Оптимизација експерименталних услова применом методе површине одговора.
  10. Експлоративна анализа мултиваријантних података
    Мултиваријантни подаци. Увод у експлоративну анализу мултиваријантних података. Анализа главне компоненте и хијерархијска кластерска анализа.

Теоријске вежбе:

0 поена (2 часа недељно)

Програм рада:

  1. Увод у софтверске пакете за статистичку и напредну обраду података.
  2. Графичко и табеларно приказивање резултата мерења, израчунавање основних елемената дескриптивне статистике, процена грешке и мерне несигурности, пропагација мерне несигурности, значајне цифре, правила заокруживања и исправно приказивање резултата мерења.
  3. Упознавање са основним концептима вероватноће, теоријским и практичним аспектима биномне, Гаусове, лог-нормалне, Студентове, Фишерове, и хи-квадрат расподеле.
  4. Детекција нестандардних опсервација. Провера тачности резултата мерења, поређење резултата мерења према параметрима расипања, поређење аритметичких средина два независна скупа података, поређење упоредних скупова мерења, поређење више статистички независних резултата мерења. Испитивање утицаја различитих фактора на исход биохемијских процеса.
  5. Поређење категоријских параметара. Конструкција табела контигенције. Примена хи-квадрат теста, Фишеровог егзактног теста и Мекнемаровог теста.
  6. Непараметријски приступи у: поређењу референтне вредности са скупом поновљених мерења, поређењу независних и зависних скупова мерења, поређењу вишеструких скупова мерења, детекцији присуства трендова у подацима.
  7. Калибрација и конструисање линераних и криволинијских регресионих модела. Процена грешке модела, његове комплексности, грешака очитане вредности и вредности који проистичу из регресионих коефицијената.
  8. Елементи контроле и осигурања квалитета. Процена основних параметара валидације и верификације аналитичких метода у биохемији - прецизности, тачности, линеарности, радног опсега, границе детекције и квантификације. Контролне карте за средње вредности и опсеге. Процена мерне несигурности. Улога колаборативних студија и међулабораторијских тестова успешности у процени параметара верификације.
  9. Одабир и анализа факторских експеримената. Конструкција плана експеримената према централном-сложеном и Бокс-Бенкеновом моделу. Конструкција регресионих модела, процена утицаја фактора и њихових интеракција и одабир оптималних експерименталних услова у биохемијским и биотехнолошким процесима.
  10. Третман мултиваријантних података. Упознавање са практичним аспектима анализе главне компоненте и тумачењем дијаграма скорова и лоадингова. Извођење хијерархијске кластерске анализе и тумачење дендрограма објеката и варијабли.

Колоквијуми:

30 поена

Писмени испит:

60 поена