Използване на бейсовска статистика за статистически изводи при непредварителни извадки (през примера на изследването на отпадащи студенти в бакалавърска степен на обучение във Философския факултет на Софийския университет “Св. Климент Охридски”)

Калоян Харалампиев

СУ „Св. Климент Охридски“

Имейл: k_haralampiev@phls.uni-sofia.bg

Абстракт: Много често при работата на терен се срещат трудности, които водят до това, че една извадка, която е планирана като представителна, всъщност се оказва непредставителна. Най-често срещаният проблем е високият дял на неоткритите и/или неотговорили лица. В този случай не е коректно да се използват класическите статистически методи за построяване на доверителни интервали и/или за проверка на статистически хипотези. Това налага да се използва бейсовска статистика, която позволява да се построяват доверителни интервали и да се проверяват статически хипотези на базата на данни от непредставителни извадки. Точно такъв беше случаят при изследването на отпадащите студенти в бакалавърска степен на обучение във Философски факултет на Софийски университет „Св. Климент Охридски“. Изследването на отпадналите студенти беше планирано като изчерпателно, но поради ниския процент на попълнени анкетни карти то беше реализирано като непредставителна извадка. Изследването на контролната група от студенти, продължаващи своето образование, беше планирано като представителна извадка, но поради високия процент на неоткритите и/или неотговорили студенти, то също беше реализирано като непредставителна извадка. Това наложи сравнението между двете групи да бъде направено с помощта на бейсовската статистика.

Ключови думи: представителни извадки, непредставителни извадки, статистически изводи и заключения, доверителни интервали, проверка на статистически хипотези, бейсовска статистика.

Using of Bayesian statistics for statistical inferences with non-representative samples (based on an example of the research of the dropout bachelor students in the Faculty of Philosophy of the Sofia University “St. Kliment Ohridski”)

Kaloyan Haralampiev

Sofia University “St. Kliment Ohrdski”

E-mail: k_haralampiev@phls.uni-sofia.bg

Abstract: Very often in the course of fieldwork, there are difficulties which lead to a situation in which a sample that has been planned to be representative is actually non-representative. The most common problem is the high proportion of undiscovered respondents and/or non-respondents. In this case, it is not correct to use the classic statistical methods for confidence intervals and/or hypotheses testing. There is a need to use Bayesian statistics, which allows confidence intervals to be constructed and statistical hypotheses to be tested based on non-representative sampling data. This is exactly the case in the study of the dropout Bachelor students in the Faculty of Philosophy of Sofia University „St. Kliment Ohridski“. The dropout study had been planned to be exhaustive, but due to the low percentage of filled-in questionnaires, it was implemented as a non-representative sample. The study of the control group of students continuing their education had been planned as a representative sample, but due to a high percentage of undiscovered and/or non-responded students, it was again implemented as a non-representative sample. This required the comparison between the two groups to be made by use of Bayesian statistics.

Keywords: representative samples, non-representative samples, statistical inferences, confidence intervals, hypotheses testing, Bayesian statistics.