跳到主要內容區

基礎貝氏統計 - 心理所二年級 張良聖

課程名稱基礎貝氏統計      授課教師統計 李國榮老師
心得分享者心理所二年級 張良聖
前言
我是成大心理所碩二張良聖,第一次來修模組化課程,選擇了李國榮老師的《基礎貝氏統計》課程。我之前曾修過心理系的心理教育統計學,當時陳俊宏老師有提到「頻率學派」(古典機率)與貝氏學派(先驗機率)間的簡短比較。由於我在接下來的學期要大量收案,還得舉辦實習課課程、投稿學會壁報、撰寫期刊文章、擔任兼任助理等等,實在沒什麼時間挪空來修課,剛好在暑假期間看到成大跨領域模組化課程有開設貝氏統計課程,也只有1學分,因此前來修課,看看自己能否收穫些什麼。
 
課程介紹
本課程主要介紹貝氏學派的統計理論,像是貝氏統計依賴先驗機率分布,也就是研究者(使用者)根據過往自身的主觀經驗所推論的機率分布。相對而言後驗機率分布則會隨著先驗機率分布、資料機率分布與預設機率模型所推證的超參數(hyperparameter)做改變;同時後驗期望值也會隨著先驗期望值(prior mean)與資料平均數(data average)的權重而有所改變。與之前在心理系所學到的古典機率不同的是,貝氏機率假定參數可被視為隨機變數並與資料概似性相關聯,而古典機率則是假定參數被視為固定數值但未知(實際值大概只有上帝才能知道)。另外,本課程也討論貝氏學派的幾種能被簡單證明出來的先驗-資料機率模型:Beta-Binomial模型、Gamma-Poisson模型、Normal-Normal模型,以及其實際應用例題。這門課助教很用心花了許多時間,介紹給我們諸多使用R程式語言及R Markdown的基本方法,以及套件如LearnBayes等。
 
授課風格
其實在上個學期,心理系有邀請李國榮老師至心理系seminar分享「Bayesian mixed models for longitudinal data」主題。聽完主題後,我隱隱覺得要找個機會來修習老師所開設的貝氏統計課程。整門模組化課程聽下來,李老師不會講得很枯燥乏味,「盡力地」將那三項模型的導證過程講得簡單生動又活潑(我能理解,要講述數理過程真的很難活躍起來,自己也有相關的教學經驗……)。上課期間,老師還向我們聊起最近的學術研究生活。我個人是蠻喜歡聽教授們的研究生涯與相關八卦,所以每次都讓我感到很精采。
 
課程心得
我在這門課中學習最多的是證明各種後驗機率分布是如何與先驗機率分布呈正比。雖然自己有修習過微積分、心理教育統計學及機率論,然而所學的都是些簡單的證明方法,並沒有像數學系那般嚴謹(有旁聽過幾次,但學習坡度真的是陡到一個不行)。因此在這次模組化課程中每次在推演每項後驗機率分布的證明時,都讓我花費一大段時間去理解。然而對我而言,嚴格證明的重要性是能夠幫助理解過程,因而對於結果的理解也相對地大幅度提升。例如Beta-Binomial模型下的後驗機率分布服從Beta(α+y, β+n-y),所有推證過程一定要有數學上的驗證來支撐,只要不推論全部過程且不斷地思考整項過程的邏輯,相信所有修課同學「背誦」起來後用不著多少時間,就會像心理學上Ebbinghaus遺忘曲線那般,指數般地下降給忘得差不多了吧。因此,還是很感謝教授花了許多時間在做推證,讓我們有一些時間可以沉浸這種思考過程。雖然教授不厭其煩地再三強調,由於時間不足,加上大家對微積分似乎不是很熟悉,如果對於貝氏統計有想要做更深更廣的探討,可以修習統計系開設的《貝氏分析》課程。儘管如此,這門課對我來說是不錯的入門,起碼讓我知道,之後若我有任何心理學研究使用到貝氏統計模型,可以較為簡單地去尋找與之相關的資源,嘗試了解其過程與結果並加以運用。
另一個讓我學到很多的是使用R Markdown。在這門課之前,我已經有一年多使用R程式語言的經驗,具備較為熟練的操作方法,因此使用R語言對我不再是很困難的事情。然而卻在自修R Markdown時碰壁許多,不是很能理解Markdown的語法。但在本課程助教的幫助下,我快速理解如何使用Markdown語法,讓我很快地能夠生出我想要的數式,真的很快(以前生成數式時,我是用Word的方程式慢慢地輸入,哈哈)!雖然這不是本課程的主要內容,但對我而言,能使用Markdown語法生成數式是種重大進步。
本課程我覺得可惜的是沒有介紹更多的機率模型及實例,畢竟在接近18小時的短課程中,確實很難介紹到諸多統計方法(如MCMC等)。個人建議未來可以將前述的統計學與機率學知識給濃縮起來,多介紹些貝氏統計方法、R的相關套件與函式(像如何利用更多LearnBayes套件的函式),並給予相關的貝氏統計學習網站,讓學生們往後覺得不足時,可以自行上網學習,更快地查詢相關關鍵字。或者建議可以將本課程改成1.5學分,多一些時間讓老師及助教帶領我們探索更多有趣的貝氏統計模型及實例。
 
給同學們的建議
想要修習本課程的話,個人建議要先修統計學(不是心理教育統計學,因為會上到Gamma/Beta/Poisson分布!)與微積分課程,才能對教授對五花八門的各種後驗機率分布證明過程產生更多共鳴。另外,多少要對R語言感到興趣,否則在繳作業或寫報告時,就很難完成唷!對了,如果是開在上午的話,就要有早起、上課連續3小時多、連續5天的熱情與覺悟!
 
關鍵字 #成大模組化 #貝氏學派 #先驗機率分布 #後驗機率分布 #後驗期望值 #R語言 #RMarkdown
瀏覽數: