2013年10月17日 星期四

[課程] 清大資應所課程【資料探勘(Data Mining)】陳宜欣教授《2012修課分享》


課程名稱:資料探勘 (Data Mining) 資應所課程
教授:陳宜欣 
報告地點:清華大學台達館
修課時間:2012/09 - 2013/01
語言:英文

2012年修課比較特別,因為老師懷孕了,而且快要生產,所以沒有期末考,但是期末必須要報告論文,這大概是比往常還要不一樣的一點。我將在以下的文章分享修課經驗:



開學測驗英文聽力之考試 x 1

考試內容就是老師自己念一段文章,並且請你寫下她在錄音機內所問的問題。如果考試結果不及格,那麼之後每堂課都要簽到,假如未到,扣分制度是缺一次扣(1)分、缺兩次扣(1+4)分、缺三次扣(1+4+9)分、缺四次扣(1+4+9+16)分,以此類推。



隨機課堂小考 x N

老師會在課堂上公佈下一次小考所要考的內容,基本上我這屆小考都不算分,老師會請助教更改,老師稱此為鑑定自己的好方式。(老師不會跟你說不算分)



期中考 x 1

看考古題可以找出方向,但是不太可能會出一樣的題目。所以通常老師的期中考結果不會太好看,但如果認真看的話要70左右的機率還是很大,但高分不容易。老師在開學就強調:不會為了讓誰過就調分。


大程式作業 x 1

通常應該是兩份,但據說這學期助教忘記要出第二份,所以就只有一份大程式作業。


論文報告 x 1

英文報告,我當初是和印度人一起報告。老師採取班上同學給分制,基本上英文表達好勝於一切,報告太技術層面的話會導致分數不高,最好報告比較概念層面的,否則班上同學給分會不高,切記。報告結束之後老師通常會問的問題就那幾個,「這篇論文是屬於Data Mining的哪一個層面?」,「你覺得這個方法最大的缺點是什麼?」。



Final Project x 1

2012這屆是給一堆資料,要求你使用Data Mining中學到的方法去分析這些資料要表達什麼意思。重點是「結果要讓人意想不到。」千萬不要報告那種全世界都知道的事情,否則分數必然會不高,我們那組當時就是這樣,所以慘淡。


Term Paper

紙上報告這一學期所學習到的東西,每屆的格式要求不同。



上課風格

陳宜欣教授不大會注重於技術層面,幾乎都是觀念上的東西。她尤愛講歷史故事,所以會聽到很多電腦科學史的事情。她是中央資管碩士、南加大電腦科學博士,在美國教過幾年書,英文口說上沒問題,只偶爾有些文法上的錯誤,無大礙。

課程中時常會提出問題,讓同學去思考,通常同學們發表踴躍。她的課程通常一半外國人,一半台灣人,我猜可能因為她是清大IMPISA的主辦人之一,而且課程通常都是英文授課。基課程中只能使用英文對話,所有的報告都是要使用英文。



修課後感想

分數通常不會好看,因為老師強調不調分。此課程修課難度頗高,在所有課程的Loading中算是蠻重的,不適合沒興趣的同學修。如果修了此堂課,不建議此學期修超過三門課。若是你實驗室非常操,不建議修超過兩門課。如果同時修了高等資料庫跟資料探勘,期中考周要小心,因為此兩堂課的時間通常是一致的,考試會連環考,期中考周請準備好保肝丸。


1 則留言 :

  1. 學長您好
    我對陳宜欣老師開的這門課很有興趣,
    謝謝您細心整理了這門課的相關心得,
    但有點好奇程式作業有規定要使用哪種程式語言嗎?
    如果有, 請問是規定使用哪種程式語言呢?
    非常感謝!

    回覆刪除