起源

參加今年的 TNAET 其實是一個巧妙的機會,在今年的八月初參加了 Pixnet Hackathon ,在比賽中實際使用到 Pixnet 釋出了開放資料[1],發現其實很多有趣的 issue 可以試試看的,因此在活動結束其實也是抱持了一種整理報告的感覺,把一些心得做成筆記記錄下而已。

剛好看到 TANET 有在徵稿,就想多累積一下經驗值,做個投稿的練習。

晚宴

既然參加了研討會,就要做好做滿,因此我們也參加了不知道在幹嘛的晚宴。晚宴基本上就是一個大拜拜,如果不知道學術圈的人,其實蠻無聊的,默默吃東西的概念。

不過很好吃就是了:)

TANET 2015 晚宴

發表

論文

我們最後以 基於機器學習之動態垃圾訊息散佈者階層式偵測-實作於痞客邦開放資料為例 為題的投稿,發表在 Big Data 與資料探勘的 session。

本研究基於真實資料的角度,透過觀察垃圾訊息特性,分析垃圾訊息與該作者的分佈關係,提出一個以機器學習為基礎的垃圾訊息散佈者階層式偵測方法,透過階層式的偵測,除了可以有效並自動地判斷垃圾訊息,也能進一步挖掘出隱藏在垃圾訊息背後的散佈者。也很幸運的獲得這個 session 的最佳論文獎。

發表

由於個人的懶惰,其實只有聽我們報告那場的議程,聽完之後發現 Big Data 的面向真的很廣,像是將巨量資料的技術運用在姓名學研究、空氣汙染等等議題上,都是很有趣的應用!也因為大家的內容都很有趣,有些難度也很高,對我們為什麼拿獎其實有點出乎意料。

後記

很累!
很花錢!

雖然有最佳論文獎金,當三個分下來還是入不敷出。

Reference

[1] PIXNET Open API


License


本著作由 Chang, Wei-Yaun (v123582) 製作,
創用CC 姓名標示-相同方式分享 3.0 Unported授權條款釋出。