2009年10月5日 星期一

Introduction to LDA

Introduction to LDA

Linear Discriminant Analysis
Not latent dirichlet allocation

2009年8月6日 星期四

Experiment Result for Pair Method

此篇為闡述實驗結果,相關的說明在PPT的摘要中,可下載來看已獲得更詳細的說明。
1. 對於相同網站,可以下不同的query來作比較。
2. 對於相同網站,相同query,不同時間來做比較。

3. 詢問之前發表過的論文,詢問作者是否有留下測試資料。

4. Combine process之後可以針對每筆合併的vector新增feature

5. Attributefeature可以比較新增下一個attributefeature後的不同。或者下下個。

6. Attributeset中的位置也可以當作feature

7. 此次實驗為Attribute label,可嘗實驗instance label

8. 其他Domain的測試。

9. 多看論文。


Progress Report090806
View more presentations from GUANBO.





2009年4月29日 星期三

ProgressReport09/04/27

延續上次的議題
以Old.xml 作Testing New.xml作Training 的測試下
同樣feature的輸入 其表現結果非常不好
instance accurary只有不到20%的效果
attribute accurary只有1/4

嚐試使用其他的feature set
attribute accurary最佳的效果只有2/4
面對不同的XML資料 所適用的featrue set 差異很大


對new.xml vs old.xml適用的feature set 不一定能應用在old.xml vs new.xml的對應上




上圖是以上次的feature set 當作輸入
我們所關心的Class 6 ,17 ,27 ,32中
只有Class 27是正確對映到的之外
其他Class並沒有很明顯的對映到正確的Class

2009年4月22日 星期三

Progress Report(09/04/16)



1.增加時間類型的feature 以求提高 attribute 17的precision 及recall
增加兩種計算時間格式的方法 time1 及 time2 以及之前的五個屬性 {: _ . , ?} 由於{? _} 兩屬性成效不高 刪除

但結果仍然囧


舊資料

新資料
instance accuracy 30.59%
32.16%
Recall 6 0.93
0.93

17 0
0

27 0.5
1

32 0.857
0
Precision 6 0.189
0.25

17 0
0

27 1
0.969

32 0.92
0


2.比較不同Thread的Rejection 機制下的instance及attribute 的 accuracy (並畫圖)
摸索中

3.整理用過的程式


之前用c++寫 因為語言沒有支援xml 所以上網找了tinyxml
這是一款很多功能的xml 工具
http://www.grinninglizard.com/tinyxml/ 包含了驗證等功能 比lite還麻煩

也找了另一個m$出的簡易版XML,對於只要讀寫XML等動作也是非常簡便 (但也摸很久 囧)
http://msdn.microsoft.com/zh-tw/magazine/cc163436.aspx

直到我遇到他.............
C#
有種相逢恨晚的感覺
http://support.microsoft.com/kb/307548/zh-tw
真的是連猴子也會呢XD

4.比較舊feature set 以及新feature set 的instance 以及attribute 的accuracy


如圖一:




ps:帳號密碼try 好久 囧


用部落格分享照片、影音、趣味小工具和最愛清單,盡情秀出你自己 — Windows Live Spaces

test

test

聰明搜尋和瀏覽網路的免費工具列 — Windows Live 工具列