看到一篇會議論文[1],宣稱用lenet-5在fmnist上可以實現(xiàn)超過98%的識別率。
當(dāng)時看到就驚呆了!
先介紹一下論文主體內(nèi)容:
第一部分引言強調(diào)了CNN在計算機視覺中有廣泛的應(yīng)用,并引出了lenet5是一個重要的CNN模型,并分6個方面闡述Fashion-MNIST是一個復(fù)雜的數(shù)據(jù)集。
第二部分介紹了相關(guān)的工作,即識別Fashion-MNIST的工作。
紅圈處為本文結(jié)果,可達98.8%
第三部分方法部分首先介紹了lenet5的結(jié)構(gòu),如下圖
之后介紹了評價指標(biāo),主要關(guān)注accuracy
第四部分介紹了實驗結(jié)果,并對實驗結(jié)果進行了討論
恕我無知,這是我第一次看到test acc比train acc還要高,而且對于Fashion-MNIST,竟然在8epochs達到了98.8%,我當(dāng)然想重復(fù)這個實驗,畢竟在Fashion-MNIST github頁面上,RESNet18[2]也只能實現(xiàn)95%的準(zhǔn)確率,最高為96.7%
根據(jù)文中給出的十分有限的超參數(shù):學(xué)習(xí) = 0.005 batchsize = 32 epochs = 10,我找出了用matlab寫的CNN程序,準(zhǔn)備重復(fù)這個實驗,由于論文中未提及用bn核dropout等技術(shù),我也沒用,下圖是我的結(jié)果:
呵呵,下圖是我用其他結(jié)構(gòu)跑的結(jié)果,超過92%
網(wǎng)絡(luò)結(jié)構(gòu)為:
XDM,是我對這篇論文的內(nèi)容理解有誤嗎?有沒有識別過Fashion-MNIST的出來發(fā)個話啊
[1](PDF) Classification of Garments from Fashion MNIST Dataset Using CNN LeNet-5 Architecture (http://researchgate.net)
[2]https://github.com/zalandoresearch/fashion-mnist