各位同學好:
以下是關於作業二更改的部分,附錄為更改後的作業
1. 評分標準那邊有誤並已經做更新
2. 題目中提到所有的方法,都不用跟 pre-trained models 比較,只需要自己訓練固定次數就好。
- 例如大家都訓練10 epoch 就好(但是切記不能只有訓練1 epoch,太低沒有比較的意義)
- training/val acc curve 也是需要畫的
3. 第二題中的2層CNN,修改成為 2-4層CNN都可以。
- 關於如何認定CNN的層數:
- 一個layer必須等上一個layer完全計算完才能拿到數據,這樣算是兩層。
- 但如果一層中做很多事情,例如包含convolution、attention機制,並將attention結果乘回到convolution特徵上,最後輸出,這也可以算是一層(或一個block)。
- 不同的CNN架構中,一個block所包含的層數可能不同:
- ResBlock: 一個Block包含兩層。
- DenseBlock: 一個Block包含五層。
- SplitAttBlock (ResNeSt): 一個Block雖然包含兩層,但中間並非所有feature map都參與計算,最終是通過平均的方式來進行feature map的重新加權(reweighting)。