1 min readAug 20, 2020
我這邊要提的是說數據量的不平衡不一定會對MAP判斷造成影響,主要影響是來自資料的代表性(也就是學習時候的資料是否足以代表整個母體)。
我這邊寫bias–variance trade-off這項好像有點不合適,因為一般是再說模型是否overfitting or underfitting(前提是當資料代表性族夠)。
比較少人探討資料特性造成的bias–variance trade-off,這邊可以想像如果我們的資料代表性不足,學習的分布偏向我們收集到的資料,這時候可能在學習分布時候可以學得很好,所以造成bias低,但variance增加。所以才會提到這個論點,但我忽略了一般敘述這件事情都在說的是模型的複雜度,造成你的困擾,不好意思。