Scratch
从
facebook/facebook/convnextv2-base-22k-384继续训练, 断断续续跑了挺久, lr比较长时间是直线
regressor:
- prediction target:
np.log1p(twitter_favorite_count) - 低分段比较准, 但高分段不是特别准; 特别高分很多梗图, 而且预测值的分布和实际训练时的数值分布不同 TODO: check 区别
data:
- twitter favorites (从不同时间收集, 数据本身有noise, 同时”favorite count”本身作为target也比较模糊)
transformations:
- prediction target:
np.log1p(twitter_favorite_count) - input images: any → 768, no norm