Cara kerja Vision Transformer (ViT) dalam 10 menit: sebuah gambar bernilai 16×16 kata
Kali ini saya akan menjadi tajam dan pendek. Dalam 10 menit saya akan menunjukkan sedikit modifikasi pada arsitektur transformator untuk klasifikasi gambar. Karena ini adalah...