[스노피 AI] Vision Transformer 쉽게 이해하기 - 3. Patch Embedding in Vision Transformers
1. Introduction to Patch EmbeddingDefinition: 패치 임베딩은 입력 이미지를 더 작은 고정 크기 패치로 나누는 ViT(Vision Transformers)에서 사용되는 기술입니다. 그런 다음 각 패치는 평면화되고 벡터 공간에 선형으로 투영되어 Transformer 아키텍처에서 처리할 수 있는 일련의 임베딩이 생성됩니다.Importance: 패치 임베딩을 사용하면 Transformer가 NLP 작업에서 시퀀스를 처리하는 방식과 유사하게 이미지를 처리할 수 있으므로 모델이 이미지의 여러 부분 간의 관계와 종속성을 캡처할 수 있습니다.2. Process of Patch Embedding Steps: step 1. 이미지를 패치로 나누기 step 2. ..
SnowPea(스노피) AI
2024. 6. 20. 17:30