1. GPU 벤더별 아키텍처 개요시작하기에 앞서 밑 내용은 NVIDIA GPU 기준으로 작성되었음을 알려드립니다.NVIDIA GPU를 포함한 주요 벤더사들의 아케턱처는 다음과 같이 간략하게 요약해두었습니다.항목NVIDIAAMDIntel연산 유닛 이름CUDA Core / Tensor CoreStream Processor / Matrix CoreXe Core / XMX Engine병렬 실행 단위Warp (32 Threads)Wavefront (64 Threads)SIMD Lane (8~16)GPU 클러스터 단위SM (Streaming Multiprocessor)CU (Compute Unit)Xe-core프로그래밍 모델CUDAROCm / HIPoneAPI / SYCL딥러닝 지원cuDNN, TensorRTMIO..