팁/CUDA
CUDA 메모.
산과 나무
2016. 12. 22. 17:04
-블록/쓰레드/워프
*. 블록.
1. 여러개의 쓰레드로 구성 됨.
2. SM에 의해서 스케줄링 됨.
3. SM 은 워프단위로 쓰레드를 처리한다.
워프란 - 32개의 쓰레드를 묶어 워프라 하며, 진행단위가 된다.
작업은 워프 단위로 처리가 되기 때문에, Shared Memory 가 요구된다.
4. SM 당 할당되는 블록 수는 Compute ability 버전에 따라 결정됨.
5. 블록 당 쓰레드 수도 Compute Ability 버전에 따라 결정됨. 1024.
6. SM 당 워프 총 갯수도 Compute Ability 버전에 따라 결정됨.
6. SM당 워프는 최대 64 구성된다
2. SM당 블록 갯수.