팁/CUDA

CUDA 메모.

산과 나무 2016. 12. 22. 17:04

-블록/쓰레드/워프

   *. 블록.
    1. 여러개의 쓰레드로 구성 됨.
    2. SM에 의해서 스케줄링 됨.
    3. SM 은 워프단위로 쓰레드를 처리한다. 
       워프란 - 32개의 쓰레드를 묶어 워프라 하며, 진행단위가 된다.
       작업은 워프 단위로 처리가 되기 때문에, Shared Memory 가 요구된다.             

    4. SM 당 할당되는 블록 수는  Compute ability 버전에 따라 결정됨.
    5. 블록 당 쓰레드 수도 Compute Ability 버전에 따라 결정됨. 1024.
    6. SM 당 워프 총 갯수도 Compute Ability 버전에 따라 결정됨.  
     
         



   6. SM당 워프는 최대 64 구성된다

        

 

2. SM당 블록 갯수.