Nvidia GPU Raytracing and Optix (Siggraph 2012 Slide)
http://cafe.naver.com/infocg/9459
주요 슬라이드만 캡쳐했습니다.
Nvidia 의 레이트레이싱 관련 기술들
- Cuda : 언어이며 연산 플랫폼.
- OptiX : 레이트레이싱 개발자를 위한 미들웨어
- iray & mental ray : 라이센스된 렌더링 제품
- mental ray : 영화 산업에 촛점. 단독버전 및 플러그인 형태로 라이센스됨
- iray : 디자인 분야에 촛점. 플러그인 형태로 라이센스됨
- OptiX : 범용 GPU레이트레이싱 개발에 촛점. 무료
- iray 3 - 출시됨.
. 새로운 라이팅 알고리즘으로 더 힘든 라이팅 상황에서 더욱 정확하고 우수한 커스틱스
. 렌더 버퍼 지원 (디퓨즈, 스펙큘러, UVW, ID, 등등)
. 유연한 클러스터 관리기능
- 초기수준 라이트 패스 익스프레션 지원, 가을에 완료
. 광범위한 렌더링 패스 컨트롤
. 유연한 포스트 프로세싱 가능
- 인터렉티브 iray 는 현재 개발진행 중이며 연말에 이용가능해질 예정
- 다양한 렌더링 모드 지원
. 리얼타임 버전 : 매우 높은 해상도 가능 / 추정치가 크게 사용
. 인터렉티브 버전 : 인터렉티브 작업시 노이즈 거의 없음 / 물리기반은 아님
. 포토리얼 버전 : 물리기반 / 노이즈 발생
- GPU 레이트레이싱에 대한 미신들
. GPU에서는 단지 "패스 트레이싱" 만 가능하다 ?
-> 아니다. 다양한 기술이 가능
. 전문적 그래픽카드들만 레이트레이싱을 할 수 있다 ?
-> 아니다. 모든 Nvidia 그래픽카드에서 GPU컴퓨팅 언어가 실행됨
. GPU 렌더팜은 CPU팜에 비해 비싸다 ?
-> 아니다. 비용대 효율성이 높으며, 케플러에서는 더욱 그러하다
. GPU 레이트레이싱은 매우 어렵다 ?
-> 그렇다. OptiX가 레이트레이싱과 GPU개발 모두 가속시킨다(???)
. 한정된 GPU메모리 크기에 씬이 맞아야 한다?
-> 꼭 그렇진 않다. Panta Ray, CentiLeo, OptiX 2.5 paging, Nvidia Index
- 단일 GPU레이트레이싱 속도
. 일반적으로 동일 GPU세대일 경우 GPU코어수와 클럭속도에 비례
. GPU세대 사이의 이득은 어플리케이션/기술에 따라 다르다.
- 복수 GPU레이트레이싱 속도
. 솔루션에 의존. 렌더러들은 일반적으로 그러하며, OptiX 도 기본으로 지원함
. 확장의 효율성은 솔루션에 따라 다름.
일반적으로 느린 기법 (AO 등)은 빠른 기법에 비해 더 잘 비례
- 클러스터 속도 (멀티 머신 렌더링)
. 솔루션 의존적이며 OptiX는 불가능하나 iray 는 가능
- SLI 조합은 필요하지 않음
- 거의 모든 렌더러들은 단일 정밀도
- ECC 드라이버 비추천 : 정밀도 이득 없으면서 속도가 느려지며 메모리 많이 잡아먹음
- 윈도우7은 XP나 리눅스에 비해 다소 느림
- GPU 메모리 크기가 핵심
. 전체 씬은 GPU메모리 한도내에 있어야 함
. 복수 GPU의 경우 메모리 풀을 할 수 없으므로 각각의 메모리에 맞아야 함
. 만약 Out-of-Core 가 지원될 경우에는, GPU메모리에 맞는 경우에 비해 훨씬 느림
- 게임용 그래픽카드는 "데이터 센터"용도로 디자인 된 것이 아님
- 어도비 애프터이펙츠 CS6에 채용된 OptiX 는 100퍼센트 OptiX이며 x86코드는 전무함
- Optix 의 빠른 발전속도
. 2009년 11월, 버전1
. 2010년 8월, 버전2 : 페르미 아키텍쳐에서 2~5배의 속도 증가
. 2011년 1월, 버전2.1 : 64bit PTX , 복잡한 기법에서 50퍼센트 성능향상. 초기 CPU보조
. 2012년 4월, 버전2.5 : 메모리 페이징, GPU가속 구조
. 곧, 버전 2.6 : 첫 케플러 지원 및 코어 향상
. 곧 베타버전 나올 버전 3
No comments:
Post a Comment
로그인하지 않아도 댓글을 달 수 있습니다.