상세 컨텐츠

본문 제목

AI 비디오 생성기 WAN 2.1 으로 테스트 해 본 영상

A.I/생성형 A.I : 미드저니 등

by A.I Voodoo Houngan 2025. 3. 14. 13:30

본문

Wan 설치 포스트 

 

AI 비디오 생성기 WAN 2.1 설치 및 사용법 가이드

최근 AI 기술이 발전하면서 텍스트나 이미지를 활용해 자동으로 동영상을 생성하는 솔루션이 주목받고 있습니다. 그중에서도 WAN 2.1은 알리바바 클라우드에서 개발한 오픈 소스 AI 비디오 생성기

apex74.tistory.com

 

설치한 WAN2.1 로 Image to Video  이미지 투 비디오로 생성한 결과 입니다. 

그래픽 카드가 부족하여 해상도는 480P 로 테스트 했습니다. 

 

최대 12초 까지 생성 할수 있고 생성 스텝은 낮게 잡을수록 생성 속도가 빠르고 퀄리티가 낮습니다.

생성 시키면 그래픽 팬 돌아가는 소리가 요란하게? 나면서 일 하는 걸 티내요... 

시작이미지 여성분은 댄씽 자세로 샤라랄랄가 가능한 허벅지 괴물급 입니다

 

프롬프트는 간략하게 썼습니다.
gif 변환
시작 이미지

 

 

 

Prompt :The Rangers move into a combat stance, damaging the battlefield's explosions.

아 나의 메달오브 아너가 그래도 이렇게 역동적이 모션이라니
쉬프트 스케일 값을 5정도 까지 올려서 만들었어요

 

결론

무료로 생성 할수 있다는 것은 고무적? 입니다.

스테이블 디퓨전 이나 귀찮은? 설치 행위를 하지 않고 비교적 간단한 설치로 진행이 가능한 점이 장점 같습니다.

아침에 그래픽 카드 가격을 좀 알아보다가 그냥 닫았습니다. AI 시대가 더이상 발전할 일이 없게

종결되지 안는 이상 그래픽 카드 가격이 중고차 가격에 가까운 이 상황은 언제까지 갈지 누가 알겠습니까.. 

 

젠슨황 나쁜놈,NVDIA 망해라,NVDIA 주식 사 놓을껄,AMD 화이팅 

 


WAN 2.1 엔진 옵션에 대한 설명을 정리하면 다음과 같습니다.

1. Transformer model for Image to Video

  • WAN 2.1 - 480p 14B Image to Video quantized to 8 bits (추천)
  • 기본적으로 480p 해상도를 지원하며, 8비트 양자화(quantized)된 모델을 사용합니다.
  • 양자화를 적용하면 메모리 사용량이 줄어들지만, 품질이 약간 저하될 수 있습니다.

2. Text Encoder model

  • UMT5 XXL quantized to 8 bits
  • 대형 텍스트 인코더 모델이지만, 8비트 양자화를 통해 RAM 사용량을 줄였습니다.
  • 품질은 다소 저하될 수 있음.

3. Attention Type

  • 자동(Auto): sage2 > sage > sdpa 중 설치된 것에 따라 자동 선택
  • attention 메커니즘을 자동으로 선택하여 성능을 최적화.

4. Compile Transformer

  • (최대 50% 속도 향상 및 30% 더 많은 프레임)
  • 단, Linux / WSL 환경에서 Sage나 Flash 기반의 attention이 필요함.
  • OFF일 경우, Windows에서 WSL 없이 실행하는 경우 선택해야 함.

5. VAE Tiling (VAE 디코딩/인코딩 시 VRAM 요구량 감소)

  • Auto로 설정되어 있음.
  • VRAM 요구량을 줄이는 옵션이지만, 활성화하면 처리 속도가 다소 느려질 수 있음.

6. Boost (10% 속도 향상, VRAM 최대 1GB 추가 사용)

  • ON
  • 품질 저하 없이 속도를 10% 증가시키는 옵션.
  • 단, 최대 프레임 및 해상도에서 VRAM을 최대 1GB 추가로 사용할 수 있음.

7. Profile (전문가용, 일반 사용자는 변경할 필요 없음)

  • 일반적인 사용자는 변경할 필요 없는 설정.

관련글 더보기