Hugging Face üzerindeki en güçlü açık kaynak video modellerinden Wan2.2 serisini keşfedin. Metinden video (T2V) ve görselden video (I2V) üretiminde çığır açan bu teknolojiyi Eka Sunucu'nun yüksek performanslı GPU altyapısıyla deneyimleyin.
Wan-AI, video üretimi ve düzenleme görevleri için optimize edilmiş, Mixture-of-Experts (MoE) mimarisine sahip güçlü bir model ailesidir.
Text+Image to Video. Tüketici elektroniği için en uygun model.
Text to Video. Sadece metinden sinematik videolar üretir.
Image to Video. Görselleri profesyonelce canlandırır.
Audio to Video. Sesten dudak senkronizasyonu ve animasyon.
Yapay zeka ile video oluşturma süreçleri, metin tabanlı modellere (LLM) göre çok daha fazla hesaplama gücü ve VRAM gerektirir. Wan-AI modelleri için doğru donanımı seçmek, projenizin başarısı için kritiktir.
| Model | Minimum VRAM | Önerilen Kart | Durum |
|---|---|---|---|
| Wan2.2-TI2V-5B Metin+Resim -> Video |
24 GB | RTX 4090 / 2x3090 | Ev/Ofis Uygun |
| Wan2.2-T2V-A14B Metin -> Video |
80 GB | NVIDIA A100 80GB | Sunucu Şart |
| Wan2.2-I2V-A14B Resim -> Video |
80 GB | NVIDIA A100 / H100 | Sunucu Şart |
| Wan2.2-Animate Video Düzenleme |
48 GB | RTX 6000 Ada / 2x4090 | Workstation |
RTX 4090 (24GB VRAM) donanımına sahip bir Eka Sunucu GPU sunucusunda veya kendi bilgisayarınızda bu modeli çalıştırmak için aşağıdaki adımları izleyin.
Ubuntu 22.04 LTS kullanmanız önerilir. Windows'a göre %30'a varan performans artışı sağlar.
sudo apt update && sudo apt install python3.10 python3.10-venv -y
python3.10 -m venv wan_env
source wan_env/bin/activate
pip install --upgrade pip
PyTorch ve gerekli yapay zeka kütüphanelerini yükleyin. CUDA 12.1 sürümü önerilir.
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install diffusers transformers accelerate einops opencv-python safetensors xformers
Hugging Face üzerinden modeli klonlayın. (Git LFS yüklü olmalıdır)
git lfs install
git clone https://huggingface.co/Wan-AI/Wan2.2-TI2V-5B
cd Wan2.2-TI2V-5B
Aşağıdaki komut ile 720p çözünürlüğünde, 24fps hızında bir video oluşturabilirsiniz.
python inference.py \
--prompt "cinematic drone shot of a futuristic city at sunset, neon lights, 8k, highly detailed" \
--image input_image.jpg \
--height 720 --width 1280 \
--frames 48 \
--fps 24
export PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True komutunu çalıştırarak bellek yönetimini optimize edebilirsiniz.
Yapay zekadan en iyi videoyu almak için doğru kelimeleri kullanmalısınız.
"Epic cinematic scene, golden hour lighting, slow motion, dramatic shadows, ultra detailed, film grain, anamorphic lens"
"Cinematic product video, soft studio lighting, slow camera movement, shallow depth of field, clean background, 4k look"
"A realistic human walking forward, natural body motion, smooth animation, cinematic lighting, stable camera, detailed face"
Negatif Prompt Önerisi (Neleri İstemiyoruz?):
"cartoon, anime, low quality, blurry, distorted, shaky, deformed, ugly, text, watermark"
Eka Sunucu'nun yüksek performanslı Ekran Kartlı Sunucuları (GPU) ile Wan-AI, Stable Diffusion ve diğer yapay zeka modellerini sorunsuz çalıştırın. Kurulum desteği bizden!