İnteraktif videolar; kullanıcı etkileşimi, sesli komutlar ve yönlendirmeler içeren multimedya içeriklerdir. Bu videolardan sesleri analiz ederek içerik dökümü oluşturmak ve bunu PDF formatına çevirmek, eğitim, toplantı özetleri, röportaj arşivleri ve daha birçok kullanım için oldukça değerlidir. Bu makalede, bir videonun ses içeriğini işleyip metne dönüştürme ve sonrasında düzenli bir PDF çıktısı alma sürecini adım adım anlatıyoruz.
1. Video Sesini Ayıklama (Extract Audio)
İlk adım video dosyasından sesi çıkartmaktır.
✅ Önerilen araç: FFmpeg
ffmpeg -i video.mp4 -vn -acodec copy ses.aac
veya WAV formatı isterseniz:
ffmpeg -i video.mp4 -ab 160k -ac 2 -ar 44100 -vn ses.wav
2. Sesi Metne Dönüştürme (Speech to Text)
Videodaki konuşmaları yazıya dökmek için çeşitli yapay zeka tabanlı çözümler kullanılabilir.
Önerilen araçlar:
-
OpenAI Whisper (yüksek doğruluk oranı)
-
Google Speech-to-Text API
-
Vosk (offline seçenek)
Whisper komut örneği:
whisper ses.wav --language Turkish --model medium
Çıktı: ses.txt
dosyası
3. Metin Düzenleme ve Formatlama
Elde edilen ham transkript genellikle zaman kodları ve düzensiz yapılar içerir. Metin düzenleme adımında:
-
Zaman kodlarını kaldırın (veya isteğe bağlı bırakın)
-
Paragraf yapısını oluşturun
-
Konuşmacı isimleri ekleyin (örneğin: Röportajlarda)
-
Gereksiz sesleri ("eee", "ııı") temizleyin
4. PDF Dosyası Oluşturma
Yöntem 1: Word veya LibreOffice üzerinden
-
ses.txt
içeriğini Word'e yapıştırın -
İstenilen şekilde biçimlendirin
-
"Dosya > Farklı Kaydet > PDF" şeklinde kaydedin
Yöntem 2: Python ile otomatik PDF oluşturma
from fpdf import FPDF
pdf = FPDF()
pdf.add_page()
pdf.set_font("Arial", size=12)
with open("ses.txt", "r", encoding="utf-8") as f:
for line in f:
pdf.multi_cell(0, 10, line)
pdf.output("video_ozeti.pdf")
Ekstra: Slaytlı veya Etkileşimli PDF'ler
-
Canva veya Adobe InDesign gibi araçlarla ses metnini görsel öğelerle zenginleştirip PDF haline getirebilirsiniz
-
İnteraktif PDF'lerde bağlantı, buton, ses dosyası ekleme gibi özellikler de desteklenir
✅ Sonuç
İnteraktif videolardan ses çıkarıp yazıya dökerek PDF’e dönüştürme işlemi; otomatikleştirilebilen ve birçok alanda fayda sağlayan bir yöntemdir. FFmpeg, Whisper gibi açık kaynaklı araçlarla bu süreç tamamen ücretsiz ve yüksek doğrulukla yapılabilir.