Aynı saat hızları temel alındığında yeni Penryn 65 nm'lik selefi Conroe'den biraz daha hızlı. Bundan doğrudan sorumlu olan iki önemli etmen L2 önbelleğin 2 x 4 MB'dan 2 x 6 MB'a çıkmış olması ve yeni SSE4 komut setinin duyuruluşu.
Daha geniş L2 önbellek, bazı uygulamalara erişim amacıyla daha yavaş çalışan sistem belleğine (RAM) nadiren ihtiyaç duyulmasını sağlıyor ve böylece bu uygulamalar biraz daha hızlı çalışıyor, yaklaşık %27'ye kadar başarım artışı öngörülüyor.
SSE4 komut seti çoğu video kodlama işlemlerini hızlandırma amaçlı olan 54 yeni komutla beraber geliyor. Bununla beraber Intel henüz ilgili komutların tümünü eklemiş değil (işlemciler şimdilik sadece 47 tanesini destekliyor). İşte bu nedenle yeni SSE sürümü SSE4.1 olarak da biliniyor (sürüm 4.1). Tüm komut setlerini içeren ikinci sürüm Penryn'den sonra tanışacağımız Nehalem'e gömülecek ve SSE4.2 olarak adlandırılacak.
Bu diyagram SSE uzantılarının ilk nesilden bugüne kadar kısa bir tarihini gösteriyor.
SSE4, Video Yaratımlamayı Nasıl Hızlandırıyor?
Yaşadığımız şu günlere kadar hareket algılamanın blok halindeki kodları şu şekilde görünüyordu:
Şimdi, SSE4'ün yardımıyla tüm bu kodlar aşağıdaki komutla yer değiştirebilir:
MPSADBW xmm0, xmmm1, 0
Böylece programlama sırasında harcanan zaman azalırken, programın çalışma hızında da büyük oranda artış meydana geliyor.
Video kodlama (encoding) söz konusu olduğunda kod çözücü (codec - örneğin DivX 6.6.1 veya sonrası) tek etken olarak algılanmamalı ve kullanılan kodlama programı da göz önünde bulundurulmalı. Örneğin VirtualDub'un son sürümü hali hazırda SSE4 desteklerken TMpegEnc ve Adobe Premiere sırayla kasım ayında ve bu senenin sonunda ilgili güncellemelere sahip olacaklar.
Neyse ki TMpegEnc'nin SSE4 destekli deneme aşamasındaki sürümünü deneme şansımız oldu. İşte elde ettiğimiz sonuçlar:
Intel Adobe Premiere CS3 üzerinde SSE4.1'in başarımı hakkında canlı bir deney yapıyor.
Intel 45 nm'ye oldukça hızlı bir biçimde geçmeyi hedefliyor.