Digital Report
  • DERGİ
  • TEKNOLOJİ
  • YAPAY ZEKA
  • PROFESYONEL
    • GİRİŞİM
    • E-TİCARET
    • FİNTEK
    • MARKA
  • GÜVENLİK
  • KRİPTO
  • OYUN
  • REHBER
No Result
View All Result
Digital Report
No Result
View All Result
Home Teknoloji

EMO ile fotoğraflara hayat verin

Yapay zeka dünyası yeni bir dönüm noktasına imza atıyor: Alibaba'nın EMO sistemi, tek bir fotoğraftan konuşan ve şarkı söyleyen gerçekçi videolar üretiyor.

by Bünyamin Furkan Demirkaya
29/02/2024
in Teknoloji
Alibaba'nın EMO'su fotoğraflardan gerçekçi video portreler yaratıyor
Facebook'ta PaylaşTwitter'da PaylaşLinkedIn'de PaylaşWhatsApp'ta PaylaşTelegram'da Paylaş

Alibaba’nın Akıllı Bilişim Enstitüsü’ndeki araştırmacılar, “EMO” adlı yeni bir yapay zeka sistemi geliştirdiler. “Emote Portrait Alive“ın kısaltması olan bu sistem, tek bir portre fotoğrafını canlandırıp kişinin konuştuğu veya şarkı söylediği, şaşırtıcı derecede gerçekçi videolar oluşturabiliyor.

arXiv’de yayınlanan bir araştırma makalesinde tanımlanan sistem, sağlanan bir ses parçasının nüanslarına yakından uyan akıcı ve etkileyici yüz hareketleri ile kafa pozları oluşturabiliyor. Bu, yapay zekâ araştırmacılarını yıllardır zorlayan ses odaklı yüz videosu oluşturma alanında önemli bir ilerlemeyi temsil ediyor.

Sesler videoya dönüşüyor

EMO sistemi, gerçekçi sentetik görüntüler oluşturma konusunda muazzam yetenek göstermiş bir AI tekniği olan difüzyon modelini kullanıyor. Araştırmacılar, modeli 250 saatten fazla konuşma, film, TV şovu ve şarkı performanslarından oluşan bir veri seti üzerinde eğittiler.

Yüz hareketlerini tahmin etmek için 3D yüz modellerine veya harmanlama şekillerine dayanan önceki yöntemlerin aksine, EMO doğrudan ses dalga biçimini video karelerine dönüştürüyor. Bu sistemin, doğal konuşmayla ilişkili ince hareketleri ve kimliğe özgü özellikleri yakalamasını sağlıyor.

EMO’nun sunduğu yenilikler:

  • Gerçekçi konuşma videoları: EMO, tek bir fotoğraftan yola çıkarak, kişinin ses tonuna ve duygularına uyumlu, oldukça gerçekçi konuşma videoları oluşturabiliyor.
  • Etkileyici şarkı performansları: EMO’nun yeteneği sadece konuşmayla sınırlı değil. Sistem, şarkı videoları da üretebiliyor. Vokallere senkronize ağız hareketleri ve duygusal yüz ifadeleri ile etkileyici performanslar yaratabiliyor.
  • Kolay kullanım: EMO’yu kullanmak oldukça basit. Tek ihtiyacınız olan bir fotoğraf ve ses kaydı. Sistem, gerisini sizin için halloluyor.
Alibaba'nın EMO'su fotoğraflardan gerçekçi video portreler yaratıyor
EMO, sohbet videolarının ötesinde vokallere senkronize uygun ağız şekilleri ve çağrıştırıcı yüz ifadeleriyle şarkı portrelerini de canlandırabilir (Görsel kaynak)

Gerçekçi şarkı videoları oluşturuyor

EMO, sohbet videolarının ötesinde vokallere senkronize uygun ağız şekilleri ve çağrıştırıcı yüz ifadeleriyle şarkı portrelerini de canlandırabilir. Sistem, giriş sesinin uzunluğuna göre keyfi bir süre için video oluşturmayı destekler.

EMO’nun potansiyel uygulama alanları:

  • Eğitim: EMO, uzaktan eğitim materyalleri veya interaktif ders içerikleri oluşturmak için kullanılabilir.
  • Eğlence: Kişiselleştirilmiş avatarlar ve sanal karakterler yaratmak için kullanılabilir.
  • Sosyal Medya: Daha etkileyici ve duygusal içerikler üretmek için kullanılabilir.
  • Pazarlama: Ürün ve hizmetleri tanıtmak için ilgi çekici videolar oluşturmak için kullanılabilir.
Alibaba'nın EMO'su fotoğraflardan gerçekçi video portreler yaratıyor
Araştırmacılar, sentetik videoları tespit edecek yöntemler keşfetmeyi planladıklarını söylüyorlar. (Görsel kaynak)

Belirttiğimiz üzere EMO’nun araştırması, kişiselleştirilmiş video içeriğinin yalnızca bir fotoğraf ve ses klibinden sentezlenebileceği bir geleceğe işaret ediyor. Ancak bu tür bir teknolojinin, insanların rızası olmadan taklit edilmesi veya yanlış bilgilerin yayılması için olası kötüye kullanımı konusunda etik kaygılar devam ediyor. Araştırmacılar, sentetik videoları tespit edecek yöntemler keşfetmeyi planladıklarını söylüyorlar.

EMO’nun etik açıdan da bazı önemli sorulara yol açtığı unutulmamalı. Örneğin, bu teknoloji deepfake videolar oluşturmak için kullanılabilir mi? Bu videoların yayılmasıyla nasıl mücadele edilecek? Bu soruların cevabı, EMO’nun geleceği ve toplum üzerindeki etkisi için belirleyici olacak.

Bu yazımız da ilginizi çekebilir:
Apple, elektrikli otonom araç projesini iptal etti

EMO, yapay zeka ve video teknolojisi alanında video oluşturma popüleritesine katıldı gibi gözüküyor. Bu yapay zekanın video oluşturma sistemi, gelecekte birçok farklı alanda kullanılacağına ve dünyayı birçok yönden etkileyeceğine inanıyoruz.


Öne çıkan kaynak görseli: rawpixel.com / freepik

Tags: Alibaba

İLGİLİ YAZILAR

Alibaba, Wan2.6
Basın bülteni

Alibaba, Wan2.6 serisini tanıttı

by Emre Çıtak

Alibaba, görsel üretim modellerinde yeni bir sayfa açarak Wan2.6 serisini duyurdu. Bu yeni seri, içerik üreticilerinin yapay zeka tarafından oluşturulan...

Read moreDetails
Alibaba'dan Quark AI gözlüğü ve yeni AI asistanı
Teknoloji

Alibaba’dan Quark AI gözlüğü ve yeni AI asistanı

by Aytun Çelebi

Alibaba, perşembe günü Quark uygulamasına entegre edilmiş yeni bir AI sohbet asistanını ve 660 dolar fiyat etiketine sahip Quark AI...

Read moreDetails
Alibaba, OpenAI Deep Research'e rakip ajan tanıttı
Yapay Zeka

Alibaba, OpenAI Deep Research’e rakip ajan tanıttı

by Emre Çıtak

Alibaba Group Holding, OpenAI'nin amiral gemisi Deep Research aracına rakip bir açık kaynaklı derin araştırma yapay zeka ajanı tanıttı. Şirket,...

Read moreDetails
Tongyi Qianwen nedir, neler yapabiliyor?
Yapay Zeka

Alibaba’dan GPT-4’e rakip olacak yeni yapay zeka dil modeli

by Barış Selman

Cuma günü Alibaba Cloud'un resmi WeChat hesabında yapılan duyuruya göre, hizmetin adı "Tongyi Qianwen" olarak duyuruldu. Yapay zeka teknolojileri son...

Read moreDetails

SON YAZILAR

Xiaomi Buds 6 tanıtıldı

VEPARA’nın faaliyetleri yasa dışı bahis soruşturması kapsamında durduruldu

Windows’ta JPG dosyalarını etkileyen kritik güvenlik açığı keşfedildi

iPhone Air 2 için 2026 umudu yeniden doğdu

Tesla’nın Avrupa satışları çakıldı, BYD öne geçti

Lise yıllarından kalma utanç verici Gmail adresinizden yakında kurtulacaksınız

ChatGPT’ye reklamlar 2026’da geliyor

Google 2025’i yapay zeka fayda yılı ilan etti, OpenAI kırmızı kod ile karşılık verdi

Nvidia’nın 20 milyar dolarlık Groq satın alması yalan çıktı

X’te Artık herkes paylaştığınız fotoğrafları yapay zeka ile değiştirebiliyor

SON REHBERLER

Android telefon hafıza kartını görmüyor sorunu nasıl çözülür

Instagram’da fotoğraf paylaşma sorununu gidermenin pratik yolları

OLED ekranlarda oluşabilecek yanma sorununu önlemenin pratik yolları

Windows 10’da unmountable boot volume hatası nasıl düzeltilir

Nvidia DLAA ile oyun grafiklerinde kenar yumuşatma nasıl sağlanır

ChatGPT’yi 1 saatten kısa sürede ustaca kullanmayı öğrenin

Windows’un farklı sürümlerinde ve Mac’te şifre kaldırma

iPhone’da kilit ekranına istediğiniz metni yazma nasıl yapılır

Telegram’da engellendiğinizi pratik yöntemlerle nasıl anlarsınız

Windows’ta işletim sisteminin bit mimarisini nasıl öğrenirsiniz

BASIN BÜLTENLERİ

RTB House, Derin Öğrenme ile dijital reklamcılığın yeni işletim sistemini kuruyor

ESET, Çin bağlantılı LongNosedGoblin APT grubunu tespit etti

Simya VC’den Rudiq’e 1 milyon dolar yatırım

Huawei Cloud, İstanbul’da dijital perakende buluşması düzenledi

SteelSeries, tek kulaklıkla birden fazla platformda oyun oynama özgürlügü sunuyor

Aktif Tech, Deloitte Teknoloji Fast 50’de üçüncü oldu

Dolap, 2024 yılında 307 bin 340 ton karbon salımını önledi

Canon, Istanbul’da EOS R6 Mark III ve EOS C50 tanıttı

LG, yeni yıl için soundbar kampanyasını duyurdu

Citrix, Hibrit çoklu bulut lisans modeli sunuyor

Digital Report

© 2019 Digital Report bir Linkmedya markasıdır.

  • Dergi
  • Yazarlar
  • Basın bültenleri
  • Gizlilik
  • İletişim
  • Künye

Bizi takip edin

No Result
View All Result
  • TEKNOLOJİ
  • YAPAY ZEKA
  • PROFESYONEL
    • GİRİŞİM
    • E-TİCARET
    • FINTECH
    • MARKA
  • GÜVENLİK
  • KRİPTO
  • OYUN
  • REHBER
  • BASIN BÜLTENLERİ
  • YAZARLAR
  • DERGİ
  • KÜNYE
  • İLETİŞİM