OpenAI, GPT-4o ‘omni’ modelini piyasaya sürüyor

OpenAI, ChatGPT’yi güçlendiren yeni üretken yapay zeka lisan modeli GPT-4o ‘omni’ modelini piyasaya sürüyor. GPT-4o kullanıcıların ChatGPT ile daha çok bir asistan benzeri etkileşime girmesine imkan tanıyor. 50 lisanda simultane çeviri yapabilecek,…

OpenAI, GPT-4o ‘omni’ modelini piyasaya sürüyor
Yayınlama: 14.05.2024
46
A+
A-

HANDE BERKTAN

OpenAI, bugün bahar güncellemesi etkinliğinde ChatGPT’yi güçlendiren yeni üretken yapay zeka lisan modeli, GPT-4o’yu tanıttı.

“o”, modelin metin, konuşma ve görüntüyü sürece maharetine atıfta bulunan “omni” manasına geliyor. GPT-4o, önümüzdeki birkaç hafta içinde şirketin geliştirici ve tüketiciye yönelik eserlerinde kullanıma sunulacak.

50 lisanda simultane çeviri yapabilecek, telefon kamerasıyla çevreyi görüp algılayabilecek, kullanıcılara bir matematik sorununun tahlil sürecine özel öğretmen benzeri eşlik edebilecek olan GPT-4o, önümüzdeki birkaç hafta içinde kullanıma sunulacak.

OpenAI Baş Teknoloji Sorumlusu Mira Murati, ChatGPT’nin artık bellek yeteneklerine de sahip olacağını, yani kullanıcılarla yapılan evvelki görüşmelerden öğrenebileceğini ve gerçek vakitli çeviri yapabileceğini söyledi. Mira Murati, GPT-4o’nun “GPT-4 düzeyinde” zeka sağladığını fakat GPT-4’ün çeşitli prosedür ve ortamlardaki yeteneklerini geliştirdiğini söyledi.

OpenAI’nin evvelki “öncü” en gelişmiş “modeli olan GPT-4 Turbo, görsel ve metin kombinasyonuyla eğitilmişti ve görsellerden metin çıkarmak ve hatta bu görsellerin içeriğini tanımlamak benzeri vazifeleri gerçekleştirmek için görselleri ve metni tahlil edebiliyordu. Lakin GPT-4o karışıma konuşmayı da ekliyor.

GPT-4o’un özellikleri neler?

GPT-4o, ChatGPT’nin metin, ses ve kelamda görüntü kullanarak etkileşim kurmasını sağlayacak. Bu, kullanıcılar tarafından yüklenen ekran manzaralarını, fotoğrafları, evrakları ya da grafikleri görüntüleyebileceği ve bunlar hakkında bir şeyler söyleyebileceği manasına geliyor. GPT-4o, metin, ses ve video alanlarında daha süratli bir şekilde çalışıyor.

Model, kullanıcılarla gerçek vakitli olarak konuşurken, yetenekleriyle ChatGPT’nin ses modundan ayrışıyor. Bu yetenekler kapsamında model, ses tonlamaları arasındaki farkı ayırt edebiliyor. Aynı şekilde farklı çeşitlerde sesler üretebiliyor. Modelin sesine sözler ekleyerek ses tonunu değiştirebildiğini de belirtelim.

Etkinlikte, ChatGPT’nin telefon kamerasıyla çevreyi görebildiği ve algılayabildiği de gösterildi. Verilen bir yazılım kodunu algılayarak, kod hakkında bilgi verebilen ve kod hakkında sorulan sorulara yanıt vererek karşılıklı olarak sohbet edilebilen sistem, sesli irtibatta araya girilebildiği için hakikaten bir beşerle konuşuyormuş hissiyatı oluşturuyor.

GPT-4o, özel öğretmen benzeri matematik problemlerini konuşarak çözebiliyor

GPT-4o, kullanıcılara matematik sorunları çözmede de akıcı bir şekilde konuşarak destek oluyor. Gerçek vakitli olarak görüntüleri görebilen model, bir matematik sorununun tahlil sürecine eş vakitli olarak adım adım bir özel öğretmen benzeri eşlik etti.

GPT-4o kullanıcıların ChatGPT ile daha çok bir asistan benzeri etkileşime girmesine imkan tanıyor.

GPT-4o 50 lisanda simultane çeviri yapabilecek

GPT-4o, çeviri yetenekleriyle de öne çıktı. Model aktiflikte İtalyanca ve İngilizce arasında simultane çeviri yaptı. Bu ortada model, 50 lisanı desteklemekte.
Daha akıllı ve 2 kat daha süratli olduğu belirtilen model, sürpriz şekilde kullanıcılara bedelsiz açılacak yalnızca bedelsiz kısımda limitler olacak.

Bir Yorum Yazın

Ziyaretçi Yorumları - 0 Yorum

Henüz yorum yapılmamış.