ChatGPT V4 çıtayı, SAT'ları aşar ve ETH sözleşmelerindeki açıkları belirleyebilir

Yapay Zeka (AI) sohbet robotu ChatGPT'nin en son sürümü olan GPT-4, lise sınavlarını ve hukuk fakültesi sınavlarını yüzde 90'lık bir puanla geçebilir ve önceki sürümde mümkün olmayan yeni işleme yeteneklerine sahiptir.

GPT-4'ün test puanlarından elde edilen rakamlar, yaratıcısı OpenAI tarafından 14 Mart'ta paylaşıldı ve "çok daha incelikli talimatları" daha yaratıcı ve güvenilir bir şekilde işlemenin yanı sıra görüntü, ses ve video girişlerini metne dönüştürebildiğini ortaya koydu.

OpenAI, "Sınava girenlerin ilk %10'u civarında bir puanla simüle edilmiş bir bar sınavını geçiyor" diye ekledi. "Buna karşılık, GPT-3.5'in puanı alt %10 civarındaydı."

Rakamlar, GPT-4'ün LSAT sınavında 163. yüzdelik dilimde 88 puan aldığını gösteriyor — üniversite öğrencilerinin hukuk fakültesine kabul edilmek için Amerika Birleşik Devletleri'nde geçmeleri gereken sınav.

Bir dizi yeni ABD sınavında GPT-4 ve GPT-3.5 sınav sonuçları. Kaynak: OpenAI

GPT4'ün puanı, onu en iyi 20 hukuk fakültesine kabul edilmek için iyi bir konuma getirir ve Harvard, Stanford, Princeton veya Yale gibi prestijli okullara kabul için gereken rapor edilen puanlardan yalnızca birkaç puan eksiktir.

ChatGPT'nin önceki sürümü, LSAT'larda yalnızca 149 puan alarak onu en alttaki %40'a yerleştirdi.

GPT-4 ayrıca, yakın zamanda mezun olmuş hukuk öğrencilerinin girdikleri ve herhangi bir ABD yargı alanında avukat olarak çalışmalarına izin veren bir sınav olan Tek Tip Baro Sınavında 298 üzerinden 400 puan aldı.

UBE puanlarının her bir ABD yargı alanında avukatlık yapmak için kabul edilmesi gerekiyordu. Kaynak: Ulusal Baro Denetçileri Konferansı

ChatGPT'nin eski sürümü bu testte zorlandı ve 10 üzerinden 213 puan alarak en alttaki %400'luk dilimde bitirdi.

ABD'li lise öğrencilerinin üniversiteye hazırbulunuşluklarını ölçmek için girdikleri SAT Kanıta Dayalı Okuma ve Yazma ve SAT Matematik sınavlarında GPT-4 sırasıyla 93. ve 89. yüzdelik dilimde puan aldı.

GPT-4, AP Biyoloji (%85-100), Kimya (%71-88) ve Fizik 2'de (%66-84) ortalamanın çok üzerinde puanlar vererek "zor" bilimlerde de başarılı oldu.

Bir dizi yeni ABD Sınavında GPT-4 ve GPT-3.5 sınav sonuçları. Kaynak: OpenAI.

Bununla birlikte, AP Calculus puanı oldukça ortalamaydı ve 43 ila 59. yüzdelik dilim arasında yer alıyordu.

GPT-4'ün eksik olduğu başka bir alan, iki ayrı testte 8. ila 44. yüzdelik dilimde puanlar veren İngiliz Edebiyatı sınavlarıydı.

OpenAI, GPT-4 ve GPT-3.5'in 2022-2023 uygulama sınavlarından bu testleri aldığını ve dil işleme araçları tarafından "belirli bir eğitim" alınmadığını söyledi:

“Bu sınavlar için özel bir eğitim yapmadık. Sınavlardaki sorunların küçük bir kısmı model tarafından eğitim sırasında görüldü, ancak sonuçların temsili olduğuna inanıyoruz.”

Sonuçlar Twitter topluluğunda da korkuya yol açtı.

İlgili: ChatGPT, Web3 alanını nasıl etkileyecek? Endüstri cevapları

FactoryDAO'nun kurucusu Nick Almond söyledi 14,300 Mart'ta 14 Twitter takipçisi GPT4'ün "insanları korkutacağını" ve küresel eğitim sistemini "çökeceğini" söyledi.

Eski Coinbase yöneticisi Conor Grogan, GPT-4'e canlı bir Ethereum akıllı sözleşmesi eklediğini ve anında birkaç "güvenlik açığına" işaret ettiğini ve kodun nasıl kötüye kullanılabileceğini özetlediğini söyledi:

ChatGPT'de daha önceki akıllı sözleşme denetimleri, ilk sürümünün kod hatalarını da makul bir dereceye kadar tespit edebildiğini buldu.

AI haber bülteni "The Rundown" un kurucusu Rowan Cheung, GPT'nin elle çizilmiş sahte bir web sitesini bir parça kağıda koda dönüştürdüğü bir video paylaştı.