Yapay Zeka (AI) sohbet robotu ChatGPT'nin en son sürümü olan GPT-4, lise sınavlarını ve hukuk fakültesi sınavlarını yüzde 90'lık bir puanla geçebilir ve önceki sürümde mümkün olmayan yeni işleme yeteneklerine sahiptir.
GPT-4'ün test puanlarından elde edilen rakamlar, yaratıcısı OpenAI tarafından 14 Mart'ta paylaşıldı ve "çok daha incelikli talimatları" daha yaratıcı ve güvenilir bir şekilde işlemenin yanı sıra görüntü, ses ve video girişlerini metne dönüştürebildiğini ortaya koydu.
OpenAI, "Sınava girenlerin ilk %10'u civarında bir puanla simüle edilmiş bir bar sınavını geçiyor" diye ekledi. "Buna karşılık, GPT-3.5'in puanı alt %10 civarındaydı."
Rakamlar, GPT-4'ün LSAT sınavında 163. yüzdelik dilimde 88 puan aldığını gösteriyor — üniversite öğrencilerinin hukuk fakültesine kabul edilmek için Amerika Birleşik Devletleri'nde geçmeleri gereken sınav.
GPT4'ün puanı, onu en iyi 20 hukuk fakültesine kabul edilmek için iyi bir konuma getirir ve Harvard, Stanford, Princeton veya Yale gibi prestijli okullara kabul için gereken rapor edilen puanlardan yalnızca birkaç puan eksiktir.
ChatGPT'nin önceki sürümü, LSAT'larda yalnızca 149 puan alarak onu en alttaki %40'a yerleştirdi.
GPT-4 ayrıca, yakın zamanda mezun olmuş hukuk öğrencilerinin girdikleri ve herhangi bir ABD yargı alanında avukat olarak çalışmalarına izin veren bir sınav olan Tek Tip Baro Sınavında 298 üzerinden 400 puan aldı.
ChatGPT'nin eski sürümü bu testte zorlandı ve 10 üzerinden 213 puan alarak en alttaki %400'luk dilimde bitirdi.
ABD'li lise öğrencilerinin üniversiteye hazırbulunuşluklarını ölçmek için girdikleri SAT Kanıta Dayalı Okuma ve Yazma ve SAT Matematik sınavlarında GPT-4 sırasıyla 93. ve 89. yüzdelik dilimde puan aldı.
GPT-4, AP Biyoloji (%85-100), Kimya (%71-88) ve Fizik 2'de (%66-84) ortalamanın çok üzerinde puanlar vererek "zor" bilimlerde de başarılı oldu.
Bununla birlikte, AP Calculus puanı oldukça ortalamaydı ve 43 ila 59. yüzdelik dilim arasında yer alıyordu.
GPT-4'ün eksik olduğu başka bir alan, iki ayrı testte 8. ila 44. yüzdelik dilimde puanlar veren İngiliz Edebiyatı sınavlarıydı.
OpenAI, GPT-4 ve GPT-3.5'in 2022-2023 uygulama sınavlarından bu testleri aldığını ve dil işleme araçları tarafından "belirli bir eğitim" alınmadığını söyledi:
“Bu sınavlar için özel bir eğitim yapmadık. Sınavlardaki sorunların küçük bir kısmı model tarafından eğitim sırasında görüldü, ancak sonuçların temsili olduğuna inanıyoruz.”
Sonuçlar Twitter topluluğunda da korkuya yol açtı.
İlgili: ChatGPT, Web3 alanını nasıl etkileyecek? Endüstri cevapları
FactoryDAO'nun kurucusu Nick Almond söyledi 14,300 Mart'ta 14 Twitter takipçisi GPT4'ün "insanları korkutacağını" ve küresel eğitim sistemini "çökeceğini" söyledi.
Değerlendirme teorisi, birkaç yıldır hayatımın büyük bir parçasıydı. Yıllar önce bu günün gelişiyle ilgili konuşuyordum. O sırada kelimenin tam anlamıyla yerleşik krank gibi ses çıkardım.
Ama… gerçekten bu, bu noktadan sonra gözetimsiz değerlendirme dışında her şeyin bittiği anlamına gelir.
— drnick ️² (@DrNickA) 14 Mart, 2023
Eski Coinbase yöneticisi Conor Grogan, GPT-4'e canlı bir Ethereum akıllı sözleşmesi eklediğini ve anında birkaç "güvenlik açığına" işaret ettiğini ve kodun nasıl kötüye kullanılabileceğini özetlediğini söyledi:
Canlı bir Ethereum sözleşmesini GPT-4'e döktüm.
Bir anda, bir dizi güvenlik açığının altını çizdi ve sözleşmenin istismar edilebileceği yüzeysel alanları işaret etti. Daha sonra, sözleşmeden yararlanabileceğim belirli bir yolu doğruladı. pic.twitter.com/its5puakUW
— Conor (@jconorgrogan) 14 Mart, 2023
ChatGPT'de daha önceki akıllı sözleşme denetimleri, ilk sürümünün kod hatalarını da makul bir dereceye kadar tespit edebildiğini buldu.
AI haber bülteni "The Rundown" un kurucusu Rowan Cheung, GPT'nin elle çizilmiş sahte bir web sitesini bir parça kağıda koda dönüştürdüğü bir video paylaştı.
Az önce GPT-4'ün elle çizilmiş bir taslağı işlevsel bir web sitesine dönüştürmesini izledim.
Bu çılgınlık. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) 14 Mart, 2023
Kaynak: https://cointelegraph.com/news/chatgpt-v4-aces-the-bar-sats-and-can-identify-exploits-in-eth-contracts