MacWhisper, Beklediğim Ücretsiz Transkripsiyon Yazılımı

Ses dosyalarını yazılı metin dosyalarına dönüştürmek için Mac yazılımı mı arıyorsunuz? Otter.ai ve Trint gibi çok fazla kullanmaya başladığınızda gerçek paraya mal olabilecek çok sayıda ücretli araç vardır. Ancak MacWhisper internetin beklediği ücretsiz çözümdür. Ya da en azından beklediğim kişi.

OpenAI, Eylül 2022'de, biraz teknoloji bilgisine sahip kişilerin ses ve video dosyalarını inanılmaz derecede doğru transkriptlere dönüştürmesine olanak tanıyan inanılmaz derecede güçlü bir ücretsiz program yayınladı. Sorun, Terminal uygulamasındaki komutları kullanmaya aşina olmanız gerektiğinden, ortalama bir kullanıcı için çok erişilebilir olmamasıydı.

Ancak ilk olarak tarafından tespit edilen MacWhisper ile 9to5Mac, birisi nihayet OpenAI'nin Whisper'ı üzerine inşa edilen ve tüm kafa karıştırıcı teknik şeyleri kaputun altında bırakan, ses dosyanızı sürükleyip bırakmanıza ve çok hızlı bir şekilde bir transkripsiyon almanıza izin veren bir GUI veya grafik kullanıcı arayüzü geliştirdi. Ve MacWhisper son derece isabetlidir çünkü OpenAI'nin Whisper'ı şu konularda eğitilmiştir: 680,000 saat web üzerindeki ses verilerinin

MacWhisper ile ilgili güzel şeylerden biri, yazıya dökülmesini istediğiniz ses veya video dosyasını internete yüklememenizdir. Bu, hassas bir haber üzerinde çalışan gazeteciler veya kişisel dosyalarını buluta yükleme konusunda genel olarak temkinli davranan herkes için önemlidir. Dosya masaüstünüzde kalır, yani kimsenin sesinizi kesme şansı yoktur.

Yine, MacWhisper, OpenAI tarafından geçen yılın sonlarında tanıtılan ücretsiz bir program için yalnızca yeni bir kullanıcı arabirimidir, ancak ses transkripsiyonunu hemen hemen herkes için gerçekten kolaylaştıracak. Çünkü Whisper kullanıyorum ve piyasaya çıktığından beri çok faydalı buldum. Hatta artık MacWhsiper kullanacağım çünkü iş akışımı hızlandıracağı kesin.

Sadece bir örnek olarak, kripto şirketi FTX'in iflas haberinden sonra, şirket kurucusu Sam Bankman-Fried ile yapılan düzinelerce saatlik eski YouTube röportajını yazmak için Whisper'ı kullandım. Oradan, transkriptleri arayabildim ve yazılacak makaleler için tuhaf ve ilginç fikirler bulabildim, örneğin SBF'nin Haziran 2021'de söylediği gibi blockchain Enron'u düzeltirdi. FTX'in nasıl çöktüğü hakkında artık bildiğimiz her şey göz önüne alındığında, SBF'nin Enron ile karşılaştırması garip bir tesadüftü. Ama arayabileceğim düzinelerce transkript olmasaydı, o anı eski, belirsiz bir röportajda asla bulamazdım. Ve bu süreç, saatlerce kaset dinlemekten daha kolay olsa da, yine de hantaldı ve çok otomatik değildi.

Whisper'ı makineme yükledikten sonra, ne zaman bir dosyayı yazıya dökmek istesem Mac'in Terminal uygulamasına “whisper audiofilename.mp3 —model tiny.en” yazardım. WhisperMac ile ses dosyamı sürükleyip bırakabiliyorum ve fazladan yazmadan sihrini yapıyor.

MacWhisper'ı YouTube'dan indirdiğim bir NBC Nightly News bölümüyle test ettim. Ve "windchills" kelimesini "windshills" olarak yorumlamak ve Lester Holt'u "Lester Hold" olarak duymak gibi birkaç hata dışında, transkript çok doğruydu. MacWhisper ücretsizdir, ancak OpenAI'nin daha yoğun eğitim modellerini kullandığı için biraz daha doğru olabilecek ücretli bir yazılım katmanı vardır, ancak ücretsiz sürüm çoğu insan için harika çalışacaktır.

MacWhisper, kopyalanmış kelimeyi düz metin, CSV ve hatta SRT ve VTT gibi bir altyazı dosyası formatı dahil olmak üzere birkaç farklı formatta dışa aktarmanıza olanak tanır.

Ve MacWhisper sadece İngilizce için değil. Sesi 100 farklı dilde yazıya dökebilirsiniz ki bu inanılmaz derecede kullanışlıdır. MacWhisper'ın sahip olmadığı ve Terminal uygulamasında Whisper'da oynamaktan zevk aldığım tek özellik, dil çevirisidir. Viral videoları Rusça ve Çince olarak çevirdim ve Twitter'da bu dilleri konuşan kişiler tarafından çevirilerin doğru.

MacWhisper'ın sahip olmadığı diğer bir özellik, OpenAI's Whisper'da bulunmasa da, konuşmacıları ayırt etme yeteneğidir. Örneğin, iki konuşmacıyla yapılan bir röportajı yazıya döküyorsanız, bir konuşmacının ne zaman durduğunu ve diğerinin ne zaman başladığını gösteren net bir işaret yoktur. Ama eninde sonunda birinin bu yeteneği geliştireceğinden şüpheleniyorum. Trint gibi ücretli hizmetler bunu otomatik olarak yapar ve sonunda ücretsiz olması harika olur, ancak ödediğinizin karşılığını alırsınız.

MacWhisper'da, bilgisayarınızın mikrofonundaki konuşmayı metne dönüştürebileceğiniz bir özellik de vardır; bu, anında bir şeyi yazıya dökmek istiyorsanız kullanışlı olabilir.

Aylarca birisinin nihayet Whisper için bir GUI geliştireceğini merak ederek geçirdim, çünkü birkaç kişi bir şans verdi ama kullanıcı dostu bir şey yaratmadı. Ama Jordi Bruin tarafından geliştirilen MacWhisper, beklediğim yazılım. Bruin ayrıca aşağıdaki gibi yazılımlar geliştirmiştir: MacGPT, kullanıcıların kendi menü çubuklarından ChatGPT'ye erişmesine izin verir.

MacWhisper'ı indirebilirsiniz bedava, e-posta kaydıyla, Bruin'in web sitesinde.

Kaynak: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/