Japonca Transkripsiyon Araçları ve Doğruluğu: Özet

Japonca toplantı transkripsiyon testimizde, kaydedilmiş üç toplantı üzerinden altı aracı değerlendirdik. Sonuçlara göre ,tl;dv toplamda en yüksektl;dv 200 puanlık ölçekte 189 puan aldı.

İyi puan alan ikinci araç, 166 puanla Notta oldu; onu 140 puanla Rimo izledi.

tl;dv , transkripsiyon doğruluğu ve özetler gibi gerçek hayattaki toplantı unsurları konusunda tl;dv yanı sıra, transkripsiyonun ötesinde toplantı çıktısının kalitesini artıran birçok kullanışlı özelliğe sahipti. Özellikle, konuşmacıların isimlendirilmesi ve özel isimlerin transkripsiyonunu doğru bir şekilde gerçekleştirdi.

İçindekiler

Japonca toplantı transkripsiyon araçları, günlük toplantılarını ve işlerini Japonca yürütenler için son derece kullanışlıdır.

Dünyanın her yerinde toplantılar, çok sayıda konuşmacı, hızlı söz alma sırası ve ara sıra kullanılan İngilizce alıntı kelimelerle oldukça hareketli geçebilir. Piyasadaki pek çok araç, Japonca konuşanlara transkripsiyon ve diğer özellikler sunsa da, toplantılarınızın doğru bir şekilde kaydedildiğinden emin olmak önemlidir.

tl;dv Japonca konuşan bir kullanıcı için nasıl tl;dv dair bir fikir vermek amacıyla, bu aracı piyasada yaygın olarak kullanılan diğer beş araçla karşılaştırmalı olarak test ettik. Bunlar şunlardı:

    1. Rimo
    2. Tactiq
    3. Naver’dan CLOVA
    4. Notta
    5. Google Gemini

Bu araçların tümüne aynı kaynak materyal verildi ve ardından dört ayrı alanda puanlandırıldılar.

Ardından, transkripsiyon ve özet çıktılarını kullandık, bunları bir LLM ile değerlendirdik ve daha sonra Japonca konuşan ikinci bir panelin bu çıktıları anonimleştirilmiş bir biçimde incelemesini sağladık.

İşte sonuçlar.

SeviyeMaxtl;dvRimoTactiqClovaNoteNottaGoogle Gemini
Transkripsiyon ve doğruluk65605726335739
Gerçek hayattaki toplantı kalitesi45452430243817
Yetenekler ve özellikler72664746325911
Güven, güvenlik ve değer1818121261215
Toplam puan2001891401149516682
Sıra 134526

Japonca Toplantı Transkripsiyonu ve Doğruluğu

Bu sonuçlar, aynı Japonca ses kaydı kullanılarak altı farklı aracın transkripsiyon doğruluğunun karşılaştırılmasıyla elde edilmiştir. Bu sonuçlar, büyük dil modelleri (AnthropicClaude’u ve OpenAI’nin ChatGPT’si) tarafından puanlandırılmış ve ardından araç isimleri gizlenmiş olarak, ana dili Japonca olan kişiler tarafından yapılan kör değerlendirmeyle doğrulanmıştır.

Metrik Puanlama nasıl yapılır? tl;dv Rimo Tactiq ClovaNote Notta Google Gemini
Dil doğruluğu Aynı dildeki doğruluk düzeyine ilişkin, ana dili konuşan kişiler tarafından yapılan kör ciddiyet derecelendirmesi 20/20 20/20 20 Ağustos 20/12 20/20 16/20
Dile özgü işlemler Aksan işaretleri, noktalama işaretleri, bölgesel varyantlar, dil değiştirme 16/20 16/20 20 Ağustos 20 Ağustos 16/20 20/12
Karakter hata oranı puanlaması Resmi transkript veya referans metin temel alınarak hesaplanmıştır 5/5 4/5 2/5 2/5 5/5 1/5
Varlık algılama Oyuncu kadrosundaki isimler, şirketler ve yerler 5/5 4/5 2/5 2/5 4/5 2/5
Sayılar, tarihler ve para birimleri Rakamlar, tarihler ve tutarlar ilgili dilde doğru biçimde biçimlendirilmiştir 4/5 4/5 3/5 3/5 4/5 4/5
Teknik terimin ham tanıma Özel eğitim öncesinde sektör terimleri ve kısaltmalar 5/5 4/5 2/5 2/5 4/5 3/5
Noktalama ve bölümleme Deneme çalıştırması çıktısındaki cümle sonları ve paragraflandırma 5/5 5/5 1/5 4/5 4/5 1/5
Transkripsiyon ve doğruluk ara toplamı 60/65 57/65 26/65 33/65 57/65 39/65

Değerlendirilen altı araç arasında tl;dv, 60’lık bir ara toplamla en yüksek doğruluk oranını kaydetti.

Rimo 57 puanla ikinci sırada yer alırken, Notta da 57 puanla onu takip etti; Google Gemini 39, ClovaNote ise 33 puan aldı ve Tactiq 26 puan aldı.

tl;dv , herhangi bir özel eğitimden önce dil doğruluğu, özel isim ve ad doğruluğu ile teknik terim tanıma alanlarında birinci sırada tl;dv . Ayrıca, dile özgü işleme, sayılar, tarihler ve para birimleri ile noktalama ve bölümleme gibi alanlarda da mükemmel sonuçlar elde etti.

Varlık Algılama

Test ettiğimiz unsurlardan biri de varlık algılamaydı. Varlık algılama, aracın bilinen isimleri ve terimleri doğru bir şekilde işleme yeteneği olarak tanımlanır. Ses kaydında, tl;dv dahil olmak üzere birkaç marka adı yer alıyordu.

tl;dv tl;dv noktalı virgül ile birlikte gerçek biçimi tl;dv tanımlayıp doğru bir şekilde yazıya dökmeyi tl;dv . Diğer araçların hiçbiri bunu başaramadı; ancak birçoğu bunu TLDV olarak yazıya döktü ki bu, bu örnekte doğruya oldukça yakındır. Diğer araçlardan bazıları ise bunu hiç doğru bir şekilde yazıya dökemedi; bunlara, pldv, gldv ve sadece dv gibi farklı varyasyonlarda yazıya döken CLOVA de dahildir.

Diğer marka adları ve kişi isimleri için de durumun aynı olduğunu tespit ettik; birçok araç, çıktıların genelinde özel isimlerin farklı versiyonlarını veriyordu. Yaygın olarak kullanılan bir adı doğru şekilde aktaran bir araç, toplantıda yer alan konumlar, kişiler ve şirket adları gibi diğer varlıklar için de doğruluğu koruma eğilimindedir.
tl;dv , altı araç arasında en yüksek puanıtl;dv . Aynı tutarlılık, transkriptlerdeki diğer varlıklara da uzanıyordu; tl;dv , konuşmada atıfta bulunulan kişi isimlerini tl;dv korudu.

CER Puanları

ASR (konuşma-metin dönüştürme)değerlendirmesinde temel bir ölçüt olanKarakter Hata Oranı’nı (CER) hesaplamak için, üçüncü taraf bir kaynaktan alınan doğrulanmış bir transkripti kullanarak dördüncü bir test gerçekleştirebildik. CER testimizde tl;dv , %0,8 gibi mükemmel bir sonuç tl;dv ; Notta da buna çok yakın bir sonuç elde etti. Karşılaştırma amacıyla belirtmek gerekirse, Rimo %1,5, Tactiq ,7, Clova ,8 ve Gemini ,8 sonuçları elde etti. Gemini , toplantı hatası ile karşılaştığı için daha kısa bir kayda dayalı olarak Gemini .

Konuşmacı Etiketleme

tl;dv , konuşmacı isimlerini etiketleyen tektl;dv . Birden fazla konuşmacının yer aldığı kayıtlarda bu ayrım, transkriptin kullanışlılığını doğrudan etkiler. Bu, tl;dv Rimo’nun önüne tl;dv başlıca nedenidir; zira Rimo benzer bir doğruluk oranı sergilese de konuşmacı etiketleri sunmamaktadır.

Rakip Gözlemleri

Rimo, yüksek doğruluk oranı ve dengeli, okunabilir bölümlerle en yakın sonucu kaydetti. En büyük sınırlaması, konuşmacı etiketlerinin bulunmamasıdır; ayrıca ürün adını “TLDV” olarak aktarmıştır.

Notta da iyi bir performans sergiledi ve metni net paragraflara ayırdı; ancak ana dilini konuşan uzmanlar panelimize göre, paragraflar biraz uzun olma eğilimindeydi.

Clova , her cümle için net satır sonları Clova ; ancak bu satır sonlarını destekleyecek kadar doğru değildi ve çeşitli ürün adlarını tutarsız bir şekilde yansıtması, daha genel bir tanıma sorununa işaret ediyor.

Tactiq , temel özellikler açısından en zayıf Tactiq . Konuşmacı algılama başarısız oldu; tek bir konuşmacıyı birden fazla etikete böldü ve genel olarak doğruluk oranı düşüktü. Altı sistem arasında en düşük sonucu kaydetti.

Google Gemini Hakkında Bir Not

Kaynak materyaller önceden kaydedilmiş web seminerleriydi; bu nedenle Gemini , standart kayıt yöntemi olan Google Meet içinde canlı olarak Gemini . M4A dosyasını doğrudan işlemek için ücretli bir Google hesabı kullanıldı. Gemini , kaydın tamamını değil, oturumun yalnızca bir kısmını Gemini ve sesin ayrıştırılamadığı yerlerde transkripsiyon kalitesi düştü; bu da zayıf ve okunması zor bir çıktıya neden oldu. Bağlamı anlamak için, aynı dosya Notta'ya da verildi ve sorunun kaynak dosyada olmadığı görüldü.

Dördüncü bir varlık üzerinde canlı bir deneme gerçekleştirildi ve bu, CER puanlarını hesaplamak Google Meet üzerinden canlı olarak yapıldı. Google Gemini , toplantıya canlı olarak Gemini ancak yarıda durdu ve yeniden eklenmesi gerekti. Sonuç olarak, konuşma metni yine kesintiye uğradı ve birçok yanlışlık içeriyordu.

Gemini , bu sınırlamaya dikkat çekilmek kaydıyla, eksiksizlik amacıyla karşılaştırmaya dahil Gemini . Sonuçlarında da ses dosyası içindeki İngilizce kayıt ipuçlarını tespit ederek, çok dilli algılama yeteneği sergilemiştir.

Gemini
Google Gemini

Gerçek Hayattaki Toplantı Kalitesi

Transkripsiyon kalitesinin yanı sıra, transkriptin çıktısı ve özetler gibi diğer ilgili öğeler de son derece önemli unsurlardır. Yaptığımız testlerde, bu öğelerin nasıl sunulduğunu ve günlük kullanım açısından kalite düzeyini inceledik.

Metrik Puanlama nasıl yapılır? tl;dv Rimo Tactiq ClovaNote Notta Google Gemini
Günlüğe kaydetme kalitesi Doğru oyuncu sayısı ve rol dağılımı ile bilinen oyuncu kadrosu karşılaştırması 10/10 4/10 2/10 6/10 6/10 6/10
Davranışsal istikrar Oturum türleri arasında davranışsal istikrar 10/10 10/10 6/10 9/10 10/10 2/10
Özet kalitesi Özetin yararlılığı ve ödünç kelimeler de dikkate alındığında özetin kaynak dilde kalıp kalmadığı 5/5 0/5 4/5 0/5 4/5 0/5
Halüsinasyon / ekleme oranı Ses kaydında bulunmayan, uydurulmuş, tekrarlanmış veya kopyalanmış metin. Yanlış duyulanlar ve kesik kısımlar hariç 10/10 10/10 9/10 9/10 10/10 9/10
Eylem maddelerinin çıkarılması Toplantıdan çıkarılan görevlerin ve takip konularının kalitesi 5/5 0/5 4/5 0/5 3/5 0/5
Otomatik bölümler / bölümlere ayırma Özet, toplantıyı faydalı bölümlere ayırıyor mu? 5/5 0/5 5/5 0/5 5/5 0/5
Gerçek ortamda yapılan toplantı kalitesi ara toplamı 45/45 24/45 30/45 24/45 38/45 17/45

Altı araç arasında, tl;dv gerçek dünya toplantı kalitesinin her kategorisinde tam puan alan tek araç tl;dv ve 45 üzerinden 45 puanlık bir ara toplam elde etti. Notta 38 puanla ikinci sırada yer alırken, Tactiq 30 Tactiq , Rimo ve CLOVA 24 puanla dördüncü ve Google Gemini ise 17 Gemini beşinci sırada yer aldı.

Bu farkın büyük bir kısmı tek bir faktöre bağlıdır: Bir aracın kullanışlı bir Japonca toplantı özeti oluşturup oluşturmadığı. Test edilen planda herhangi bir özet elde edilemediğinde, araç özet kalitesi, eylem maddeleri ve bölümlendirme kategorilerinde 0 puan aldı. Bu, aracın hazır haliyle sunduğu performansı yansıtır; başka bir planda üretebileceği özetlerin kalitesini değil.

Günlükleştirme ve Konuşmacı Atıflandırma

tl;dv , doğru konuşmacıları belirleme ve her bir konuşma sırasını doğru şekilde atama konusunda tam puan tl;dv . CLOVA , Notta ve Gemini sıralamanın ortalarında Gemini , Tactiq tek bir konuşmacıyı birkaç etikete bölerek en çok Tactiq .

Özetler, Yapılacaklar ve Bölümlere Ayırma

Bu noktada alan en net şekilde ikiye ayrılıyor. tl;dv, Tactiq ve Notta, kalite açısından değerlendirilen Japonca özetler üretti; bu değerlendirmede tl;dv en yüksek tl;dv . Rimo, CLOVA ve Gemini ise test edilen planda hazır olarak hiçbir Gemini : CLOVA özelliği yalnızca Korece’ye yönelikti, Rimo’nun özelliği ücretliydi ve Gemini ise hiçbir Gemini . Puan, özet kalitesini değil, kullanılabilirliği yansıtmaktadır.

Yetenekler ve Özellikler

Bir yapay zeka toplantı asistanı, sadece toplantı notları tutan bir araçtan çok daha fazlasıdır; transkript çıktısının kalitesini ve bununla ilgili faaliyetleri geliştiren birçok özellik ve unsura sahiptir. Mevcut en dikkat çekici özelliklerden bazılarını inceledik ve her bir aracın bu yeteneğe sahip olup olmadığını belirledik; ardından, her bir özelliğin sağladığı faydayı ve kullanıcı deneyimi üzerindeki etkisini ölçmek için puanlamayı ayarladık.

Metrik Puanlama nasıl yapılır? tl;dv Rimo Tactiq ClovaNote Notta Google Gemini
Kutudan çıkar çıkmaz hoparlörlerin isimlendirilmesi Meet, Zoom ve Teams’te gerçek konuşmacıların adlarını otomatik olarak belirler 5/5 0/5 1/5 0/5 0/5 0/5
Sesli baskı Kullanıcının kendi sesi için ses izi eğitimi seçeneği 5/5 0/5 0/5 0/5 5/5 0/5
Bot içermeyen kayıt Aramaya bir bot göndermeden sistem sesinden kayıt yapar 5/5 5/5 5/5 5/5 5/5 0/5
CRM senkronizasyonu Yerel ve otomatik senkronizasyon 3/3 0/3 3/3 0/3 3/3 0/3
Özel notlar / şablonlar Özelleştirilebilir özet biçimleri ile sabit çıktı karşılaştırması 3/3 3/3 3/3 0/3 3/3 0/3
Özel kelime dağarcığı / varlık eğitimi Sektör terimlerini ve kısaltmalarını öğretin 5/5 5/5 0/5 5/5 5/5 0/5
Japonca kullanıcı arayüzü yerelleştirmesi Ürünün arayüzünün kendisi Japonca olarak mevcut olup olmadığı 5/5 5/5 5/5 5/5 5/5 5/5
Entegrasyonların kapsamı Slack, takvim, Zapier, API 3/3 0/3 3/3 0/3 3/3 0/3
İşlem hızı Toplantının bitiminden transkriptin tamamlanmasına kadar geçen süre 3/3 2/3 1/3 0/3 3/3 0/3
Dolgu kelimelerinin izlenmesi Dolgu kelimelerinin izlenmesi - “um”, “eh”, “este” gibi kelimeleri, kekeleme nedeniyle tekrarlanan sesler olmadan izler. Konuşma metinlerinin aşırı düzeltme yapılmaksızın tam olarak görünür olmasını sağlar 3/3 0/3 0/3 0/3 0/3 0/3
Zaman damgası doğruluğu Zaman damgalarının doğru ana denk geldiğini rastgele kontrol edin 3/3 3/3 2/3 2/3 3/3 0/3
Çeviri seçenekleri Toplantı notlarını çevirebilir mi ve kaç dile çevirebilir? 3/3 3/3 3/3 0/3 3/3 0/3
Transkript içinde arama yap Toplantı içinde ve kütüphane genelinde arama yapın 3/3 3/3 0/3 3/3 3/3 0/3
Transkript düzenleme kullanıcı arayüzü Transkripti sonradan kolayca düzeltebilir misiniz? 3/3 3/3 3/3 3/3 3/3 3/3
Dışa aktarma biçimleri SRT, VTT, TXT, DOCX ve benzeri 0/3 3/3 3/3 3/3 3/3 0/3
Canlı / gerçek zamanlı konuşma metni Toplantı sırasında canlı olarak bir konuşma metni gösteriliyor mu? 0/3 3/3 3/3 0/3 3/3 3/3
Toplantı platformu kapsamı Zoom, Meet, Teams ve Webex kapsamı 3/3 3/3 3/3 0/3 3/3 0/3
Mobil uygulama yakalama Mobil uygulama aracılığıyla yüz yüze toplantıları kaydedebilir mi? 3/3 3/3 0/3 3/3 3/3 0/3
Yerel MCP sunucusu AI asistanlarının toplantı arşivinde arama yapmasına olanak tanıyan, kendi geliştirilen birinci taraf sunucu 5/5 0/5 5/5 0/5 0/5 0/5
Hoparlör etiketini düzenleme Hoparlörlerin adını daha sonra değiştirebilir ve yeniden atayabilir misiniz? 3/3 3/3 3/3 3/3 3/3 0/3
Yetenekler ve özellikler ara toplamı 66/72 47/72 46/72 32/72 59/72 11/72

Özel bir toplantı aracını temel bir toplantı not alma uygulamasından ayıran pek çok özellik vardır ve tl;dv bu özelliklerin hepsinde sektörün en üst sıralarında tl;dv . Bunlar arasında özellikle öne çıkan iki özellik vardır

Yerel MCP Sunucusu

tl;dv , yapay zeka asistanlarının toplantı arşivine doğrudan sorgu gönderebilmesini sağlayan yerel bir MCP sunucusuna sahip sadece iki araçtan tl;dv . Sektördeki çoğu şirket bu konuda sıfır puan aldı. Bu özellik, kayıtlı toplantıları kapalı bir sistemde bırakmak yerine, bir ekibin halihazırda kullandığı daha geniş yapay zeka araçları yelpazesine bağlamaktadır.

Ses Tanıma

tl;dv , Notta ile birlikte sesli yazdırma özelliği sunan sadece iki araçtan tl;dv . Kendi sesinizle eğitildiğinden, toplantılarınızda kimliğinizin ne kadar güvenilir bir şekilde tespit edildiğini artırır; bu avantaj, kullandıkça daha da artar.

Güven, Güvenlik ve Değer

Japonca toplantılarınızı kaydetmek için bir araç seçerken göz önünde bulundurmanız gereken en önemli hususlardan bazıları güven, güvenlik ve değeridir. Bunların çoğu, mükemmel özelliklere ve kullanışlı çıktılara sahip kaliteli bir transkripsiyon ürünüyle sağlanabilir; ancak en önemli faktörlerden biri, şirketin hassas verilerin işlenmesine nasıl yaklaştığıdır. Güvenlik, uyumluluk ve veri yerleşimi gibi konulardaki durumları ve bakış açılarını daha iyi anlamak için her bir aracı inceledik.

Metrik Puanlama nasıl yapılır? tl;dv Rimo Tactiq ClovaNote Notta Google Gemini
Veri yerleşimi / bölgesel barındırma Bölgesel barındırma seçenekleri, örneğin talep üzerine Japonya’da barındırma 3/3 3/3 0/3 0/3 0/3 3/3
Güvenlik ve uyumluluk SOC2, ISO 27001, GDPR 3/3 3/3 3/3 0/3 3/3 3/3
Kullanıcı ses kayıtları üzerine yapay zeka eğitimi Bu, yapay zekanın sizin ses verilerinizle eğitilmesini engelliyor mu (eğitim yapılmadığında tam puan alınır mı)? 3/3 3/3 3/3 0/3 0/3 3/3
Veri saklama kontrolleri Kayıtların ve transkriptlerin ne kadar süreyle saklanacağına ilişkin kontrol 3/3 0/3 0/3 0/3 3/3 3/3
Fiyat şeffaflığı Plan fiyatları, sadece teklif olarak değil, açık bir şekilde yayınlanmaktadır 3/3 3/3 3/3 3/3 3/3 3/3
Ücretsiz paket / sınırlar Ücretsiz planın mevcut olup olmadığı (sadece ücretsiz deneme sürümü varsa puan 0 olarak değerlendirilir) 3/3 0/3 3/3 3/3 3/3 0/3
Güven, güvenlik ve değer ara toplamı 18/18 18 Aralık 18 Aralık 18 Haziran 18 Aralık 15/18

Bu özel kriter, transkripsiyonun ötesine geçerek her bir aracın verilerinizi nasıl işlediğine odaklanmaktadır; bu konu, Japon kuruluşları için özellikle büyük önem taşımaktadır.

Talep Üzerine Japonya’da Veri Barındırma

Japonya, toplantı verilerinin ülke içinde depolanmasını yasal olarak zorunlu kılmamaktadır. Ancak, yurtdışına gönderilen tüm kişisel verilerin özenle işlenmesini şart koşmaktadır: APPI uyarınca, verilerin başka bir ülkedeki üçüncü bir tarafa aktarılması genellikle kişinin önceden rızasını gerektirirken, bu verilerin Japonya’daki bir hizmet sağlayıcıda tutulması durumunda bu yükümlülük ortadan kalkmaktadır. Birçok Japon şirketi için, verilerin yurt içinde depolanması aynı zamanda basit bir güven meselesi ve iç politika konusudur.

tl;dv , isteğe bağlı Japonya’da veri barındırma özelliğini tl;dv ; bu sayede, buna ihtiyaç duyan kuruluşlar, toplantı verilerinin varsayılan olarak yurtdışında işlenmek yerine Japonya’da barındırılmasını sağlayabilirler.

Verileriniz Size Ait Kalır

tl;dv , güvenlik durumu, veri saklama kontrolleri ve yapay zeka modellerinin müşteri ses kayıtlarıyla eğitilmemesi konularında tl;dv tam puan aldı. Tüm bu unsurlar bir arada değerlendirildiğinde, bu seviye, toplantı kayıtları odadan çıkmadan önce bir Japon şirketinin beklediği standartları karşılamak üzere tasarlanmış bir aracı yansıtmaktadır.

Japonca Toplantı Doğruluk Testi: Metodoloji

Karşılaştırmamız, her bir araca aynı koşulları sağlamak üzere tasarlanmış, kontrollü ve eşdeğer bir test temelinde gerçekleştirilmiştir.

Test Seti

Karşılaştırmanın temelini, her biri yaklaşık bir saat süren üç adet önceden kaydedilmiş web semineri oluşturdu. Ana dosyalar indirildi ve her bir aracın yükleme işlevi aracılığıyla işlendi. Araçların çoğu MP4 formatını doğrudan kabul ederken, ikisi yüklemeden önce M4A formatına dönüştürülmesini gerektirdi. Üç web semineri de bu iki formattan birinde altı aracın tümünde çalıştırıldı; CLOVA Gemini ise M4A formatında Gemini .

İnceleme

Çıktılar, ana dili İngilizce olan panelimiz tarafından değerlendirildi: Mioko, Oji ve Hiromi, anonim olarak çalışarak her bir sonucun olumlu yönlerini ve faydalarını puanladılar. Bu puanlar birleştirilerek nihai derecelendirmeler oluşturuldu. Özellik ve nitelik verileri, kamu malı belgelerden elde edildi.

Alet Seti

Seçim, Japon pazarındaki popülerlik ve yaygın kullanım temel alınarak yapılmıştır. Gemini , önceden kaydedilmiş web semineri içerikleri için uygun Gemini masaüstü Gemini ; erişilebilirliği ve temelinde yatan Google motoru nedeniyle listeye dahil edilmiştir. Tactiq Japon pazarındaki faaliyetleri dikkate alınarak listeye dahil Tactiq . CLOVA , CLOVA ın Korece sürümü olan CLOVA CLOVA .

Motor ve Plan Ayrıntıları

Her bir aracın çalışma şekli, kaydı işleyip metne dönüştüren bir motor tarafından desteklenmesidir. Her aracın kendine özgü bir sürümü vardır; pek çok araç aynı şirketin motorunu kullanmasına rağmen, yapılandırılma şekilleri birbirinden farklıdır. Ayrıca, birçok araç, kaydolduğunuz pakete bağlı olarak farklı motorlar sunar. Örnek vermek gerekirse, tl;dv ’deki tüm Japonca toplantılar, ister ücretli ister ücretsiz hesap olsun, aynı motor üzerinde tl;dv ; böylece ne kadar yatırım yaparsanız yapın tutarlılık sağlanır.

Araç Temel motor / tedarikçi Şirket içi veya lisanslı Motor tipi Plan
Rimo Şirket içi Japonca derin öğrenme konuşma modeli. OpenAI API’si yalnızca düzenleyici ve özet katmanında kullanılmaktadır. Şirket içi (onaylayıcı), lisanslı (editör) Özel ASR Ücretsiz deneme
tl;dv ElevenLabs Lisanslı Özel ASR İş
Notta Adı açıklanmayan Japon yerli üçüncü taraf iş ortağı Lisanslı Özel ASR Ücretli, bir ay
Tactiq Canlı yayın yolundaki toplantı platformu altyazıları. Bu testte dosya yükleme kullanıldığından, Tactiq kendi yükleme transkripsiyonunu Tactiq ; bu işlem kamuya açık bir şekilde belgelenmemiştir. Karışık, kısmen açıklanmamış Platform altyazıları (canlı) veya ASR yükle Ücretsiz
CLOVA NAVER CLOVA Şirket içi (NAVER) Özel ASR Ücretsiz (Kore pazarı CLOVA )
Google Gemini Google Gemini Şirket içi (Google) LLM Bağımsız Gemini (Business Starter hesabı)

Kapsam ve Uyarılar

  • CLOVA , telefonla doğrulama sorunları nedeniyle erişim engellendiği için test edilemedi.
  • M4A formatına dönüştürme işlemi, orijinal formatta yapılan yüklemeye kıyasla küçük farklılıklara yol açabilir.
  • Kamu malı olan özellik verileri, test yapıldığı tarihte yayınlanan bilgileri yansıtmaktadır ve değişikliklere tabidir.

Karşılaştırmanın olabildiğince adil olması için her araç aynı kaynak dosyalar üzerinde çalıştırıldı, aynı değerlendirme heyeti tarafından incelendi ve aynı kriterlere göre puanlandı.

Japonya için en iyi toplantı transkripsiyon yazılımı hangisidir?

Dört alanın tamamında gerçekleştirdiğimiz tüm testlerde tl;dv birinci tl;dv . Konuşmacıları isimleriyle tanımlayabiliyor, tüm özel isimleri doğru bir şekilde aktarıyor ve ses izleme özelliği, ChatGPT ve Claude ile entegre yerel bir MCP sunucusu ile isteğe bağlı Japonya’da veri barındırma hizmeti sunan az sayıdaki araçtan biri. Bu özelliklerin her biri, onu mükemmel bir Japonca toplantı transkripsiyon aracı olarak güçlü bir aday haline getiriyor.

Diğer araçların da kendine özgü güçlü yanları var; Notta, transkripsiyon kalitesi biraz daha düşük olsa da mükemmel özellikler sunuyor. Benzer şekilde, Rimo transkripsiyon konusunda iyi bir performans gösterdi, ancak pratik kullanım olanakları daha azdı ve özetleme özelliği yoktu; bu da birçok alanda 0 puan aldığı anlamına geliyor. CLOVA Korece özetler sunduğu için bu özellikleri test edemedik.

Tactiq , çıktı olarak sağlam görünen bir transkripsiyon Tactiq ; ancak bu metin, ana dili Japonca olan panelimiz tarafından neredeyse okunamaz durumdaydı ve bazı bariz hatalar içeriyordu. Gemini ses kaydının tamamını Gemini ; bu da, transkripsiyonun sahip olabileceği tüm güçlü yanlarının fiilen sıfıra indirgenmesine neden oldu, zira çıktı tam anlamıyla kullanılamaz durumdaydı.

Özellikle önemli konular üzerinde birçok unsur ve farklı görüşlerin etkileşimde bulunduğu Japon toplantılarında, tl;dv üç denememizin tamamında başarılı tl;dv .

Ekibiniz toplantılarını Japonca yürütüyorsa ve toplantıların sadece bir transkriptten öteye geçerek işinizi geliştiren ve ilerleten ek özelliklere sahip sağlam ve güvenilir bir toplantı kayıt aracına ihtiyaç duyuyorsa, tl;dv en iyi tl;dv .

tl;dv deneyin ve Google Meet, Zoom ve masaüstü uygulamamız aracılığıyla Japonca toplantılarınızı nasıl kaydettiğini görün; bot içermeyen kayıt özelliği sayesinde diğer tüm toplantı platformlarında da aynı şekilde çalışır. 

Japonca Transkripsiyon Doğruluğu Hakkında Sık Sorulan Sorular

AI Japonca toplantısı transkripsiyon, çoğu iş toplantısı için yeterince doğrudur ve en güçlü araçlar, ana dili İngilizce olan bir okuyucunun çok az düzeltmeyle kabul edebileceği metinler üretir. Yaptığımız testlerde, tl;dv Japonca doğruluk konusunda lider oldu. Diğer alanlardaki en yaygın hatalar ise yanlış kanji ve isimlerin katakana ile yazılmış isimler ve konuşmacı etiketleri.

Çoğu transkripsiyon aracı öncelikle İngilizceye göre geliştirildiğinden, Japonca’da kullanılmayan kelimeler arası boşluklar gibi ipuçlarına dayanırlar. Japonca kendi başına daha zor bir dil değildir; sadece farklı işler: aynı sesli kelimeler farklı kanji karakterleriyle yazılır ve tek bir ses için üç farklı yazı sistemi vardır. En iyi araçlar, İngilizceyi varsaymak yerine bu özellikleri dikkate alacak şekilde tasarlanmış olanlardır.

Doğru seçim toplantıya göre değişir, ancak tl;dv test ettiğimiz her seviyede birinci tl;dv . Birkaç kişinin katıldığı toplantılarda, tl;dv konuşmacıları isimleriyle etiketleyen tek tl;dv ; bu sayede transkript, sonradan manuel olarak düzeltmeye gerek kalmadan kullanılabilir hale geliyor.

Çoğu araç, keigo’yu doğru bir şekilde algılar ancak daha sonra bu saygı ifadesini basitleştirir ya da “düzeltir”, böylece söylenenlerin üslubunu değiştirir. Transkript hâlâ akıcı bir Japonca gibi okunduğundan, bu değişikliği fark etmek kolay değildir. Anadili Japonca olan kişilerce yapılan kör incelememizde, tl;dv bu ince dilbilimsel ayrıntıları diğer araçlara kıyasla daha güvenilir bir şekilde tl;dv .

Yapay zeka destekli Japonca transkripsiyonun güvenliği, markadan çok ses kaydının nerede depolandığına ve kullandığınız planın bu kayıtlarla eğitim yapıp yapmadığına bağlıdır. Japonya’nın APPI yasası uyarınca, toplantı ses kayıtlarının yurt dışına gönderilmesi sınır ötesi veri aktarımı olarak kabul edilir; bu nedenle hassas toplantılar söz konusu olduğunda, verilerin nerede depolandığını kontrol edin ve ses kayıtlarını, eğitim amacıyla örnekleme yapılabilecek ücretsiz paketlerde saklamayın.