Resumo das ferramentas de transcrição em japonês e sua precisão

Em nosso teste de transcrição de reuniões em japonês, avaliamos seis ferramentas em três reuniões gravadas. Os resultados mostraram que tl;dv a pontuação geral mais alta, com 189 dos 200pontos disponíveis.

A segunda ferramenta que obteve boa pontuação foi o Notta, com 166 pontos, seguida pelo Rimo, com 140.

Resumindo, tl;dv em áreas como a precisão da transcrição, elementos práticos das reuniões, como resumos, além de oferecer muitos recursos úteis que aprimoraram a qualidade do resultado da reunião, além da própria transcrição. Em particular, ele lidou corretamente com a identificação dos participantes e a transcrição de nomes próprios.

Índice

As ferramentas de transcrição de reuniões em japonês são extremamente úteis para quem realiza reuniões e operações diárias nesse idioma.

Em todo o mundo, as reuniões podem ser bastante agitadas, com vários participantes falando, trocas rápidas de palavras e, ocasionalmente, algum empréstimo linguístico do inglês. E, embora muitas ferramentas disponíveis no mercado ofereçam transcrição e outros recursos para falantes de japonês, é importante ter certeza de que suas reuniões estão sendo gravadas corretamente.

Para dar uma ideia de como tl;dv para um falante de japonês, fizemos um teste comparativo com outras cinco ferramentas comumente utilizadas no mercado. Foram elas:

    1. Rimo
    2. Tactiq
    3. CLOVA da Naver
    4. Nota
    5. Google Gemini

Todas essas ferramentas receberam o mesmo material de origem e, em seguida, foram avaliadas em quatro áreas distintas.

Em seguida, utilizamos os resultados da transcrição e do resumo, avaliamos esses resultados com um LLM e, depois, solicitamos que um segundo painel de falantes de japonês revisasse os resultados de forma anônima.

Estes são os resultados.

NívelMaxtl;dvRimoTactiqClovaNoteNotaGoogle Gemini
Transcrição e precisão65605726335739
Qualidade de reunião como na vida real45452430243817
Recursos e funcionalidades72664746325911
Confiança, segurança e valor1818121261215
Pontuação geral2001891401149516682
Classificação 134526

Transcrição e precisão de reuniões em japonês

Estes são os resultados da comparação da precisão da transcrição entre seis ferramentas, utilizando o mesmo áudio em japonês. Os resultados foram avaliados por LLMs (o Claude,Anthropic, e o ChatGPT, da OpenAI) e, em seguida, confirmados por meio de uma avaliação cega realizada por falantes nativos, com os nomes das ferramentas ocultados

Métrico Como foi a pontuação tl;dv Rimo Tactiq ClovaNote Nota Google Gemini
Precisão linguística Avaliação cega da gravidade, realizada por falantes nativos, sobre a precisão na língua em questão 20/20 20/20 20/8 20/12 20/20 16/20
Tratamento específico por idioma Diacríticos, pontuação, variantes regionais, alternância de código 16/20 16/20 20/8 20/8 16/20 20/12
Avaliação da taxa de erros de caracteres Calculado com base em um histórico escolar oficial ou texto de referência 5/5 4/5 2/5 2/5 5/5 1/5
Detecção de entidades Nomes, empresas e locais presentes no elenco 5/5 4/5 2/5 2/5 4/5 2/5
Números, datas e moedas Números, datas e valores formatados corretamente no idioma local 4/5 4/5 3/5 3/5 4/5 4/5
Reconhecimento bruto de termos técnicos Termos e siglas do setor antes do treinamento personalizado 5/5 4/5 2/5 2/5 4/5 3/5
Pontuação e segmentação Quebras de frase e divisão em parágrafos na saída do teste 5/5 5/5 1/5 4/5 4/5 1/5
Subtotal de transcrição e precisão 60/65 57/65 26/65 33/65 57/65 39/65

Entre as seis ferramentas avaliadas, tl;dv registrou a maior precisão, com um subtotal de 60.

Rimo ficou em segundo lugar com 57, seguido por Notta, também com 57, Google Gemini com 39, ClovaNote com 33 e Tactiq com 26.

tl;dv a primeira posição em precisão linguística, precisão em nomes próprios e nomes de pessoas, e reconhecimento de termos técnicos antes de qualquer treinamento personalizado. Também obteve excelentes resultados em áreas como tratamento específico de idiomas, números, datas e moedas, além de pontuação e segmentação.

Detecção de entidades

Um dos aspectos que testamos foi a detecção de entidades. A detecção de entidades é definida como a capacidade da ferramenta de identificar nomes e termos conhecidos com precisão. No áudio, havia vários nomes de marcas, incluindo tl;dv.

tl;dv identificar e transcrever corretamente tl;dv sua forma correta, com o ponto-e-vírgula. Nenhuma das outras ferramentas conseguiu fazer isso, embora muitas tenham transcrito como TLDV, o que, neste caso, está próximo da precisão. Algumas das outras ferramentas não conseguiram transcrever corretamente de forma alguma, incluindo CLOVA , que apresentou variações como pldv, gldv e apenas dv.

Constatamos que isso também se aplicava a outras marcas e nomes de pessoas, com muitas das ferramentas apresentando versões diferentes dos nomes próprios ao longo dos resultados. Uma ferramenta que reproduz corretamente um nome já estabelecido tende a manter a precisão em relação a outras entidades presentes em uma reunião, como locais, pessoas e nomes de empresas.
tl;dv a pontuação mais alta entre todas as seis ferramentas. Essa mesma consistência se estendeu a outras entidades nas transcrições, com tl;dv mantendo tl;dv os nomes de pessoas quando mencionados na fala.

Pontuações do CER

Conseguimos realizar um quarto teste utilizando uma transcrição verificada proveniente de uma fonte terceirizada para calculara Taxa de Erro de Caracteres (CER), uma métrica fundamental para a avaliação do ASR (reconhecimento de fala para texto). Em nossos testes de CER, tl;dv uma excelente pontuação de 0,8%, seguida de perto pelo Notta. A título de comparação, o Rimo obteve 1,5%, Tactiq , Tactiq %, Clova ,8% e Gemini , Gemini %. Gemini com base em uma gravação mais curta, pois ocorreu um erro de falha na reunião.

Rotulagem de alto-falantes

tl;dv a única ferramenta capaz de identificar os nomes dos interlocutores. Em gravações com vários interlocutores, essa distinção afeta diretamente a usabilidade da transcrição. Essa é a principal razão pela qual tl;dv à frente do Rimo, que apresentou precisão comparável, mas não fornece identificações dos interlocutores.

Observações sobre os concorrentes

O Rimo apresentou o resultado mais próximo, com alta precisão e segmentos bem proporcionados e legíveis. Sua principal limitação é a ausência de identificações dos falantes, e ele reproduziu o nome do produto como “TLDV”.

Notta também teve um bom desempenho e dividiu o texto em parágrafos claros, embora os blocos tendessem a ser longos, segundo nosso painel de falantes nativos.

Clova quebras de linha claras entre as frases, mas sua precisão foi insuficiente para sustentá-las, e sua renderização inconsistente dos diversos nomes de produtos reflete problemas mais amplos de reconhecimento.

Tactiq o pior Tactiq nos aspectos fundamentais. A detecção de locutor falhou, dividindo um único locutor entre várias categorias, e a precisão foi baixa em todos os aspectos. Ele registrou o pior resultado entre os seis.

Uma observação sobre o Google Gemini

Os materiais de origem eram webinars pré-gravados; portanto, Gemini não Gemini ser executado ao vivo durante uma Google Meet , que é seu método padrão de captura. Utilizou-se uma conta paga do Google para processar o arquivo M4A diretamente. Gemini apenas uma parte da sessão, em vez da gravação completa, e a seção transcrita apresentou qualidade inferior nos trechos em que o áudio não pôde ser analisado, resultando em um texto final fraco e de difícil compreensão. Para contextualizar, esse mesmo arquivo foi enviado ao Notta, demonstrando que o problema não estava na fonte.

Foi realizado um teste ao vivo com um quarto recurso, e isso foi feito em tempo real no Google Meet o objetivo de calcular as pontuações do CER. O Google Gemini adicionado ao vivo à reunião, mas foi interrompido no meio do processo, tendo que ser reintroduzido. Como resultado, a transcrição foi novamente truncada e apresentou muitas imprecisões.

Gemini mantido na comparação por uma questão de exaustividade, com essa limitação devidamente indicada. Seu resultado também demonstrou certa capacidade de reconhecimento multilíngue, identificando indicações de gravação em inglês no áudio.

Gemini
Google Gemini

Qualidade das reuniões na prática

Além da qualidade da transcrição, o resultado final do transcrito e de outros itens associados, como resumos, é um elemento muito importante. Em nossos testes, analisamos como esses itens foram apresentados e o padrão de qualidade para o uso diário.

Métrico Como foi a pontuação tl;dv Rimo Tactiq ClovaNote Nota Google Gemini
Qualidade da diarização Contagem correta de falantes e atribuição de falas em comparação com o elenco conhecido 10/10 4/10 2/10 6/10 6/10 6/10
Estabilidade comportamental Estabilidade comportamental entre os diferentes tipos de sessão 10/10 10/10 6/10 9/10 10/10 2/10
Qualidade do resumo A utilidade do resumo e se ele foi mantido no idioma de origem, levando em conta os empréstimos linguísticos 5/5 0/5 4/5 0/5 4/5 0/5
Taxa de alucinação / inserção Texto inventado, repetido ou duplicado que não está presente no áudio. Erros de compreensão auditiva e trechos omitidos excluídos 10/10 10/10 9/10 9/10 10/10 9/10
Extração de itens de ação Qualidade das tarefas e ações de acompanhamento definidas na reunião 5/5 0/5 4/5 0/5 3/5 0/5
Capítulos automáticos / divisão em seções O resumo divide a reunião em seções úteis? 5/5 0/5 5/5 0/5 5/5 0/5
Subtotal da qualidade das reuniões no mundo real 45/45 24/45 30/45 24/45 38/45 17/45

Entre as seis ferramentas, tl;dv a única a obter nota máxima em todas as categorias relacionadas à qualidade das reuniões na prática, com um subtotal de 45 em 45. O Notta ficou em segundo lugar, com 38; Tactiq 30; o Rimo e CLOVA , empatados em quarto, com 24; e o Google Gemini 17.

Grande parte dessa variação se resume a um único fator: se uma ferramenta produziu ou não um resumo utilizável da reunião em japonês. Nos casos em que não foi gerado nenhum resumo no plano testado, a ferramenta recebeu nota 0 em qualidade do resumo, itens de ação e divisão em seções. Isso reflete o que a ferramenta oferece por padrão, e não a qualidade de qualquer resumo que ela possa produzir em outro plano.

Diarização e atribuição de falantes

tl;dv nota máxima na atribuição dos interlocutores corretos e na identificação de cada intervenção. CLOVA , o Notta e Gemini na parte intermediária da tabela, enquanto Tactiq mais Tactiq , atribuindo um único interlocutor a várias etiquetas.

Resumos, ações a serem tomadas e divisão em seções

É aqui que o campo se divide de forma mais clara. tl;dv, Tactiq e o Notta produziram resumos em japonês que foram avaliados quanto à qualidade, com tl;dv mais alta. O Rimo, CLOVA e Gemini nenhum resumo de forma imediata no plano testado: o recurso CLOVA é disponível apenas em coreano, o do Rimo exigia pagamento e Gemini nenhum resultado. A pontuação reflete a disponibilidade, não a qualidade do resumo.

Recursos e funcionalidades

Um assistente de reuniões baseado em IA é muito mais do que um simples registrador de notas de reuniões, com diversos recursos e elementos que aprimoram a qualidade da transcrição final e das atividades relacionadas a ela. Analisamos alguns dos recursos mais notáveis disponíveis e determinamos se cada ferramenta possui essa capacidade, ajustando a pontuação para avaliar o benefício e o impacto de cada uma na experiência do usuário.

Métrico Como foi a pontuação tl;dv Rimo Tactiq ClovaNote Nota Google Gemini
Nomeação de alto-falantes pronta para uso Identifica automaticamente os participantes reais no Meet, Zoom e Teams 5/5 0/5 1/5 0/5 0/5 0/5
Impressão de voz Disponibilidade de treinamento de impressão vocal para a própria voz do usuário 5/5 0/5 0/5 0/5 5/5 0/5
Gravação sem bots Grava através do áudio do sistema sem enviar um bot para a chamada 5/5 5/5 5/5 5/5 5/5 0/5
Sincronização de CRM Nativo e sincronização automática 3/3 0/3 3/3 0/3 3/3 0/3
Notas personalizadas / modelos Formatos de resumo personalizáveis versus uma saída fixa 3/3 3/3 3/3 0/3 3/3 0/3
Treinamento de vocabulário/entidades personalizadas Ensinar termos e siglas do setor 5/5 5/5 0/5 5/5 5/5 0/5
Localização da interface do usuário em japonês Se a própria interface do produto está disponível em japonês 5/5 5/5 5/5 5/5 5/5 5/5
Amplitude das integrações Slack, calendário, Zapier, API 3/3 0/3 3/3 0/3 3/3 0/3
Velocidade de processamento Tempo decorrido entre o término da reunião e a conclusão da transcrição 3/3 2/3 1/3 0/3 3/3 0/3
Rastreamento de palavras de preenchimento Rastreamento de palavras de preenchimento — Rastreia “hum”, “eh” e “este” sem duplicar as gagueiras. Permite uma visibilidade completa das transcrições faladas, em vez de suavizá-las excessivamente 3/3 0/3 0/3 0/3 0/3 0/3
Precisão do carimbo de data e hora Verifique aleatoriamente se os carimbos de data e hora correspondem ao momento correto 3/3 3/3 2/3 2/3 3/3 0/3
Disponibilidade da tradução Ele consegue traduzir as anotações da reunião? E para quantos idiomas? 3/3 3/3 3/3 0/3 3/3 0/3
Pesquisar na transcrição Pesquisar em uma reunião e na biblioteca 3/3 3/3 0/3 3/3 3/3 0/3
Interface de usuário para edição de transcrições É possível corrigir a transcrição facilmente depois que ela já estiver pronta? 3/3 3/3 3/3 3/3 3/3 3/3
Formatos de exportação SRT, VTT, TXT, DOCX e formatos semelhantes 0/3 3/3 3/3 3/3 3/3 0/3
Transcrição ao vivo / em tempo real A transcrição é exibida ao vivo durante a reunião? 0/3 3/3 3/3 0/3 3/3 3/3
Cobertura da plataforma de reuniões Cobertura do Zoom, Meet, Teams e Webex 3/3 3/3 3/3 0/3 3/3 0/3
Captura de aplicativos móveis É possível gravar reuniões presenciais por meio de um aplicativo móvel? 3/3 3/3 0/3 3/3 3/3 0/3
Servidor MCP nativo Servidor nativo próprio que permite que assistentes de IA consultem o acervo de reuniões 5/5 0/5 5/5 0/5 0/5 0/5
Edição do rótulo do alto-falante É possível renomear e reatribuir alto-falantes posteriormente? 3/3 3/3 3/3 3/3 3/3 0/3
Subtotal de recursos e funcionalidades 66/72 47/72 46/72 32/72 59/72 11/72

Existem muitos recursos que diferenciam uma ferramenta dedicada a reuniões de um simples transcritor de reuniões, e tl;dv a melhor pontuação em todos eles. Há dois, em particular, que se destacam

Servidor MCP nativo

tl;dv uma das duas únicas ferramentas com um servidor MCP nativo, o que permite que assistentes de IA consultem diretamente o acervo de reuniões. A maioria dos concorrentes obteve nota zero nesse quesito. Trata-se do recurso que conecta as reuniões gravadas ao conjunto mais amplo de ferramentas de IA que uma equipe já utiliza, em vez de deixar a transcrição em um sistema fechado.

Impressão de voz

tl;dv também tl;dv uma das duas únicas ferramentas a oferecer reconhecimento de voz, ao lado do Notta. Ele é treinado com a sua própria voz, o que aumenta a confiabilidade da sua identificação nas reuniões — uma vantagem que se consolida quanto mais você o utiliza.

Confiança, Segurança e Valor

Alguns dos aspectos mais importantes a se levar em conta ao escolher uma ferramenta para gravar suas reuniões em japonês são a confiança, a segurança e o custo-benefício. Muitos desses aspectos podem ser garantidos por um serviço de transcrição de boa qualidade, com excelentes recursos e resultados úteis, mas um fator determinante é a forma como a empresa lida com dados confidenciais. Pesquisamos cada ferramenta para saber mais sobre sua situação e suas posições em áreas como segurança, conformidade e residência de dados.

Métrico Como foi a pontuação tl;dv Rimo Tactiq ClovaNote Nota Google Gemini
Residência de dados / hospedagem regional Opções de hospedagem regional, por exemplo, hospedagem no Japão sob demanda 3/3 3/3 0/3 0/3 0/3 3/3
Segurança e conformidade SOC2, ISO 27001, GDPR 3/3 3/3 3/3 0/3 3/3 3/3
Treinamento de IA com áudio do usuário Isso evita que a IA seja treinada com o seu áudio (nenhum treinamento recebe nota máxima)? 3/3 3/3 3/3 0/3 0/3 3/3
Controles de retenção de dados Controle sobre o prazo de retenção das gravações e transcrições 3/3 0/3 0/3 0/3 3/3 3/3
Transparência de preços Os preços dos planos são publicados, em vez de serem fornecidos apenas mediante cotação 3/3 3/3 3/3 3/3 3/3 3/3
Plano gratuito / limites Disponibilidade de plano gratuito (um período de teste gratuito por si só recebe nota 0) 3/3 0/3 3/3 3/3 3/3 0/3
Subtotal de confiança, segurança e valor 18/18 18/12 18/12 18/6 18/12 15/18

Esse critério específico vai além da transcrição e analisa como cada ferramenta lida com seus dados, uma área que reveste especial importância para as organizações japonesas.

Residência de dados no Japão sob demanda

O Japão não exige legalmente que os dados sejam armazenados em território nacional. O que o país exige é o tratamento cuidadoso de quaisquer dados pessoais enviados para o exterior: de acordo com a APPI, a transferência de dados para um terceiro em outro país geralmente requer o consentimento prévio do indivíduo, enquanto a retenção desses dados por um provedor no Japão elimina essa obrigação. Para muitas empresas japonesas, o armazenamento doméstico é também uma questão simples de confiança e política interna.

tl;dv à residência de dados no Japão sob demanda; assim, as organizações que precisarem disso podem ter os dados de suas reuniões hospedados no Japão, em vez de serem processados no exterior por padrão.

Seus dados continuam sendo seus

tl;dv obteve nota máxima em relação à postura de segurança, aos controles de retenção de dados e ao fato de não treinar modelos de IA com áudio de clientes. Em conjunto, essa classificação reflete uma ferramenta projetada para atender aos padrões que uma empresa japonesa esperaria antes que as gravações de reuniões saiam da sala.

Teste de Precisão de Reuniões em Japonês: Metodologia

Nossa comparação se baseia em um teste controlado e comparativo, projetado para proporcionar as mesmas condições a todas as ferramentas.

O Conjunto de Testes

Três webinars pré-gravados, com duração de cerca de uma hora cada, serviram de base para a comparação. Os arquivos principais foram baixados e processados por meio da função de upload de cada ferramenta. A maioria das ferramentas aceitou o formato MP4 diretamente; duas exigiram a conversão para M4A antes do upload. Todos os três webinars foram testados em todas as seis ferramentas em um dos dois formatos, sendo que CLOVA Gemini no formato M4A.

A Resenha

Os resultados foram avaliados por nosso painel de falantes nativos: Mioko, Oji e Hiromi, que trabalharam de forma anônima e pontuaram os aspectos positivos e os benefícios de cada resultado. Essas pontuações foram agregadas para produzir as classificações finais. Os dados sobre recursos e atributos foram obtidos a partir de documentação de domínio público.

O conjunto de ferramentas

A seleção foi baseada na popularidade e no uso padrão no mercado japonês. Gemini a versão para desktop, adequada para materiais de webinars pré-gravados, e foi incluído por sua disponibilidade e pelo mecanismo do Google no qual se baseia. Tactiq incluído com base em sua atuação declarada no mercado japonês. CLOVA ao CLOVA , a versão coreana do CLOVA .

Discriminação do motor e do plano

Cada ferramenta funciona por meio de um mecanismo que processa a gravação e a transforma em uma transcrição. Cada ferramenta possui sua própria versão; embora muitas utilizem o mecanismo da mesma empresa, a forma como são configuradas é diferente. Além disso, muitas ferramentas oferecem mecanismos diferentes, dependendo do plano que você contratar. Para contextualizar, todas as reuniões em japonês na tl;dv processadas pelo mesmo mecanismo, seja em contas pagas ou gratuitas, garantindo consistência independentemente do seu investimento.

Ferramenta Motor subjacente / fornecedor Próprio ou licenciado Tipo de motor Plano
Rimo Modelo interno de reconhecimento de fala com aprendizado profundo em japonês. A API da OpenAI é utilizada apenas para o editor e a camada de resumo. Interno (reconhecimento), licenciado (editor) ASR dedicado Teste gratuito
tl;dv ElevenLabs Licenciado ASR dedicado Negócios
Nota Parceiro japonês não identificado, de terceiros, no mercado interno Licenciado ASR dedicado Pago, um mês
Tactiq Legendas da plataforma de reuniões na transmissão ao vivo. Este teste utilizou o envio de arquivos; por isso, Tactiq sua própria transcrição do envio, que não está documentada publicamente. Misto, parcialmente não divulgado Legendas da plataforma (ao vivo) ou upload de ASR Grátis
CLOVA NAVER CLOVA Interno (NAVER) ASR dedicado Gratuito ( CLOVA para o mercado coreano)
Google Gemini Google Gemini Interno (Google) LLM Gemini independente Gemini (conta Business Starter)

Escopo e ressalvas

  • CLOVA não foi testado, pois o acesso foi bloqueado devido a um problema com a verificação por telefone.
  • A conversão para M4A pode apresentar pequenas diferenças em relação a um arquivo enviado no formato original.
  • Os dados de recursos de domínio público refletem o que foi publicado na época dos testes e estão sujeitos a alterações.

Todas as ferramentas foram executadas em arquivos-fonte idênticos, analisadas pelo mesmo painel e avaliadas com base nos mesmos critérios, a fim de garantir que a comparação fosse a mais justa possível.

Qual é o melhor software de transcrição de reuniões para o Japão?

Em todos os nossos testes, nas quatro áreas, tl;dv primeiro lugar. Ele consegue identificar os participantes por nome, reproduzir corretamente todos os nomes próprios e é uma das poucas ferramentas que oferecem identificação de voz, um servidor MCP nativo com ChatGPT e Claude, além de residência de dados em japonês sob demanda. Cada um desses recursos o torna um forte candidato a ser uma excelente ferramenta de transcrição de reuniões em japonês.

As demais ferramentas apresentam pontos fortes reais, com o Notta oferecendo excelentes recursos, embora forneça uma versão ligeiramente inferior da transcrição. Da mesma forma, o Rimo teve um bom desempenho na transcrição, mas apresentou menos recursos práticos e não contava com um recurso de resumo, o que significa que, em muitas áreas, obteve nota 0. CLOVA oferecia resumos em coreano, por isso não pudemos testá-los.

Tactiq uma transcrição que parecia sólida à primeira vista, mas que se mostrou praticamente ilegível para nosso painel de falantes nativos de japonês, apresentando alguns erros evidentes. Gemini reproduziu o áudio na íntegra, o que significa que quaisquer pontos positivos da transcrição foram efetivamente anulados, já que ela se tornou inutilizável como resultado completo.

Especificamente nas reuniões japonesas, onde há muitos elementos e diferentes vozes interagindo sobre assuntos importantes, tl;dv eficaz em todas as nossas três sessões.

Se sua equipe realiza reuniões em japonês e precisa de um gravador de reuniões robusto e confiável, com recursos adicionais que transformam a reunião de uma simples transcrição em algo que aprimora e impulsiona seu trabalho, então tl;dv a melhor opção.

Experimente tl;dv e veja como ele lida com suas reuniões em japonês no Google Meet, no Zoom e em qualquer outra plataforma de reuniões, graças à nossa gravação sem bots disponível no aplicativo para desktop

Perguntas frequentes sobre a precisão da transcrição do japonês

Reunião sobre IA em japonês A transcrição é precisa o suficiente para a maioria das reuniões de negócios, e as melhores ferramentas produzem textos que um leitor nativo pode aceitar com correções mínimas. Em nossos testes, tl;dv o ranking em precisão em japonês. Os erros mais comuns erros em outros idiomas são o uso incorreto de kanji para um homófono, nomes escritos em katakana, além de omissão ou fusão de .

A maioria das ferramentas de transcrição foi desenvolvida inicialmente com base no inglês, por isso elas se baseiam em pistas como os espaços entre as palavras, que não existem no japonês. O japonês não é mais difícil em si, apenas funciona de maneira diferente, com homófonos escritos em kanji diferentes e três sistemas de escrita para um mesmo som. As melhores ferramentas são aquelas projetadas para lidar com essas características, em vez de partir do pressuposto de que se trata do inglês.

A escolha certa depende do tipo de reunião, mas tl;dv em primeiro lugar em todas as categorias que testamos. Para reuniões com várias pessoas, tl;dv a única ferramenta capaz de identificar os interlocutores pelo nome, o que torna a transcrição utilizável sem a necessidade de correções manuais posteriores.

A maioria das ferramentas reconhece o keigo corretamente, mas depois simplifica ou “corrige” a forma honorífica, alterando o registro do que foi dito. A transcrição ainda parece japonês fluente, por isso é fácil não perceber essa mudança. Em nossa avaliação cega realizada por falantes nativos, tl;dv esses detalhes linguísticos mais sutis de forma mais confiável do que os demais.

A segurança da transcrição em japonês feita por IA depende mais do local onde o áudio está armazenado e se o seu plano utiliza esses dados para treinamento do que da marca em si. De acordo com a APPI do Japão, o envio de áudios de reuniões para o exterior é considerado uma transferência transfronteiriça; portanto, no caso de reuniões confidenciais, verifique a residência dos dados e evite armazenar os áudios em planos gratuitos, que podem utilizá-los como amostras para treinamento.