Краткий обзор японских инструментов транскрипции и их точности

В ходе тестирования систем транскрибирования японских совещаний мы проверили шесть инструментов на примере трёх записанных совещаний. Результаты показали ,что tl;dv наибольшее общее количествобаллов — 189 из 200возможных.

Вторым инструментом, получившим высокую оценку, стал Notta — 166 баллов, за ним следует Rimo — 140 баллов.

tl;dv в таких областях, как точность транскрипции, элементы реальных встреч (например, резюме), а также обладал множеством полезных функций, которые повышали качество итогового материала встречи помимо самой транскрипции. В частности, он корректно обрабатывал имена выступающих и транскрибировал имена собственные.

Оглавление

Инструменты для стенографирования встреч на японском языке чрезвычайно полезны для тех, кто ежедневно проводит встречи и ведет работу на японском языке.

Во всем мире совещания часто проходят в очень напряженном темпе: на них выступает множество докладчиков, участники быстро сменяют друг друга, а в речи время от времени встречаются заимствованные из английского слова. И хотя многие доступные на рынке инструменты предлагают пользователям, говорящим по-японски, транскрипцию и другие функции, важно быть уверенным в том, что ваши совещания записываются правильно.

Чтобы дать представление о том, насколько tl;dv для носителей японского языка, мы провели его тестирование в сравнении с пятью другими широко используемыми на рынке инструментами. К ним относятся:

    1. Римо
    2. Tactiq
    3. CLOVA от Naver
    4. Notta
    5. Google Gemini

Все эти инструменты получили один и тот же исходный материал, после чего их оценивали по четырём отдельным критериям.

Затем мы использовали полученные транскрипции и резюме, оценили их с помощью модели LLM, а после этого попросили вторую группу экспертов — носителей японского языка — проверить эти результаты в анонимном формате.

Вот результаты.

УровеньМаксtl;dvРимоTactiqClovaNoteNottaGoogle Gemini
Транскрипция и точность65605726335739
Качество встреч в реальных условиях45452430243817
Возможности и функции72664746325911
Доверие, безопасность и ценность1818121261215
Общая оценка2001891401149516682
Ранг 134526

Транскрипция и точность записи японских встреч

Ниже приведены результаты сравнения точности транскрипции шести инструментов на основе одного и того же японского аудиозаписи. Результаты были оценены с помощью больших языковых моделей (ClaudeAnthropicи ChatGPT от OpenAI), а затем подтверждены в ходе слепой оценки носителями языка, при этом названия инструментов были скрыты.

Метрическая система Как начисляются очки tl;dv Римо Tactiq ClovaNote Notta Google Gemini
Точность языкового выражения Оценка степенью сложности, данная носителями языка вслепую, в отношении точности речи на родном языке 20/20 20/20 20 августа 20.12 20/20 16/20
Обработка с учетом особенностей языка Диакритические знаки, пунктуация, региональные варианты, смена кода 16/20 16/20 20 августа 20 августа 16/20 20.12
Оценка частоты ошибок в символах Расчет произведён на основе официальной академической ведомости или эталонного текста 5 из 5 4/5 2/5 2/5 5 из 5 1/5
Распознавание объектов Имена, компании и места, фигурирующие в списке персонажей 5 из 5 4/5 2/5 2/5 4/5 2/5
Числа, даты и валюта Цифры, даты и суммы, оформленные в соответствии с правилами данного языка 4/5 4/5 3/5 3/5 4/5 4/5
Распознавание исходных технических терминов Отраслевые термины и аббревиатуры перед началом индивидуального обучения 5 из 5 4/5 2/5 2/5 4/5 3/5
Пунктуация и сегментация Разделение предложений и абзацев в результатах пробного запуска 5 из 5 5 из 5 1/5 4/5 4/5 1/5
Промежуточный итог по транскрипции и точности 60/65 57/65 26/65 33/65 57/65 39/65

Среди шести оцениваемых инструментов tl;dv продемонстрировал наивысшую точность, набрав 60 баллов.

За ними следовали Rimo с результатом 57 и Notta — также с результатом 57, а также Google Gemini — 39, ClovaNote — 33 и Tactiq — 26.

tl;dv лидирующие позиции по точности языковой обработки, точности распознавания собственных имен и названий, а также по распознаванию технических терминов ещё до начала любого индивидуального обучения. Кроме того, он продемонстрировал отличные результаты в таких областях, как обработка языковых особенностей, чисел, дат и валют, а также пунктуации и сегментации.

Распознавание объектов

Одним из элементов, который мы тестировали, было распознавание сущностей. Распознавание сущностей определяется как способность инструмента точно воспроизводить известные имена и термины. В аудиозаписи присутствовало несколько названий брендов, в том числе tl;dv.

tl;dv распознать и правильно транскрибировать tl;dv его истинную форму с точкой с запятой. Ни один из других инструментов не смог этого сделать, хотя многие из них транскрибировали его как TLDV, что в данном случае является почти точным результатом. Некоторые из других инструментов вообще не смогли правильно воспроизвести его, в том числе CLOVA , который выдал такие варианты, как pldv, gldv и просто dv.

Мы обнаружили, что аналогичная ситуация наблюдается и в случае с другими названиями брендов и именами людей: многие инструменты в своих результатах выдают разные варианты собственных имен. Инструмент, который правильно воспроизводит общепринятое название, как правило, сохраняет точность и в отношении других сущностей, присутствующих в записи встречи, таких как географические названия, имена людей и названия компаний.
tl;dv наивысший балл из всех шести инструментов. Такая же согласованность прослеживалась и в отношении других сущностей в стенограммах: tl;dv сохранял имена людей при упоминании их в речи.

Оценки CER

Нам удалось провести четвёртый тест с использованием проверенной стенограммы из стороннего источника для расчётапоказателя ошибок на символ (CER) — одного из основных показателей оценки качества распознавания речи (ASR). В ходе тестирования CER tl;dv отличный результат — 0,8%, а Notta — почти такой же. Для сравнения: у Rimo этот показатель составил 1,5%, Tactiq , Tactiq %, Clova ,8%, а Gemini , Gemini %. Gemini на основе более короткой записи, так как при работе с записью встречи произошла ошибка.

Маркировка динамиков

tl;dv единственным инструментом, позволяющим маркировать имена говорящих. В случае записей с участием нескольких говорящих это непосредственно влияет на удобство использования стенограммы. Именно это является основной причиной, по которой tl;dv более высокое место в рейтинге, чем Rimo, который продемонстрировал сопоставимую точность, но не предоставляет маркировки говорящих.

Наблюдения за конкурентами

Rimo показал наиболее точный результат, продемонстрировав высокую точность и хорошо сбалансированные, разборчивые сегменты. Его основным недостатком является отсутствие меток говорящих, а название продукта было воспроизведено как «TLDV».

Нотта также продемонстрировала хороший результат и разбила текст на четкие абзацы, хотя, по мнению нашей группы экспертов из числа носителей языка, абзацы получились несколько длинноватыми.

Clova четкие разрывы строк после каждого предложения, однако точность ее работы оказалась недостаточной для их правильного отображения, а непоследовательное воспроизведение названий различных продуктов свидетельствует о более общих проблемах с распознаванием.

Tactiq самые слабые Tactiq по основным показателям. Функция распознавания говорящего не сработала: один говорящий был отнесен к нескольким категориям, а точность в целом оставалась низкой. Система продемонстрировала самый низкий результат из шести.

Заметка о Google Gemini

Исходными материалами были заранее записанные вебинары, поэтому Gemini не Gemini запустить в режиме реального времени в рамках Google Meet , что является стандартным способом записи. Для прямой обработки файла M4A использовался платный аккаунт Google. Gemini только часть сессии, а не полную запись, и качество транскрибированного фрагмента ухудшалось везде, где не удавалось проанализировать аудио, что привело к слабому, трудночитаемому результату. Для сравнения этот же файл был передан в Notta, что показало: проблема заключалась не в исходном материале.

Google Meet расчета показателей CER было проведено тестирование в режиме реального времени с использованием четвёртого ресурса, которое осуществлялось в Google Meet . Система Google Gemini подключена к встрече в режиме реального времени, но была отключена на полпути, после чего её пришлось подключить заново. В результате стенограмма вновь оказалась неполной и содержала множество неточностей.

Gemini включена в сравнение для полноты картины с указанием данного ограничения. Её результаты также продемонстрировали некоторую способность распознавать различные языки: система смогла выявить английские указания на запись в аудиофайле.

Gemini
Google Gemini

Качество встреч в реальных условиях

Помимо качества транскрипции, очень важную роль играет формат вывода транскрипта и других сопутствующих элементов, таких как резюме. В ходе тестирования мы оценивали, как формируются эти элементы, а также их качество при повседневном использовании.

Метрическая система Как начисляются очки tl;dv Римо Tactiq ClovaNote Notta Google Gemini
Качество диаризации Соответствие количества говорящих персонажей и распределения реплик по сравнению с известным составом актёров 10 из 10 4/10 2/10 6/10 6/10 6/10
Стабильность поведения Стабильность поведения при различных типах сеансов 10 из 10 10 из 10 6/10 9 из 10 10 из 10 2/10
Качество резюме Полезность резюме и то, сохранилось ли оно на языке оригинала, с учетом заимствованных слов 5 из 5 0/5 4/5 0/5 4/5 0/5
Частота галлюцинаций / частота вставки Выдуманный, повторяющийся или дублирующийся текст, отсутствующий в аудиозаписи. Неверно услышанные фразы и обрезанные фрагменты не учитываются. 10 из 10 10 из 10 9 из 10 9 из 10 10 из 10 9 из 10
Извлечение действий Качество задач и последующих действий, вынесенных из заседания 5 из 5 0/5 4/5 0/5 3/5 0/5
Автоматическое разделение на главы / разделы Разбивает ли резюме ход встречи на удобные разделы? 5 из 5 0/5 5 из 5 0/5 5 из 5 0/5
Промежуточный итог по качеству встреч в реальных условиях 45/45 24/45 30/45 24/45 38/45 17/45

Из шести инструментов tl;dv единственным, который набрал максимальное количество баллов во всех категориях, характеризующих качество реальных встреч, — его промежуточный итог составил 45 из 45. За ним следовали Notta с результатом 38, Tactiq 30, Rimo и CLOVA — по 24, а Google Gemini 17.

Во многом разница в результатах сводится к одному фактору: смог ли инструмент вообще сгенерировать пригодный для использования отчет о совещании на японском языке. В тех случаях, когда по тестируемому плану отчет не был сгенерирован, инструмент получал 0 баллов по показателям «качество отчета», «пункты для действий» и «разбиение на разделы». Это отражает то, что инструмент предоставляет «из коробки», а не качество отчета, который он мог бы сгенерировать при использовании другого плана.

Диаризация и атрибуция речи

tl;dv максимальную оценку за правильное определение говорящих и привязку реплик к конкретным участникам. CLOVA , Notta и Gemini в середине таблицы, а Tactiq худшие Tactiq , распределив одного говорящего между несколькими метками.

Резюме, задачи и разбиение на разделы

Именно в этом аспекте различия между системами проявляются наиболее явно. tl;dv, Tactiq и Notta сгенерировали японские резюме, качество которых было оценено: наивысший tl;dv . Системы Rimo, CLOVA и Gemini ни одного Gemini в рамках тестируемого сценария: функция CLOVA доступна только на корейском языке, функция Rimo была доступна только по подписке, а Gemini никаких результатов. Оценка отражает доступность, а не качество резюме.

Возможности и функции

Ассистент для проведения совещаний на базе искусственного интеллекта — это гораздо больше, чем просто средство для ведения протоколов: он обладает множеством функций и возможностей, которые повышают качество готовых стенограмм и оптимизируют сопутствующие процессы. Мы рассмотрели некоторые из наиболее значимых доступных функций и определили, поддерживает ли каждый инструмент эти возможности, скорректировав систему оценки с учетом преимуществ каждого из них и их влияния на пользовательский опыт.

Метрическая система Как начисляются очки tl;dv Римо Tactiq ClovaNote Notta Google Gemini
Настройка имен динамиков «из коробки» Автоматическое определение имен реальных участников в Meet, Zoom и Teams 5 из 5 0/5 1/5 0/5 0/5 0/5
Распознавание голоса Возможность обучения системе распознавания голоса на основе собственного голоса пользователя 5 из 5 0/5 0/5 0/5 5 из 5 0/5
Запись без ботов Запись через системный микрофон без подключения бота к звонку 5 из 5 5 из 5 5 из 5 5 из 5 5 из 5 0/5
Синхронизация CRM Встроенная синхронизация и автоматическая синхронизация 3/3 0/3 3/3 0/3 3/3 0/3
Пользовательские заметки / шаблоны Настраиваемые форматы сводных отчетов против фиксированного формата вывода 3/3 3/3 3/3 0/3 3/3 0/3
Обучение с использованием пользовательского словаря / сущностей Обучать отраслевым терминам и аббревиатурам 5 из 5 5 из 5 0/5 5 из 5 5 из 5 0/5
Локализация пользовательского интерфейса на японский язык Доступен ли сам интерфейс продукта на японском языке 5 из 5 5 из 5 5 из 5 5 из 5 5 из 5 5 из 5
Широта интеграций Slack, календарь, Zapier, API 3/3 0/3 3/3 0/3 3/3 0/3
Скорость обработки Время от окончания встречи до готовой стенограммы 3/3 2/3 1/3 0/3 3/3 0/3
Отслеживание слов-заполнителей Отслеживание заполняющих слов — отслеживает «ум», «э-э», «эсте» без удвоения звуков при заикании. Обеспечивает полную наглядность стенограмм речи, а не чрезмерное сглаживание 3/3 0/3 0/3 0/3 0/3 0/3
Точность временных меток Проверьте выборочно, чтобы временные метки соответствовали нужному моменту 3/3 3/3 2/3 2/3 3/3 0/3
Наличие перевода Может ли он переводить протоколы встреч и на сколько языков? 3/3 3/3 3/3 0/3 3/3 0/3
Поиск в стенограмме Поиск по материалам встречи и по библиотеке 3/3 3/3 0/3 3/3 3/3 0/3
Пользовательский интерфейс для редактирования стенограмм Можно ли легко исправить стенограмму уже после записи? 3/3 3/3 3/3 3/3 3/3 3/3
Форматы экспорта SRT, VTT, TXT, DOCX и т. п. 0/3 3/3 3/3 3/3 3/3 0/3
Транскрипт в режиме реального времени Отображается ли стенограмма в режиме реального времени во время заседания? 0/3 3/3 3/3 0/3 3/3 3/3
Освещение мероприятий на платформе Обзор сервисов Zoom, Meet, Teams и Webex 3/3 3/3 3/3 0/3 3/3 0/3
Захват мобильного приложения Можно ли с помощью мобильного приложения вести запись очных встреч? 3/3 3/3 0/3 3/3 3/3 0/3
Встроенный сервер MCP Собственный сервер, позволяющий ИИ-помощникам запрашивать данные из библиотеки встреч 5 из 5 0/5 5 из 5 0/5 0/5 0/5
Редактирование меток динамиков Можно ли впоследствии переименовать и переназначить динамики? 3/3 3/3 3/3 3/3 3/3 0/3
Итого по возможностям и функциям 66/72 47/72 46/72 32/72 59/72 11/72

Существует множество функций, которые отличают специализированный инструмент для проведения встреч от простого средства стенографирования, и tl;dv первое место в этой области по всем этим показателям. Особенно выделяются две из них

Встроенный сервер MCP

tl;dv одним из двух инструментов, оснащённых встроенным сервером MCP, что позволяет ИИ-помощникам напрямую запрашивать данные из библиотеки встреч. Большинство других решений в этой области набрали здесь ноль баллов. Именно эта функция позволяет интегрировать записи встреч с более широким набором ИИ-инструментов, которые команда уже использует, вместо того, чтобы оставлять стенограммы в закрытой системе.

Голосовая идентификация

tl;dv также tl;dv одним из двух инструментов, предлагающих функцию распознавания голоса, наряду с Notta. Он обучается на вашем собственном голосе, благодаря чему повышается надежность вашей идентификации во время встреч — это преимущество, которое становится все более заметным по мере использования.

Доверие, безопасность и ценность

При выборе инструмента для записи встреч на японском языке следует учитывать такие важные аспекты, как доверие, безопасность и соотношение цены и качества. Многие из этих критериев можно обеспечить с помощью качественного сервиса транскрипции, обладающего отличными функциями и удобными форматами вывода, однако большую роль играет подход компании к обработке конфиденциальных данных. Мы провели исследование каждого инструмента, чтобы подробнее узнать о его статусе и позиции по таким вопросам, как безопасность, соблюдение нормативных требований и место хранения данных.

Метрическая система Как начисляются очки tl;dv Римо Tactiq ClovaNote Notta Google Gemini
Место хранения данных / региональный хостинг Варианты регионального хостинга, например, хостинг в Японии по запросу 3/3 3/3 0/3 0/3 0/3 3/3
Безопасность и соответствие нормативным требованиям SOC2, ISO 27001, GDPR 3/3 3/3 3/3 0/3 3/3 3/3
Обучение ИИ на основе аудиозаписей пользователей Позволяет ли это избежать обучения ИИ на ваших аудиозаписях (вариант «без обучения» оценивается на «отлично»)? 3/3 3/3 3/3 0/3 0/3 3/3
Контроль за сохранением данных Контроль за сроками хранения записей и стенограмм 3/3 0/3 0/3 0/3 3/3 3/3
Прозрачность цен Цены по тарифным планам публикуются, а не предоставляются только по запросу 3/3 3/3 3/3 3/3 3/3 3/3
Бесплатный тариф / ограничения Наличие бесплатного тарифа (сама по себе бесплатная пробная версия оценивается в 0 баллов) 3/3 0/3 3/3 3/3 3/3 0/3
Доверие, безопасность и ценность — промежуточная сумма 18/18 18 декабря 18 декабря 18 июня 18 декабря 15/18

Данный критерий выходит за рамки простой транскрипции и учитывает то, как каждый инструмент обрабатывает ваши данные — аспект, который имеет особое значение для японских организаций.

Хранение данных в Японии по запросу

В Японии нет законодательного требования о хранении данных о встречах на территории страны. Однако предусмотрено требование об осторожном обращении с любыми персональными данными, передаваемыми за границу: согласно Закону о защите персональных данных (APPI), передача данных третьей стороне в другой стране, как правило, требует предварительного согласия физического лица, тогда как хранение этих данных у провайдера в Японии снимает эту обязанность. Для многих японских предприятий хранение данных на территории страны также является простым вопросом доверия и внутренней политики.

tl;dv хранение данных в Японии по запросу, поэтому организации, которым это необходимо, могут размещать данные своих совещаний на серверах в Японии, а не по умолчанию обрабатывать их за рубежом.

Ваши данные остаются вашими

tl;dv получил максимальные оценки по уровню безопасности, механизмам контроля хранения данных, а также за то, что модели ИИ не обучаются на аудиозаписях клиентов. В целом этот уровень отражает, что данный инструмент разработан с учетом стандартов, которых ожидает японская компания до того, как записи встреч покинут помещение.

Тест на точность восприятия японской речи: методология

Наше сравнение основано на контролируемом тесте с сопоставимыми условиями, призванном обеспечить одинаковые условия для каждого инструмента.

Набор тестов

Основой для сравнения послужили три заранее записанных вебинара продолжительностью около одного часа каждый. Исходные файлы были загружены и обработаны с помощью функции загрузки каждого инструмента. Большинство инструментов принимали файлы в формате MP4 напрямую; два из них требовали преобразования в формат M4A перед загрузкой. Все три вебинара были обработаны всеми шестью инструментами в одном из двух форматов, при этом CLOVA Gemini с файлами в формате M4A.

Обзор

Результаты оценивались нашей группой экспертов — носителями языка: Миоко, Одзи и Хироми, которые работали анонимно и выставляли оценки положительным аспектам и преимуществам каждого результата. Эти оценки были суммированы для формирования итоговых рейтингов. Данные о функциях и характеристиках были взяты из общедоступной документации.

Набор инструментов

Отбор проводился с учетом популярности и широкого распространения на японском рынке. Gemini настольная версия, подходящая для просмотра предварительно записанных вебинаров; она была включена в список благодаря своей доступности и тому, что в ее основе лежит движок Google. Tactiq включен в список на основании информации о его работе на японском рынке. CLOVA к CLOVA — корейской версии CLOVA .

Разбивка двигателя и плана

Принцип работы каждого инструмента заключается в том, что он использует движок, который обрабатывает запись и преобразует её в стенограмму. У каждого инструмента есть своя версия: хотя многие инструменты используют движок одной и той же компании, их настройки различаются. Кроме того, многие инструменты предлагают различные движки в зависимости от тарифного плана, на который вы подписались. Для сравнения: все японские встречи в tl;dv на одном и том же движке, независимо от того, является ли аккаунт платным или бесплатным, что обеспечивает единообразие результатов независимо от ваших вложений.

Инструмент Базовый двигатель / производитель Собственная разработка или лицензионная Тип двигателя План
Римо Собственная японская модель глубокого обучения для распознавания речи. API OpenAI используется исключительно для редактора и уровня генерации резюме. Внутренний (распознавание), лицензионный (редактор) Выделенный ASR Бесплатная пробная версия
tl;dv ElevenLabs Лицензированный Выделенный ASR Бизнес
Notta Неназванный японский сторонний партнер Лицензированный Выделенный ASR Оплачено, один месяц
Tactiq Субтитры платформы для проведения встреч в режиме реального времени. В ходе этого теста использовалась функция загрузки файлов, поэтому Tactiq собственную транскрипцию процесса загрузки, которая не описана в открытых документах. Смешанный, частично нераскрытый Подписи к трансляциям (в режиме реального времени) или загрузка ASR Бесплатно
CLOVA NAVER CLOVA Внутренний (NAVER) Выделенный ASR Бесплатно ( CLOVA для корейского рынка)
Google Gemini Google Gemini Внутренний (Google) LLM Автономное Gemini (аккаунт «Business Starter»)

Область применения и ограничения

  • CLOVA не была протестирована, так как доступ к ней был заблокирован из-за проблем с телефонной верификацией.
  • При конвертации в формат M4A могут возникнуть незначительные различия по сравнению с файлом, загруженным в исходном формате.
  • Данные об объектах, находящихся в общественном достоянии, отражают информацию, опубликованную на момент тестирования, и могут изменяться.

Каждый инструмент тестировался на одинаковых исходных файлах, проверялся одной и той же экспертной группой и оценивался по единым критериям, что позволило обеспечить максимально объективное сравнение.

Какая программа для транскрибирования встреч лучше всего подходит для Японии?

Во всех наших тестах по всем четырём направлениям tl;dv первое tl;dv . Он способен идентифицировать говорящих по имени, правильно воспроизводить все имена собственные и является одним из немногих инструментов, предлагающих функцию распознавания голоса, встроенный сервер MCP с ChatGPT и Claude, а также хранение данных в Японии по запросу. Каждая из этих особенностей делает его сильным претендентом на звание лучшего инструмента для транскрипции японских встреч.

Остальные инструменты обладают реальными преимуществами: Notta предлагает отличные функции, хотя и предоставляет транскрипцию несколько более низкого качества. Аналогично, Rimo показал хорошие результаты по транскрипции, но имел меньше практических возможностей и не поддерживал функцию создания резюме, из-за чего во многих категориях он получил 0 баллов. CLOVA предлагала создание резюме на корейском языке, поэтому мы не смогли протестировать эту функцию.

Tactiq транскрипт, который на первый взгляд выглядел достоверно, но оказался практически нечитаемым для нашей группы экспертов, для которых японский является родным языком, и содержал ряд явных ошибок. Gemini аудиозапись полностью, в результате чего все преимущества данной транскрипции фактически свелись к нулю, поскольку она оказалась непригодной для использования в качестве полноценного результата.

Что касается именно японских совещаний, где по важным вопросам взаимодействуют множество участников и звучат разные мнения, tl;dv себя во всех трёх наших испытаниях.

Если ваша команда проводит совещания на японском языке и нуждается в надежном и качественном устройстве для записи совещаний, оснащенном дополнительными функциями, которые позволяют превратить простую стенограмму в инструмент, способствующий повышению эффективности и продвижению вашей работы, то tl;dv лучший выбор.

Попробуйте tl;dv и убедитесь, как он справляется с записью ваших встреч на японском языке в Google Meet, Zoom, а также с помощью нашего настольного приложения — без использования ботов — на любой другой платформе для проведения встреч. 

Часто задаваемые вопросы о точности транскрипции японского языка

Встреча по искусственному интеллекту на японском языке стенограмма достаточно точна для большинство деловых встреч, а наиболее мощные инструменты генерируют текст, который носитель языка читатель может принять с минимальными исправлениями. В ходе нашего тестирования tl;dv лидирующие позиции по точности перевода с японского. Наиболее распространённые ошибками в других языках являются неправильное использование кандзи для омофонов, имена, написанные катакане, а также пропущенные или объединенные имен говорящих.

Большинство инструментов для транскрипции изначально разрабатывались с учетом особенностей английского языка, поэтому они опираются на такие ориентиры, как пробелы между словами, которых в японском языке нет. Японский язык сам по себе не сложнее, он просто устроен иначе: в нём встречаются омофоны, записываемые разными кандзи, а один звук может обозначаться тремя различными системами письма. Лучшие инструменты — это те, которые разработаны с учётом этих особенностей, а не исходят из английского языка.

Правильный выбор зависит от характера встречи, но tl;dv первое место во всех тестируемых нами категориях. При проведении встреч с участием нескольких человек tl;dv единственным инструментом, который позволял пометить говорящих по именам, благодаря чему стенограмма готова к использованию без необходимости последующей ручной доработки.

Большинство инструментов правильно распознают «кэйго», но затем упрощают или «исправляют» эту форму вежливости, изменяя регистр сказанного. В транскрипции текст по-прежнему читается как беглый японский, поэтому это изменение легко упустить из виду. В ходе нашего «слепого» тестирования с участием носителей языка tl;dv эти тонкости языка более надежно, чем остальные инструменты.

Безопасность транскрипции на японском языке с помощью ИИ зависит не столько от бренда, сколько от того, где хранится аудиозапись и используется ли она для обучения в рамках вашего тарифного плана. Согласно японскому закону APPI, отправка аудиозаписей совещаний за границу считается трансграничной передачей данных, поэтому в случае конфиденциальных совещаний следует проверить место хранения данных и не хранить аудиозаписи в бесплатных тарифных планах, где они могут использоваться для обучения.