Анализатор автоответов (версия от 07.03.2024)
Обновление CPD и шаблонов. Изменения:
1. если номер телефона содержит некорректные символы, они будут вырезаны и не помешают сохранить вавку
2. если имя голосового шаблона начинается на 8 или 9, пороговое значение коэффициента корреляции будет взято из первых двух символов - это позволяет добавлять очень короткие шаблоны типа олеговских "алло" без ложных срабатываний
3. изменен алгоритм наложения потока на шаблоны
4. добавлены новые шаблоны
Ключевой принцип подготовки шаблонов:
1. Берем 5-10 секундный файл, в котором явно есть автоответчик/секретарь.
2. Выделяем ключевое слово (например, "алло" или "секретарь ева слушаю вас").
3. Оставляем по 100-200 мсек тишины с каждой стороны если ролик очень короткий (до 0.7 сек), и не оставляем если не очень (0.7 сек и более).
4. Сохраняем как шаблон, не испортив случайно исходный формат.
5. Короткие фразы именуем начиная с 95-98. В процессе тестов коэффициент корреляции логируется - можно подобрать оптимальный. Если не понимаете, о чем идет речь - задайте уточняющие вопросы.
6. Примеры обрезки и именования можно посмотреть в моих шаблонах.
7. Натравливаем анализатор в режиме processFolder с новыми шаблонами на папку с исходными файлами и убеждаемся, что Human стало меньше, а IVR стало больше, чем на этой же папке до пополнения шаблонов. (В командной строке вызываем exe'шник анализатора, через пробел ProcessFolder и путь к папке с полными записями звонков, с которых нарезались шаблоны, и после папки указана длительность (указывайте 7000)