Сообщения

Сообщения за ноября 9, 2020

Распознавание диктора

Изображение
Распознавание голоса или говорящего - это способность машины или программы принимать и интерпретировать диктовку или понимать и выполнять голосовые команды. Распознавание голоса приобрело известность и стало использоваться с появлением искусственного интеллекта и интеллектуальных помощников, таких как Amazon Alexa, Apple Siri и Microsoft Cortana .   Системы распознавания голоса позволяют потребителям взаимодействовать с технологией, просто разговаривая с ней, позволяя выполнять запросы, напоминания и другие простые задачи без помощи рук.   Как работает распознавание голоса  Программное обеспечение для распознавания голоса на компьютерах требует преобразования аналогового звука в цифровые сигналы, известного как аналого-цифровое преобразование . Чтобы компьютер мог расшифровать сигнал, он должен иметь цифровую базу данных или словарь слов или слогов, а также быстрое средство для сравнения этих данных с сигналами. Образцы речи хранятся на жестком диске и загружаются в память при за

Распознавание речи

Изображение
Распознавание речи или преобразование речи в текст - это способность машины или программы распознавать произносимые вслух слова и преобразовывать их в читаемый текст. Простое программное обеспечение для распознавания речи имеет ограниченный словарный запас слов и фраз, и оно может идентифицировать их, только если они произносятся очень четко. Более сложное программное обеспечение способно воспринимать естественную речь, различные акценты и языки.  Распознавание речи включает в себя различные области исследований в области компьютерных наук, лингвистики и компьютерной инженерии. Многие современные устройства или программы, ориентированные на текст, могут иметь функции распознавания речи, чтобы упростить использование устройства или использовать его без помощи рук.  Важно отметить , термины распознавания речи и распознавания голоса иногда используются как синонимы. Однако эти два термина означают разные вещи . Распознавание речи используется для идентификации слов в разговорной речи. Р

Соленоид на переменном токе

Изображение
По колебаниям диафрагмы низкочастотного динамика можно наблюдать что амплитуда зависит от частоты. Само по себе сам этот очевидный факт не интересен и использовать его для изучения звука сложно.  Соберем устройство:  В середине соленоида находится цилиндрической свободно двигающийся на смазке из магнитной жидкости неодимовый магнит. Концы трубки на которую намотана катушка запаяны чтобы магнит не вылетел. При подаче на катушку переменного тока магнит будет колебаться в такт частоте около средней точки как поршень в цилиндре создавая сжатие и разрежение по концам трубки Амплитуда колебаний будет в зависимости от частоты и мощности сигнала. При гармонической частоте размах будет одинаковый в обе стороны при не периодических сигналах будет происходить усреднение в зависимости от инерционности системы. На предлагаемом устройстве можно наблюдать переход энергии электрических колебаний в кинетическую энергию и потенциальную энергию. Из физики средней школы мы знаем в замкнутой системе сумм

Алгоритм

  Сто первая попытка объяснить идею заложенную в алгоритм: Главное в анализе речевых данных – это выделить признаки, которые можно считать основными для идентификации лингвистического содержания. Все шумы и признаки которые отвечают за окраску можно отбросить. Принято использовать частотные или временные признаки отдельно или совместно. Считаю возможным использовать безразмерную величину как скважность, один из классификационных признаков импульсных систем, определяющий отношение периода следования (повторения) импульсов к длительности импульса. Речевой сигнал на выходе компаратора получится прямоугольным, с импульсами с различной длительности и периодов. Смысловое содержание при прослушивании сохраняется. Чем выше частота тем ближе звук к оригиналу. В  теории  ни бум-бум НО проверял на практике. Речь диктора можно прокрутить быстрее или тише значит изменятся и частотные и временные характеристики. Не изменится лишь скважность. Остается найти алгоритмы нахождения участков со скважность