Манипуляторы

2.5.6. Средства речевого ввода

Средства речевого ввода (устройства речевого ввода и необходимые программные  средства) открывают широкие возможности и повышают удобство общения с ПЭВМ для руководителей высокого ранга. В будущем, видимо, эти средства вытеснят клавиатуры в силу гораздо большей их скорости и удобства ввода информации в ПЭВМ. Пока же возможности средств речевого ввода весьма узки и они используются, в основном, для ввода ограниченного набора команд.

Средства речевого ввода оцениваются и (частично) классифицируются по следующим параметрам:

1)      возможности распознавать слитную речь;

2)      степени зависимости от диктора;

3)      быстродействию;

4)      объёму словаря;

5)      вероятности ошибок интерпретации слов;

6)      стоимости.

По первому параметру средства речевого ввода делятся на две основные группы: средства, обеспечивающие распознание непрерывной, слитной речи, и средства для распознания изолированных слов (команд), раздельных искусственными паузами. Решение первой задачи существенно сложнее, так как необходимо не только идентифицировать последовательность звуков, но и подвергать предложение анализу (в том числе и смысловому) для разделения его на слова.

По второму параметру средства речевого ввода подразделяются на зависимые и не зависимые от диктора. Зависимость от диктора практически интереса не представляет. Не зависимые от диктора средства, в свою очередь, делятся на средства без подстройки под диктора  и средства с подстройкой. Первые характеризуются низкой точностью распознания речи, ресурсоемки и не обеспечивают большой словарный запас. Вторые же являются наиболее перспективными. Они осуществляют «привыкание» к тому или иному пользователю путём неоднократного повторения эталонных слов и запоминания его особенностей. Приступая к использованию настроенной таким образом системы, пользователь вводит в неё свои идентификатор или фамилию, при помощи чего осуществляется автоматическая адаптация к нему .

В настоящее время различными выпускается широкая номенклатура средств речевого ввода.

Так, например, американская фирма  Logical Business Machines предлагает систему Voicecraft для семейства PC IBM. Она способна распознавать до 32000 слов, которые размещаются в наборе словарей ёмкостью 500 слов каждый. Словари хранятся в запоминающем устройстве, и любой из них включается в работу по мере необходимости. На распознавание слова затрачивается 200 мс. Для семейства PS/2 IBM фирмой Dragon Dictate предлагается система Dragon Dictate-MCA, которая может распознавать одновременно до 30000 слов при словаре 80000 слов, причем на идентификацию слова требуется не более 2 с. Стоит такая система 9000 дол.

Устройство речевого ввода для отечественной учебной ПЭВМ «Агат» представляет собой одноплатный модуль размером 250х125мм, вставляемый в гнездо расширения ПЭВМ. Оно позволяет распознавать отдельные слова или короткие словосочетания и является адаптируемым к диктору. Максимальная длительность речевого сигнала, воспринимаемого устройством, составляет 1,5 с. Минимальная длительность паузы между отдельными словами – 0,21с. Объём словаря – 64 слова, время же распознания слова не превышает 1 с. Точность распознания лежит в пределах 85-100%.