Как я узнал из замечательной книги «Кто сказал, что слоны не умеют танцевать ?» Лу Герстнера, в конце 90-х годов источником заметной части доходов IBM стала продажа технологий. И я, и я тоже в этом участвовал. В смысле подъема IBM путем закупки технологий. В меньшей степени, чем коллеги, но все-таки …
Когда российская часть компании Typhoon двинулась на север, наш американский владелец и руководитель попал в исследовательский центр IBM. Как он рассказывал, сотрудники там ходили в черном, стены были из матового стекла, и, поэтому, технологии были замечательные. Беспроигрышным вариантом представлялось встраивание технологии распознавания речи от IBM в Microsoft Word. И в самом деле, пусть Word’ом пользуются 100 млн. человек. При проникновении 0.1% у нас было бы 100 тыс. покупателей. Пусть каждый заплатил бы по 14.95 – на круг выходили бешеные деньги.
Лучшие в мире русские программисты напряглись и сделали Это. Я даже отсканировал диск, перед тем как его выбросить. Увы, успешной реализации типичной американской бизнес-модели помешали два факта. Во-первых, нужно было заплатить за само право использовать технологию IBM, не говоря о royalty за каждую проданную копию. Во-вторых, Microsoft отдавал свою технологию распознавания речи всем желающим, бесплатно и, по-существу, royalty-free. Как у нас пошел бизнес, основанный на передовых технологиях, думаю, все могут догадаться сами.
Впрочем, для IBM ничего не жалко. Я слышал, у них где-то есть лаборатория, которая занимается задачами телепортации. На такое можно сделать взнос даже из собственных средств. Однако, я ничего не внес, а пытался разрушить американскую мечту предложением делать НИОКР в области "Умного дома". Не знаю, существовало ли в 1998 году такое понятие или еще нет. Конечно, ничего такого мне делать не позволили ("Русские — отличные инженеры, но ничего не понимают в бизнесе"), но доклад, оригинальный до безграмотности, остался.
Самсонов М.С. Схема голосового управления бытовой техникой.
«Виртуальный мир». Приложение к Вестнику Академии Технического творчества. 1997. Стр. 62-63.
В данном сообщении рассматривается схема интеграции ПЭВМ, бытовой техники и устройств ввода — вывода звука в единую систему, управляемую голосом. Подобные системы давно описаны в научной фантастике. Не пытаясь оценивать полезность или экономическую выгоду модели, автор считает, что современный уровень технологии позволяет осуществить подобную идею на практике.
Предлагаемая схема управления состоит из пяти основных компонент:
- Голосовой интерфейс с пользователем. Телефон-модем-TAPI или Микрофон-звуковая карта-WAVE драйвер. Эта технология хорошо известна и ПО включается в стандартные поставки операционных систем персональных ЭВМ.
- Программное обеспечение распознавания и генерации речи. Последние разработки в этой области (IBM Voice Type Dictation или аналогичное ПО фирмы Microsoft) позволяют добиться правильного распознования команд пользователя с вероятностью 95% и выше.
- Модуль обработки команд. Это может быть интерпретатор простейшего набора команд или естественного языка. Соответсвующие стандарты уже существуют для устройств multimedia. «Digital Video Command Set for the Media Control Interface» (Microsoft Part No. 098-37538).
- Интерфейс с управляемой техникой. ПО кодирования и декодирования — плата расширения — электрическая сеть. Аппаратура подобного рода используется для локальных сетей ЭВМ. Использование электрической сети позволяет управлять удаленными устройствами (за пределами действия инфракрасного дистанционного управления).
- Управляющие модули бытовой техники. Плата кодирования/декодирования — микропроцессор.
Автор благодарит сотрудников АО «Санта-Барбара» за плодотворное обсуждение.
На всякий случай
IBM, Microsoft, Word и другие узнаваемые выражения являются (зарегистрированными) торговыми марками соответствующих компаний. Мнение автора является его личным мнением и не совпадает с мнением какой-либо организации. Автор пользуется лицензионным программным обеспечением.