Скажите, а вообще зачем этот голосовой набор?Как вариант - для транскрибации. Находите ролик по интересующей теме, смотрите его и одновременно диктуете текст на микрофон.
За 20-30 минут можно получить почти готовую статью, только подправить.
Я, правда, так не пробовал ).