Сөзді түсіну
Сөзді түсіну, әдетте, қалай түсіндіреді түрлендіру акустикалық ұсыну сөйлеу мағыналық. Құру кезінде практикалық жүйелерінің мағынасын анықтауға болады, ұсыну, извлекаются жасалған іс-әрекеттер жүйесі. Түсіну сөйлеу ажырата білген жөн жылғы распознования сөйлеу мақсаты болып табылады салыстыруға сөйлеу пікір тиісті сөздермен сөздікте. Басталғанға дейін 70-ші зерттеулердің көпшілігі жіберілді распознование сөйлеу. 5 жыл уақыт кеткен жүйесін құруға ARPA, бастапқы зерттеу мақсаты саяды анықтау сөйлеу, ал соңғы нәтижелерін түсіну. Көрінген қабілеті жүйесінің беруге ақылға қонымды бар сөз болатын аса маңызды критерийі дамыту үшін сөйлеу жүйелер. Оның үстіне, жақсылыққа сөйлеу сигнал жеткіліксіз болып табылады ақпарат көзі болып табылады, және білу контекст сөйлеу сөздері тек «сәтті», » распонавания және түсіндіру. Жүйесі бойынша распознованию сөйлеу негізделген динамикалық бағдарламалау және сәйкес үлгілері, дамытқан үшін сөйлеу сөз сөйлеу тұрған дерлік толығымен оқшауланған деген сөздерден таңдалатын шағын вокабуляра. Алайда, мұндай тәсіл ищется неғұрлым дәл сәйкестік арасындағы белгілі бір произнесенными деген сөздермен және вокабуляром акустическох үлгілерін, сөздердің бәрінен аз подходил к байланыстырып сөйлеуге, өйткені кіріс акустикалық сигнал бұл жағдайда болуы мүмкін емес тиімді смоделирован, қарапайым үйлесімі произнесенных бөліктерін лексикалық бірлік. Осыған байланысты сөйлеу өзгергіштік, выявляемая сәйкес болған жағдайда, үлгілері бар, деп хабарлайды пайдалы ақпарат үшін распознования, және түсіндіру үшін. Алайда, бастау керек негізгі лингвистикалық бірлік сияқты фонемы және сақтау туралы ақпаратты ырғағында және ұзақтығын сөйлеу сөздері. Егер кейіннен осындай жолмен, онда көзқарас өңдеу сөйлеу негізделген тезірек на білу, соответствиях үлгілері бар, ол болмай қалмайтын, өйткені, мәтіннен артықшылықтар танудың нақты лингвистикалық бірлік сигналы білу қажет, бұл бірлік байланысты қалған бөлігі тілі.
Жүйесін түсіну сөйлеу (СӨА) бар іс байланысқан бірліктері сөйлеу сияқты, сөз тіркестерін, сөйлемдер, тіпті параграфтар, өйткені «түсіну» оқшауланған сөз білдіруі мүмкін тек тривиальный процесс салыстыру біраз маңызы бар әрбір сөзіне сөздік. Түсіну байланысты сөйлеу — өте күрделі міндет, және жоба СПР әсер етті зерттеу сияқты әр түрлі салаларда, акустикалық өңдеу сигнал, нейро-физиология, психолингвистика, психология. СПР құрылды, түсіну бірнеше дикторов бір диалект қосылып, грамматически шектеулі подмножество тілі сөздікпен мыңға жуық сөз. Қазір бірақ бар көптеген әлеуетті қолданбалы бағдарламалар үшін СПР олардың тиімділігі мен сенімділігі әлі де жеткіліксіз үшін кеңінен пайдаланылады. Жүйесі, тәуелді диктор, распознающие оқшауланған сөздер аз словарем, пайдаланатын үлгілер ретінде-кедейлік тұтас сөздер қазірдің өзінде өз қолданысын тапты типті, жүкті өңдеу, әуе желілерінде. Дегенмен жеңімпаз болып танылды, жетілдіру мұндай типті жүйелерді (үлкен сөздіктер, тәуелсіздігін диктор) талап негізделген көзқарасты терең білімге.
Теориялық алғышарттары
Делдал қайта құру кезінде сөйлеу өзінің мәні ретінде қызмет етуге тиіс белгілі бір компоненттері пайдаланатын әр түрлі білім көздері (), т. б. сөйлеу сигнал кодирует көптеген әр түрлі қажетті ақпаратты қалпына келтіру үшін маңызы бар. Мысалы, вариативтілік в произношении сөздерді байланыстырып сөйлеуге артық емес болып табылады кедергі іріктеу кезінде үлгінің сәйкестігін, бірақ бұл өте маңызды ақпарат көзі, мысалы, қатысты орналасу шекараларын сөздер немесе контекстуально маңызды (бөлінген структуралық тіл білімдері) ақпарат кейбір. Жалғыз ықтимал ұйым СПР және негізгі БІРІ болып табылады келесі: СӨЗ — ОБРАБОРТКА АКУСТИКАЛЫҚ СИГНАЛ — ФОНЕТИКАЛЫҚ ТАЛДАУ — ФОНОЛОГИЧЕСКИЙ ТАЛДАУ — МОРФОЛОГИЯЛЫҚ ТАЛДАУ — ЛЕКСИКАЛЫҚ ҚОЛЖЕТІМДІЛІК СӨЗДІК — СИНТАКСИСТІК ТАЛДАУ — СЕМАНТИКАЛЫҚ ТАЛДАУ — МӘНІ. Осындай ұйымдастыру кезінде СПР ақпарат ағады жоғары болуына қарай әрбір элемент жасайды аралық ұсыну, кодируя (ішінара) гипотезалар қатысты енгізу негізінде оған қол жетімді білу.
Акустикалық өңдеу отцифровывает сигналы кіріс жиілігі, ол сақтайды сигнал түсіну үшін. Акустикалық өңдеу, сондай-ақ айналдырады отцифрованный сигнал әртүрлі тәсілдермен ұсыну үшін оның сол нысан, ол келеді фонетическому декодированию. Мысалы, спектрлік талдау болады орындалған әр проанализированного жақтаудың және қосымша параметрлері сияқты жиілігі негізгі үн, есептелуі. Параметрлік сигнал алады, содан кейін мүмкін ретінде белгіленген дискретті дәйектілігі фонем. Мысалы, егер сигнал төмен амплитудасы бар біркелкі таралады көлденең спектрін, онда бұл дыбыс бәлкім фрикативный типті [f], [v]. Сонымен қатар, әрбір фонемы тән осындай ерекшеліктері, тонының биіктігі, ұзақтығы мен амплитудасы. Акустическо — фонетическое түрлендіру болып табылады тиімді жұмыс СПР, бірақ әлі күнге дейін ең бір әлсіз жақтарын сөйлеу өңдеу. Және ол зерттеудің негізгі кемшілігі СПР негізінде әзірленген ARPA 1970-ші.
Фонологический талдау орындалады фонетическом ұсыну, ол анықтайды лингвистически маңызды айырмашылықтар бар фонетическом ұсыну произнесения, мысалы, деңгейлері мен орналасуы ударения, интонационный контуры, құрылымы буынды тізбек, фонем негізінде жатқан произнесения. Фонологический талдау үшін қажет лексикалық қол жеткізу, т. е. процесс, ол салыстырады фонетическую нысанын произнесения с каноническими фонемными ұсыныстары бар сөздіктен сөздерді қалпына келтіру үшін ақпаратты хранящуюся онда қатысты, олардың морфологиялық, синтаксистік және семантикалық қасиеттерін. Бұл жояды мұндай әсерлер тез сөйлеу, ассимиляция немесе қысқарту. Мысалы, «деген сөздер «did» мен «you» мүмкін сөздікте мынадай ретпен фонем: /dld/ /ju:/. Алайда, акустическо — фонетическое түрлендіру еді қалпына келтіру нақты дыбыстарды немесе фонемы типті [dIje]; байланыстыруға бұл фонетическую жүйелілігі c каноническими фонемными көріністері «did» мен «you». Бұл қажет, егер керек болса, қандай палатализация болды шекарадағы сөздер полента [dj] [j], және бұл неударный дауысты «you» редуцирован дейін бейтарап безударного. Осыған ұқсас, фонологическое білуі қатысты шекті тізбектер фонем в слогах пайдаланылуы мүмкін үшін танымаса, буын, және демек, шекаралары сөздер. Мысалы, /houmhelp/ болуы тиіс арасындағы шекара /m/ екінші /h/, өйткені ешқандай буын ағылшын емес болуы мүмкін /mh/.
Қалай ғана фонологический талдау аяқталды, одан әрі өңдеу пайдалануға болады подобна түсінуге, мәтіннің. Одан әрі морфологиялық, синтаксистік, семантикалық және прагматикалық талдау ықпал етеді айырып, эксплуатируя асыра сөйлеу, ақпараттық — теориялық мағынада. Кейбір жобаларды APRA міндет синтаксического анализа саяды, оның ішінде тастау үшін, гипотезаны сөздер негізінде синтаксически жол берілмейтін тізбектер.
Бұрын, сөздер, бөлінген сөйлеудегі сигналы болады сарапталып отырып, лексикалық входам сөздікте жүйесін жүргізу қажет морфологиялық талдау, ол әкелетін сөздер, олардың негізгі нысан, мысалы, жояды аяқталуы көпше /s/ немесе /z/, олар қатты еді кеңейтті қатарына кіру » сөздік.
Кейін морфологиялық талдау туындаған морфофонологическое ұсыну сөйлеу енгізу табылуы мүмкін сөздікте жүйесін алу үшін синтаксическую және семантикалық ақпаратты қатысты гипотезаны реттілік принципі. Синтаксистік, семантикалық және прагматикалық талдау — негізінен сол үшін сөйлеу және мәтінді түсіну. Алайда, болуы тиіс арасындағы өзара іс-қимыл осы және одан төмен деңгейлері талдау ғана емес, өйткені олар толықтыратын дұрыс тану произнесения, бірақ сондай-ақ, өйткені кейбір аспектілері фонологического талдау, әсіресе қатысты ударения және интонациясы ықпал ететін болады түсіндіру. Екпін, мысалы, анықтау үшін қажет контекстуально жаңа ақпарат үшін іздеу тәуелді деген сөздерден үшін қазақстан тарихы.
Бұл курстың қысқаша сипаттамасы салым әр түрлі БІРІ түсіну сөйлеу ғана ашады негізгі процестері. БІРІ пайдаланылған түсіну, сөйлеу болып табылады, ең алдымен, лингвистикалық. Алайда, тиімділігі СПР байланысты көптеген ретінде тиімді пайдалану осы БІРІ, сондай-ақ әзірлеу, оларды ұстау.
Акустическо — фонетикалық Талдау
Әрине, маңызды облысы өңдеуге сөйлеу мұқтаж зерттеулерде — бұл акустическо — фонетикалық талдау. Егер акустическо — фонетикалық талдау жасау әлсіз болса, қате гипотезаны жауапкершілігінің нәтижесінде қате талдау. Саралау және сәйкестендіру акустикалық сигнал дәйектілігі лингвистикалық бірлік өте қиын. Алдымен, сөйлеу — бұл коды, шифры; яғни, акустикалық сигналдар, ассоциирующиеся отырып, сегменттерін, олармен тікелей емес связанны; бұл сигналдар қатты әсер етуде көршілес сегменттері. Мысалы, спектрограммы /d/ /di/ /du/ өте әр түрлі болып табылады, т. к. оларға әсер ететін келесі дауысты. Сонымен қатар, мүмкін емес бөлуге акустикалық сигнал /d/ және келесі дауысты. Бұл байқау құрдық келесі теориясы: соңғы саны осы сегменттері әрдайым қол жеткізуге болады-үздіксіз қозғалыс, вокалдық трактатының. Мұндай синтезирующий талдау болар еді, алайда, өте есептеу қатысты қымбат, өйткені ол талап еткен еді СПР істей алуы керек генерациялау барлық ықтимал произнесения және салыстыруға, оларды акустическом енгізумен. Алайда, біріншіден, акустикалық сигналдар, қарама-қарсы фонемам немесе алафонам қамтиды инвариантты сигналдар. Екіншіден, акустикалық сигналдар жиі қатты редуцируются » безударном жағдайы. Бұл жиі тудырады көп қате гипотезаларды жүйелерінде, акустическо — фонетикалық компонент болады үшін гипотезаны сегменті келген тіркелген болуы керек. Үшіншіден, акустикалық сигналдар дейін түрленеді диктор диктору-физиологиялық ерекшеліктерін, вокалдық асқазан, айырмашылықтар сипаттамалары сөйлеу және т. б.. Адамдар қабілетті өтеуге бұл айырмашылықтар тез және біркелкі, бірақ әлі күнге дейін аз түсінікті, қалай бұл процесс автоматты түрде болады. Көптеген коммерциялық сөйленісті айырып тану жүйелері талап етеді ұзақ оқыту, қайталанатын пайдаланушыға әрбір сөз сөздікте жүйесін бірнеше рет және — демек өте тәуелсіз диктор. «ARPA бірнеше әзірленген СПР қол жеткіздік белгілі бір дәрежеде тәуелсіз диктор тырысып енгізілсін параметр акустическо — фонетикалық талдау үшін жаңа диктор негізінде білім алушының ұсыныстар, ол білген жүйе пайдаланушыға сол күндерге оның проговорить.
Барлық ARPA жобалайды СПР, акустическо — фонетикалық талдау іс жүзінде жүзеге асырылмаса, және сегментный талдау емес, дәл. Түпкілікті ұсыну әрбір жүйенің, негізінен, анықталған тиімділігі неғұрлым жоғары деңгейдегі талдау қателер арналған фонетическом деңгейде. Қазіргі заманғы жүйесін пайдаланады күрделі акустическо — фонетикалық талдау, интегрируя ақпаратты бірқатар өзгерістердің акустикалық сигнал құра отырып, бірнеше типтегі фонетикалық көріністер, бірақ тиімділігі әлі де шектеледі орта есеппен 70% — ға табысты распознаванием фонем бірі-сӛйлеу тілін, произнесенных саны аз дикторов.
Фонологический Талдау
Фонологический компонент үшін қажет кез келген, өңдеуші сөз жүйесін, білімге негізделген, өйткені жүйесі білуді талап етеді қатысты фонологических процестердің белсенді тілде және қолданбалы бағдарламалар үшін қалпына келтіру канонические айтылу, сөздерді, мүмкін сарапталып, тиісті кірістермен сөздік алуға және одан әрі сигналдар — синтаксической және семантикалық/прагматикалық түсіндіру, сөйлеу сөздері. Фонологические компоненттері үшін әзірленген СПР және басқа да жүйелердің ARPA. Алайда, олар айтарлықтай дәрежеде шектелуі лексикалық, сегментными процестерді және, әдетте, болған істі фонологически басқарылатын өзгерістермен жете отырып, баламалы айтылу үшін жеке лексикалық бірлік және сақтай отырып, оларды қосымша сөздікте. Бұл тәсіл болуы мүмкін емес іс барабар с фонологическими жатқан процестерді қосылу шекаралары сөздер, типті палатализации. Ең үлкен область қолданбалы бағдарламасы үшін фонологического ережесі — интонационная сөйлем; демек, фонологию қарастыруға болмайды терминдер әр түрлі айтылу үшін лексикалық бірлік. Фонологический талдау қамтамасыз етеді, көптеген маңызды ақпарат үшін СӨА; мысалы, әр түрлі түрлері фонологического ережесі блокированы түрлі лингвистикалық шекаралары сегменттер арасындағы. Пайдалы таратуға арналған буындар мен сөздер сөйлеу, саралау, сондай-ақ қамтамасыз ету үшін мәліметтер синтаксического талдау; палатализация біріктіреді шекаралары сөздер, бірақ тежелген болса шекараларында басты синтаксистік құрайтын, сондықтан оның болмауы пайдаланылуы мүмкін шешу үшін түсініксіздіктер қатысты қатысуын мұндай шекаралары осы жерде сөйлеу сигнал. Фонологические ережесі, сондай-ақ өзгереді арасында тараған. Демек, СӨА, қабілетті түсінуге дикторов түрлі диалектами, талап еткен еді білімдер қатысты осы айырмашылықтар мен қабілетін реконфигурировать үшін олардың сөйлеу. Палатализация, мысалы, жүреді, жиі американдық көрсетеді қарағанда, британдық немесе ағылшын.
Соңында жетпісінші дами бастады жаңа тәсілдер фонологии сияқты автосегментная, метрикалық қарай, уақыт байланысты, олар үшін орталық болып табылады сверхсегментальный аспект. Жекелеген жетістіктер енгізілген болатын СПР.
Жүйесі
Басты СПР әзірленген жобасы ARPA, HARPY, HWIM, HTEARSAY-11 SR/SDC. HARPY болды ең жақын тиімділік критерийі бойынша, белгілі бір жоба үшін. Алайда, құрылымы HARPY талап етті жасау барлығы бір түпкі желісі, сондықтан тіл, воспринимаемый жүйесімен, бірақ шектелген қарағанда, басқа жүйелерде. Жүйесі HEARSAY-11 құрылды ретінде өнеркәсіптік жүйесі. Бірнеше СПР үшін әзірленген Еуропалық тілдер сияқты KEAL және MYRTILLE-11 үшін Француз тілі мен EVAR үшін неміс. Алайда, бұл жүйенің превзошли жүйесін ARPA тиімділігі бойынша немесе жобасы. Сондай-ақ, құрылған автоматты жүйе брондау орындары әуе жолдары, ол үздіксіз түсіну сөйлеу. Бұл жүйе әзірленген Зертханаларда Bell, егер телефон орнату үшін тиісті бронь. Ол әдісін пайдаланады салыстыру бағалық сөздер шаблонмен үшін тануға сөздер сөздіктен, насчитывающего 127 сөз.