قریبا تمام تکنیکهای ترکیب و تشخیص صحبت بر اساس مدل تولید صحبت انسان که در شکل شماره ۳ نشان داده شده ‏است ایجاد شده‌اند. بیشتر صداهای

مربوط به صحبت انسان به دو دسته‌ی صدادار۴‏‎ ‎و سایشی۵‏‎ ‎تقسیم می‌شوند. اصوات ‏صدادار وقتی که هوا از ریه‌ها و از مسیر تارهای صوتی به بیرون دهان یا

بینی رانده می‌شوند ایجاد میگردند. تارهای ‏صوتی دو رشته‌ی اویخته از بافت هستند که در مسیر جریان هوا کشیده شده‌اند. در پاسخ به کشش ماهیچه‌ای

متفاوت تارهای ‏صوتی با فرکانسی بین ۵۰ تا ۱۰۰۰هرتز ارتعاش می‌کنند که باعث انتقال حرکتهای متناوب هوا به نای می‌شود. در شکل ‏شماره ۳ اصوات

صدادار با یک مولد پالس ترِین۶‏‎ ‎با پارامتر قابل تنظیم پیچ (فرکانس پایه‌ی موج صوتی) نشان داده شده ‏است‎

ادامه مطلب: