早期的语音识别技术就是基于“不同发音的共振峰不同”这一原理,通过分析语音的共振峰来区分不同的发音。1952 年,AT&T 公司的科学家首次利用语音的第一和第二共振峰实现了对十个英文数字的识别。如图 所示,每个小图对应一个数字,横轴表示第一共振峰F1,纵轴表示第二共振峰F2。图中的曲线展示了发音时共振峰的变化轨迹。可以看到,不同数字在 F1-F2 平面上形成了独特的轨迹。AT&T 的研究者正是利用这些轨迹上的差异,实现了对不同数字的有效区分
AT&T 的数字识别方法。图片来源:Davis et al., 1952.