教育向け音声信号処理ライブラリpyssp

numpy+scipyで実装されたpython用音声信号処理ライブラリ。matlabとかマジ辞めよう。

今の所音声品質向上やら音声認識システムの前処理向けのモノぐらいしか実装されてません。16k16bit用にハードコードしてある部分もあるので、なんか適当に何とかします。 今後は分析合成系を頑張る。

解説

voice enhancement

#bitbucket(https://bitbucket.org/aihara/pyssp/src/255c348385ded5838b433bb08fc2a270a60edbc6/pyssp/tools/noise_reduction.py)

参考文献

  1. S. F. Boll, "Suppression of Acoustic Noise in Speech Using Spectral Subtraction.", IEEE Transactions on Acoustics, Speech and Signal Processing, 1979.
  2. Y. Ephraim and D. Malah, "Speech enhancement using minimum mean-square error short-time spectral amplitude estimator.", IEEE Transactions on Acoustics, Speech and Signal Processing, 1984.
  3. T. Lotter and P. Vary, "Noise Reduction by Joint Maximum a Posteriori Spectral Amplitude and Phase Estimation with Super-Gaussian Speech Modelling.", Proceedings of European Signal Processing Conference, 2004.

voice activity detection

参考文献

  1. J. Ramirez, "Voice activity detection with noise reduction and long-term spectral divergence estimation.", ICASSP, 2004.

noise tracking

参考文献

  1. R. Martin, "Noise power spectral density estimation based on optimal smoothing and minimum statistics.", IEEE Transactions on Speech and Audio Processing, 2001.


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS