`athena.data.datasets.speech_recognition_kaldiio`¶

audio dataset

Module Contents¶

SpeechRecognitionDatasetKaldiIOBuilder SpeechRecognitionDatasetKaldiIOBuilder

class athena.data.datasets.speech_recognition_kaldiio.SpeechRecognitionDatasetKaldiIOBuilder(config=None)¶

SpeechRecognitionDatasetKaldiIOBuilder

preprocess_data(self, file_dir, apply_sort_filter=True)¶: Generate a list of tuples (feat_key, speaker).

load_scps(self, file_dir)¶: load kaldi-format feats.scp, labels.scp and utt2spk (optional)

filter_sample_by_input_length(self)¶

filter samples by input length

The length of filterd samples will be in [min_length, max_length)

Returns:	a filtered list of tuples (wav_filename, wav_len, transcripts, speed, speaker)
Return type:	entries

filter_sample_by_output_length(self)¶

filter samples by output length

The length of filterd samples will be in [min_length, max_length)

Returns:	a filtered list of tuples (wav_filename, wav_len, transcripts, speed, speaker)
Return type:	entries

compute_cmvn_if_necessary(self, is_necessary=True)¶: compute cmvn file