`athena.data.datasets.speech_set_kaldiio`¶

audio dataset

Module Contents¶

SpeechDatasetKaldiIOBuilder SpeechDatasetKaldiIOBuilder

class athena.data.datasets.speech_set_kaldiio.SpeechDatasetKaldiIOBuilder(config=None)¶

SpeechDatasetKaldiIOBuilder

preprocess_data(self, file_dir, apply_sort_filter=True)¶: generate a list of tuples (feat_key, speaker).

load_scps(self, file_dir)¶: load kaldi-format feats.scp and utt2spk (optional)

filter_sample_by_input_length(self)¶

filter samples by input length

The length of filterd samples will be in [min_length, max_length)

Returns:	a filtered list of tuples (wav_filename, wav_len, speaker)
Return type:	entries

compute_cmvn_if_necessary(self, is_necessary=True)¶: compute cmvn file