External module "core/audio_utils"

Index

Interfaces

SpecParams

Functions

Functions

applyWindow

applyWindow(buffer: Float32Array, win: Float32Array): Float32Array

- Defined in src/core/audio_utils.ts:270
Parameters
- buffer: Float32Array
- win: Float32Array
Returns Float32Array

frame

frame(data: Float32Array, frameLength: number, hopLength: number): Float32Array[]

- Defined in src/core/audio_utils.ts:322
Given a timeseries, returns an array of timeseries that are windowed according to the params specified.

Parameters
- data: Float32Array
- frameLength: number
- hopLength: number
Returns Float32Array[]

hannWindow

hannWindow(length: number): Float32Array

- Defined in src/core/audio_utils.ts:386
Parameters
- length: number
Returns Float32Array

hzToMidi

hzToMidi(frequencies: number[]): Promise<number[]>

- Defined in src/core/audio_utils.ts:424
Parameters
- frequencies: number[]
Returns Promise<number[]>

loadAudioFromFile

loadAudioFromFile(blob: Blob): Promise<AudioBuffer>

- Defined in src/core/audio_utils.ts:72
Loads audio into AudioBuffer from a Blob to transcribe.

By default, audio is loaded at 16kHz monophonic for compatibility with model. In Safari, audio must be loaded at 44.1kHz instead.

Parameters
- blob: Blob
Returns Promise<AudioBuffer>

The loaded audio in an AudioBuffer.

loadAudioFromUrl

loadAudioFromUrl(url: string): Promise<AudioBuffer>

- Defined in src/core/audio_utils.ts:57
Loads audio into AudioBuffer from a URL to transcribe.

By default, audio is loaded at 16kHz monophonic for compatibility with model. In Safari, audio must be loaded at 44.1kHz instead.

Parameters
- url: string
  
  A path to a audio file to load.
Returns Promise<AudioBuffer>

The loaded audio in an AudioBuffer.

melSpectrogram

melSpectrogram(y: Float32Array, params: SpecParams): Float32Array[]

- Defined in src/core/audio_utils.ts:88
Parameters
- y: Float32Array
- params: SpecParams
Returns Float32Array[]

midiToHz

midiToHz(notes: number): Tensor<Rank>

- Defined in src/core/audio_utils.ts:416
Parameters
- notes: number
Returns Tensor<Rank>

padCenterToLength

padCenterToLength(data: Float32Array, length: number): Float32Array

- Defined in src/core/audio_utils.ts:284
Parameters
- data: Float32Array
- length: number
Returns Float32Array

padConstant

padConstant(data: Float32Array, padding: number | number[]): Float32Array

- Defined in src/core/audio_utils.ts:295
Parameters
- data: Float32Array
- padding: number | number[]
Returns Float32Array

powerToDb

powerToDb(spec: Float32Array[], amin?: number, topDb?: number): Float32Array[]

- Defined in src/core/audio_utils.ts:111
Convert a power spectrogram (amplitude squared) to decibel (dB) units

Intended to match librosa.core.power_to_db

Parameters
- spec: Float32Array[]
  
  Input power.
- Default value amin: number = 1e-10
  
  Minimum threshold for abs(S).
- Default value topDb: number = 80
  
  Threshold the output at topDb below the peak.
Returns Float32Array[]

resampleAndMakeMono

resampleAndMakeMono(audioBuffer: AudioBuffer, targetSr?: number): Promise<Float32Array>

- Defined in src/core/audio_utils.ts:156
Parameters
- audioBuffer: AudioBuffer
- Default value targetSr: number = SAMPLE_RATE
Returns Promise<Float32Array>

Generated using TypeDoc