Un sonido también puede ser representado por su espectro, mediante un gráfico amplitud versus frecuencia. Este gráfico muestra las amplitudes de cada componente de frecuencia contenido en el sonido.
Por lo general, siempre es posible pasar de una representación en el tiempo a una representación en la frecuencia y viceversa, mediante la transformada de Fourier. No obstante, es importante destacar que el diagrama de tiempo no contiene información alguna sobre el contenido de frecuencias del sonido y el espectro no contiene información de tipo temporal. Por lo tanto, si bien cada una de estas representaciones basta por sí sola para determinar unívocamente un sonido, son en cierto sentido complementarias.
Una representación intermedia es lo que se llama el sonograma. Un sonograma consiste básicamente en un eje tridimensional donde se grafica la magnitud del espectro de un sonido versus el tiempo. Esto se logra mediante la subdivisión de la señal de audio en varias pequeñas ventanas de tiempo, usualmente traslapadas entre sí. En cada una de éstas ventanas temporales, se estima el espectro mediante lo que se denomina la transformada de Fourier de tiempo corto (o short time Fourier transform en inglés). De esta forma es posible determinar como va cambiando el contenido de frecuencia del sonido en el tiempo. Si bien el sonograma es muy útil, la información que entrega es altamente dependiente de los parámetros que se utilicen para su cálculo, como el tipo de ventana, el tamaño de cada ventana y el porcentaje de traslape, entre otros.