Ikke la deg lure av strømmetjenestenes markedskampanjer, skriver Mathieu Lacroix.

Spektrogram av introen til Beethovens 9. symfoni, fremført av TSO.

For noen år sida var det hovedsakelig lydteknikere og audiofile personer som snakket om bit dybde, samplingsrate, lossless mot lossy formater, osv. De siste årene har konseptet «HiFi-lyd» blitt en strategi innenfor markedsføring for strømmetjenester som Spotify, Beats Music og Deezer. For noen uker siden ble konseptet diskutert i forbindelse med tjenesten Tidal som ble lansert med en ekstravagant og pretensiøs pressekonferanse med flere store popstjerner, blant andre Kanye West, Jay-Z, Nicki Minaj og Madonna.

I denne artikkelen vil jeg forklare noen sentrale begreper om digital lyd, med mål om at leseren ikke blir lurt av strømmetjenestenes markedskampanjer. Noen av disse begrepene, og spesielt definisjonen og synet på hva som er bedre innenfor digital lyd, debatteres blant akustikere og lydteknikere. Før vi begynner, er det også viktig å huske at kvaliteten blir begrenset av hvert eneste element i signalet man bruker. Selv om man spiller av en lydfil med veldig høy kvalitet, blir det likevel ikke fantastisk lyd om man lytter gjennom forferdelige høyttalere eller hodetelefoner. Signalet er ikke bedre enn det svakeste punktet i signalgangen.

Samplingsrate
En lydfil på datamaskinen, eller hvilket som helst digitalt medium, må være samplet slik at signalet kan spilles av med hodetelefoner eller høyttalere. Dette høres komplisert ut, men i praksis er det enkelt. Man sampler lyden flere ganger per sekund, og det er dette som er samplingsrate. Man kan tenke på det som hvor mange ganger per sekund datamaskinen hører på signalet.

Vi kan ta utgangspunkt i en sinusbølge som dere kan se her:

Bilde1

Hvis den blir samplet seks ganger i sekundet blir signalet veldig grovt som dere kan se her:

Bilde2

Hvert punkt på bølgen representerer én sampling av sinusbølgen. Hvis man sammenligner den opprinnelige sinusbølgen med bølgen ovenfor, vil man se stor forskjell. Man må sample bølgen mange ganger per sekund for at den skal bli så lik det opprinnelige signalet som mulig.

Når man kjøper en CD, betyr dens samplingsrate 44.1 kHz at lyden har blitt samplet 44 100 ganger per sekund. Det høres ut som et høyt tall, men vitenskapsmannen Harry Nyquist regnet ut at et såpass høyt tall var nødvendig for å gjengi det opprinnelige signalet bra nok.

Filmindustrien bruker 48 kHz som standard samplingsrate, og mange studioer bruker 48 eller 96 kHz. Grammynominerte Morten Lindberg fra 2L er blant dem som tar opp med 352.8 kHz som samplingsrate, og da er vi virkelig i HiFi-verden, selv mellom lydteknikere og produsenter.

16 eller 24 bits?
Bitdybde er det også vanlig å høre om. Den er vanligvis på 16 eller 24, men hva betyr det egentlig? Vi kan se på en sinusbølge som er samplet seks ganger per sekund igjen:

Untitled-1

Bitdybden sier noe om hvor mange mulige verdier hvert samplet punkt kan ha, eller hvor høye/lave verdiene kan være på en Y-akse. Med en lavere bitdybde kan ikke Y-verdiene for hvert punkt være veldig høye, noe som betyr at hele bølgen er nærmere nullpunktet. I praksis påvirker det hvor mye dynamikk, eller variasjoner i lydnivået, man kan høre i musikken.

Dersom vi har en bitdybde på 4, har vi bare 16 mulige verdier. Dette ville gitt oss en maks dynamikk av 24 dB, noe som er veldig lite, sammenlignet med en vanlig samtale mellom to personer som står en-to meter fra hverandre og hvor lydnivået er cirka 60-70 dB. Vanligvis gjør lydteknikere 24 bits-lydopptak, noe som gir et omfang på 144 dB. Til sammenligning kan en høy rockekonsert godt være 110-115 dB, og man føler smerte ved å høre en lyd som er over 125 dB. Mens en plate blir mikset og mastret er det viktig med høy bitdybde, men siden blir den redusert til 16 bits. Dette gir et omfang på 96 dB, cirka lydnivået på en motorsag. Dette er et mer enn stort nok dynamisk omfang for de fleste lyttesituasjoner, spesielt med tanke på alle refleksjoner man har i de fleste rom – vi hører på musikk med veldig mye støy og bråk rundt oss i hverdagen.

Det er også viktig å huske at desibelskalaen (eller dB) er logaritmisk. Det vil si at hver gang man har en økning på 6 dB, har lydnivået blitt doblet. For eksempel er 66 dB dobbelt så høyt som 60 dB.

Lossless eller lossy og filformater
Et begrep som har blitt veldig trendy å bruke i det siste er “lossless lyd”, som betyr at lydfilen din ikke har mistet noen informasjon, selv om den skulle være komprimert. Verdiene for de 44 100 (eller flere) punktene eksisterer i lydfilen, eller kan bli hentet hvis filen skulle dekomprimeres. Lossy er det motsatte, det handler om at en del av informasjonen faktisk har gått tapt. Men hva innebærer dette?

Det dreier seg om å komprimere lydfilen ved å ta bort litt informasjon i filen uten at man kan høre forskjellen (blant annet på grunn av det man kaller maskering).

Filer som ikke er komprimerte er ofte altfor store, det er derfor MP3-formatet ble oppfunnet på nittitallet. Det dreier seg om å komprimere lydfilen ved å ta bort litt informasjon i filen uten at man kan høre forskjellen (blant annet på grunn av det man kaller maskering). Dette var ekstremt viktig den tida datamaskiner hadde mindre plass enn de har i dag.

I dag er spørsmålet om hva som er mest optimalt av lossless og lossy en ganske stor debatt. Det finnes argumenter for begge sider av saken, og som tidligere nevnt er det ikke noe poeng i å bruke det høyeste lossless med 96 kHz dersom du ikke har godt nok utstyr til å støtte det.

Eksempler på komprimerte lossless filformater: FLAC, m4a

Eksempler på ukomprimerte filformater: WAV, AIF

Eksempler på lossy filformater: MP3, ogg, AAC

Når man ser filformatet for en fil som for eksempel AAC, finner man også et tall, for eksempel 192 kbps (kilobits pr sekund). Det siste tallet er det man kaller bitrate, og det betyr hvor mye data som brukes per sekund. Ved å se på hvor mange kbps en fil har, får du en ide om hvor mye informasjon som har gått tapt i kompresjonen. Mange mener 128 kbps er lav kvalitet, mens mange mener alt mellom 192 og 320 kbps er likt nok den originale filen for folk flest.

Markedsføringskrig
Mange av strømmetjenestene snakker om «HiFi-lyd», samtidig som det i samme tjeneste kan stå skrevet at de for eksempel bruker AAC med 320 kbps. For at man ikke skal la seg lure er det derfor viktig å forstå grunnbegrepene bak digital lyd. Det er også viktig å bruke sunn fornuft. Om disse forskjellene virkelig utgjør en forskjell for lytteren, er en større diskusjon, ikke bare på nett, men også innenfor akustikk.

Vår oppfatning av lyd er annerledes enn hva teorien skulle tilsi, og ny forskning viser at oppfattelse av lyd er helt individuell sak. Mange sier også at konsumentteknologien er ikke klar for de ekte høykvalitetsformatene, og at å bruke dem på mindre utstyr kan gi litt lavere kvalitet (blant annet på grunn av filtre, osv). Poenget er rett og slett at man ikke bør la seg lure til å betale mer enn det man faktisk trenger.

Publisert:

Del: