2. Äänen tallennus

Ääntä voidaan tallentaa esimerkiksi seuraavin menetelmin:
  1. Mekaanisesti
  2. Magneettisesti
  3. Optisesti

Tavallisimmat äänityksessä käytettävät menetelmät perustuvat magneettiseen tallennukseen.

2.1 Analogisen äänen magneettisen tallennuksen perusteita

Magneettisessa tallennuksessa ajan suhteen vaihtuva jännite muunnetaan magneettikentän vaihteluksi. Vaihtuva jännite saadaan tuotettua esimerkiksi mikrofonilla. Tallennusmedialla tarkoitetaan tässä yhteydessä välinettä, joka voidaan magnetoida pysyvästi (ääninauha, kovalevy ym.).

2.1.1 Ääninauha

Nykyaikainen ääninauha on kerrosrakenteinen: Varsinaiseen nauhapohjaan on liitetty sidosaineen avulla kerros ferromagneettista materiaalia, joka voidaan magnetoida pysyvästi ulkoisen magneettikentän avulla. Nauhassa voi olla lisäksi erilaisia suojakerroksia. Tietokoneissa käytettävien kovalevyjen tallennusmateriaalin perusrakenne on samankaltainen.

Ääninauhan pohjan ja magneettisen kerroksen materiaalit ovat kehittyneet huomattavasti vuosien saatossa. Ensimmäisten ääninauhojen pohjamateriaalina käytettiin paperia, mutta heikon kestävyyden vuoksi siirryttiin käyttämään erilaisia muoveja. Magneettisen kerroksen tekemiseen käytetään materiaaleja, joissa magneettiset hiukkaset ovat aiempaa pienempiä.

2.1 Tallentaminen ääninauhalle

Ääninauhaa käyttävä tallennusjärjestelmä muodostuu seuraavista kolmesta komponentista (ks. kuva 1):

  1. Äänityspää
  2. Toistopää
  3. Poistopää

Kuva 1. Analoginauhurin nauhankuljetusmekanismi ja äänipäät.

Ääninauha magnetisoidaan äänityspäällä, joka on useimmiten katkaistun renkaan muotoinen (ks. kuva 2). Lähellä nauhaa olevaa katkaisukohtaa nimitetään ilmaraoksi. Mikrofonin tuottama signaali ohjataan äänityspäähän, joka muuttaa sähkövirran vaihtelun magneettivuon vaihteluksi. Magneettivuo kulkee äänityspäätä lähellä olevan nauhan läpi, koska nauhan magneettisen kerroksen reluktanssi (magneettivuota vastustava voima) on pienempi kuin äänityspään ilmaraon reluktanssi (Huber & Runstein 1989, 107). Seurauksena nauhan magneettiset hiukkaset järjestyvät seuraten äänipään magneettivuon muutosta.

Kuva 2. Äänipään rakenne.

Toistopää muuttaa nauhalla olevan magneettivuon vaihtelun takaisin sähkövirran vaihteluksi. Toistopään ilmaraon leveys ja nauhanopeus määräävät toistettavan taajuusalueen. Mitä suurempi nauhanopeus ja mitä kapeampi ilmarako sitä suurempia taajuuksia voidaan tallentaa. (Huber & Runstein 1989, 109.) Ääninauhaan kohdistettavan magneettivuon suuruus ei voi kuitenkaan olla ääretön; Tietyn voimakkuuden ylittäessään magnetisointi "kyllästää" nauhan. Kaikki äänipään kohdalla olevat magneettiset hiukkaset ovat tällöin järjestäytyneet.

Nykyaikaisissa analogisissa tallentimissa nauha esimagnetoidaan korkeataajuisella signaalilla (engl. bias), joka linearisoi virran (siis äänen) ja magneettivuon muunnosta. Nauhan magnetoituminen on epälineaarista, koska jo magnetoituneet hiukkaset vaativat paljon vähemmän äänityspäähän ohjattua virtaa järjestäytyäkseen kuin magnetoitumattomat hiukkaset. Jos käytämme suunnattomasti virtaa magnetoimattominen hiukkasten järjestämiseen, nauha saturoituu. Jos käytämme puolestaan pientä virtaa, nauhaan muodostuu kohtia, joissa magneettivuon arvo on nolla. Nollakohdat aiheuttavat äänen "portaita" (ks. kuva 3). Nauha esimagnetoinnin jälkeen hiukkaset järjestyvät tasaisemmin. Esimagnetoinnin taajuus on niin korkea, ettei toistopää toista sitä; Kuulemme vain äänisignaalin. (Huber & Runstein 1989, 111-112.)

Kuva 3. Esimagnetoinnin vaikutus analogiseen tallennukseen. a) Sisääntuleva signaali b) Ilman esimagnetointia tallentuva signaali c) Signaali tallentuu oikein esimagnetoinnin ansiosta.

Yhdelle nauhalle voidaan tallentaa useita raitoja käyttämällä useampia äänipäitä. Nauhan leveys saattaa vaikuttaa tällöin suurestikin äänenlaatuun: kapeaa nauhaa käytettäessä äänipää saattaa esimerkiksi poimia viereisen raidan signaalin. Jos nauha on leveä, kulkee äänipään ohitse keskiarvoisesti enemmän magneettista materiaalia. Tällöin muodostuva signaali on kapeaan nauhaan verrattuna voimakkaampi ja kohinattomampi (Huber & Runstein 1989, 119).

2.2 Analogisen äänen magneettisen tallennuksen historiaa

Ensimmäiset magneettista tallennusta hyödyntävät laitteet hävisivät usein kilpailussa Thomas Edisonin kehittämälle fonografille, jonka toiminta perustui mekaaniseen tallennukseen. Fonografin jousimoottori pystyi ohjaamaan kaiutinta, jolloin tallennetun äänen pystyi kuulemaan useampi ihminen. Varhaisia magneettisia tallenteita pystyttiin kuuntelemaan ainoastaan kuulokkeilla, koska sähköistä signaalia vahvistavaa menetelmää ei ollut vielä keksitty. (Mullin 1988, 696.)

Vuonna 1888 amerikkalainen insinööri Oberlin Smith ehdotti ensimmäisenä sähkömagnetismiin perustuvaa tallennustapaa, jossa tallennusmediana käytettiin magnetoituvaa teräslankaa. Tanskalainen Valdemar Poulsen puolestaan patentoi vuonna 1898 sähkömagneettisessa tallennuksessa käytettäviä menetelmiä, joita hän käytti hyväkseen rakentamassaan Telegrafoni - nimisessä laitteessa. Myös Telegrafonissa käytettiin tallennusmediana magnetoituvaa lankaa. Telegrafoni herätti kiinnostusta vuoden 1900 Pariisin maailmannäyttelyssä, mutta se ei kuitenkaan johtanut laitteen yleistymiseen. (Thiele 1988, 396-398.)

Käytännöllisiä toteutuksia magneettisesti ääntä tallentavista laitteista alkoi syntyä, kun signaalin vahvistamisen mahdollistava tyhjiöputki keksittiin. Yhdysvalloissa vuonna 1912 Lee de Forest yhdisti keksimänsä tyhjiöputken Poulsenin Telegrafoniin yrittäessään vahvistaa heikkoa toistosignaalia (Mullin 1988, 696). Euroopassa Itävaltalainen Robert von Lieben patentoi tyhjiöputken vuonna 1910 ja myi patentin yritysryhmälle, johon kuuluivat mm. AEG, Siemens ja Telefunken. Ensimmäinen putkitransistoria hyödyntävä Telegrafoni ilmeistyi Euroopassa vuonna 1920. (Thiele 1988, 398.)

Vuonna 1928 saksalainen F. W. O. Bauch rakensi ensimmäisen magneettiseen tallennukseen perustuvan laitteen, jossa käytettiin tallennusmediana teräsnauhaa. Vuonna 1929 saksalainen Curt Stille puolestaan esitteli laitteen, joka tallensi ääntä elokuvafilmin tapaan rei´itetylle teräsnauhalle. Rei'itys mahdollisti äänen tahdistamisen elokuvan kanssa. (Thiele 1988, 399-400.) Curt Stille myi kehittämänsä patentit englantilaiselle Louis Blatnerille, jonka omistama yritys kehitti Blattnerphon- nimisen teräsnauhatallentimen 1930-luvun alussa. Blattnerfoni ei lopulta saavuttanut suosiota elokuvan äänilähteenä, mutta radiotoiminnassa sitä käytettiin paljon. Esimerkiksi BBC käytti Blattnerfonia puheen välittämiseen. Musiikin tallentaminen ei ollut mielekästä, koska tallentimien nauhakeloja pyörittävien moottorien nopeus oli epätasainen. Myöhemmin englantilainen Marconi-yritys toteutti Blattnerin ideoiden pohjalta kehittyneemmän Marconi-Stille - laitteeksi kutsutun teräsnauhatallentimen, jota englantilaiset käyttivät radiotoiminnassa toisen maailmansodan loppuun asti. (Mullin 1988, 697.) Saksassa teräsnauhatallentimien huippua edusti nk. Lorenz Stahlton - laite, jota käytettiin myös radiotoiminnassa monilla Euroopan radioasemilla (Thiele 1988, 400).

Teräslanka- ja teräsnauhatallentimet olivat koostamisen kannalta huonoja. Teräsnauhaa oli mahdollista leikata ja liittää yhteen hitsaamalla tai niittaamalla, mutta toimenpide oli hankala ja poisti liitoskohdasta tallennetun materiaalin. Suojaamattomattomista tallentimista aiheutui lisäksi koneiden käyttäjille vakavia onnettomuuksia, koska teräsnauhojen reunat olivat erittäin teräviä ja nauhanopeus oli suuri. Muita teräsnauhan huonoja puolia olivat suuri paino ja kalliit valmistus- ja toimituskustannukset. (Thiele 1988, 399-400.)

Vuonna 1928 itävaltalainen Fritz Pfleumer patentoi magneettisessa tallennuksessa käytettävän kerrosrakenteisen nauhan, joka muodostui ei-magneettisesta pohjasta ja ohuesta kerroksesta magneettista materiaalia. Pfleumer oli tupakkateollisuuden toimeksiannosta tutkinut menetelmiä, joiden avulla metallihiukkasia pystyttiin liittämään paperin pinnalle ja oivalsi soveltaa samaa tekniikkaa magneettisen tallennusmedian valmistukseen. Uutta nauhaa käyttävien tallentimien äänipäät ja nauhankuljetusmekanismi oli suunniteltava uudestaan, koska nauha oli terästä herkempää mekaaniselle rasitukselle. Toisaalta nauhan koostaminen oli vihdoin käytännöllistä. Vuonna 1928 Pfleumer rakensi myös tiettävästi maailman ensimmäisen kerrosrakenteista nauhaa käyttävän tallentimen. Vuonna 1930 AEG kiinnostui keksinnöstä ja osti lopulta Pfleumerin aiheeseen liittyvät patentit. (Thiele 1988, 401.)

AEG:n insinöörit havaitsivat pian, että Pfleumerin idea nauhan kerrosrakenteesta oli hyvä, mutta paperin ja rautapulverin yhdistelmä ei sopinut hyvin massatuotantoon. AEG alkoi itse kehittää tallenninta ja antoi nauhan kehityksen BASF-yhtiön tehtäväksi. BASF:in työntekijät testasivat erilaisia pohjamateriaaleja ja päätyivät selluloosa-asetaattiin, jolla oli korkea viskositeetti. Magneettiseksi päällystysmateriaaliksi valittiin rautajauhe, jonka demagnetointiin vaadittava koersitiivivoima oli suuri. Tallennin, jota AEG:llä kutsuttiin Magnetofoniksi, oli pian valmis koekäyttöön, mutta laitteen julkistaminen vuoden 1934 Berliinin radionäyttelyssä jouduttiin perumaan teknisten ongelmien vuoksi. (Engel 1988, 606-608.)

Koekäytössä huomattiin kuitenkin Magnetofonin sopivuus musiikin taltiointiin. Vuoden 1935 huhtikuussa AEG:n työntekijät äänittivät Mannheimin kansallisteatterin muusikoita ja käyttivät nauhoituksia vakuuttamaan Magnetofonin tuotannosta vastaavia johtajia. Magnetofoni esiteltiin julkisesti vuoden 1935 Berliinin radionäyttelyssä ja se saavutti heti suuren suosion. (Engel 1988, 608.) Vuonna 1936 BASF:in työntekijät äänittivät Magnetofonilla Lontoon filharmonikkoja, jotka Saksan vierailun yhteydessä soittivat konsertin tehtaalla. Kyseisestä äänityksestä säilyneet kopiot osoittivat, että magneettisen tallennuksen taso ei ollut vielä yhtä korkea kuin äänilevyn kaiverruksessa voitiin saavuttaa. (Mullin 1988, 697.)

Magnetofonin kehitystä jatkettiin innokkaasti. Vuoden 1939 jälkeen Saksan yleisradio käytti laitetta laajalti ja osallistui myös tekniseen kehitystyöhön. Saksan yleisradion laboratorioissa kehitettiin Walter Weberin johdolla nykyäänkin käytettävä suurtaajuusesimagnetointivirta (engl. bias), joka paransi Magnetofonin hyödynnettävää dynamiikka-aluetta huomattavasti. 1940-luvun alussa myös elokuvatuottajien kiinnostus Magnetofonia kohtaan heräsi, koska ääninauhojen tuottaminen ja käyttö oli halpaa. Radiolähetyksistä ei myöskään enää voinut erottaa, esitettiinkö musiikki suorana lähetyksenä vai oliko esitys tallennettu aiemmin Magnetofonilla.

Toinen maailmansota aiheutti esteitä kehitetyn tekniikan leviämiselle. Saksan yleisradion radiolähetykset kuuluivat kuitenkin Englantiin asti, jossa John T. Mullin ja muut yhdysvaltalaiset viestintäjoukkojen jäsenet olivat vakuuttuneita Magnetofonin mahdollisuuksista. (Thiele 1988, 405.) Sodan jälkeen vuonna 1947 Mullin toi Saksasta Yhdysvaltoihin kaksi Magnetofonia ja muokkasi ne käytettäväksi Bing Crosbyn radio-ohjelmien koostamiseen. Mullin onnistui myös vakuuttamaan Magnetofoneillaan Ampex-yrityksen johdon, joka teki päätöksen nauhureiden tuotannon aloittamisesta. Magnetofonit saavuttivat suuren suosion Yhdysvaltalaisilla radioasemilla. (Mullin 1988, 698.)

2.3 Digitaalisen äänen magneettisen tallennuksen perusteita

Mikrofonin tuottama jännitteen vaihtelu mitataan hetkellisesti eli näytteistetään (ks. kuva 4). Näytteenottojen välinen aika määrää näytteenottotaajuuden.

Kuva 4. Aaltomuodon amplitudi mitataan lyhyin väliajoin. Väritetyt alueet kuvaavat amplitudin arvoa, joka signaalilla oli näytteenottohetkellä.

Hetkelliset arvot muunnetaan analogiadigitaalimuuntimella (lyh. AD-muunnin) digitaalisiksi näytteiksi, jotka esitetään yleisimmin binäärilukuina (ks. kuva 5). Binääriluvuksi muuttamista kutsutaan myös kvantisoinniksi. Binääriluvun bittien lukumäärä määrittää, kuinka monta eri arvoa binääriluvulla voidaan esittää. Bittien lukumäärä määrittelee myös, kuinka suuri virhe näytteistyksessä keskimäärin tulee. Analogisen signaalin hetkellinen mittaustulos sijaitsee keskimäärin kahden peräkkäisen binäärisen arvon välillä. Analoginen arvo joudutaan pyöristämään toiseen kahdesta arvosta (kvantisointi), mistä on seurauksena ns. kvantisointi virhe.

Kuva 5. a) 8-bittinen binääriluku. b) Bittejä vastaavat kahden potenssit. c) Kahden potensseja vastaavat luvut kymmenjärjestelmässä. Lukujen summa on 8-bittisellä luvulla esitettävien erisuurten arvojen suurin määrä. d) Ylinnä olevasta binääriluvusta muodostuu kymmenjärjestelmän luku summaamalla ykkösien kohdalla olevat kakkosien potenssit.

Digitaalitallentimissa äänityssignaali ei välttämättä kyllästy analogitallentimien tapaan. Jos sisääntulevan signaalin taso nousee suurimman esitettävän bittiarvon yläpuolelle, voi AD-muunnoksen seurauksena olla lukualueen toisessa ääripäässä sijaitseva binääriluku. Jos siis äänität esimerkiksi DAT-nauhurilla liian suurilla tasoilla, saattaa koko äänitys epäonnistua, koska säröytyminen on erittäin epämiellyttävän kuuloista.

Näytteet talletetaan nauhalle peräkkäin. Nopealle kovalevylle näytteet voidaan puolestaan tallentaa epälineaarisesti. Toistettaessa kovalevyn hakuajan täytyy siis olla pienempi kuin näytteenottotaajuuden määräämä näyteväli. Näytteet tallennetaan useimmiten erityisiin äänitiedostoihin (esim. .wav - päätteiset tiedostot). Uusimpia äänentallennuksen suuntauksia edustaa äänen perkeptuaalinen koodaus. Ääni muutetaan usein taajuustason esitykseksi, josta poistetaan kuulon kannalta "turhat" komponentit käyttäen hyväksi psykoakustiikan teorioita. Tällaista menetelmää käytetään esimerkiksi Mini Disk-tallentimissa (ATRAC-koodaus) ja MP3-koodauksessa.

Nauhalle digitaalisesti tallentavat laitteet voidaan jakaa kahteen haaraan: Kiinteällä äänipäällä varustetut avokelanauhurit ja pyörivällä äänipäällä varustetut nauhurit (esim. DAT/ADAT). Kiinteällä äänipäällä varustetuissa avokelatallentimissa ongelmana on epäpuhtauksien aiheuttamat virheet. Nauhureissa joudutaankin käyttämään erilaisia virheenkorjausmenetelmiä. Pyörivällä äänipäällä varustetuissa digitaalinauhureissa äänen koostaminen on vaikeaa, koska nauha sijaitsee erityisessä kasetissa. Kiintolevylle talletettaessa koostamisessa voidaan käyttää hyväksi erilaisia tietorakenteita. Valitettavasti useat ohjelmat on toteutettu huonosti: Näytteitä siirretään kovalevyllä paikasta toiseen.

2.4 Digitaalisen äänen magneettisen tallennuksen historiaa

Digitaalista ääntä tutkittiin jo 1950-luvulla esimerkiksi Bellin laboratorioissa Yhdysvalloissa. Digitaalinen ääni tallennettiin tietokoneissa käytettäville nauhalaitteille. Käytössä oli myös levymuisteja, joiden tekniikka oli kuitenkin nykyiseen verrattuna alkeellista. Nykyaikainen suljettu kovalevy (winchester disk) kehitettiin vasta 1970-luvun alussa (IBM). Ensimmäiset äänityskäyttöön kehitetyt digitaalinauhurit esiteltiin 1970-luvun alussa.

1970-luvulla kehitettiin myös äänitysjärjestelmiä, joissa hyödynnettiin analogisia videonauhureita. Ennen tallennusta videonauhalle analoginen äänisignaali johdettiin PCM-sovittimeen (engl. pulse code modulation adapter), joka muodosti äänestä kvantisoituja näytteitä. Tämän jälkeen näytteistä muodostettiin binäärinen bittivirta, joka muutettiin ns. pseudovideo aaltomuodoksi tallennettavaksi videonauhurille. Videoformaatin käytostä seurasi myös eräitä erikoisia piirteitä: Esimerkiksi CD-levyn näytteenottotaajuus 44.1 kHz on peräisin videonauhureiden yleisestä käytöstä äänitteiden kantanauhojen tuottamisessa. Kyseinen näytteenottotaajuus oli yksinkertaisessa suhteessa kahdessa eri videoformaatissa (NTSC/PAL) määriteltyihin viivatiheyksiin ja lisäksi se oli tarpeeksi korkea kattamaan äänitaajuudet.

Videonauhureihin perustuvat järjestelmät ohjasivat kehitystä myös jatkossa. Sony suunnitteli nauhuriprototyypin, jossa käytettiin videonauhureiden tapaan pyörivää äänipäätä. Eräs pyörivän äänipään etuja oli suuri nopeus nauhan ja äänipään välillä, jolloin signaali-kohinasuhde parani. Prototyypissä käytettiin nauhaa, jonka leveys oli sama kuin C-kasetin nauhassa. Standardisoinnin tuloksena syntyi nykyäänkin ammattilaisten erittäin laajalti käyttämä DAT-formaatti (engl. digital audio tape). DAT-formaatti ei yleistynyt kuluttajamarkkinoilla, koska laitteita valmistava viihdeteollisuus pelkäsi menettävänsä tuottoja, jos kuluttujat alkaisivat kopioida CD-levyjä.

Kiinteällä äänipäällä toteutetut digitaliset nauhurit kehitettiin korvaamaan analogiset moniraitanauhurit, joiden kohinaominaisuudet olivat mikrofoneja ja analogisia äänipöytiä huonommat. Digitaalinen moniraitanauhuri suunniteltiin siten, että se voitiin kytkeä helposti analogisen nauhurin tilalle. Jotta nauhaa voitiin leikata, käytettiin kiinteällä äänipäällä varustetuissa digitaalisissa nauhureissa avoimia nauhakeloja. Yleisesti digitaalinauhurin ulkonäkö ja toiminta suunniteltiin vastaamaan analoginauhuria. (Watkinson 1988, 499.)

Kiinteällä äänipäällä varustettujen digitaalinauhurien kehitys on ollut analoginauhureihin verrattuna sikäli käänteinen, että kaksikanavaisia nauhureita on esitelty vasta moniraitanauhureiden jälkeen. Kaksikanavaiset nauhurit kehitettiin lähinnä äänitteiden kantanauhan koostamiseen, mikä johti luonoolisesti parannuksiin koostamisessa tarvittavissa ominaisuuksissa. Esimerkiksi Sonyn eräässä stereonauhurissa nauhanopeus oli kaksinkertainen, mikä helpotti leikkauskohtien etsimistä. Nauhaa leikatessa syntyviä virheitä pienennettiin menetelmällä, jossa jokainen näyte tallennettiin nauhalle kahteen kertaan. (Watkinson 1988, 502.)

2.5 Digitaalisen äänen optinen tallennus

Yleisin tätä kurssia koskettava optinen tallennusjärjestelmä on CD (engl. Compact Disk). Teoriassa "tyhjän" CD:n pintaan poltetaan kuoppia, jotka tulkitaan binäärisiksi näytteiksi. Kuoppien reunat vastaavat ykkösiä ja tasaiset kohdat kuopassa tai kuopan ulkopuolella nollia. Käytännössä ääninäytteet koodataan hieman monimutkaisemmin, jotta mahdolliset virheet olisi toistettaessa mahdollista korjata. Toistettaessa CD:n pintaan kohdistetun valon (laser) intensitetti muuttuu kuopan reunoja ja tasaisia kohtia seuraten. (Rossing 1990, 569.)

Lähteet

Engel, F. K. 1988. Magnetic Tape From the Early Days to the Present. Journal of the Audio Engineering Society, Vol. 36, No. 7/8, July/August, pp.606 - 616

Huber, D. M. & Runstein, R. E. 1989. Modern Recording Techniques. Third edition. Howard W. Sams & Company. ISBN 0-672-22682-0

Ingebretsen R. B. & Stockham, T. G. 1984. Random-Access Editing of Digital Audio. Journal of the Audio Engineering Society, Vol. 32, Number 3 pp. 114

Rossing T. D. 1990. The Science of Sound. 2nd ed. Addison-Wesley. ISBN 0-201-15727-6

Thiele, H. H. K. 1988. Magnetic Sound Recording in Europe up to 1945. Journal of the Audio Engineering Society, Vol. 36, No. 5, May, pp. 393 - 408

Watkinson, J. 1988. Digital Audio. Journal of the Audio Engineering Society, Vol. 36, No. 6, June, pp. 492 - 508