2. Äänen tallennus

Ääntä voidaan tallentaa esimerkiksi seuraavin menetelmin:
  1. Mekaanisesti
  2. Magneettisesti
  3. Optisesti

Tavallisimmat äänityksessä käytettävät menetelmät perustuvat magneettiseen tallennukseen.

2.1 Analogisen äänen magneettisen tallennuksen perusteita

Magneettisessa tallennuksessa ajan suhteen vaihtuva jännite muunnetaan magneettikentän vaihteluksi. Vaihtuva jännite saadaan tuotettua esimerkiksi mikrofonilla. Tallennusmedialla tarkoitetaan tässä yhteydessä välinettä, joka voidaan magnetoida pysyvästi (ääninauha, kovalevy ym.).

2.1.1 Ääninauha

Nykyaikainen ääninauha on kerrosrakenteinen: Varsinaiseen nauhapohjaan on liitetty sidosaineen avulla kerros ferromagneettista materiaalia, joka voidaan magnetoida pysyvästi ulkoisen magneettikentän avulla. Nauhassa voi olla lisäksi erilaisia suojakerroksia. Tietokoneissa käytettävien kovalevyjen tallennusmateriaalin perusrakenne on samankaltainen.

Ääninauhan pohjan ja magneettisen kerroksen materiaalit ovat kehittyneet huomattavasti vuosien saatossa. Ensimmäisten ääninauhojen pohjamateriaalina käytettiin paperia, mutta heikon kestävyyden vuoksi siirryttiin käyttämään erilaisia muoveja. Magneettisen kerroksen tekemiseen käytetään materiaaleja, joissa magneettiset hiukkaset ovat aiempaa pienempiä.

2.1.2 Tallentaminen ääninauhalle

Ääninauhaa käyttävä tallennusjärjestelmä muodostuu seuraavista kolmesta komponentista (ks. kuva 1):

  1. Äänityspää
  2. Toistopää
  3. Poistopää

Kuva 1. Analoginauhurin nauhankuljetusmekanismi ja äänipäät.

Ääninauha magnetisoidaan äänityspäällä, joka on useimmiten katkaistun renkaan muotoinen (ks. kuva 2). Lähellä nauhaa olevaa katkaisukohtaa nimitetään ilmaraoksi. Mikrofonin tuottama signaali ohjataan äänityspäähän, joka muuttaa sähkövirran vaihtelun magneettivuon vaihteluksi. Magneettivuo kulkee äänityspäätä lähellä olevan nauhan läpi, koska nauhan magneettisen kerroksen reluktanssi (magneettivuota vastustava voima) on pienempi kuin äänityspään ilmaraon reluktanssi (Huber & Runstein 1989, 107). Seurauksena nauhan magneettiset hiukkaset järjestyvät seuraten äänipään magneettivuon muutosta.

Kuva 2. Äänipään rakenne.

Toistopää muuttaa nauhalla olevan magneettivuon vaihtelun takaisin sähkövirran vaihteluksi. Toistopään ilmaraon leveys ja nauhanopeus määräävät toistettavan taajuusalueen. Mitä suurempi nauhanopeus ja mitä kapeampi ilmarako sitä suurempia taajuuksia voidaan tallentaa. (Huber & Runstein 1989, 109.) Ääninauhaan kohdistettavan magneettivuon suuruus ei voi kuitenkaan olla ääretön; Tietyn voimakkuuden ylittäessään magnetisointi "kyllästää" nauhan. Kaikki äänipään kohdalla olevat magneettiset hiukkaset ovat tällöin järjestäytyneet.

Nykyaikaisissa analogisissa tallentimissa nauha esimagnetoidaan korkeataajuisella signaalilla (engl. bias), joka linearisoi virran (siis äänen) ja magneettivuon muunnosta. Nauhan magnetoituminen on epälineaarista, koska jo magnetoituneet hiukkaset vaativat paljon vähemmän äänityspäähän ohjattua virtaa järjestäytyäkseen kuin magnetoitumattomat hiukkaset. Jos käytämme suunnattomasti virtaa magnetoimattominen hiukkasten järjestämiseen, nauha saturoituu. Jos käytämme puolestaan pientä virtaa, nauhaan muodostuu kohtia, joissa magneettivuon arvo on nolla. Nollakohdat aiheuttavat äänen "portaita" (ks. kuva 3). Nauha esimagnetoinnin jälkeen hiukkaset järjestyvät tasaisemmin. Esimagnetoinnin taajuus on niin korkea, ettei toistopää toista sitä; Kuulemme vain äänisignaalin. (Huber & Runstein 1989, 111-112.)

Kuva 3. Esimagnetoinnin vaikutus analogiseen tallennukseen. a) Sisääntuleva signaali b) Ilman esimagnetointia tallentuva signaali c) Signaali tallentuu oikein esimagnetoinnin ansiosta.

Yhdelle nauhalle voidaan tallentaa useita raitoja käyttämällä useampia äänipäitä. Nauhan leveys saattaa vaikuttaa tällöin suurestikin äänenlaatuun: kapeaa nauhaa käytettäessä äänipää saattaa esimerkiksi poimia viereisen raidan signaalin. Jos nauha on leveä, kulkee äänipään ohitse keskiarvoisesti enemmän magneettista materiaalia. Tällöin muodostuva signaali on kapeaan nauhaan verrattuna voimakkaampi ja kohinattomampi (Huber & Runstein 1989, 119).

2.1.3 Analogisen äänen magneettisen tallennuksen historiaa

Ensimmäiset magneettista tallennusta hyödyntävät laitteet hävisivät usein kilpailussa Thomas Edisonin kehittämälle fonografille, jonka toiminta perustui mekaaniseen tallennukseen. Fonografin jousimoottori pystyi ohjaamaan kaiutinta, jolloin tallennetun äänen pystyi kuulemaan useampi ihminen. Varhaisia magneettisia tallenteita pystyttiin kuuntelemaan ainoastaan kuulokkeilla, koska sähköistä signaalia vahvistavaa menetelmää ei ollut vielä keksitty. (Mullin 1988, 696.)

Vuonna 1888 amerikkalainen insinööri Oberlin Smith ehdotti ensimmäisenä sähkömagnetismiin perustuvaa tallennustapaa, jossa tallennusmediana käytettiin magnetoituvaa teräslankaa. Tanskalainen Valdemar Poulsen puolestaan patentoi vuonna 1898 sähkömagneettisessa tallennuksessa käytettäviä menetelmiä, joita hän käytti hyväkseen rakentamassaan Telegrafoni - nimisessä laitteessa. Myös Telegrafonissa käytettiin tallennusmediana magnetoituvaa lankaa. Telegrafoni herätti kiinnostusta vuoden 1900 Pariisin maailmannäyttelyssä, mutta se ei kuitenkaan johtanut laitteen yleistymiseen. (Thiele 1988, 396-398.)

Käytännöllisiä toteutuksia magneettisesti ääntä tallentavista laitteista alkoi syntyä, kun signaalin vahvistamisen mahdollistava tyhjiöputki keksittiin. Yhdysvalloissa vuonna 1912 Lee de Forest yhdisti keksimänsä tyhjiöputken Poulsenin Telegrafoniin yrittäessään vahvistaa heikkoa toistosignaalia (Mullin 1988, 696). Euroopassa Itävaltalainen Robert von Lieben patentoi tyhjiöputken vuonna 1910 ja myi patentin yritysryhmälle, johon kuuluivat mm. AEG, Siemens ja Telefunken. Ensimmäinen putkitransistoria hyödyntävä Telegrafoni ilmeistyi Euroopassa vuonna 1920. (Thiele 1988, 398.)

Vuonna 1928 saksalainen F. W. O. Bauch rakensi ensimmäisen magneettiseen tallennukseen perustuvan laitteen, jossa käytettiin tallennusmediana teräsnauhaa. Vuonna 1929 saksalainen Curt Stille puolestaan esitteli laitteen, joka tallensi ääntä elokuvafilmin tapaan rei´itetylle teräsnauhalle. Rei'itys mahdollisti äänen tahdistamisen elokuvan kanssa. (Thiele 1988, 399-400.) Curt Stille myi kehittämänsä patentit englantilaiselle Louis Blatnerille, jonka omistama yritys kehitti Blattnerphon- nimisen teräsnauhatallentimen 1930-luvun alussa. Blattnerfoni ei lopulta saavuttanut suosiota elokuvan äänilähteenä, mutta radiotoiminnassa sitä käytettiin paljon. Esimerkiksi BBC käytti Blattnerfonia puheen välittämiseen. Musiikin tallentaminen ei ollut mielekästä, koska tallentimien nauhakeloja pyörittävien moottorien nopeus oli epätasainen. Myöhemmin englantilainen Marconi-yritys toteutti Blattnerin ideoiden pohjalta kehittyneemmän Marconi-Stille - laitteeksi kutsutun teräsnauhatallentimen, jota englantilaiset käyttivät radiotoiminnassa toisen maailmansodan loppuun asti. (Mullin 1988, 697.) Saksassa teräsnauhatallentimien huippua edusti nk. Lorenz Stahlton - laite, jota käytettiin myös radiotoiminnassa monilla Euroopan radioasemilla (Thiele 1988, 400).

Teräslanka- ja teräsnauhatallentimet olivat koostamisen kannalta huonoja. Teräsnauhaa oli mahdollista leikata ja liittää yhteen hitsaamalla tai niittaamalla, mutta toimenpide oli hankala ja poisti liitoskohdasta tallennetun materiaalin. Suojaamattomattomista tallentimista aiheutui lisäksi koneiden käyttäjille vakavia onnettomuuksia, koska teräsnauhojen reunat olivat erittäin teräviä ja nauhanopeus oli suuri. Muita teräsnauhan huonoja puolia olivat suuri paino ja kalliit valmistus- ja toimituskustannukset. (Thiele 1988, 399-400.)

Vuonna 1928 itävaltalainen Fritz Pfleumer patentoi magneettisessa tallennuksessa käytettävän kerrosrakenteisen nauhan, joka muodostui ei-magneettisesta pohjasta ja ohuesta kerroksesta magneettista materiaalia. Pfleumer oli tupakkateollisuuden toimeksiannosta tutkinut menetelmiä, joiden avulla metallihiukkasia pystyttiin liittämään paperin pinnalle ja oivalsi soveltaa samaa tekniikkaa magneettisen tallennusmedian valmistukseen. Uutta nauhaa käyttävien tallentimien äänipäät ja nauhankuljetusmekanismi oli suunniteltava uudestaan, koska nauha oli terästä herkempää mekaaniselle rasitukselle. Toisaalta nauhan koostaminen oli vihdoin käytännöllistä. Vuonna 1928 Pfleumer rakensi myös tiettävästi maailman ensimmäisen kerrosrakenteista nauhaa käyttävän tallentimen. Vuonna 1930 AEG kiinnostui keksinnöstä ja osti lopulta Pfleumerin aiheeseen liittyvät patentit. (Thiele 1988, 401.)

AEG:n insinöörit havaitsivat pian, että Pfleumerin idea nauhan kerrosrakenteesta oli hyvä, mutta paperin ja rautapulverin yhdistelmä ei sopinut hyvin massatuotantoon. AEG alkoi itse kehittää tallenninta ja antoi nauhan kehityksen BASF-yhtiön tehtäväksi. BASF:in työntekijät testasivat erilaisia pohjamateriaaleja ja päätyivät selluloosa-asetaattiin, jolla oli korkea viskositeetti. Magneettiseksi päällystysmateriaaliksi valittiin rautajauhe, jonka demagnetointiin vaadittava koersitiivivoima oli suuri. Tallennin, jota AEG:llä kutsuttiin Magnetofoniksi, oli pian valmis koekäyttöön, mutta laitteen julkistaminen vuoden 1934 Berliinin radionäyttelyssä jouduttiin perumaan teknisten ongelmien vuoksi. (Engel 1988, 606-608.)

Koekäytössä huomattiin kuitenkin Magnetofonin sopivuus musiikin taltiointiin. Vuoden 1935 huhtikuussa AEG:n työntekijät äänittivät Mannheimin kansallisteatterin muusikoita ja käyttivät nauhoituksia vakuuttamaan Magnetofonin tuotannosta vastaavia johtajia. Magnetofoni esiteltiin julkisesti vuoden 1935 Berliinin radionäyttelyssä ja se saavutti heti suuren suosion. (Engel 1988, 608.) Vuonna 1936 BASF:in työntekijät äänittivät Magnetofonilla Lontoon filharmonikkoja, jotka Saksan vierailun yhteydessä soittivat konsertin tehtaalla. Kyseisestä äänityksestä säilyneet kopiot osoittivat, että magneettisen tallennuksen taso ei ollut vielä yhtä korkea kuin äänilevyn kaiverruksessa voitiin saavuttaa. (Mullin 1988, 697.)

Magnetofonin kehitystä jatkettiin innokkaasti. Vuoden 1939 jälkeen Saksan yleisradio käytti laitetta laajalti ja osallistui myös tekniseen kehitystyöhön. Saksan yleisradion laboratorioissa kehitettiin Walter Weberin johdolla nykyäänkin käytettävä suurtaajuusesimagnetointivirta (engl. bias), joka paransi Magnetofonin hyödynnettävää dynamiikka-aluetta huomattavasti. 1940-luvun alussa myös elokuvatuottajien kiinnostus Magnetofonia kohtaan heräsi, koska ääninauhojen tuottaminen ja käyttö oli halpaa. Radiolähetyksistä ei myöskään enää voinut erottaa, esitettiinkö musiikki suorana lähetyksenä vai oliko esitys tallennettu aiemmin Magnetofonilla.

Toinen maailmansota aiheutti esteitä kehitetyn tekniikan leviämiselle. Saksan yleisradion radiolähetykset kuuluivat kuitenkin Englantiin asti, jossa John T. Mullin ja muut yhdysvaltalaiset viestintäjoukkojen jäsenet olivat vakuuttuneita Magnetofonin mahdollisuuksista. (Thiele 1988, 405.) Sodan jälkeen vuonna 1947 Mullin toi Saksasta Yhdysvaltoihin kaksi Magnetofonia ja muokkasi ne käytettäväksi Bing Crosbyn radio-ohjelmien koostamiseen. Mullin onnistui myös vakuuttamaan Magnetofoneillaan Ampex-yrityksen johdon, joka teki päätöksen nauhureiden tuotannon aloittamisesta. Magnetofonit saavuttivat suuren suosion Yhdysvaltalaisilla radioasemilla. (Mullin 1988, 698.)

2.2 Digitaalisen äänen magneettisen tallennuksen perusteita

Mikrofonin tuottama jännitteen vaihtelu mitataan hetkellisesti eli näytteistetään (ks. kuva 4). Näytteenottojen välinen aika määrää näytteenottotaajuuden.

Kuva 4. Aaltomuodon amplitudi mitataan lyhyin väliajoin. Väritetyt alueet kuvaavat amplitudin arvoa, joka signaalilla oli näytteenottohetkellä.

Hetkelliset arvot muunnetaan analogiadigitaalimuuntimella (lyh. AD-muunnin) digitaalisiksi näytteiksi, jotka esitetään yleisimmin binäärilukuina (ks. kuva 5). Binääriluvuksi muuttamista kutsutaan myös kvantisoinniksi. Binääriluvun bittien lukumäärä määrittää, kuinka monta eri arvoa binääriluvulla voidaan esittää. Bittien lukumäärä määrittelee myös, kuinka suuri virhe näytteistyksessä keskimäärin tulee. Analogisen signaalin hetkellinen mittaustulos sijaitsee keskimäärin kahden peräkkäisen binäärisen arvon välillä. Analoginen arvo joudutaan pyöristämään toiseen kahdesta arvosta (kvantisointi), mistä on seurauksena ns. kvantisointi virhe.

Kuva 5. a) 8-bittinen binääriluku. b) Bittejä vastaavat kahden potenssit. c) Kahden potensseja vastaavat luvut kymmenjärjestelmässä. Lukujen summa on 8-bittisellä luvulla esitettävien erisuurten arvojen suurin määrä. d) Ylinnä olevasta binääriluvusta muodostuu kymmenjärjestelmän luku summaamalla ykkösien kohdalla olevat kakkosien potenssit.

Digitaalitallentimissa äänityssignaali ei välttämättä kyllästy analogitallentimien tapaan. Jos sisääntulevan signaalin taso nousee suurimman esitettävän bittiarvon yläpuolelle, voi AD-muunnoksen seurauksena olla lukualueen toisessa ääripäässä sijaitseva binääriluku. Jos siis äänität esimerkiksi DAT-nauhurilla liian suurilla tasoilla, saattaa koko äänitys epäonnistua, koska säröytyminen on erittäin epämiellyttävän kuuloista.

Näytteet talletetaan nauhalle peräkkäin. Nopealle kovalevylle näytteet voidaan puolestaan tallentaa epälineaarisesti. Toistettaessa kovalevyn hakuajan täytyy siis olla pienempi kuin näytteenottotaajuuden määräämä näyteväli. Näytteet tallennetaan useimmiten erityisiin äänitiedostoihin (esim. .wav - päätteiset tiedostot). Uusimpia äänentallennuksen suuntauksia edustaa äänen perkeptuaalinen koodaus. Ääni muutetaan usein taajuustason esitykseksi, josta poistetaan kuulon kannalta "turhat" komponentit käyttäen hyväksi psykoakustiikan teorioita. Tällaista menetelmää käytetään esimerkiksi Mini Disk-tallentimissa (ATRAC-koodaus) ja MP3-koodauksessa.

Nauhalle digitaalisesti tallentavat laitteet voidaan jakaa kahteen haaraan: Kiinteällä äänipäällä varustetut avokelanauhurit ja pyörivällä äänipäällä varustetut nauhurit (esim. DAT/ADAT). Kiinteällä äänipäällä varustetuissa avokelatallentimissa ongelmana on epäpuhtauksien aiheuttamat virheet. Nauhureissa joudutaankin käyttämään erilaisia virheenkorjausmenetelmiä. Pyörivällä äänipäällä varustetuissa digitaalinauhureissa äänen koostaminen on vaikeaa, koska nauha sijaitsee erityisessä kasetissa. Kiintolevylle talletettaessa koostamisessa voidaan käyttää hyväksi erilaisia tietorakenteita. Valitettavasti useat ohjelmat on toteutettu huonosti: Näytteitä siirretään kovalevyllä paikasta toiseen.

2.2.1 Digitaalisen äänen magneettisen tallennuksen historiaa

Digitaalista ääntä tutkittiin jo 1950-luvulla esimerkiksi Bellin laboratorioissa Yhdysvalloissa. Digitaalinen ääni tallennettiin tietokoneissa käytettäville nauhalaitteille. Käytössä oli myös levymuisteja, joiden tekniikka oli kuitenkin nykyiseen verrattuna alkeellista. Nykyaikainen suljettu kovalevy (winchester disk) kehitettiin vasta 1970-luvun alussa (IBM). Ensimmäiset äänityskäyttöön kehitetyt digitaalinauhurit esiteltiin 1970-luvun alussa.

1970-luvulla kehitettiin myös äänitysjärjestelmiä, joissa hyödynnettiin analogisia videonauhureita. Ennen tallennusta videonauhalle analoginen äänisignaali johdettiin PCM-sovittimeen (engl. pulse code modulation adapter), joka muodosti äänestä kvantisoituja näytteitä. Tämän jälkeen näytteistä muodostettiin binäärinen bittivirta, joka muutettiin ns. pseudovideo aaltomuodoksi tallennettavaksi videonauhurille. Videoformaatin käytostä seurasi myös eräitä erikoisia piirteitä: Esimerkiksi CD-levyn näytteenottotaajuus 44.1 kHz on peräisin videonauhureiden yleisestä käytöstä äänitteiden kantanauhojen tuottamisessa. Kyseinen näytteenottotaajuus oli yksinkertaisessa suhteessa kahdessa eri videoformaatissa (NTSC/PAL) määriteltyihin viivatiheyksiin ja lisäksi se oli tarpeeksi korkea kattamaan äänitaajuudet.

Videonauhureihin perustuvat järjestelmät ohjasivat kehitystä myös jatkossa. Sony suunnitteli nauhuriprototyypin, jossa käytettiin videonauhureiden tapaan pyörivää äänipäätä. Eräs pyörivän äänipään etuja oli suuri nopeus nauhan ja äänipään välillä, jolloin signaali-kohinasuhde parani. Prototyypissä käytettiin nauhaa, jonka leveys oli sama kuin C-kasetin nauhassa. Standardisoinnin tuloksena syntyi nykyäänkin ammattilaisten erittäin laajalti käyttämä DAT-formaatti (engl. digital audio tape). DAT-formaatti ei yleistynyt kuluttajamarkkinoilla, koska laitteita valmistava viihdeteollisuus pelkäsi menettävänsä tuottoja, jos kuluttujat alkaisivat kopioida CD-levyjä.

Kiinteällä äänipäällä toteutetut digitaliset nauhurit kehitettiin korvaamaan analogiset moniraitanauhurit, joiden kohinaominaisuudet olivat mikrofoneja ja analogisia äänipöytiä huonommat. Digitaalinen moniraitanauhuri suunniteltiin siten, että se voitiin kytkeä helposti analogisen nauhurin tilalle. Jotta nauhaa voitiin leikata, käytettiin kiinteällä äänipäällä varustetuissa digitaalisissa nauhureissa avoimia nauhakeloja. Yleisesti digitaalinauhurin ulkonäkö ja toiminta suunniteltiin vastaamaan analoginauhuria. (Watkinson 1988, 499.)

Kiinteällä äänipäällä varustettujen digitaalinauhurien kehitys on ollut analoginauhureihin verrattuna sikäli käänteinen, että kaksikanavaisia nauhureita on esitelty vasta moniraitanauhureiden jälkeen. Kaksikanavaiset nauhurit kehitettiin lähinnä äänitteiden kantanauhan koostamiseen, mikä johti luonoolisesti parannuksiin koostamisessa tarvittavissa ominaisuuksissa. Esimerkiksi Sonyn eräässä stereonauhurissa nauhanopeus oli kaksinkertainen, mikä helpotti leikkauskohtien etsimistä. Nauhaa leikatessa syntyviä virheitä pienennettiin menetelmällä, jossa jokainen näyte tallennettiin nauhalle kahteen kertaan. (Watkinson 1988, 502.)

2.3 Digitaalisen äänen optinen tallennus

Yleisin tätä kurssia koskettava optinen tallennusjärjestelmä on CD (engl. Compact Disk). Teoriassa "tyhjän" CD:n pintaan poltetaan kuoppia, jotka tulkitaan binäärisiksi näytteiksi. Kuoppien reunat vastaavat ykkösiä ja tasaiset kohdat kuopassa tai kuopan ulkopuolella nollia. Käytännössä ääninäytteet koodataan hieman monimutkaisemmin, jotta mahdolliset virheet olisi toistettaessa mahdollista korjata. Toistettaessa CD:n pintaan kohdistetun valon (laser) intensitetti muuttuu kuopan reunoja ja tasaisia kohtia seuraten. (Rossing 1990, 569.)

2.4 Tietokonepohjaisen tallentamisen ja koostamisen teknistä taustaa

Seuraavissa luvuissa esitellään äänen tallennukseen, signaalinkäsittelyyn ja ohjelmointiin liittyviä käsitteitä, jotka muodostavat tietokonepohjaisen koostamisohjelman perustan. Suurin ero nauhatekniikkaan verrattuna on äänen tallennus nauhan sijasta (levy)muistiin, jonka tärkein ominaisuus on tiedon hajasaanti. (Levy)muistissa ääni tallennetaan äänitiedostoihin, joihin viitataan koostamisohjelmassa käytettävässä soittolistassa. Soittolista mahdollistaa tuhoamattoman koostamisen, mikä tarkoittaa äänitiedostojen osien yhdistämistä tosiaikaisesti ja mahdollisuutta perua koostamiseen liittyviä toimenpiteitä.

2.4.1 Tiedon tallentaminen tietokoneen muistiin tai kovalevylle

Tietokonetekniikan mahdollistamia menetelmiä digitaalisen äänen tallennukseen tutkittiin jo varhain. Esimerkiksi Max Mathews (1969: 31) kertoo vuonna 1969 ilmestyneessä kirjassaan, että digitaalisten ääninäytteiden tallennus magneettiselle levylle olisi mahdollista, joskaan menetelmä ei tarjoaisi suurta etua nauhaan nähden. Curtis Abbott (1984: 394) mainitsee Stanfordin yliopiston CCRMA:n (Center for Computer Research in Music and Acoustics) yhdeksi tutkimuslaitoksista, joissa jo varhain käytettiin levymuistia digitaalisen äänen tallentamiseen. Myös John Watkinson (1988: 502) vahvistaa, että magneettisia levyjä käytettiin digitaalisen äänen tallentamiseen, mutta lisää, että laitteista luovuttiin, koska nauhan valmistuskustannukset olivat levyjä alhaisemmat ja tallennuskapasiteetti levyjä suurempi. Tietotekniikassa levytallennus on kuitenkin saavuttanut ylivoimaisesti suosituimman tallennusmuodon aseman. Tällä hetkellä kovalevyt ovat korvautumassa flash-muistiyksiköihin perustuvilla SSD-levyillä (Solid State Drive). SSD-levyissä ei siis ole fyysisesti pyörivää levyä, jolloin luku- ja kirjoitusnopeudet ovat todella nopeita. Tällä hetkellä SSD-levyjen kapasiteetti on vielä pyöriviä kovalevyjä pienempi, mutta audiotallennukseen varsin riittäviä. Vaikka seuraavissa kappaleissa kuvataan "vanhemman" kovalevyn toimintaa, on suurin osa käsitteistä valideja koskien esim. SSD-levyjä.

Levytallennin kehitettiin alun perin nopeaksi tiedon tallennusjärjestelmäksi tietokoneille. Levytallentimessa tiedot tallennetaan pyörivän levyn ympyrän muotoisille raidoille, joita luetaan erityisellä lukupäällä. Lukupää liikkuu levyn säteen suuntaisesti (ks. kuva 5).

Kuva 5. Pyörivän levyn säteen suuntaisesti liikkuva luku- ja kirjoituspää

Lukupään siirtyminen levyn kauimmaisten pisteiden välillä tapahtuu erittäin nopeasti verrattuna nauhan kelaamiseen alusta loppuun. Lukupään ja levyn välissä on ilmaa, jotta suuri pyörimisnopeus ei kuluttaisi levyä. Lukupäähän voi kuitenkin kertyä epäpuhtauksia, jotka kasautuessaan saattavat aiheuttaa levyn rikkoutumisen. Epäpuhtauksien aiheuttamien ongelmien ratkaisemiseksi kehitettiin nykyisissä mikrotietokoneissakin käytettävä suljettu kovalevy (engl. hard disk), jossa levy ja lukupää sijaitsevat ilmatiiviissä kotelossa. (Watkinson 1988: 502-503.)

Levymuistien toiminnassa on olennaista tiedon loogisen ja fyysisen sijainnin erottaminen toisistaan. Tällöin loogisesti peräkkäiset tiedot (esim. ääninäytteet) eivät välttämättä sijaitse fyysisesti peräkkäin levymuistissa. Kun levylle tallennetaan esimerkiksi ääninäytteitä, toimii levymuistin ja ääninäytevirran välissä ohjain, joka hajauttaa tiedot levylle ohjaimen valmistajan suunnittelemalla tavalla (ks. kuva 6).

Kuva 6. Tietojen hajautus levylle levyohjaimen avulla

Levyn rakenteesta johtuen näytteet eivät välttämättä voi sijaita fyysisesti peräkkäin. Kun levyltä luetaan tietoja, muodostaa ohjain alkuperäistä vastaavan näytevirran näytteiden mahdollisesta epäjatkuvasta sijoittelusta. Tällaista menetelmää tiedon tallentamiseksi kutsutaan hajasaanniksi (engl. random access).

Moorer (1990: 3) painottaa lisäksi levyohjaimen sijainnin merkitystä tietokoneen hierarkiassa: useissa levyissä ohjain on toteutettu erillisenä tietokoneen käyttöjärjestelmään liittyvänä ohjelmana, mutta esimerkiksi SCSI-levyissä ohjain on integroitu fyysisesti levyyn. Jos koostamisohjelman tekijä haluaa optimoida näytteiden sijoituksen, hänen on valittava levy, jonka ohjaimeen on mahdollista tehdä muutoksia. Osa varhaisista artikkeleista, jotka liittyvät hajasaantimuistiin perustuvaan koostamiseen, käsittelevätkin erilaisten ulkoisten laitteiden toiminnan optimointia.

1970- ja 1980-luvun vaihteessa kehitettiin erityisiä äänitiedostojärjestelmiä, joissa näytteet sijoitettiin fyysisesti peräkkäin levylle. Tällöin levyn käyttö muistutti lähinnä digitaalinauhurin toimintaa. Näytteiden haluttiin sijoittaa levylle peräkkäin, koska tavanomainen levyohjain saattoi hajauttaa näytteet niin kauas toisistaan, ettei levyn lukupää ehtinyt hakea näytettä näytevälin määräämässä ajassa. (Pope & van Rossum 1995: 28.)

Edellä mainittu ongelma aiheutui todennäköisesti levyjen hitaasta toiminnasta eikä levyohjaimen huonosta suunnittelusta. Koska levymuistien hajasaantikykyä haluttiin käyttää paremmin hyväksi koostamisessa, esitettiin menetelmä, jolla digitaalinen ääni hajautetaan kovalevylle siten, että hakuajat pysyvät lähes riippumattomina tallennuskohdasta. Levyn suorituskyky laski silti vain 80 prosenttiin teoreettisesti suurimmasta mahdollisesta. Menetelmän kehittämisen eräänä syynä oli monikanavaisen äänitiedoston jakaminen kanavakohtaisesti eri tiedostoihin, jolloin kanavien keskinäistä ajallista suhdetta voitiin helposti muokata. (Abbott 1984: 394.)

Mikrotietokoneiden aikakaudella osasta laitteita, esimerkiksi kovalevyistä ja äänikorteista, on tullut standardinomaisia komponentteja, joiden matalan tason toiminta on tietokoneen käyttäjälle käytännössä näkymätöntä. Tutkimustyö, joka minitietokoneiden aikakaudella pyrki äänen tallennuksessa levyjen sujuvaan ja tehokkaaseen käyttöön, johti kuitenkin erilaisten äänitiedostomuotojen syntyyn (Pope & van Rossum 1995: 28).

2.4.2 Äänen tallennus äänitiedostoihin

Tietokoneella käsiteltävät äänet tallennetaan useimmiten erityisesti ääninäytteitä varten määriteltyyn äänitiedostoon. Vaikka äänitiedostomuotoja on useita erilaisia, ne voidaan jakaa kahteen pääryhmään: itsemääritteleviin ja otsikoimattomiin äänitiedostomuotoihin (ks. kuva 7). Itsemäärittelevät äänitiedostomuodot voidaan lisäksi jakaa kiinteä- tai vaihtuvaotsikkoisiin. (Pope & van Rossum 1995: 33-35.)

Kuva 7. Äänitiedostomuotojen jaottelu puurakenteen avulla

Otsikoimattomissa äänitiedostomuodoissa tallennustapaan liittyvät tiedot ovat ennalta sovittuja, mikä käytännössä rajoittaa monipuolista äänen käsittelyä. Tallennustapaan olennaisesti liittyviä tietoja ovat esimerkiksi näytteenottotaajuus, näytteiden bittien määrä ja erillisten äänikanavien lukumäärä. Itsemäärittelevissä äänitiedostomuodoissa tallennustapaan liittyvät tiedot tallennetaan useimmiten tietorakenteeseen, jota kutsutaan äänitiedoston otsikoksi (engl. header). Otsikko sijaitsee äänitiedoston alussa ja varsinaiset ääninäytteet seuraavat sitä. Ohjelma, joka soittaa äänitiedostoja, käyttää äänitiedoston otsikkoa D/A-muuntimen alustamiseen. Itsemäärittelevissä kiinteäotsikkoisissa tiedostomuodoissa otsikko sisältää aina samat tallennustavan määrittelevät tiedot. Otsikkoa seuraavat ääninäytteet (ks. kuva 8). Esimerkiksi NeXT- ja Sun-yhtiöiden määrittelemä ns. SND-äänitiedostomuoto sisältää kiinteän otsikon. Itsemäärittelevät vaihtuvaotsikkoiset äänitiedostot voivat sisältää useampia erikokoisia otsikoita eri kohdissa tiedostoa, mikä edellyttää monimutkaisempia ohjelmia tiedostojen lukemiseen ja kirjoittamiseen.

Kuva 8. Äänen ominaisuuksia kuvaavan otsikon sisältävä äänitiedosto

Yleinen vaihtuvaotsikkoinen äänitiedostomuoto on Microsoftin ja IBM:n RIFF-tallennusmuotoon sisältyvä WAV (RIFF 1.0 - Multimedia Programming Interface and Data Specifications 1.0). WAV-tiedosto koostuu lohkoista (engl. Chunk), jotka voivat olla sisäkkäisiä. WAV-tiedosto alkaa RIFF-otsikolla, joka koostuu kirjaimista “RIFF” ja neljästä tavusta, jotka ilmoittavat koko tiedoston koon (ks. Kuva 9). RIFF-otsikon jälkeen seuraa WAV-lohko, joka koostuu kirjaimista “WAVE” ja kahdesta tärkeästä alilohkosta: äänitietoa kuvaavasta otsikosta ja ääninäytteistä. Äänitietoa kuvaava otsikko sisältää tietoa esimerkiksi ääninäytteiden määrästä, näytteenottotaajuudesta ja ääninäytteiden bittien määrästä.

Kuva 9. Wav-tiedoston 44 tavusta koostuva otsikko

Nykyaikaiset käyttöjärjestelmät huolehtivat itse tiedon hajautuksesta kovalevylle. Äänitiedoston sisältämät ääninäytteet saattavat siis sijaita epäjatkuvasti muistissa, vaikka tiedon hajautus ei ole ilmeistä tietokoneen käyttäjälle.

2.4.3 Äänenvoimakkuuden muokkaaminen leikkauskohdissa

Yleensä ääni asetetaan koostettaessa toisen äänen tai digitaalisen hiljaisuuden viereen. Molemmissa tapauksissa on tarpeellista rajoittaa rajakohtien äänenvoimakkuutta häivytyksellä tai nostolla erilaisten häiriöäänten välttämiseksi. Jos liitettävien äänten rajakohdan ääninäytteiden arvot eroavat toisistaan huomattavasti, aiheuttaa äkillinen epäjatkuvuus häiritsevän naksahduksen.

Digitaaliseen ääneen tehdään häivytys tai nosto kertomalla leikkauskohtaa ympäröivä alue vaippakäyrällä, jonka muoto saattaa vaihdella halutusta lopputuloksesta riippuen (ks. kuva 10).

Kuva 10. Erilaisia muotoja, joilla häivytyksiä voidaan tehdä a) lineaarinen, b) eksponentiaalinen.

Ääneen voidaan joutua tekemään häivytys tai nosto, jos se liitetään hiljaisuuteen (ks. kuva 11). Kohdassa a) siniäänen liittäminen hiljaisuuteen on tehty ilman häivytystä. Aaltomuoto katkeaa äkkinäisesti, mikä todennäköisesti aiheuttaa häiriöitä toistettaessa leikkauskohtaa. Kohdassa b) siniääni on vaimennettu käyttämällä lineaarista vaimennusta. Tässä tapauksessa leikkauskohdassa ei ole epäjatkuvuutta.

Kuva 11. Siniäänen liittäminen hiljaisuuteen ilman häivytystä ja häivytyksen kanssa

Ristihäivytyksellä tarkoitetaan liitettävien äänten osittaista päällekkäin asettelua, jossa ajallisesti ensimmäinen ääni häivytetään ja jälkimmäinen nostetaan (ks. kuva 12). Tapauksissa A ja B summataan päällekkäin kahden siniäänen harmaalla merkityt alueet. Harmaassa alueessa näkyy lisäksi lineaarinen nosto ja häivytys. Tapauksessa A liitos on tehty ilman häivytystä, jolloin liitoskohdan rajoilla on nähtävissä selvät epäjatkuvuudet. Tapauksessa B liitos on tehty ristiin häivyttämällä, jolloin epäjatkuvuuksia ei ole havaittavissa.

Kuva 12. Eri vaiheessa olevien siniäänten liittäminen toisiinsa

Lineaarista ristihäivytystä voidaan kutsua äänen amplitudin suhteen tasapainotetuksi menetelmäksi. Jos ristihäivytettävät äänet ovat täysin samanlaisia, lineaarinen menetelmä ei muuta signaalin amplitudia. Jos ristihäivytettävät äänet ovat keskenään erilaisia (tilastollisesti korreloimattomia), ei lineaarinen häivytys muodosta yhtenäistä äänenvoimakkuutta häiveen ajalle. Tällöin tulisi käyttää signaalien energioiden suhteen tasapainotettua häivytystä. Musiikillista materiaalia koostettaessa myös kahden edellisen vaihtoehdon välimuodot voivat tulla kyseeseen. (Moorer 1990: 4-5.)

Ristihäivytys on mahdollista tehdä usealla eri tavalla. Ristihäivytykseen käytettävät äänet voidaan käsitellä samoin säännöin, jolloin molemmat äänet osallistuvat ristihäiveeseen yhtä pitkällä ajallisella osuudella. Toisaalta voidaan tehdä ristihäivytys, jossa toisesta äänestä käytetään toista pidempi osuus. Myös sellainen ristihäivytys on mahdollinen, jossa kahden äänen keskinäinen suhteellinen ajallinen sijainti säilytetään: toisen äänen ajallista osuutta häivytykseen vähennetään yhtä paljon kuin toisen osuutta lisätään. (Moorer 1990: 2.)

Moorer (1990: 3-4) erittelee neljä erilaista häivytystyyppiä ohjelmallisen toteutuksen perusteella: muistiton, ennalta laskettu, ennalta tallennettu ja uudelleen laskettu häive. Tätä jakoa tarkasteltaessa on mainittava, että järjestelmät, joita Moorer on suunnitellut, perustuvat pitkälti erikoisosien, -ohjelmistojen ja -käyttöjärjestelmien hyödyntämiseen. Jotkut edellä mainituista häivytystyypeistä saattavat näin ollen vaikuttaa keinotekoisilta suhteutettuna yleiskäyttöisten PC-tietokoneiden laitekokoonpanoihin.

Muistiton häivytys tehdään yleensä tosiaikaisesti käsin ohjattavalla kytkimellä, jonka jälkeen tulos talletetaan. Jos häivytystä halutaan muuttaa, on häivytys ja tallennus tehtävä uudestaan. Muistiton häivytys on käyttökelpoinen lähinnä koostettaessa nauhaa.

Ennalta laskettu häivytys toteutetaan laskemalla soittolistan osoittamat häivytykset keskusmuistiin. Tätä menetelmää käytettäessä voi ongelmaksi muodostua keskusmuistin pieni määrä verrattuna esimerkiksi levymuisteihin, mikä saattaa rajoittaa mahdollisten häivytysten määrää. Häivytykset on lisäksi siirrettävä toiselle medialle, koska yleensä keskusmuistiin talletettu tieto häviää, kun tietokoneesta kytketään virta pois.

Ennalta tallennettu häivytys toteutetaan nimensä mukaisesti tallentamalla häivytyksen tulos tietokoneen kovalevylle. Häivytys toistetaan lukemalla kovalevyä kohdasta, johon häivytys on tallennettu. Ennalta tallennettuja häivytyksiä ei voi tehdä tosiaikaisesti. Tietokoneen suorituskyvystä riippuen häivytyksen laskeminen ja tallennus saattaa kestää jopa yhtä kauan kuin häive kestää soitettaessa. Ennalta tallennetut häivytykset vievät myös tilaa kovalevyltä.

Uudelleen laskettu häivytys toteutetaan laskemalla häive tietokoneella tosiaikaisesti. Suoraan kovalevyltä luetut ääninäytteet kerrotaan häivytyksen vaippakäyrän arvoilla ja mahdolliset ristihäivytysäänet summataan esimerkiksi erillisessä signaaliprosessorissa. Ennalta lasketut häivytykset voidaan toteuttaa tosiaikaisesti, mutta ne asettavat suuria vaatimuksia koostamisjärjestelmälle. Häivytyksen aikana järjestelmä saattaa joutua työskentelemään jopa kaksi kertaa normaalia enemmän. Toinen ongelma uudelleen lasketuissa häivytyksissä on se, että useita häivytyksiä ei voi olla päällekkäin. Edellinen häivytys on tallennettava levylle, jos päälle halutaan tehdä uusi.

Moorerin (1990: 4) mielestä paras vaihtoehto olisi yhdistää uudelleen laskettujen ja ennalta talletettujen häivytysten toteutukset. Häivytys kuunnellaan signaaliprosessorin läpi ja talletetaan levylle. Tämän vaihtoehdon ongelma on se, että useita peräkkäisiä häivytyksiä ei ole mahdollista muokata puuttumatta viimeisimpään.

2.4.4 Koostaminen soittolistan avulla

Roads (1996: 759) mainitsee, että vain digitaalisen äänen koostamisessa voidaan käyttää hyväksi äänimateriaalia tuhoamatonta koostamista (engl. nondestructive editing). Ennen leikkauksen tekemistä voidaan kuunnella leikkauksen lopputulosta leikkauskohdan ympäriltä. Kuuntelun perusteella tehdään päätös leikkauksen suorittamisesta. Roads viittaa määritelmässään jo hieman vanhentuneeseen ohjelmatyyppiin, jossa ääninäytteitä luetaan tietokoneen keskusmuistiin, mutta todellinen leikkaus tehdään muokkaamalla äänitiedostoja.

Tuhoamattomalla koostamisella tarkoitetaan myös menetelmää, jossa käytetään hyväksi viittauksia fyysisten äänitiedostojen osiin. Viittaukset muodostavat ohjausrakenteen, jota kutsutaan soittolistaksi (engl. splice table) (Ingebretsen & Stockham 1984: 116). Kun muokattua ääntä halutaan kuunnella, soitetaan soittolistassa viitattujen äänitiedostojen osat halutussa järjestyksessä.

Koostettaessa luotava soittolista muodostaa ajallisesti lineaarisen rakenteen epälineaarisesti järjestetyistä äänitiedostoista. Yksinkertainen tapahtuma on soittolistan rivi, joka kuvaa osan yksittäisestä äänitiedostosta. On myös mahdollista muodostaa useita soittolistoja, jotka voivat kuvata koostamisen tilaa eri aikoina. Erillisiä soittolistoja voidaan käyttää lisäksi kahden ajallisesti päällekkäisen tapahtuman kuvaamiseen. Kehittyneempi kuvaus saavutetaan yhdistämällä kaksi edellistä periaatetta. Soittolista voidaan tallettaa esimerkiksi tavalliseen tekstitiedostoon ja sitä voidaan muokata tekstinkäsittelyohjelmalla.

Kun käytetään hyväksi soittolistaa, ei Roadsin esittämää todellista fyysistä leikkausta tarvita lainkaan. Soittolista mahdollistaa myös tehtyjen toimenpiteiden perumisen. Tietokoneen muistiin voidaan tallentaa useita versioita soittolistasta, jotka vastaavat koostamistilanteita eri ajanhetkinä. Yhden soittolistan sisältämille viittauksille voidaan antaa järjestysnumerot, tai ne voidaan järjestää peräkkäin (ks. kuva 13), jolloin syntyvää rakennetta on helpompi arvioida silmämääräisesti.

Kuva 13. Esimerkki äänitiedostojen yhdistämiseen käytetystä soittolistasta

Soittolistan ensimmäisellä rivillä viitataan äänitiedostoon nimeltä Otto_1, jonka todellinen pituus on 300 näytettä. Soitto aloitetaan kuitenkin soittolistan perusteella kohdasta 10 näytettä tiedoston alusta ja soittoa jatketaan 30 näytteen verran. Seuraavaksi siirrytään soittolistassa yksi rivi alaspäin, jolloin luetaan Otto_2-niminen äänitiedosto koko pituudeltaan. Eräs soittolistan merkittäviä etuja tulee esille riveillä kolme ja neljä: kolmannella rivillä viitataan myöhempään kohtaan Otto_3-nimisessä äänitiedostossa kuin rivillä neljä. Soittolista muuttaa äänitiedoston lineaarisen aikakäsityksen.

Soittolistan käyttäminen mahdollistaa myös tehtyjen koostamistoimenpiteiden perumisen. Kun ohjelmassa suoritetaan esimerkiksi leikkaus, voidaan käytössä oleva soittolista jättää entiselleen ja muodostaa kokonaan uusi lista. Jos muodostettavat soittolistat pidetään järjestyksessä, voidaan tehty toimenpide perua palaamalla tilannetta edeltävään soittolistaan (ks. kuva 14). Useat soittolistat mahdollistavat myös tietyssä määrin peruttujen toimenpiteiden uusimisen.

Kuva 14. Järjestettyjen soittolistojen käyttäminen koostamistoimenpiteiden perumiseen

2.4.5 Tieteellisesti dokumentoiduista koostamisjärjestelmistä

Yhdysvaltalaisen Soundstream-yhtiön koostamiseen tarkoitettu työasema oli ensimmäisiä kaupallisia laitteistoja, jossa käytettiin levymuistia ja joka mahdollisti toistettaessa ääninäytteiden saumattoman liittämisen peräkkäin tosiaikaisesti. Laitteiston tekijät nimesivät tosiaikaisen menetelmän jatkuvaksi hajasaantikoostamiseksi (engl. continuous random-access editing). Samassa yhtiössä oli kehitetty jo 1970-luvun puolivälissä samantyyppinen koostamisjärjestelmä, joka ei kuitenkaan toiminut tosiaikaisesti, koska äänitiedostot oli kopioitava ennen soittoa nauhalle. (Ingebretsen & Stockham 1984: 114-115.)

Vuonna 1985 BBC (British Broadcasting Company) kehitti hajapääsymuistia käyttävän koostamisjärjestelmän yhteistyössä Studer-yhtiön kanssa. Euroopassa tietokonetekniikan edut havaittiin siis vasta noin kymmenen vuotta Yhdysvaltoja myöhemmin. BBC:n järjestelmä oli alkeellinen verrattuna Soundtsream-yhtiön laitteisiin: Kirbyn (1988: 368) mukaan BBC:n prototyyppilaitteistolla voitiin käsitellä vain kuuden minuutin mittaisia ääniä, kun Ingebretsen (1984: 114) puolestaan mainitsee, että Soundstreamin laitteistolla oli koostettu vuoteen 1984 mennessä jo yli 200 kaupallista äänitettä. Edellä mainitut järjestelmät eivät olleet ohjelmiston osalta siirrettäviä, koska ne eivät toimineet yleiskäyttöisillä käyttöjärjestelmillä tai laitteistoilla.

Moorer & al. (1986) esittivät laajan äänen koostamiseen soveltuvan arkkitehtuurin (Digital Audio Processing Station), joka oli suunnattu ammattikäyttöön ja koostui käytännössä kokonaan erikoisosista. Järjestelmän suunnittelun painopiste oli ajan huipputekniikan soveltamisessa ammattimaiseen äänituotantoon, mikä tarkoitti myös sitä, että järjestelmä oli erittäin laitteistoriippuvainen.

Yleiskäyttöisten tietokoneiden käyttämistä koostamisen apuvälineenä pohdittiin myös varhaisessa vaiheessa. Pope (1995:2) pitää erityisen merkittävänä tietokone-musiikkijärjestelmien kehityksessä vuonna 1977 alkanutta viiden vuoden jaksoa. Tällöin esiteltiin esimerkiksi Apple II ja IBM PC. Samaan aikaan myös UNIX-käyttöjärjestelmän suosio kasvoi ensin minitietokoneiden ja myöhemmin tehokkaampien työasemien myötä. Minitietokoneella tarkoitettiin esimerkiksi DEC PDP-11 ja DEC VAX-tietokonetta.

Griffiths ja Bloom (1981) esittivät minitietokoneelle kirjoitetun ohjelman, jonka avulla voitiin koostaa ääntä kovalevypohjaisesti. Järjestelmä oli osittain siirrettävissä laitteistoympäristöjen välillä: Ohjelma oli kirjoitettu yleiskäyttöisellä FORTRAN-kielellä, mutta ääninäytteiden talletukseen käytettiin räätälöityä tiedostojärjestelmää, jonka toiminta perustui peräkkäisten levylohkojen käyttämiseen ja eri äänikanavien näytteiden lomittamiseen.

Sound Kit oli yksi varhaisia Macintosh-tietokoneille ohjelmoituja järjestelmiä. Sound Kitin merkittävyyttä lisää se, että se sisältää ensimmäisen kuvauksen olio-ohjelmoitavasta koostamisjärjestelmästä. Koostamistoimenpiteistä pidettiin kirjaa ja käyttäjä pystyi halutessaan tarkastelemaan tehtyjä koostamistoimenpiteitä puurakenteena, joka voitiin ymmärtää myös äänen korkean tason kuvauksena. Sound Kit oli ohjelmoitu Smalltalk-80 olio-ohjelmointikielellä. (Lentczner 1985.)

Weisser, Komly ja Seidel (1986) esittivät puolestaan kovalevyäänitysjärjestelmän muodostamiseksi mallin, jossa kiinnitettiin erityistä huomiota järjestelmän osien helppoon saatavuuteen. Järjestelmä oli rakennettu mikrotietokoneen ympärille, eikä juuri muutoin poikennut aiemmista minitietokoneille kirjoitetuista toteutuksista. Järjestelmässä toimivasta ohjelmistosta ei myöskään esitetty kuvausta.

MacMix oli Adrian Freedin IRCAM:ssa (Institut de Recherche et Coordination Acoustique/Musique) ohjelmoima kovalevykoostamiseen tarkoitettu järjestelmä, jonka Studer-yhtiö muokkasi myöhemmin kaupalliseksi tuotteeksi (Studer/Editech-laitteisto). MacMix koostui Macintosh tietokoneen graafisesta käyttöliittymästä ja erilliseen keskustietokoneeseen muodostetusta yhteydestä. Järjestelmän suunnittelun lähtökohta oli se, että suuret määrät äänitiedostoja säilytetään vain yhdessä paikassa keskustietokoneella ja useat käyttäjät voivat muokata tiedostoja MacMix:n avulla. (Freed 1987.)

NeXT-tietokoneisiin suunniteltu SoundKit esiteltiin 1988 ja se lähestyi olio-suuntautuneesti äänen muokkaamista. Toiminnallisesta rajallisuudesta huolimatta SoundKit oli mielenkiintoinen, koska järjestelmästä oli saatavissa yksityiskohtaista tietoa ohjelmakoodin ja dokumentaation tasolla. Esimerkiksi Sound-luokka sisälsi useita peräkkäisiä viittauksia äänitiedostoon, mikä tarkoitti, että sen avulla voitiin koostaa ääntä tuhoamattomasti. Luokka sisälsi myös toimenpiteet, joilla koostamisen tuloksena fragmentoitunut ääni koottiin kovalevylle yhtenäiseksi. (Jaffe & Boynton 1989.) Menetelmiä Sound-luokan tietojen tallentamisesta myöhempää käyttöä varten ei esitetty, joskin tämä olisi ollut mahdollista, ja ennen kaikkea tarpeellista, toimivan koostamisohjelman toteuttamiseksi.

Kyma oli säveltämisen apuvälineeksi tarkoitettu järjestelmä, jonka merkittäviin ominaisuuksiin kuului ääniolioiden hierarkkinen järjestäminen. Hierarkkisen järjestämisen avulla ääniolioiden tekninen ja filosofinen raja kaventui. Kyma-järjestelmä mahdollisti myös ääniolioiden peräkkäisen järjestämisen ajassa, minkä avulla olisi voitu toteuttaa koostamisohjelman toiminnallisuus. Kyma-järjestelmä liitettiin ulkoiseen tosiaikaiseen signaaliprosessoriin, mikä rajoitti järjestelmän siirrettävyyttä. (Scaletti 1989.)

Ircamissa kehitetty SignalEditor oli järjestelmä, joka koostui graafisesta käyttöliittymästä, äänen analysointiyksiköstä, tiedostojärjestelmästä ja äänenmuokkaus-ympäristöstä. Tiedostojärjestelmässä käytettiin virtuaalitiedostoja, jotka koostuivat hakemistossa olevista pienemmistä äänitiedostoista. Hakemistossa olevien äänitiedostojen soittojärjestys muodostettiin äänitiedostojen nimien aakkosjärjestyksen perusteella. (Eckel 1990.) Ei ole kuitenkaan selvää, käytettiinkö virtuaalitiedoston muodostavan hakemiston sisällä soittolistaa, jolla viitattiin alueisiin äänitiedostojen sisällä.

Lähteet

Abbott, Curtis 1984. Efficient Editing of Digital Sound on Disk. The Journal of the Audio Engineering Society, Vol. 32, No. 6, June, pp.394 – 402.

Eckel, Gerhard 1990. A Signal Editor for the IRCAM Musical Workstation. Proceedings of the International Computer Music Conferense. Glasgow: International Computer Music Association.

Engel, F. K. 1988. Magnetic Tape From the Early Days to the Present. Journal of the Audio Engineering Society, Vol. 36, No. 7/8, July/August, pp.606 - 616

Freed, Adrian 1987. Recording, Mixing, and Signal Processing on a Personal Computer. Proceedings of the AES 5th International Conference on Music and Digital Technology.

Huber, D. M. & Runstein, R. E. 1989. Modern Recording Techniques. Third edition. Howard W. Sams & Company. ISBN 0-672-22682-0

Ingebretsen R. B. & Stockham, T. G. 1984. Random-Access Editing of Digital Audio. Journal of the Audio Engineering Society, Vol. 32, Number 3 pp. 114

Jaffe, David & Boynton, Lee 1989. An Overview of the Sound and Music Kits for the NeXT Computer. Teoksessa S.T. Pope (ed.). The Well-Tempered Object: Musical Applications of Object-Oriented Software Technology. Cambridge: MIT Press.

Kirby, D. G. 1988. The exploitation and realisation of a random access digital audio editor. Presented at the 85th Convention 1988 November 3-6 Los Angeles. An Audio Engineering Society Preprint.

Lentczner, Mark 1985. Sound Kit - A Sound Manipulator. Proceedings of the International Computer Music Conference 1985. San Francisco: International Computer Music Association.

Mathews, Max V. 1969. The Technology of Computer Music. The M.I.T Press.

Moorer, James A. & Abbott, Curtis. & Nye, Peter. & Borish, Jeffrey. & Snell, John. 1986. The Digital Audio Processing Station: A New Concept in Audio Postproduction. The Journal of the Audio Engineering Society, Vol. 34, No. 6 pp. 454.

Moorer, James A. 1990. Hard-disk recording and editing of digital audio. Presented at the 89th Convention 1990-09. An Audio Engineering Society Preprint.

Pope, Stephen T. 1995. Computer Music Workstations I Have Known and Loved. Proceedings of the International Computer Music Conference 1995. Banff, Alberta, Canada: International Computer Music Association.

Pope, Stephen T. & van Rossum, G. 1995. Machine Tongues XVIII: A Child's Garden of Sound File Formats. Computer Music Journal, 19:1, pp. 25-63, Spring 1995.

Roads, Curtis. 1996. The Computer Music Tutorial. Cambridge: The MIT Press. ISBN 0-262-68082-3.

Rossing T. D. 1990. The Science of Sound. 2nd ed. Addison-Wesley. ISBN 0-201-15727-6

Scaletti, Carla. 1989 The Kyma/Platypus Computer Music Workstation. Teoksessa S.T. Pope (ed.). The Well-Tempered Object: Musical Applications of Object-Oriented Software Technology. Cambridge: MIT Press.

Thiele, H. H. K. 1988. Magnetic Sound Recording in Europe up to 1945. Journal of the Audio Engineering Society, Vol. 36, No. 5, May, pp. 393 - 408

Watkinson, J. 1988. Digital Audio. Journal of the Audio Engineering Society, Vol. 36, No. 6, June, pp. 492 - 508