Gerviröddin
Tæknin gerir okkur nú kleift að hugsa um röddina 'eins og við hugsum um leturgerðir fyrir skrifaðan texta.'

Shutterstock / Pablo Inones
Þegar Roger Ebert missti neðri kjálkann - og þar með röddina - úr krabbameini, stofnaði texta-í-talfyrirtækið CereProc gervirödd sem væri sérsniðið fyrir kvikmyndagagnrýnandann. Tölvustýrða röddin, samruni þeirra orða sem Ebert hafði tekið upp á löngum ferli sínum, myndi ekki hljóma fullkomlega eðlileg; það myndi hins vegar hljóma áberandi. Það var ætlað að hjálpa Ebert að endurheimta eitthvað sem hann hafði misst með því að fjarlægja raddböndin: eigin rödd.Flestir eru ekki svo heppnir. Þeir sem hafa fengið heilablóðfall - eða sem búa við sjúkdóma eins og Parkinsonsveiki eða heilalömun - treysta oft á útgáfur af tilbúnum röddum sem eru algjörlega almennar í fæðingu þeirra. (Hugsaðu um tölvutæka eintóna Stephen Hawking. Eða um Alex , rödd VoiceOver hugbúnaðar Apple.) Góðu fréttirnar eru þær að það er hægt að heyra í þessu fólki; slæmu fréttirnar eru þær að þeim hefur enn verið rænt einu af kraftmestu hlutum sem rödd getur gefið okkur: einstaka og heyranlega sjálfsmynd. Uppi í Boston, Rupal Patel er að vonast til að breyta því. Hún og samstarfsmaður hennar, Tim Bunnell Nemours AI DuPont sjúkrahúsið fyrir börn, hafa í nokkur ár verið að þróa reiknirit sem byggja upp raddir fyrir þá sem ekki geta talað—án tölvuaðstoðar. Raddirnar eru ekki bara náttúrulega hljómandi; þau eru líka einstök. Þetta eru raddgervitæki, í meginatriðum, sniðin að núverandi röddum (og, almennt séð, auðkenni) notenda þeirra. Þeir eru byggðir á hugmyndinni, sagði Patel mér, að tæknin gerir okkur nú kleift að hugsa um röddina „alveg eins og við hugsum um leturgerðir fyrir skrifaðan texta.“Það virkar svona : Sjálfboðaliðar koma í vinnustofu og lesa í gegnum nokkur þúsund dæmisögur (fengnar úr bókum eins og White Fang og Hinn dásamlegi galdrakarl í Oz ). Patel, Bunnell og teymi þeirra taka síðan upptökur af eigin rödd viðtakanda, ef mögulegt er, til að fá tilfinningu fyrir tónhæð og tóni hennar. (Ef viðtakandinn hefur alls enga rödd, velur hann fyrir hluti eins og kyn, aldur og svæðisbundinn uppruna.) Síðan klippir teymið raddupptökurnar niður í öreiningar af talmáli (með t.d. einum sérhljóða sem samanstendur af nokkrar af þessum einingum). Síðan, með því að nota hugbúnað sem þeir bjuggu til- VocaliD , það er kallað-þau blanda saman raddsýnunum tveimur til að búa til nýtt, verkfræðilegt orðasafn: hljóðrænt safn orða sem eru til ráðstöfunar einstaklings sem þarf á þeim að halda til að hafa samskipti.Þetta er, þrátt fyrir reikniritaðstoð, vandað ferli. Að búa til rödd sem er einfaldlega nothæf, Nýr vísindamaður athugasemdum , krefst þess að gjafa lesi að minnsta kosti (að minnsta kosti!) 800 setningar. Og til að koma með rödd sem hljómar tiltölulega eðlilega þarf að lesa upphátt 3.000 setningar. Auk þess krefst núverandi kerfi - mannleg upptaka ásamt reikniritmi endurhljóðblöndun - líkamlega nærveru raddgjafa.„Núna,“ sagði Patel mér, „ferlið okkar er að kalla fólk inn á rannsóknarstofuna – og það mælist ekki.Þrátt fyrir allar þessar hindranir virðist fólk þó hafa áhuga á að ljá þeim sem þurfa á rödd sína. Patel, í hlutverki sínu sem dósent við Northeastern University , er nú að þróa Human Voicebank Initiative, verkefni sem miðar að því að búa til geymslu mannlegra radda sem hægt er að gefa fólki sem hefur ekki eigin raddir. Frumkvæðið eru nú meira en 10.000 manns skráðir sem raddgjafar , segir Patel. Hún og teymi hennar eru í því ferli að byggja upp tækniinnviði verkefnisins, þróa verkfæri eins og vefþjón og iPhone app sem gerir gjöfum kleift að gera sínar eigin upptökur á sínum tíma.Það er kannski viðeigandi notkun á tækjunum sem munu í auknum mæli kalla á mannlegar raddir fyrir skipanir sínar. „Þegar við erum að hugsa um tækni sem þú og ég notum og treystum á, þá ætlum við nú að nota tal miklu meira,“ segir Patel. 'Við tölum við símana okkar og símarnir okkar tala við okkur.'