ChatGPT uudet äänet: huolellinen valintaprosessi
OpenAI julkaisi taustatietoa ChatGPT uusista äänistä, jotka lanseerattiin alun perin syyskuussa 2023. Äänivalinta oli pitkä ja tarkka prosessi, jossa OpenAI teki yhteistyötä ääni- ja näyttelijäteollisuuden huippuammattilaisten kanssa. Viisi ääntä—Breeze, Cove, Ember, Juniper ja Sky—valittiin yli 400 näytteen joukosta. Äänien valinta kesti viisi kuukautta ja sisälsi lukuisia vaiheita, kuten auditionit, kriteerien määrittelyn ja läheiset keskustelut äänenäyttelijöiden kanssa. Näiden lisäksi OpenAI teki tiivistä yhteistyötä palkittujen casting-ohjaajien ja tuottajien kanssa.
Kriteerit äänen valinnalle
OpenAI asetti tietyt kriteerit valitessaan ääniä ChatGPT. Valittujen äänien tuli olla ajattomia ja helposti kuunneltavia, sävyltään lämpimiä ja karismaattisia sekä luottamusta herättäviä ja luonnollisia puhetyyliltään. Näyttelijöiltä edellytettiin monipuolista taustaa ja mahdollisesti kykyä puhua useita kieliä. Näiden ominaisuuksien tavoitteena oli luoda ääniä, jotka puhuttelevat laajaa yleisöä ja edistävät miellyttävää vuorovaikutusta ChatGPT käyttäjien kanssa.
Ääninäyttelijöiden valintaprosessi
Toukokuussa 2023 OpenAI ja casting-tiimi vastaanottivat yli 400 ääninäytettä näyttelijöiltä ympäri maailmaa. Näytteet sisälsivät skenaarioita, kuten käyttäjien matkasuunnitelmien ideointia tai keskusteluja päivän tapahtumista. Näistä karsittiin ensin 14 parasta ääntä, ja lopulliset viisi valittiin tarkkaan harkinnan jälkeen. Ääninäyttelijät matkustivat OpenAI San Franciscon toimistolle kesä- ja heinäkuussa 2023. Siellä he osallistuivat nauhoituksiin ja työskentelivät tiiviisti OpenAI tuote- ja tutkimusryhmien kanssa.
Sky-äänen kiista ja OpenAI vastaus
Ääni nimeltä Sky herätti kiistaa, kun sen väitettiin muistuttavan Scarlett Johanssonin ääntä. OpenAI toimitusjohtaja Sam Altman kuitenkin korosti, että ääni ei ollut jäljitelmä ja että sen valinta tehtiin ennen kuin näyttelijään oltiin yhteydessä. Altman esitti julkisen anteeksipyynnön Johanssonille ja ilmoitti, että Sky-äänen käyttö keskeytetään toistaiseksi.
GPT-4o ja tulevat äänikehitykset
Toukokuussa 2024 OpenAI lanseerasi GPT-4o-version, joka toi mukanaan uuden Voice Mode -ominaisuuden maksullisille käyttäjille. Tämä uusi ominaisuus mahdollistaa entistä sujuvamman puhevuorovaikutuksen, taustamelun suodattamisen ja ryhmäkeskustelujen hallinnan. Lisäksi OpenAI suunnittelee lisäävänsä uusia ääniä käyttäjien moninaisten tarpeiden ja mieltymysten mukaan.
ChatGPT uudet äänet: valintaprosessin taustat
ChatGPT uusien äänien valintaprosessi korostaa OpenAI pyrkimystä tarjota käyttäjille tekoälyä, joka tuntuu aidolta ja miellyttävältä. Tämä saavutettiin yhdistämällä teknologia ja huippuluokan ääniosaaminen. Äänien kehittämisessä otettiin huomioon paitsi niiden tekninen toteutus, myös niiden kyky herättää luottamusta ja lämpöä. Näin varmistettiin, että käyttäjät kokevat ääniominaisuuden osana luonnollista ja intuitiivista vuorovaikutusta tekoälyn kanssa.
Valintaprosessi oli pitkä ja huolellinen. OpenAI teki yhteistyötä palkittujen casting-ohjaajien ja tuottajien kanssa, jotka auttoivat määrittämään tarkat kriteerit äänille. Näyttelijöiden tuli täyttää tiukat vaatimukset, kuten luonnollinen puhetapa, ajaton sävy ja kyky tavoittaa laaja yleisö. Näitä ominaisuuksia etsittiin siksi, että ne tekevät äänistä universaalisti miellyttäviä ja helpottavat tekoälyn ja ihmisten välistä kommunikaatiota.
Lopuksi
OpenAI sitoutuminen luovuuden kunnioittamiseen ja huolelliseen äänivalintaan näkyy koko prosessissa. Samalla yritys jatkaa teknologian kehittämistä varmistaakseen, että ChatGPT tarjoaa entistä paremman käyttäjäkokemuksen. GPT-4o uusien ominaisuuksien myötä ääni- ja tekoälyteknologia ottavat jälleen yhden askeleen eteenpäin.