Value Learning

Value learning on ehdotettu menetelmä inhimillisten arvojen sisällyttämiseksi AGI: iin. Siihen liittyy keinotekoisen oppijan luominen, jonka toiminnassa otetaan huomioon monia mahdollisia arvoja ja mieltymyksiä, joita punnitaan niiden todennäköisyydellä. Arvooppiminen voisi estää AGI: tä asettamasta inhimillisille arvoille haitallisia tavoitteita, mikä auttaisi ystävällisen tekoälyn luomisessa.

vaikka on olemassa monia tapoja sisällyttää inhimillisiä arvoja AGIIN (esim.: Coherent Extrapolated Volition, Coherent Aggregated Volition ja Coherent Blended Volition), tämä menetelmä on mainittu suoraan ja kehitetty Daniel Deweyn teoksessa ”Learning What to Value”. Kuten useimmat kirjoittajat, hän olettaa, että ihmisen tavoitteet eivät luonnollisestikaan tapahtuisi keinotekoisessa aineessa ja ne tulisi toteuttaa siinä. Ensinnäkin Dewey väittää vastaan käyttää yksinkertaista käyttöä vahvistaminen oppimisen ratkaista tämän ongelman, sillä tämä johtaa maksimointi erityisiä palkintoja, jotka voivat poiketa arvon maksimointi. Esimerkiksi, vaikka me voimakkaasti suunnittelisimme agentin maksimoimaan ne palkinnot, jotka myös maksimoivat inhimilliset arvot, agentti voisi muuttaa ympäristöään tuottaakseen helpommin samat palkinnot ilman vaivaa myös maksimoida inhimilliset arvot (ts.jos palkkio olisi ihmisen onnellisuus, se voisi muuttaa ihmismieltä, jotta se olisi tyytyväinen mihin tahansa).

kaikkien näiden ongelmien ratkaisemiseksi Dewey ehdottaa hyödyllisyysfunktion maksimoijaa, joka pitää kaikkia mahdollisia yleishyödyllisiä funktioita niiden todennäköisyyksien mukaan painotettuina: ”e propose uncertainty over utility functions. Sen sijaan, että tarjoaisimme agentille yhden hyödyllisyysfunktion eteen, tarjoamme agentille poolin mahdollisia hyödyllisyysfunktioita ja todennäköisyysjakauman P siten, että jokaiselle hyödyllisyysfunktiolle voidaan määrittää todennäköisyys P(Ujyxm) tietyn vuorovaikutushistorian perusteella . Agentti voi sitten laskea odotusarvon mahdollisille hyödyllisille funktioille tietyn vuorovaikutushistorian perusteella ” hän toteaa lopuksi, että vaikka se ratkaisee monia mainituista ongelmista, tämä menetelmä jättää silti monia avoimia kysymyksiä. Sen pitäisi kuitenkin antaa suuntaa tulevalle työlle….

(Lue Lisää)

Vastaa

Sähköpostiosoitettasi ei julkaista.