Verdilæring

Verdilæring er en foreslått metode for å inkorporere menneskelige verdier i EN AGI. Det innebærer etablering av en kunstig elev hvis handlinger vurdere mange mulige sett av verdier og preferanser, veid av deres sannsynlighet. Verdilæring kan forhindre AT EN AGI har mål som er skadelige for menneskelige verdier, og dermed bidrar til å skape Vennlig AI.

selv om det er mange måter å innlemme menneskelige verdier i EN AGI (f. eks.: Sammenhengende Ekstrapolert Volition, Sammenhengende Aggregert Volition og Sammenhengende Blandet Volition), er denne metoden direkte nevnt og utviklet I Daniel Deweys papir ‘Learning What To Value’. Som de fleste forfattere antar han at menneskets mål ikke naturlig ville forekomme i en kunstig agent og bør håndheves i den. For Det første argumenterer Dewey mot bruk av en enkel bruk av forsterkningslæring for å løse dette problemet, på grunnlag av at dette fører til maksimering av spesifikke belønninger som kan avvike fra verdimaksimering. For eksempel, selv om vi kraftig konstruerer agenten for å maksimere de belønningene som også maksimerer menneskelige verdier, kan agenten endre sitt miljø for å lettere produsere de samme belønningene uten problemer med å maksimere menneskelige verdier (dvs.

for å løse alle disse problemene foreslår Dewey en bruksfunksjonsmaksimator, som vurderer alle mulige bruksfunksjoner vektet av deres sannsynligheter :» e foreslår usikkerhet over bruksfunksjoner. I stedet for å gi en agent en verktøyfunksjon foran, gir vi en agent med et utvalg av mulige verktøyfunksjoner Og en sannsynlighetsfordeling P Slik at hver verktøyfunksjon kan tilordnes sannsynlighet P (Ujyxm) gitt en bestemt interaksjonshistorikk . En agent kan da beregne en forventet verdi over mulige bruksfunksjoner gitt en bestemt interaksjonshistorie» konkluderer han med å si at selv om det løser mange av de nevnte problemene, gir denne metoden fortsatt mange åpne spørsmål. Men det bør gi en retning for fremtidig arbeid….

(Les Mer)

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.