Værdiindlæring

Værdiindlæring er en foreslået metode til at inkorporere menneskelige værdier i en AGI. Det indebærer oprettelsen af en kunstig lærer, hvis handlinger overvejer mange mulige sæt værdier og præferencer, vejet af deres sandsynlighed. Værdiindlæring kunne forhindre en AGI i at have mål, der er skadelige for menneskelige værdier, og dermed hjælpe med at skabe Venlig AI.

selvom der er mange måder at indarbejde menneskelige værdier i en AGI (f. eks.: Sammenhængende ekstrapoleret vilje, sammenhængende aggregeret vilje og sammenhængende blandet vilje), er denne metode direkte nævnt og udviklet i Daniel Duveys papir ‘Learning Hvad to Value’. Som de fleste forfattere antager han, at menneskets mål ikke naturligt ville forekomme i et kunstigt middel og bør håndhæves i det. For det første argumenterer Duvey imod brugen af en simpel brug af forstærkningslæring til at løse dette problem på det grundlag, at dette fører til maksimering af specifikke belønninger, der kan afvige fra værdimaksimering. For eksempel, selvom vi kraftigt konstruerer agenten til at maksimere de belønninger, der også maksimerer menneskelige værdier, kunne agenten ændre sit miljø for lettere at producere de samme belønninger uden besværet med også at maksimere menneskelige værdier (dvs.: hvis belønningen var menneskelig lykke, kunne den ændre det menneskelige sind, så det blev tilfreds med noget).

for at løse alle disse problemer foreslår Duvey en hjælpefunktionsmaksimering, der overvejer alle mulige hjælpefunktioner vægtet af deres sandsynligheder: “e foreslår usikkerhed om hjælpefunktioner. I stedet for at give en agent en hjælpefunktion foran, giver vi en agent en pulje af mulige hjælpefunktioner og en sandsynlighedsfordeling P, således at hver hjælpefunktion kan tildeles Sandsynlighed P(Ujyksm) givet en bestemt interaktionshistorik . En agent kan derefter beregne en forventet værdi i forhold til mulige hjælpefunktioner givet en bestemt interaktionshistorik ” konkluderer han og siger, at selvom det løser mange af de nævnte problemer, efterlader denne metode stadig mange åbne spørgsmål. Det skal dog give en retning for det fremtidige arbejde….

(Læs Mere)

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.