Värdeinlärning

Värdeinlärning är en föreslagen metod för att införliva mänskliga värden i en AGI. Det handlar om att skapa en artificiell elev vars handlingar överväger många möjliga uppsättningar värden och preferenser, vägda av deras sannolikhet. Värdeinlärning kan förhindra en AGI att ha mål som skadar mänskliga värden, vilket hjälper till att skapa Vänlig AI.

även om det finns många sätt att införliva mänskliga värden i en AGI (t. ex.: Koherent extrapolerad Volition, koherent aggregerad Volition och koherent blandad Volition), nämns denna metod direkt och utvecklas i Daniel Deweys papper ’Learning What to Value’. Liksom de flesta författare antar han att människans mål inte naturligt skulle uppstå i en artificiell agent och bör verkställas i den. För det första argumenterar Dewey mot användningen av en enkel användning av förstärkningsinlärning för att lösa detta problem, på grundval av att detta leder till maximering av specifika belöningar som kan avvika från värdemaximering. Till exempel, även om vi kraftfullt konstruerar agenten för att maximera de belöningar som också maximerar mänskliga värden, kan agenten ändra sin miljö för att lättare producera samma belöningar utan problem att också maximera mänskliga värden (dvs. om belöningen var mänsklig lycka kan det förändra det mänskliga sinnet så det blev nöjd med någonting).

för att lösa alla dessa problem föreslår Dewey en utility function maximizer, som överväger alla möjliga utility-funktioner viktade efter deras sannolikheter: ”e föreslår osäkerhet över utility-funktioner. I stället för att tillhandahålla en agent en nyttofunktion på framsidan, tillhandahåller vi en agent med en pool av möjliga nyttofunktioner och en sannolikhetsfördelning P så att varje nyttofunktion kan tilldelas Sannolikhet P(Ujyxm) med en viss interaktionshistorik . En agent kan sedan beräkna ett förväntat värde över möjliga nyttofunktioner med tanke på en viss interaktionshistorik” avslutar han med att säga att även om det löser många av de nämnda problemen, lämnar denna metod fortfarande många öppna frågor. Det bör dock ge en riktning för framtida arbete….

(Läs Mer)

Lämna ett svar

Din e-postadress kommer inte publiceras.