Értéktanulás

az Értéktanulás egy javasolt módszer az emberi értékek AGI-be történő beépítésére. Ez magában foglalja egy mesterséges tanuló létrehozását, akinek cselekedetei számos lehetséges értéket és preferenciát vesznek figyelembe, mérlegelve azok valószínűségét. Az értéktanulás megakadályozhatja, hogy az AGI-k olyan célokat érjenek el, amelyek károsak az emberi értékekre, ezáltal segítve a barátságos AI létrehozását.

bár számos módon lehet beépíteni az emberi értékeket egy AGI-ba (pl.: Koherens extrapolált akarat, koherens aggregált akarat és koherens kevert akarat), ezt a módszert közvetlenül megemlíti és fejleszti Daniel Dewey ‘Learning What to Value’című tanulmánya. Mint a legtöbb szerző, azt feltételezi, hogy az emberi célok természetesen nem fordulnak elő egy mesterséges ágensben, és azt érvényesíteni kell. Először is, Dewey azzal érvel, hogy a megerősítő tanulás egyszerű használatát alkalmazzák a probléma megoldására, azon az alapon, hogy ez olyan konkrét jutalmak maximalizálásához vezet, amelyek eltérhetnek az érték maximalizálásától. Például, még akkor is, ha erőteljesen Megtervezzük az ügynököt, hogy maximalizálja azokat a jutalmakat, amelyek szintén maximalizálják az emberi értékeket, az ügynök megváltoztathatja környezetét, hogy könnyebben előállítsa ugyanazokat a jutalmakat, anélkül, hogy gondot okozna az emberi értékek maximalizálása is (azaz: ha a jutalom emberi boldogság volt, megváltoztathatja az emberi elmét, így bármivel elégedett lett).

mindezen problémák megoldására Dewey egy hasznossági függvény maximalizálót javasol, aki figyelembe veszi az összes lehetséges hasznossági funkciót, amelyet valószínűségük súlyoz: “e bizonytalanságot javasol a hasznossági funkciók felett. Ahelyett, hogy egy ügynök egy segédprogram funkció elöl, biztosítunk egy ügynök egy medence lehetséges hasznossági funkciók és a valószínűség-Eloszlás P oly módon, hogy minden hasznossági függvény lehet rendelni valószínűség P(Ujyxm) adott interakciós előzmények . Az ügynök ezután kiszámíthatja a várható értéket a lehetséges hasznossági funkciók felett egy adott interakciós előzmény alapján” arra a következtetésre jut, hogy bár az említett problémák közül sokat megold, ez a módszer még mindig sok nyitott kérdést hagy maga után. Ennek azonban irányt kell adnia a jövőbeni munkához….

(Tovább)

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.