Value Learning

Value learning je navržená metoda pro začlenění lidských hodnot do AGI. Zahrnuje vytvoření umělého žáka, jehož akce zvažují mnoho možných hodnot a preferencí, zvážených jejich pravděpodobností. Hodnotové učení by mohlo zabránit tomu, aby AGI měla cíle škodlivé pro lidské hodnoty, a proto pomáhá při vytváření přátelské AI.

ačkoli existuje mnoho způsobů, jak začlenit lidské hodnoty do AGI (např.: Koherentní Extrapolovaná vůle, koherentní agregovaná vůle a koherentní smíšená vůle), tato metoda je přímo zmíněna a vyvinuta v příspěvku Daniela Deweye „učení, co si vážit“. Stejně jako většina autorů předpokládá, že lidské cíle by se přirozeně nevyskytovaly v umělém agentovi a měly by se v něm prosazovat. Za prvé, Dewey argumentuje proti použití jednoduchého použití posilování učení k vyřešení tohoto problému, na základě toho, že to vede k maximalizaci konkrétních odměn, které se mohou lišit od maximalizace hodnoty. Například, i když jsme násilně inženýr agent maximalizovat ty odměny, které také maximalizovat lidské hodnoty, agent by mohl změnit své prostředí snadněji produkovat tytéž odměny bez potíží také maximalizaci lidských hodnot (tj: v případě, že odměnou bylo lidské štěstí mohlo by to změnit lidskou mysl, takže se stal spokojený s čímkoli).

pro vyřešení všech těchto problémů navrhuje Dewey maximalizátor užitkových funkcí, který zvažuje všechny možné užitkové funkce vážené jejich pravděpodobnostmi: „e navrhnout nejistotu nad užitkovými funkcemi. Místo toho, abychom agentovi poskytli jednu užitkovou funkci vpředu, poskytujeme agentovi skupinu možných užitkových funkcí a rozdělení pravděpodobnosti P tak, že každé užitkové funkci lze přiřadit pravděpodobnost P (Ujyxm) vzhledem k konkrétní historii interakce . Agent pak může vypočítat očekávanou hodnotu nad možnými užitečnými funkcemi s ohledem na konkrétní historii interakce“ uzavírá, že ačkoli řeší mnoho zmíněných problémů, tato metoda stále ponechává mnoho otevřených otázek. Měla by však poskytnout směr pro budoucí práci….

(Číst Více)

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.