Value Learning

Value learning to proponowana metoda włączania ludzkich wartości do AGI. Polega na stworzeniu sztucznego ucznia, którego działania uwzględniają wiele możliwych zestawów wartości i preferencji, zważonych na ich prawdopodobieństwo. Uczenie się wartości może uniemożliwić AGI posiadanie celów szkodliwych dla ludzkich wartości, a tym samym pomóc w tworzeniu przyjaznej sztucznej inteligencji.

Chociaż istnieje wiele sposobów na włączenie ludzkich wartości do AGI (np.: Coherent Extrapolated Volition, Coherent Aggregated Volition i Coherent Blended Volition), metoda ta jest bezpośrednio wymieniona i rozwijana w pracy Daniela Deweya „Learning What to Value”. Jak większość autorów, zakłada on, że cele człowieka nie występują naturalnie w sztucznym środku i powinny być w nim egzekwowane. Po pierwsze, Dewey argumentuje przeciwko użyciu prostego wykorzystania uczenia zbrojeniowego w celu rozwiązania tego problemu, na podstawie tego, że prowadzi to do maksymalizacji określonych nagród, które mogą odbiegać od maksymalizacji wartości. Na przykład, nawet jeśli siłą zaprojektujemy agenta, aby zmaksymalizować te nagrody, które również maksymalizują ludzkie wartości, agent może zmienić swoje otoczenie, aby łatwiej produkować te same nagrody bez kłopotów z maksymalizacją ludzkich wartości (tj.: jeśli nagrodą było ludzkie szczęście, mogło to zmienić ludzki umysł, aby stał się szczęśliwy z czegokolwiek).

aby rozwiązać wszystkie te problemy, Dewey proponuje maximizer funkcji użyteczności, który rozważa wszystkie możliwe funkcje użyteczności ważone ich prawdopodobieństwem: „zaproponuj niepewność nad funkcjami użyteczności. Zamiast dostarczać agentowi jedną funkcję użyteczności z góry, zapewniamy agentowi pulę możliwych funkcji użyteczności i rozkład prawdopodobieństwa P, tak że każdej funkcji użyteczności można przypisać prawdopodobieństwo P (Ujyxm), biorąc pod uwagę konkretną historię interakcji . Agent może następnie obliczyć wartość oczekiwaną nad możliwymi funkcjami użyteczności, biorąc pod uwagę szczególną historię interakcji”, podsumowuje mówiąc, że chociaż rozwiązuje wiele wymienionych problemów, ta metoda nadal pozostawia wiele otwartych pytań. Powinien on jednak wskazywać kierunek przyszłych prac….

(Czytaj Więcej)

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.