învățarea valorii

învățarea valorii este o metodă propusă pentru încorporarea valorilor umane într-un AGI. Aceasta implică crearea unui cursant artificial ale cărui acțiuni iau în considerare multe seturi posibile de valori și preferințe, cântărite de probabilitatea lor. Învățarea valorii ar putea împiedica AGI – ul de a avea obiective în detrimentul valorilor umane, ajutând astfel la crearea unei ia prietenoase.

deși există multe modalități de a încorpora valorile umane într-un AGI (de ex.: Voință extrapolată coerentă, voință agregată coerentă și voință mixtă coerentă), această metodă este menționată direct și dezvoltată în lucrarea lui Daniel Dewey ‘Learning What to Value’. La fel ca majoritatea autorilor, el presupune că obiectivele umane nu ar apărea în mod natural într-un agent artificial și ar trebui să fie aplicate în el. În primul rând, Dewey argumentează împotriva utilizării unei simple utilizări a învățării de întărire pentru a rezolva această problemă, pe baza faptului că acest lucru duce la maximizarea recompenselor specifice care pot diferi de maximizarea valorii. De exemplu, chiar dacă inginerim cu forță agentul pentru a maximiza acele recompense care maximizează și valorile umane, agentul și-ar putea modifica mediul pentru a produce mai ușor aceleași recompense fără a avea probleme să maximizeze și valorile umane (adică: dacă recompensa ar fi fericirea umană, ar putea modifica mintea umană, astfel încât să devină fericită cu orice).

pentru a rezolva toate aceste probleme, Dewey propune un maximizator de funcții utilitare, care ia în considerare toate funcțiile utilitare posibile ponderate de probabilitățile lor: „e propune incertitudine asupra funcțiilor utilitare. În loc să oferim o funcție de utilitate agent one în față, oferim unui agent un grup de funcții de utilitate posibile și o distribuție de probabilitate P astfel încât fiecărei funcții de utilitate să i se poată atribui probabilitatea P(Ujyxm) având în vedere un anumit istoric de interacțiune . Un agent poate calcula apoi o valoare așteptată asupra posibilelor funcții de utilitate, având în vedere un anumit istoric de interacțiune”, concluzionează el spunând că, deși rezolvă multe dintre problemele menționate, această metodă lasă încă multe întrebări deschise. Cu toate acestea, ar trebui să ofere o direcție pentru munca viitoare….

(Mai Mult)

Lasă un răspuns

Adresa ta de email nu va fi publicată.