Erősítő tanulás

Szerző: Lewis Jackson
A Teremtés Dátuma: 11 Lehet 2021
Frissítés Dátuma: 15 Lehet 2024
Anonim
Erősítő tanulás - Technológia
Erősítő tanulás - Technológia

Tartalom

Meghatározás - Mit jelent a megerősítéses tanulás?

A megerősítéses tanulás a mesterséges intelligencia szempontjából egy olyan dinamikus programozás, amely algoritmusokat képez ki jutalom és büntetés rendszerének segítségével.


Egy megerősítő tanulási algoritmus, vagy ügynök, a környezettel való kölcsönhatás révén tanul. Az ügynök jutalmat kap a helyes végrehajtás és a büntetés a helytelen végrehajtásért. Az ügynök beavatkozás nélkül megtanulja az embert azáltal, hogy maximalizálja jutalmát és minimalizálja a büntetést.

Bevezetés a Microsoft Azure és a Microsoft Cloud | A jelen útmutató során megtanulja, hogy mi a lényeg a felhőalapú számítástechnikában, és hogyan segítheti a Microsoft Azure a felhőből történő migrációt és az üzleti vállalkozás futtatását.

A Techopedia magyarázza a megerősítéses tanulást

A megerősítő tanulás egy olyan megközelítés a gépi tanuláshoz, amelyet a biheviorista pszichológia ihlette. Hasonló ahhoz, hogy egy gyermek megtanul egy új feladat elvégzésére. A megerősítéses tanulás ellentétben áll más gépi tanulási megközelítésekkel abban, hogy az algoritmust nem kifejezetten mondják el, hogyan kell egy feladatot végrehajtani, hanem önmagában dolgozik a problémán.


Mint ügynök, amely önálló vezetésű autó vagy sakkot játszó program lehet, kölcsönhatásba lép a környezetével, jutalomban részesül, attól függően, hogy teljesít, például biztonságosan vezet a rendeltetési helyre vagy nyer egy játékot. Ellenkezőleg, az ügynök büntetést kap a hibás végrehajtásért, például az útról való elhagyásért vagy cselekedetekért.

Az ügynök idővel dönt arról, hogy maximalizálja jutalmát és minimalizálja a büntetést a dinamikus programozás segítségével. Ennek a mesterséges intelligencia megközelítésnek az az előnye, hogy lehetővé teszi egy AI program számára, hogy programozó nélkül megtanulja, hogy pontosan megmondja, hogyan kell az ügynöknek végrehajtania a feladatot.