Erősítő tanulás

Tartalom

Meghatározás - Mit jelent a megerősítéses tanulás?
Bevezetés a Microsoft Azure és a Microsoft Cloud | A jelen útmutató során megtanulja, hogy mi a lényeg a felhőalapú számítástechnikában, és hogyan segítheti a Microsoft Azure a felhőből történő migrációt és az üzleti vállalkozás futtatását.
A Techopedia magyarázza a megerősítéses tanulást

Meghatározás - Mit jelent a megerősítéses tanulás?

A megerősítéses tanulás a mesterséges intelligencia szempontjából egy olyan dinamikus programozás, amely algoritmusokat képez ki jutalom és büntetés rendszerének segítségével.

Egy megerősítő tanulási algoritmus, vagy ügynök, a környezettel való kölcsönhatás révén tanul. Az ügynök jutalmat kap a helyes végrehajtás és a büntetés a helytelen végrehajtásért. Az ügynök beavatkozás nélkül megtanulja az embert azáltal, hogy maximalizálja jutalmát és minimalizálja a büntetést.

Bevezetés a Microsoft Azure és a Microsoft Cloud | A jelen útmutató során megtanulja, hogy mi a lényeg a felhőalapú számítástechnikában, és hogyan segítheti a Microsoft Azure a felhőből történő migrációt és az üzleti vállalkozás futtatását.

A Techopedia magyarázza a megerősítéses tanulást

A megerősítő tanulás egy olyan megközelítés a gépi tanuláshoz, amelyet a biheviorista pszichológia ihlette. Hasonló ahhoz, hogy egy gyermek megtanul egy új feladat elvégzésére. A megerősítéses tanulás ellentétben áll más gépi tanulási megközelítésekkel abban, hogy az algoritmust nem kifejezetten mondják el, hogyan kell egy feladatot végrehajtani, hanem önmagában dolgozik a problémán.

Mint ügynök, amely önálló vezetésű autó vagy sakkot játszó program lehet, kölcsönhatásba lép a környezetével, jutalomban részesül, attól függően, hogy teljesít, például biztonságosan vezet a rendeltetési helyre vagy nyer egy játékot. Ellenkezőleg, az ügynök büntetést kap a hibás végrehajtásért, például az útról való elhagyásért vagy cselekedetekért.

Az ügynök idővel dönt arról, hogy maximalizálja jutalmát és minimalizálja a büntetést a dinamikus programozás segítségével. Ennek a mesterséges intelligencia megközelítésnek az az előnye, hogy lehetővé teszi egy AI program számára, hogy programozó nélkül megtanulja, hogy pontosan megmondja, hogyan kell az ügynöknek végrehajtania a feladatot.