Deep Q-Networks

Szerző: Laura McKinney
A Teremtés Dátuma: 5 Április 2021
Frissítés Dátuma: 26 Június 2024
Anonim
Deep Q-Learning - Combining Neural Networks and Reinforcement Learning
Videó: Deep Q-Learning - Combining Neural Networks and Reinforcement Learning

Tartalom

Meghatározás - Mit jelent a Deep Q-Networks?

A Deep Q Networks (DQN) olyan neurális hálózatok (és / vagy kapcsolódó eszközök), amelyek mély Q tanulást használnak annak érdekében, hogy olyan modelleket biztosítsanak, mint például az intelligens videojátékok szimulációja. Ahelyett, hogy egy konkrét neurális hálózat felépítésére szolgálneve, a Deep Q Networks konvolúciós neurális hálózatokból és más struktúrákból állhat, amelyek speciális módszereket használnak a különböző folyamatok megismerésére.


Bevezetés a Microsoft Azure és a Microsoft Cloud | A jelen útmutató során megtanulja, mi szól a felhőalapú számítástechnikából, és hogyan segítheti a Microsoft Azure a felhőből történő migrációt és az üzleti vállalkozás futtatását.

A Techopedia magyarázza a Deep Q-Networks-t

A mélyreható Q tanulás módszere általában az általános politikai iterációnak, az úgynevezett általános politika iterációjának, amelyet a politika kiértékelésének és a politika iterációjának összekapcsolásaként ír le, a politikák megtanulására nagy dimenziós érzékszervi bemenetek alapján.

Például egy olyan típusú mély Q-hálózat, amelyet a műszaki kiadványokban lefednek, például a Medium, az Atari 2600 videojátékok érzékszervi bemeneteit modellezi. Ez nagyon alapvető szinten történik, mintákat gyűjtve, tárolva és tapasztalati visszajátszás céljából felhasználva a Q hálózat frissítése céljából.


Általános értelemben a mély Q hálózatok olyan bemenetekre vonatkoznak, amelyek aktív szereplőket képviselnek a területeken vagy más tapasztalt mintákban, és megtanulják ezeket az adatokat a kívánt kimenetekhez igazítani. Ez egy hatékony módszer a mesterséges intelligencia kifejlesztésében, amely magas szintű sakkot játszhat, vagy más magas szintű kognitív tevékenységeket végezhet - az Atari vagy a sakk videojátékok példája szintén jó példa arra, hogy az AI miként használja a az interfészek típusai, amelyeket az emberi ügynökök hagyományosan használtak.

Más szavakkal, a mély Q-tanulással az AI-játékos inkább emberi szereplő lesz, mint a tanulás a kívánt eredmények elérése érdekében.