<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
	<channel>
		<title>Game Ai on Phạm Duy Tùng Machine Learning Blog</title>
		<link>https://www.phamduytung.com/tags/game-ai/</link>
		<description>Recent content in Game Ai on Phạm Duy Tùng Machine Learning Blog</description>
		<generator>Hugo</generator>
		<language>vi-VN</language>
		
		
		
			<copyright>Copyright © 2016-{year} Phạm Duy Tùng. All Rights Reserved.</copyright>
		
		
			<lastBuildDate>Sun, 27 Oct 2024 00:19:00 +0300</lastBuildDate>
		
			<atom:link href="https://www.phamduytung.com/tags/game-ai/index.xml" rel="self" type="application/rss+xml" />
			<item>
				<title>Sử dụng mô hình Double DQN  huấn luyện mô hình Reinforcement Learning với game mario</title>
				<link>https://www.phamduytung.com/blog/2024-10-27-mario-reinfomation-learning-double-dqn/</link>
				<pubDate>Sun, 27 Oct 2024 00:19:00 +0300</pubDate>
				<guid>https://www.phamduytung.com/blog/2024-10-27-mario-reinfomation-learning-double-dqn/</guid>
				<description>Chào các bạn, sau một thời gian ở ẩn, chúng ta lại tiếp tục với việc thực chiến AI, ở bài viết này, chúng ta sẽ train mô hình AI Reinforcement Learning với tựa game đã đi vào bao nhiêu thế hệ trẻ thơ, Mario, tuy nhiên, để bắt đầu bài viết, mình sẽ note lại một vài ý về Reinforcement Learning, Q learning, và cải tiến của Deep Q-Network là Double Deep Q-Network , trong phần code mình sẽ sử dụng  Double Deep Q-Network</description>
			</item>
			<item>
				<title>Xây dựng chương trình AI đơn giản cho game cờ tướng</title>
				<link>https://www.phamduytung.com/blog/2021-08-12-china_chess_alpha_beta_ai/</link>
				<pubDate>Thu, 12 Aug 2021 00:19:00 +0300</pubDate>
				<guid>https://www.phamduytung.com/blog/2021-08-12-china_chess_alpha_beta_ai/</guid>
				<description>Hướng dẫn xây dựng chương trình AI đơn giản cho game cờ tướng sử dụng  minimax và cắt tỉa alpha, beta. Sử dụng html với javascript và package http-server của nodejs</description>
			</item>
			<item>
				<title>Reinforcement Learning và tictactoe</title>
				<link>https://www.phamduytung.com/blog/2020-12-26---tic-tac-toe/</link>
				<pubDate>Sun, 27 Dec 2020 00:19:00 +0300</pubDate>
				<guid>https://www.phamduytung.com/blog/2020-12-26---tic-tac-toe/</guid>
				<description>Trong khi trong các phương pháp lý thuyết trò chơi nói chung, ví dụ thuật toán min-max, thuật toán luôn giả định chúng ta có một đối thủ hoàn hảo, công việc phải thực hiện là tối đa hóa phần thưởng của mình và giảm thiểu phần thưởng của đối thủ ( tối đa hóa điểm của mình và tối thiểu hóa điểm của đối thủ), trong học củng cố, chúng ta không cần giả định đối thủ của chúng ta là 1 thiên tài xuất chúng, nhưng chung ta vẫn thu được mô hình với kết quả rất tốt.</description>
			</item>
	</channel>
</rss>
