tetris

Reinforcement Learning và tictactoe

Reinforcement Learning và tictactoe

Trong khi trong các phương pháp lý thuyết trò chơi nói chung, ví dụ thuật toán min-max, thuật toán luôn giả định chúng ta có một đối thủ hoàn hảo, công việc phải thực hiện là tối đa hóa phần thưởng của mình và giảm thiểu phần thưởng của đối thủ ( tối đa hóa điểm của mình và tối thiểu hóa điểm của đối thủ), trong học củng cố, chúng ta không cần giả định đối thủ của chúng ta là 1 thiên tài xuất chúng, nhưng chung ta vẫn thu được mô hình với kết quả rất tốt.

• Phạm Duy Tùng 11 minute read
Xây dựng game xếp gạch bằng opencv và python

Xây dựng game xếp gạch bằng opencv và python

Xếp gạch là một trong những game được các bạn thế hệ 8x, 9x đời đầu phá đảo. Bây giờ chúng ta thử code lại nó với opencv và Python nhé. (optional)

• Phạm Duy Tùng 7 minute read