Tip:
Highlight text to annotate it
X
Có lẽ sẽ có lợi cho bạn hơn khi giới thiệu một số thuật ngữ cơ bản
mà nó được sử dụng phổ biến trong Trí Tuệ Nhân Tạo để phân biệt những loại vấn đề khác nhau
Từ đầu tiên tôi sẽ chỉ cho bạn là khái niệm ' có thể quan sát được hoàn toàn' với ' có thể quan sát được một phần'
Một môi trường được gọi là ' có thể quan sát được hoàn toàn' nếu những gì thực thể độc lập (agent) của bạn cảm nhận được
ở bất cứ thời điểm nào là hoàn toàn đủ để đưa ra quyết định tối ưu
chẳng hạn, trong nhiều trò chơi đánh bài
khi tất cả các quân bài được bày ra trên bàn, địa điểm tức thời của tất cả những quân bài đó
thật sự đủ để cho chúng ta đưa ra một lựa chọn tối ưu.
Điều này trái với một số môi trường khác nơi bạn cần nhớ
mặt còn lại của thực thể độc lập để đưa ra quyết định tốt nhất có thể
Ví dụ, trong trò chơi poker, các quân bài không được lật ra trên bàn
và việc nhớ những sự dịch chuyển của quân bài sẽ giúp bạn đưa ra quyết định tốt hơn
Để hoàn toàn hiểu được sự khác nhau đó, hãy xét sự tương tác của một thực thể
với môi trường đối với cảm biến và thiết bị truyền động của nó
và sự tương tác này diễn ra qua nhiều chu trình,
thường được gọi là 'chu trình nhận thức hành động'.
Với nhiều môi trường,để tiện lợi, chúng ta giả sử rằng
môi trường đó có một số loại 'trạng thái bên trong'
Ví dụ, trong một trò chơi bài nơi mà những quân bài không được mở trên bàn,
trạng thái có thể gắn liền với những quân bài trong tay bạn.
Một môi trường được gọi là' có thể quan sát được hoàn toàn' nếu các cảm biến có thể luôn thấy được
toàn bộ trạng thái của môi trường đó
Nó là ' quan sát được một phần' nếu các cảm biến có thể chỉ thấy được một phần nhỏ của trạng thái,
nhưng việc ghi nhớ những phép đo trước đó lại cho chúng ta những thông tin thêm về trang thái
mà không dễ dàng quan sát được ngay lúc đó
Bất kể trò chơi mà, chẳng hạn, những sự dịch chuyển trong quá khứ chứa những thông tin về
những gì có thể có trong tay của một người chơi, thì những trò chơi đó là ' có thể quan sát được một phần'
và chúng yêu cầu những cách xử lý khác nhau.
thông thường những thực thể độc lập mà nó gắn với môi trường có thể quan sát được một phần
yêu cầu bộ nhớ trong để hiểu
trạng thái môi trường là gì, và ta sẽ nói về điều này một cách bao quát
khi nói về những mẫu Markov ẩn lên quan đến cách mà cấu trúc này
có được bộ nhớ trong như thế.
Một thuật ngữ thứ hai về môi trường liên quan đến việc môi trường đó
có tính 'xác định' hay 'ngẫu nhiên'
Môi trường có tính xác định là môi trường trong đó các hành động của thực thể độc lập của bạn
xác định một cách duy nhất kết quả đạt được
Ví dụ, trong đánh cờ, thật sự không có sự ngẫu nhiên khi bạn chuyển một mẫu
Ảnh hưởng của việc chuyển một mẫu hoàn toàn có thể được xác định trước
và bất kể nơi nào bạn chuyển mẫu đó đến, kết quả luôn không thay đổi.
nên ta nói nó có tính xác định
Những trò chơi xúc sắc, chẳng hạn như backgammon, thì có tính ngẫu nhiên.
Trong khi bạn có thể vẫn chuyển được những mẫu một cách xác định,
kết quả của một hành động cũng liên quan đến việc thả một con xúc sắc,
và bạn không thể đoán được kết quả
Có một số lượng nhất định các sự ngẫu nhiên liên quan kết quả của con xúc sắc,
và vì thế, ta nói nó có tính ngẫu nhiên.
Tôi sẽ nói về tính 'hữu hạn' với tính 'liên tục'.
Một môi trường hữu hạn là môi trường trong đó bạn có hữu hạn các lựa chọn hành động
and chỉ có hữu hạn thứ bạn có thể cảm nhận được.
Ví dụ, trong đánh cờ, có hữu hạn các vị trí
và hữu hạn những thứ bạn có thể làm
Nó khác với môi trường liên tục
nơi mà không gian của các hành động có thể xảy ra mà bạn có thể cảm nhận được là vô hạn
Ví dụ, nếu bạn ném phi tiêu, có vô hạn cách để điều chỉnh góc phóng
và làm tăng tốc phi tiêu
Cuối cùng, ta phân biệt 'môi trường ôn hòa' với 'môi trường đối kháng'
Trong " môi trường ôn hòa", môi trường có thể ngẫu nhiên.
Nó có thể có tính ngẫu nhiên, nhưng không tự có mục đích
mà mâu thuẫn với mục đích riêng.
Ví dụ, thời tiết là " môi trường ôn hòa".
Nó có thể ngẫu nhiên, có thể ảnh hưởng đến kết quả của hành động.
Nhưng nó không thật sự ở ngoài đó hiểu được ý của bạn
Trái với môi trường đối kháng, như nhiều trò chơi giống đánh cờ,
nơi mà đối thủ của bạn thật sự ở đó để hiểu được ý bạn.
Hóa ra khó hơn nhiều để tìm ra những hành động tốt trong môi trường đối kháng
nơi mà đối thủ bạn luôn quan sát bạn và chống lại những gì bạn cố đạt được
tương xứng với môi trường ôn hòa, nơi mà môi trường có thể đơn thuần là ngẫu nhiên
nhưng lại không thật sự quan tâm đến việc làm cho cuộc sống bạn tồi tệ hơn
Vì thế, hãy xem những biểu hiện đó làm bạn hiểu tới mức độ nào
bằng việc đến với trò chơi tiếp theo của chúng ta.
Xin nhắc lại, đây là 4 khái niệm: tính quan sát được một phần với toàn phần,
tính ngẫu nhiên với tính xác đinh, tính liên tục với tính hữu hạn
tính đối kháng với tính ôn hoà.
Để tôi hỏi bạn về trò checker
Hãy kiểm tra một hoặc tất cả những thuật tính mà có trong đó.
Nếu bạn nghĩ trò checker có tính quan sát được một phần thì hãy kiểm tra cái này.
Nếu không thì đừng kiểm nó.
Nếu bạn cho rằng nó có tính ngẫu nhiên thì hãy kiểm tra cái này.
liên tục, kiểm cái này, đối kháng thì kiểm cái này
Nếu bạn không biết trò chơi checker, bạn có thể tra cứu nó bằng Google
để tìm hiểu về trò checker