Bài viết Artificial Intelligence – Phân loại
tác tử thuộc chủ đề về Hỏi &
Đáp thời gian này đang được rất nhiều bạn quan tâm đúng không
nào !! Hôm nay, Hãy cùng HLink tìm
hiểu Artificial Intelligence – Phân loại tác tử trong bài viết hôm
nay nhé ! Các bạn đang xem nội dung về : “Artificial
Intelligence – Phân loại tác tử”
Đánh giá về Artificial Intelligence – Phân loại tác tử
Xem nhanh
Đăng Ký kênh miễn phí để cập nhật video mới : https://goo.gl/ddWSTz
TUYÊN BỐ MIỄN TRỪ CÁC TRÁCH NHIỆM PHÁP LÝ:
►Các thông tin được tập hợp từ báo chí chính thống của Việt Nam có chọn lọc, các đánh giá dựa trên quan điểm cá nhân, Tin nóng 24h không cố tình công kích hay phỉ báng bất cứ cá nhân, tổ chức nào!
► Xin quý khán giả không đề cập tới các vấn đề chính trị đi quá mức nhằm mục đích kích động đảng phái.
►Tin nóng 24h không chịu bất cứ trách nhiệm nào liên quan đến các bình luận của khán giả trên Youtube.
* Lưu ý: Kênh Tin Nóng 24h không sở hữu tất cả tư liệu được sử dụng trong Video này. Mọi thắc mắc về bản quyền, tài trợ, quảng cáo, cộng tác vui lòng liên hệ email: [email protected]
Tiếp theo về tác vụ của phần trước (link: https://viblo.asia/tanphan/posts / NbmebAdpGYO ) Chủ đề hôm nay là phân loại tác nghiệp nha mọi người 4 loại cơ bản tác vụ:
- Tác tử phản xạ dễ dàng
- Tác tử phản xạ dựa trên mô hình
- Tác tử dựa trên mục tiêu
- Tác tử dựa trên lợi ích
Tác tử phản xạ dễ dàng
Tác tử hành động theo một quy tắc có khó khăn phù hợp với trạng thái hiện thời của môi trường
Hiểu dễ dàng là tác vụ có 1 tập luật và có kho lưu trữ (biết) 1 loạt các trạng thái của môi trường, nếu có trạng thái này thì có luật này, luật này sẽ trả về 1 hành tương ứng
class SimpleReflexAgent static RULES #tập luật dạng điều kiện -> hành động def reflex action = action_rule load_rule end def load_rule rule_match state, rules end def state interpret_input percept end end
có thể hình dung qua sơ đồ sau: Sơ đồ này khá dễ dàng, nhìn qua là hình dùng
được nên mình sẽ không nói kĩ nhé :v
Tác tử phản xạ dựa trên mô hình
Tác tử sử dụng mô hình nội bộ để giám sát trạng thái hiện nay của môi trường Cách tác tử lựa chọn hành động giống như tác tử phản xạ đơn giản
class ReflexAgentWithState static RULES #tập luật dạng điều kiện -> hành động static state #trạng thái hiện thời của môi trường static action #action gần nhất def reflex action = action_rule load_rule end def load_rule rule_match state, rules end def state update_state state, action, percept end end
Sơ đồ mô hình: Nào cùng tìm hiểu chút nha : Đầu tiên
sensors của tác tử nhận input từ môi trường. nhưng ngoài việc nhận
input, đối sánh luật và đưa ra hành động, tác tử này thông minh hơn
1 tí, nó kiểm tra state của môi trường, đối chứng xem môi trường
thay đổi ngay như thế nào và xem lại nó đã làm gì trước đó để đưa
ra 1 hành động thích hợp nhất (hay tìm 1 luật phù hợp nhất trong
trường hợp này). Tác tử dạng này tiến hóa hơn tác tử dạng trước một
chút, đó là thay vì chỉ nhận input từ môi trường và đối chiếu luật
đưa ra hành động, tác tử này biết thêm thông tin về môi trường (chi
tiết là sự thay đổi ngay của môi trường) và dùng hành động trước đó
để đưa ra hành động hiện thời phù hợp.
Tác tử dựa trên mục tiêu
Biết thông tin về môi trường như tác tử dựa trên mô hình, ngoài ra tác tử này còn biết thêm thông tin về mục tiên nó cần đạt được.
Ví dụ đơn giản nhất: tác tử máy lau nhà khi đứng giữa 4 viên gạch đều đặn có khả năng đi (theo 4 hướng), tác tử có thêm 1 mục tiêu là ưu tiên lau viên gạch bẩn nhất. vậy là nó sẽ xử lí thêm 1 lượng thông tin và tìm ra viên gạch bẩn nhất để lau trước. Tác tử dựa trên mục tiêu sẽ có 1 quy trình làm việc chuẩn sau:
- Theo dõi trạng thái Hiện tại của môi trường
- Lưu trữ 1 tập các mục tiêu
- Đưa ra hành động để hướng tới mục tiêu Mô hình:
Theo mô hình trên, ta thấy là đã không còn 1 tập luật gì hết cả, mà thay vào đấy là goals, ta thay thế tập luật bằng tập các mục tiêu cần phải đạt được, vậy nên sau khi nhận input từ môi trường, xử lí thông tin môi trường này nọ, tiếp theo sẽ là tìm ra hành động. ở đây, tác tử sẽ phân tích xem, nếu hành động này thì goal là gì, nó sẽ chọn ra hành động miễn hướng đến 1 loạt các mục tiêu được đề ra.
✅ Mọi người cũng xem : tâm linh là gì thích chân quang
Tác tử dựa trên lợi ích
Tác tử có thông tin về môi trường, có thông tin về mục tiêu nhưng hoạt động dựa trên hiệu quả của hành động.
Để dễ hiểu, quay lại bài toán robot lau nhà,
thừa nhận rằng robot ưu tiên lau gạch bẩn nhất là 1 mục tiêu nhỏ,
lau sạch toàn bộ căn phòng là mục tiêu lớn, nhưng đi theo viên gạch
nào sẽ làm cho việc lau nhà hiệu quả nhất (tiết kiệm pin, thời
gian, ít viên gạch bị lau lại lần 2… là 1 trong các tiêu chí đánh
giá hiệu quả của robot) Từ đó, ta sinh ra hàm đánh giá lợi ích của
tác tử. Mô hình: Mô hình này tiến hóa hơn mô hình phản xạ dựa
trên mục tiêu là tác tử có thêm 1 hàm đành giá hiệu quả trước khi
đưa ra hành động trên mục tiêu. dễ hiểu vậy thôi =)) Được rồi dừng
ở đây thôi. Bài tiếp theo mình sẽ nói về tác tử có thể học và chúng
ta sẽ đi vào những giải thuật cơ bản nhất của trí tuệ nhân tạo nhé,
chúc mọi người ăn tết vui vẻ
Các câu hỏi về tác tử là gì
Nếu có bắt kỳ câu hỏi thắc mắt nào vê tác tử là gì hãy cho chúng mình biết nhé, mõi thắt mắt hay góp ý của các bạn sẽ giúp mình cải thiện hơn trong các bài sau nhé
Trả lời