Lời mở đầu

Dạo gần đây, khi các ứng dụng AI đang hô mưa gọi gió trên toàn cõi, điển hình là hot keywork chatGPT, thì trong cộng đồng nghiên cứu cũng nổ ra cuộc chiến giữa hai phe Symbolic AI và Connectionist AI. Có vẻ như ở nơi nào có chia nhóm, thì sẽ có một nhóm người chọn phe này, và một nhóm khác chọn phe còn lại, một nhóm khác nữa đứng ở cả hai, nhóm khác nữa không chọn nhóm nào cả. Hai nhóm là nhóm đứng cả hai và nhóm không chọn nhóm nào cả thường ít hoặc không làm gì cả, còn nhóm chọn phe này và nhóm chọn phe kia sẽ đối đầu nhau rất gay gắt.

Dưới sự cường điệu của giới truyền thông, cùng với việc nổi như cồn của những ứng dụng được PR một cách mạnh mẽ, thì nhóm Connectionist AI đang bị xem là … AI.

Sự thật là mỗi nhóm thuật toán đều có chỗ đứng của nó. Không có một thuật toán AI nào toàn năng ở thời điểm hiện tại, giúp giải các bài toán, hay nói cách khác là chúng ta không có “viên đạn bạc” nào trong AI. Mỗi công cụ đều có điểm mạnh và điểm yếu riêng, và việc chúng ta sử dụng đúng công cụ sẽ là chìa khoá cho sự thành công.

Symbolic AI là gì

Nhóm thuật toán này đôi khi còn được gọi là GOFAI (Good Old Fashioned A.I.), không nên hiểu nó theo nghĩa là công nghệ cũ hay công nghệ lỗi thời. Mà nên hiểu là nó là cách tiếp cận cổ điển của việc biến thông tin tri thức và và các luật của con người thành những dòng code trên máy tính.

Con người thường xuyên sử dụng các “biểu tượng” để gán ý nghĩa cho các sự vật và sự kiện trong môi trường của họ. Ví dụ, nếu ai đó nói với bạn của họ rằng họ vừa mua một bó hoa hồng, người nghe tin đó có thể nhanh chóng liên tưởng đến hình ảnh của những bông hoa. Ý tưởng của symbolic AI là những “biểu tượng” này được xây dựng thành khối nhận thức.

Các hệ thống thuộc loại này thường liên quan đến lý luận suy diễn, suy luận logic và một số thuật toán tìm kiếm để tìm ra giải pháp trong các ràng buộc của mô hình đã chỉ định. Chúng bao gồm các hệ thống chuyên gia, sử dụng các quy tắc và cây quyết định để suy ra kết luận từ dữ liệu đầu vào, bộ giải ràng buộc, tìm kiếm giải pháp trong một không gian khả năng và hệ thống lập kế hoạch, cố gắng tìm một chuỗi các hành động để đạt được một mục tiêu được xác định rõ ràng từ một số trạng thái ban đầu. Chúng cũng thường có các biến thể có khả năng xử lý sự không chắc chắn và rủi ro.

Tic-Tac-Toe MiniMax

Các thuật toán như vậy thường có độ phức tạp thuật toán là NP-hard, khi giải quyết các vấn đề trong thế giới thực, nhóm này phải đối mặt với không gian tìm kiếm siêu lớn. Điều này có nghĩa là các thuật toán thuyền thống trang bị kỹ năng tìm kiếm ngẫu nhiên sẽ không hoạt động, ngoại trừ các trường hợp ngoại lệ, Do khả năng cao là lời giản sẽ vét cạn không gian tìm kiếm.

Có rất nhiều nhóm thuật toán trong nhóm này:

Branch and bound algorithms

Các thuật toán thuộc nhóm Branch and bound được sử dụng trong các bài toán tối ưu hoá hoặc bài toán ràng buộc có điều kiện. Khi mà chúng ta không thể áp dụng heuristic trong các bài toán đó. Cách thức hoạt động của các bài toán dạng này là phân vấn đề thành các vùng nhỏ sử dụng upper bound và lower bound, và thực hiện tìm kiếm giải pháp trên các vùng đó.

Local search

Tìm kiếm cục bộ xem xét các biến thể gần đúng và sử dụng các biến thể đó để cố gắng cải thiện nó dần dần. Đôi khi, thực hiện các bước nhảy ngẫu nhiên nhằm thoát khỏi tối ưu cục bộ.

Meta-heuristics

Siêu kinh nghiệm sử dụng các thuật toán tiến hóa, bắt chước các cơ chế cộng tác hoặc phân tán được tìm thấy trong tự nhiên, chẳng hạn như chọn lọc tự nhiên hoặc các hành vi được lấy cảm hứng từ bầy đàn.

Heuristic search

Heuristic search sử dụng hàm lượng giá để xác định mức độ liên quan của điểm dữ liệu và mục tiêu.

Các thuật toán này thường không phù hợp với dữ liệu đầu vào là nhiễu, hoặc trong các tình huống mô hình không được định nghĩa rõ ràng. Chúng tỏ ra hiệu quả trong ngữ cảnh chúng ta có các hành động rõ ràng và cụ thể, và hệ thống cần cung cấp một kỹ thuật chuẩn để triển khai các hành động trên.

Connectionist AI là gì

Cái tên được lấy từ liên kết mạng mà các thuật toán trong nhóm này sử dụng. Kỹ thuật phổ biến trong nhóm này là sử dụng Artificial Neural Network (ANN). Chúng bao gồm nhiều lớp mạng, mỗi lớp sẽ có nhiều node, chúng sẽ xử lý các tín hiệu đầu vào, kết hợp chúng với các trọng số, và biến đổi chúng trước khi đưa vào lớp tiếp theo. Support Vector Machines (SVMs) cũng thuộc nhóm này.

ANNs có rất nhiều biến thể, ví dụ Convolution Neural Networks (được sử dụng chủ yếu trong xử lý ảnh), Long Short-term Memory Networks ( thường được dùng trong bài toán phân tích time series hoặc các bài toán mà thời gian là đặc trưng quan trọng, bị ẩn đi dưới lăng kính bình thường (văn bản :) ). Deep learning về cơ bản là đồng nghĩa với Artificial Neural Networks.

Giá trị cốt lõi của loại kỹ thuật này là người dùng không cần chỉ định các quy tắc của miền được mô hình hóa. Mạng tự phát hiện ra các quy tắc từ training data. Người dùng cung cấp dữ liệu đầu vào và dữ liệu đầu ra mẫu (bộ dữ liệu càng lớn và đa dạng càng tốt). Các thuật toán kết nối sau đó áp dụng các mô hình hồi quy thống kê để điều chỉnh các hệ số trọng số của các biến trung gian của chúng, cho đến khi tìm thấy mô hình phù hợp nhất. Các trọng số được điều chỉnh theo hướng giảm thiểu lỗi tích lũy từ tất cả các điểm dữ liệu huấn luyện, sử dụng các kỹ thuật như giảm độ dốc.

Vì các kỹ thuật này sử dụng các thuật toán cực tiểu hoá độ lỗi, nên chúng vốn có khả năng chống nhiễu. Chúng sẽ loại bỏ các giá trị ngoại lệ và đưa ra giải pháp phân loại dữ liệu trong phạm vi sai số nhất định.

Các thuật toán này không cần một mô hình được cung cấp trước. Nó chỉ cần đủ dữ liệu mẫu và nó sẽ tự suy ra mô hình. Đây là một đặc điểm rất mạnh mẽ, nhưng cũng là một điểm yếu. Các tính năng đầu vào phải được lựa chọn rất cẩn thận. Chúng cũng phải được chuẩn hóa hoặc chia tỷ lệ, để tránh một tính năng áp đảo các tính năng khác và được xử lý trước để có ý nghĩa hơn đối với việc phân loại.

Feature engineering thường có thể là yếu tố quyết định thành công chính của một dự án máy học. Việc có quá nhiều đặc trưng hoặc không có đủ dữ liệu mẫu đại diện cho toàn bộ vấn đề, có thể dẫn dến overfitting hoặc underfitting. Ngay cả với sự giúp đỡ của nhà khoa học dữ liệu lành nghề nhất, bạn vẫn phải chịu sự phụ thuộc vào chất lượng của dữ liệu mà bạn có. Các kỹ thuật này cũng không tránh khỏi curse of dimensionality, hoặc số lượng input feature tăng, hoặc rủi ro của giải pháp không hợp lệ.

Các thuật toán mặc nhiên giả định rằng mô hình thế giới mà chúng đang nắm bắt là tương đối ổn định. Điều này làm cho chúng rất hiệu quả đối với các vấn đề mà luật chơi không thay đổi nhiều hoặc thay đổi với tốc độ đủ chậm để cho phép thu thập đủ các mẫu dữ liệu mới để đào tạo lại và thích ứng với thực tế mới. Nhận dạng hình ảnh là câu chuyện thành công, bởi vì con chó năm nay với năm sau thường không thay đổi nhiều.

Chúng ta nên chọn cái nào

Việc chọn thuật toán dựa vào vấn đề chúng ta cần giải quyết. Ngày nay, việc chọn sai kỹ thuật đang dần trở nên phổ biến. Nguyên nhân rất nhiều, có thể là do sự cường điệu hoá của kỹ thuật đó, hoặc sự thiếu nhận thức về bối cảnh của thuật toán AI. Khi bạn cầm trong tay một cái búa, một thứ bắt bắt đầu giống một cái đinh.

Khi AI phát triển mạnh mẽ trong mọi khía cạnh của cuộc sống của chúng ta, các yêu cầu cho AI càng ngày càng trở nên phức tạp hơn, rất có khả năng ứng dụng của chúng ta sẽ cần cả hai kỹ thuật này. Dữ liệu tiếng ồn được thu thập thông qua các cảm biến có thể được xử lý thông qua ANN để suy ra thông tin rời rạc về môi trường, trong khi thuật toán tsymbolic sử dụng thông tin đó để tìm kiếm không gian của các hành động khả thi có thể dẫn đến một số kết luận rõ ràng hơn.

Một thuật toán học máy có thể rất hiệu quả trong việc suy luận môi trường xung quanh của một phương tiện cá nhân trong một mức xác suất nhất định, nhưng khả năng xảy ra sai sót là không thể chấp nhận được nếu sai sót đó có thể khiến chiếc xe lao xuống vực, nguyên nhân là sai sót đó chưa có trọng training data. Hơn nữa, việc đưa công nghệ học sâu vào các ứng dụng quan trọng đang tỏ ra là một thách thức, đặc biệt là khi một chiếc xe tay ga bị nhầm lẫn với một chiếc dù khi nó bị lật ngửa.

Việc kết hợp với symbolic AI đảm bảo rằng những gì rõ ràng về mặt logic vẫn được thực thi, ngay cả khi lớp học sâu bên dưới nói khác đi do một số sai lệch thống kê hoặc số đọc cảm biến nhiễu. Điều này ngày càng trở nên quan trọng đối với các ứng dụng có rủi ro cao, như quản lý nhà máy điện, điều động tàu hỏa, hệ thống lái tự động và ứng dụng không gian. Hệ lụy của việc phân loại sai trong các hệ thống như vậy nghiêm trọng hơn nhiều so với việc giới thiệu sai phim.

Một hệ thống kết hợp sử dụng cả thuật toán connectionist và symbolic sẽ tận dụng điểm mạnh của cả hai trong khi khắc phục điểm yếu của nhau. Các giới hạn của việc sử dụng một kỹ thuật riêng lẻ đã được xác định và nghiên cứu mới nhất đã bắt đầu chỉ ra rằng việc kết hợp cả hai phương pháp có thể dẫn đến một giải pháp thông minh hơn.

Hướng phát triển tiếp theo của AI

Theo quy luật tự nhiên, cái gì đạt mức độ cực thịnh thì là thời điểm bắt đầu dẫn tới cực suy, AI cũng không ngoại lệ, do đó, theo phỏng đoán, AI có thể tiến hoá theo các chiều hướng sau: