‘Trí tuệ nhân tạo’ - AI là một lĩnh vực khoa học nghiêm ngặt tập trung vào việc thiết kế hệ thống và máy móc thông minh, sử dụng các thuật toán được lấy cảm hứng phần nào từ những gì chúng ta biết về bộ não của con người.
‘Trí tuệ nhân tạo’ - AI sẽ mang lại sự thay đổi lớn trong xã hội thông qua sự phát triển của ô tô tự lái, phân tích hình ảnh y học, chẩn đoán bệnh án tốt hơn hay các loại thuốc được cá nhân hóa. Và nó cũng sẽ là nền tảng của rất nhiều các ứng dụng và dịch vụ mới nhất của tương lai. Đối với nhiều người, khái niệm về "Trí tuệ nhân tạo" vẫn còn là một bí ẩn.
Để giúp gỡ bỏ bí ẩn này, Facebook đang tạo ra một loạt các video trực tuyến với thông tin về cách thức ‘Trí tuệ nhân tạo’ - AI hoạt động và hy vọng những lời giới thiệu đơn giản, ngắn gọn sẽ giúp mọi người hiểu thêm về lĩnh vực khoa học kỹ thuật cao này.
Trí tuệ nhân Tạo: Không phải là phép thuật
Nhiều hệ thống ‘Trí tuệ nhân tạo’ - AI hiện đại sử dụng các mạng lưới thần kinh nhân tạo, mã máy tính mô phỏng các hệ thống mạng lưới rộng lớn các đơn vị đơn giản, giống như tế bào thần kinh trong não. Các mạng lưới này có thể học hỏi từ kinh nghiệm bằng cách thay đổi các kết nối giữa các bit giống như cách bộ não của con người và động vật làm với tế bào thần kinh.
Mạng lưới thần kinh hiện đại có thể học cách nhận diện mô hình, dịch thuật, học cách tư duy logic đơn giản, và thậm chí tạo hình ảnh và xây dựng những ý tưởng mới. Nhận diện mô hình đặc biệt quan trọng – ‘Trí tuệ nhân tạo’ - AI có thể nhận diện mô hình với số lượng lớn dữ liệu, một điều không hề dễ dàng đối với con người.
Tất cả quá trình này xảy ra với tốc độ vô cùng cao, thông qua một tập hợp các chương trình mã hóa được thiết kế để chạy các mạng lưới thần kinh với hàng triệu đơn vị và hàng tỷ kết nối. Trí thông minh đến từ những tương tác giữa số lượng lớn các thành phần đơn giản này.
Trí thông minh nhân tạo không phải là ma thuật, nhưng chúng ta đã nhìn thấy những đóng góp của nó trong nghiên cứu khoa học và sự kỳ diệu của việc xác định các đối tượng trong ảnh, nhận diện lời nói, lái xe, hoặc dịch một văn bản trực tuyến ra hàng chục ngôn ngữ.
Tại phòng nghiên cứu Trí thông minh Nhân tạo của Facebook - Facebook Artificial Intelligence Research (FAIR), Facebook đang cải thiện các cỗ máy thông minh để làm việc tốt hơn. Một phần lớn trong số này được gọi là deep learning - học sâu, là cách mà Facebook cải thiện trí thông minh của máy móc bằng cách cơ cấu mạng lưới thần kinh qua nhiều lớp xử lý. Sử dụng học sâu, chúng ta có thể giúp ‘Trí tuệ nhân tạo’ - AI tiếp nhận các thông tin trừu tượng của thế giới. Học sâu có thể giúp cải thiện nhận dạng bài lời nói và đối tượng và nó có thể đóng vai trò quan trọng trong việc thúc đẩy nghiên cứu trong các lĩnh vực khác nhau như vật lý, kỹ thuật, sinh học và y học.
Một hệ thống đặc biệt hữu ích của hệ thống học sâu được gọi là mạng lưới thần kinh chập, hoặc gọi là ConvNet. Một ConvNet là một cách đặc biệt để kết nối các đơn vị trong một mạng lưới thần kinh được lấy cảm hứng từ kiến trúc của vỏ não thị giác ở động vật và con người.
ConvNets hiện đại có thể tối ưu từ 7 tới 100 lớp của các đơn vị. Trong một công viên chúng ta có thể thấy một chú chó collie và chihuahua, nhưng đều coi chúng là chó, mặc dù kích thước và trọng lượng của chúng khác nhau. Đối với máy tính, một hình ảnh đơn giản chỉ là một dãy số. Với các dãy số này, các họa tiết lớn, chẳng hạn như các hình khối của vật thể, có thể được dễ dàng phát hiện trong các lớp đầu tiên. Lớp tiếp theo sẽ phát hiện sự kết hợp của những họa tiết đơn giản tạo nên các hình dạng đơn giản, như bánh xe của một chiếc xe hoặc mắt trong một khuôn mặt. Lớp tiếp theo sẽ phát hiện sự kết hợp của các hình khối tạo thành các bộ phận của đối tượng, như một khuôn mặt, chân, hoặc cánh của máy bay. Lớp cuối cùng sẽ phát hiện sự kết hợp của các bộ phận tạo thành đối tượng: một chiếc xe, một chiếc máy bay, một người, một con chó, vv Độ sâu của mạng lưới - với nhiều lớp của nó - cho phép nó nhận biết các mô hình phức tạp này .
Khi được cung cấp một cơ sở dữ liệu đủ lớn, ConvNets đặc biệt hữu ích cho việc nhận diện các tín hiệu tự nhiên như hình ảnh, video, lời thoại, âm nhạc, và thậm chí cả văn bản. Để đào tạo một mạng lưới tốt, bạn cần phải cung cấp một lượng lớn các hình ảnh đã được phân loại bởi con người. Các ConvNet học cách kết nối mỗi hình ảnh với nhãn tương ứng của nó. Điều thú vị là nó sẽ tạo ra các nhãn tốt cho những hình ảnh nó chưa bao giờ thấy trước đây. Kết quả là một hệ thống có thể lược qua một khối lượng lớn các hình ảnh và xác định những gì có trong bức ảnh. Các mạng lưới này cũng cực kì hữu dụng trong nhận diện lời nói và văn bản, và là một thành phần quan trọng của những chiếc xe tự lái và thế hệ mới nhất của hệ thống phân tích hình ảnh y học.