Học máy, trí tuệ nhân tạo và Ô Nhiễm Không Khí

LTG: Tút này đã pót trên mục ONKK tuy nhiên nhận thấy đây là vấn đề chung do mấy năm nay ML và AI bị or được “chém” ở tất cả các ngành và mọi lãnh vực! (Đây là một vài cảm nghĩ khi có anh bạn có gửi tin đọc trên tờ báo mạng lớn về một anh Tiến sĩ có 4 bằng sáng chế ‘dạy’ máy học đo ô nhiễm môi trường!).

Học máy, trí tuệ nhân tạo và ONKK

Gần đây có khá nhiều đề tài về ứng dụng học máy (machine learning-ML) và trí tuệ nhân tạo (AI) vào lãnh vực ONKK khi nhiều anh chị từ ngành máy tính (thậm chí không hẳn chuyên về khoa học dữ liệu) đá sang nghiên cứu về ONKK. Liên ngành trong nghiên cứu về ONKK là rất cần thiết để có thể xem xét các góc độ ảnh hưởng khác nhau của ONKK, hoặc ứng dụng công nghệ và các phương pháp mới trong việc xử lý dữ liệu ONKK.

Để có thể có nghiên cứu tốt trong nghiên cứu liên ngành cần sự phối hợp của các chuyên gia mỗi ngành, và sẽ kém hiệu quả (thậm chí nhiều kết quá rất buồn cười) nếu 1 người chuyên ngành này nhảy sang làm đề tài chuyên nghành kia khi chưa thực sự tìm hiểu vấn đề của ngành đó. Theo cảm giác chủ quan của tôi thì một số chưa thực sự hiểu sâu về ONKK và thạm chí còn mù mờ một số thuật ngữ cơ bản.

Ứng dụng AI/ML trong ngành ONKK

Cũng cần chú ý là AI hay ML đã được ứng dụng trong bài toán ONKK hàng thập kỷ. Như trong lãnh vực hẹp về tìm nguồn ô nhiễm bụi mịn, chúng tôi đã áp dụng các thuật toán phân loại như phân tích cụm (K-mean Clusters) hoặc phân tích nhân tố thành phần cách đây cả chục năm. Các thuật toán như Random forest hay mạng CNN (convolutional neural nets) cũng được ứng dụng rộng rãi trong việc xử lý số liệu trống. Đặc biện hiện tại các thuật toán về học sâu (DL) đang có nhiều ứng dụng hay trong phân tích dữ liệu viễn thám.

Chúng ta cần phát triển gì?

Tuy nhiên AI/ML không phải là chìa khóa vạn năng để giải mọi bài toán, và cần hiểu nên sử dụng cho bài toán nào! Đọc nhiều bài báo khoa học như bài báo được tung hô của vị tiến sĩ trên kia chết cười! Nhiều vị dùng thuật toán có sẵn cho một ít dữ liệu, không hiểu thuật toán nó chạy ra sao rồi tung hô độ dự đoán chính xác trên 90%. Mà không chỉ ngành tôi, hồi nọ đọc bài báo 1 tập đoán số một ở VN còn bỏ ra cả chục triệu mua công ty start-up của Singapor về công nghệ AI chẩn đoán Covid bằng hơi thở! Gần đây tập đoàn đó còn có bán gói “bói toán khoa học”: đoán 120 tính cách qua nước bọt!

Tôi cho rằng vấn đề quan trọng nhất khi sử dụng ML trong lĩnh vực ONKK là chất lượng về dữ liệu và hiểu về dữ liệu, chứ không hẳn bê những thuật toán từ những thư viên đã có sẵn rồi đem chém ngang và bổ dọc. Do đó chúng ta cần phát triển những bộ dữ liệu có độ tin cậy cao. ML/AI trong lĩnh vực ONKK chỉ là một công cụ bổ trợ cho những nghiên cứu căn bản đã có từ trước. Vì vậy theo tôi tăng cường phát triển những nghiên cứu căn bản (thí dụ như xây dựng mô hình vận chuyển hóa học dựa trên kiểm kê nguồn thải) mới là cái gốc để giải quyết vấn đề trong đó có bài toán dự báo ô nhiễm trong tương lai.

Updated:

Leave a comment