Facebook Facebook Facebook Facebook

Machine learning là gì?



Khi làm việc trong lĩnh vực Machine learning, ắt hẳn một ngày đẹp trời, bạn sẽ được đồng nghiệp hay những đứa bạn của mình hỏi rằng “Machine learning là gì?”. Để trả lời ngay câu hỏi trên không phải là điều đơn giản vì trên thực tế ta có nhiều hơn một định nghĩa về Machine learning. Do đó, hãy thủ sẵn cho mình câu trả lời ngắn gọn và dễ hiểu nhất để thể hiện bạn không phải là tay mơ trong lĩnh vực này.


Theo góc nhìn của tâm lý học

Con người nhìn nhận thế giới qua các giác quan của mình gồm thị giác, thính giác, xúc giác, khứu giác, và vị giác. Từ những thông tin nhận được qua các giác quan này, mỗi người sẽ có những góc nhìn, những phân tích và đánh giá riêng. Ví dụ, thông qua thị giác của mình, một người sẽ cho rằng đây là tấm hình một người phụ nữ đứng bên góc cây ven sông, nhưng người kia lại cho rằng đây là khuôn mặt của một người đàn ông hói trán.

Hoặc vào thời đại mà kiến thức con người còn hạn hẹp, mọi người đều cho rằng mặt trời quay xung quanh trái đất và trái đất là trung tâm của vũ trụ. Nhưng khi ta xem hiện tượng tự nhiên này dưới một góc nhìn khác là góc nhìn khoa học thì ta biết rằng trái đất quay xung quanh mặt trời. Quay lại định nghĩa Machine learning:

Ta xem máy tính cũng như con người. Bằng những mô hình (góc nhìn) khác nhau, máy tính sẽ cho ra những kết quả với độ chính xác khác nhau. Do đó, việc lựa chọn đúng mô hình cho từng bài toán cụ thể là một yếu tố quan trọng.

Theo góc nhìn của người trong ngành

Trong cuốn sách Machine learning của Tom Mitchell. Ông định nghĩa như sau:

A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

Từ định nghĩa trên, ta có thể diễn giải như sau: máy tính được gọi là học từ kinh nghiệm (dữ liệu) E với tác vụ (dự đoán, phân lớp, gom nhóm) T và được đánh giá bởi độ đo (độ chính xác) P nếu máy tính khiến tác vụ T này cải thiện được độ chính xác P thông qua dữ liệu E cho trước.

Thoạt đầu ta có thể lúng túng trước phát biểu này, nhưng đây là các thành phần cở bản mà bất cứ hệ thống Machine learning nào cũng có. Đó là, dữ liệu E cho trước (tập dữ liệu email) nhằm hoàn thành tác vụ T (xác định email là spam hay không). Mô hình này được đánh giá bởi độ đo P (độ chính xác), từ đó ta có thể tiến hành cải thiện mô hình dựa vào độ đo P này.

Theo góc nhìn của thống kê

Trong cuốn sách Pattern recognition của Christopher Bishop ông có phát biểu khác dưới góc nhìn của thống kê.

Pattern recognition has its origins in engineering, whereas machine learning grew out of computer science. However, these activities can be viewed as two facets of the same field.

Pattern recognition (nhận diện mẫu hay nhận diện quy luật) là cách nhìn khá thú vị. Từ xa xưa, ông cha ta có đưa ra một số quy luật nhờ biết quan sát hiện tượng tự nhiên như “Chuồn chuồn bay thấp thì mưa, bay cao thì nắng, bay vừa thì râm”. Do tập dữ liệu quá lớn, với khả năng quan sát hữu hạn của con người, ta khó có thể nhận diện được các quy luật để xây dựng mô hình dự đoán chính xác. Vì vậy, dựa vào các mô hình thống kê, ta hy vọng rằng máy tính có thể đưa ra những quy luật tìm ẩn có giá trị để chúng ta có thể khai thác và phục vụ cho những nghiên cứu của mình.


Theo góc nhìn của lập trình viên

Để có thể cài đặt được mô hình Machine learning, ta tiến hành các bước sau:
Chuẩn bị dữ liệu để cho máy tính “học”. (Data)
Xây dựng mô hình thông qua dữ liệu đầu vào. (Algorithm)
Đánh giá mô hình vừa mới xây dựng. (Model)
Câu trả lời ngắn gọn

Qua các góc nhìn thú vị trên, tôi sẽ đưa ra định nghĩa riêng của mình về Machine learning.


Machine learning là quá trình xây dựng mô hình dự đoán dựa vào dữ liệu cho trước và được đánh giá hiệu suất bởi một độ đo nào đó.

Tóm lại, để máy tính có thể học ta cần có dữ liệu cho trước. Không có dữ liệu thì máy tính không thể học. Từ dữ liệu này, tùy vào bài toán chúng ta cần giải quyết mà ta sẽ quyết định lựa chọn mô hình phù hợp để có thể đưa ra kết quả chính xác nhất.


0 nhận xét:

Đăng nhận xét