Trang chủ Công nghệ & Ứng dụng Công nghệ & Ứng dụng Bước đầu xác lập hệ chuyên gia ảo hỗ trợ khuyến nông từ xa

Bước đầu xác lập hệ chuyên gia ảo hỗ trợ khuyến nông từ xa

1. Giới thiệu
Ngày nay nền nông nghiệp của nước ta đã và đang phát triển mạnh mẽ, góp phần đảm bảo an ninh lương thực cho khu vực. Tuy nhiên, việc canh tác nông nghiệp ngày càng trở nên khó khăn, phức tạp hơn do thường xuyên phát sinh nhiều loại sâu bệnh lạ và chịu tác động lớn do biến đổi khí hậu... Điều đó đòi hỏi nông dân cần tích lũy kinh nghiệm, tích hợp các tri thức và thông tin từ nhiều nguồn khác nhau trong quá trình canh tác. Để duy trì khả năng cạnh tranh, nâng cao năng suất và chất lượng, nhà nông thường dựa trên kiến thức và thông tin từ các chuyên gia cho việc ra quyết định. Vấn đề là các chuyên gia không phải lúc nào cũng sẵn sàng hỗ trợ kịp thời khi nông dân cần. Để khắc phục vấn đề đó, hiện nay một số hệ thống hỗ trợ khuyến nông dựa trên nền web [1-4] hay thông qua truyền hình trực tuyến đã được thiết lập. Tuy nhiên, chỉ một số ít nông dân có cơ hội tiếp cận với công nghệ này, cũng như cần chi phí thực hiện lớn.

Từ thực tiễn đó, việc xây dựng một hệ thống nhằm hỗ trợ thông tin, kỹ thuật cho nhà nông một cách kịp thời là rất cần thiết và hợp lý. Trong bài viết này, chúng tôi đề cập đến giải pháp hỗ trợ cho công tác khuyến nôngqua mạng thông tin di động bằng tin nhắn văn bản SMS hoặc tinh nhắn hình ảnh MMS. Ngay khi có nhu cầu tư vấn kỹ thuật, nông dân có thể gửi tin nhắn đến tổng đài. Tại đây, một công cụ phân loại sẽ tự động nhận dạng nhu cầu của nông dân. Kết quả tư vấn sẽ được trả về cho nông dân dạng tin nhắn SMS.   

2. Xây dựng hệ thống

Mô hình tổng thể của hệ thống được xây dựng theo nguyên tắc sau: Khi nhà nông có vấn đề/câu hỏi (chẳng hạn như liên quan đến bệnh hại trên cây lúa, cần tư vấn cách điều trị,…) thì họ có thể đặt câu hỏi bằng tin nhắn SMS hoặc chụp lại hình ảnh hiện trạng cho tin nhắn MMS để gửi đến hệ thống bằng điện thoại di động. Yêu cầu này sẽ được hệ thống nhận dạng, phân loại và tự động truy xuất câu trả lời từ cơ sở dữ liệu sẵn có hoặc chuyển đến các chuyên gia thích hợp trong từng lĩnh vực để được giải đáp. Ngay sau khi nhận được phản hồi từ cơ sở dữ liệu hoặc từ phía chuyên gia, hệ thống sẽ gửi trả lại kết quả cho nhà nông bằng tin nhắn SMS. Như vậy, với ý tưởng này, hệ thống có thể xem như một “Nhịp cầu nhà nông trực tuyến 24/7”.

Quy trình xây dựng hệ thống được tóm tắt qua các bước sau:
a) Xây dựng mô-đun gửi/nhận tin nhắn SMS/MMS
b) Xây dựng mô-đun phân loại nội dung tin nhắn văn bản bằng SVM(Support Vector Machine).
c) Tách từ bằng công cụ VnTokenizer [5].
d) Chọn từ khóa hoặc loại bỏ từ dừng (tùy theo cấu hình hệ thống).
e) Xây dựng bộ dữ liệu huấn luyện cho mô hình SVM.
f) Huấn luyện mô hình.
g) Đánh giá kết quả.
h) Xây dựng website để tích hợp các mô-đun, quản lý và cấu hình hệ thống.

Để giao tiếp trực tuyến giữa hệ thống và nông dân, mô-đun gửi và nhận tin nhắn (SMS/MMS) cần được thiết lập. Kỹ thuật này hiện đã được tất cả các nhà mạng hỗ trợ, nên việc thiết lập mô-đun này được tiến hành một cách thuận lợi. Nghiên cứu sử dụng thư viện SMSLIB [6] để gửi/nhận tin nhắn SMS/MMS; thư viện jWAP [7] để kết nối đến Wap Gateway của nhà mạng và JMMSLIB [8] để giải mã tin nhắn MMS. Việc thử nghiệm gửi và nhận tin nhắn được thực hiện thông qua một modem 3G được kết nối trực tiếp với máy tính.

Sau khi tiếp nhận tin nhắn từ nông dân, mô-đun phân loại và nhận dạng nội dung tin nhắn sẽ được kích hoạt.  Mô-đun nhận dạng nội dung tin nhắn này được tiến hành bằng kỹ thuật phân lớp SVM. Trong nghiên cứu này, chúng tôi thực hiện xây dựng và huấn luyện mô hình phân loại nội dung văn bản tin nhắn nhờ vào sự hỗ trợ của công cụ LibSVM[9]. Mô hình này bao gồm 2 bước, (i) xây dựng mô hình phân loại từ tập dữ liệu đã được phân lớp (đã gán nhãn) và (ii) sử dụng mô hình để phân loại văn bản mới (chưa gán nhãn).

Thử nghiệm trên cây lúa, có 6 lớp (nhãn) tương ứng với 6 chuyên ngành của ngành lúa, bao gồm: Bệnh hại lúa/Sâu hại lúa/Cỏ hại lúa/Giống lúa/Kỹ thuật canh tác/Sau thu hoạch[10]. Các chuyên gia được mời cộng tác thuộc một hoặc nhiều chuyên ngành trong sáu chuyên ngành này. Như vậy ta sẽ xây dựng tập dữ liệu huấn luyện với sáu nhãn tương ứng. Ngoài ra ta cũng thêm một lớp là lớp tin nhắn rác nếu nó không thuộc một trong sáu lớp trên để đảm bảo mô-đun phân nhận dạng tin nhắn hoạt động không bị gián đoạn.

Để phân loại tin nhắn văn bản SMS, nghiên cứu sử dụng phần mềm tách từ VnTokenizer [5] để thực hiện việc tách tin nhắn thành các từ độc lập, công cụ này được phát triển dựa trên phương pháp so khớp tối đa (Maximum matching) với tập dữ liệu sử dụng là bảng âm tiết tiếng Việt và từ điển từ vựng tiếng Việt. Công cụ được xây dựng trên ngôn ngữ Java, mã nguồn mở.

3. KẾT QUẢ THỰC NGHIỆM

Bước đầu hệ thống được xây dựng với 1.044 từ khóa thuộc 06 chuyên ngành lúa để thử nghiệm phân loại câu hỏi tin nhắn bằng công cụ SVM. Trang chủ hệ thống cho phép chuyên gia và người quản trị đăng nhập được xây dựng như Hình 1.

Hình 1: Trang chủ website hệ thống

Sau khi tiếp nhận câu hỏi của nhà nông, hệ thống tiến hành phân loại câu hỏi, tự động truy xuất cơ sở dữ liệu câu trả lời hoặc tự động gửi câu hỏi đến cho chuyên gia tương ứng. Câu hỏi đi kèm một mã số để xác định tin nhắn trong cơ sở dữ liệu tin nhắn. Hình 2 minh họa tin nhắn câu hỏi do nông dân gửi đi và nội dung tin nhắn trả lời của hệ thống mà nhà nông nhận được.

4. KẾT LUẬN VÀ ĐỀ NGHỊ

Nghiên cứu này đã sử dụng một số thư viện, phần mềm ứng dụng như SMSLib, jWAP, jMmsLib, LibSVM để xây dựng một hệ chuyên gia ảo, có khả năng tiếp nhận tin nhắn từ nhà nông, phân loại câu hỏi bằng kỹ thuật SVM và gửi tin nhắn trả lời cho nhà nông các giải pháp kỹ thuật hỗ trợ canh tác nông nghiệp. Bước đầu, nghiên cứu này đã tham khảo cơ sở dữ liệu khuyến nông trên nền web [1-4]. Cơ sở dữ liệu này sẽ được xây dựng bổ sung trong quá trình vận hành, thu thập từ các chuyên gia tình nguyện. Hiện tại, hệ thống được thử nghiệm chỉ với hai nhà mạng di động là Mobifone và Vinaphone. Tuy nhiên, việc mở rộng là hoàn toàn khả thi. Việc giới hạn về số lượng ký tự trong một tin nhắn và việc người dùng có thói quen nhắn tin tiếng Việt không có dấu làm cho việc phân loại tin nhắn văn bản trở nên khó khăn hơn. Kết quả thử nghiệm bước đầu cho thấy hệ thống hoạt động tin cậy và hoàn toàn có thể phát triển tiếp để đưa vào áp dụng, theo các hướng đề nghị như sau:

(a)                                         (b)
Hình 11: a) Câu hỏi của nông dân và b) Trả lời của hệ thống cho nông dân

- Phát triển mô-đun nhận dạng hình ảnh từ tin nhắn MMS do nhà nông gửi đến để tự động xác định tình trạng sâu bệnh và đưa ra giải pháp kỹ thuật tương ứng.
- Áp dụng hệ thống trên diện rộng và có thể phát triển mô hình này sang nhiều lĩnh vực khác như cây ăn quả, thủy sản…q

TÀI LIỆU THAM KHẢO
[1]. Thư viện KHCN Quảng Trị, 2014. Các câu hỏi thường gặp (truy cập: 03/2014).
[2]. Công ty CP Phân bón Bình Điền, 2014. Các câu hỏi về lúa (truy cập: 03/2014).
[3]. Bạn nhà nông, 2014. Hỏi và đáp (truy cập: 01/2014).
[4]. Sở KHCN Vĩnh Phúc, 2014. hỏi đáp khoa học kỹ thuật (truy cập: 1/2014).
[5]. http://mim.hus.vnu.edu.vn/phuonglh/node/33 (truy cập: 2/2014)
[6]. SMSLib, 2014. A universal API for sms messaging (truy cập: 01/2014)
[7]. jWAP, 2014.  http://jwap.sourceforge.net/(truy cập: 02/2014 )
[8]. jMmsLib, 2014. http://jmmslib.sourceforge.net (Truy cập: 02/2014 )
[9]. Chang, C.C., Lin,  C.J., 2011.LIBSVM – a library for support vector machines, http://www.csie.ntu.edu.tw/~cjlin/libsvm(truy cập: 3/2014)
[10]. Nguyễn Ngọc Đệ, 2008. Giáo trình cây lúa, Viện nghiên cứu phát triển đồng bằng sông Cửu long, Đại Học Cần Thơ.

Nguyễn Chí Ngôn Đại học Cần Thơ

Số 167+168 (1-2/2015)♦Tạp chí tự động hóa ngày nay


Newer news items:
Older news items:

 

Hỗ trợ online

Hỗ trợ Web
Mr Phương: 0988906030

Liên kết & Quảng cáo


 
 
 






 

 

Nhà tài trợ


Sửa biến tần

Mới cập nhật

Tìm kiếm

Quảng cáo&Liên kết