Sản phẩm "Thiết bị thông minh dành cho người khiếm thị" của em Bùi Đình Nguyên Khoa, Trường Trung học phổ thông Chuyên Nguyễn Tất Thành tỉnh Kon Tum là 1 trong 5 sản phẩm được Ban tổ chức Hội thi Sáng tạo kỹ thuật tỉnh Kon Tum đánh giá cao và chọn gửi dự thi Cuộc thi Sáng tạo TTN-ND toàn quốc lần thứ 15 năm 2018-2019.
Sản phẩm được ứng dụng thị giác máy tính, trí tuệ nhân tạo để phục vụ người khiếm thị, với các tính năng như: nhận diện, miêu tả gương mặt; nhận diện vật thể, ký tự bằng quang học; tìm kiếm các thông tin, tin tức và điều khiển các thiết bị thông minh.
Bùi Đình Nguyên Khoa cho rằng, cùng với sự phát triển của khoa học, công nghệ, nhiều sản phẩm hiện đại được ra đời phục vụ cho nhu cầu của con người. Tuy nhiên, các sản phẩm dành cho người khiếm thị vẫn còn nhiều hạn chế. Người khiếm thị thường gặp rất nhiều khó khăn trong việc đi lại, ảnh hưởng đến đời sống, sinh hoạt hằng ngày.
Tuy nhiên, các thiết bị thông minh trên thị trường hiện nay như máy chuyển thể văn bản thành chữ nổi, kính thông minh,… là sản phẩm nước ngoài, không hỗ trợ tiếng Việt và giá thành cao nên đa số người khiếm thị trong nước chưa tiếp cận được thiết bị này. Từ những suy nghĩ trên, Bùi Đình Nguyên Khoa đã có ý tưởng nghiên cứu ra sản phẩm của này.
Sản phẩm có các tính năng như: Miêu tả cảnh bằng câu văn có ý nghĩa; nhận diện vật thể; nhận diện gương mặt, miêu tả gương mặt; nhận diện ký tự; tra cứu thông tin trên internet; điều khiển thiết bị IoT; giao tiếp giữa thiết bị và máy chủ, nhận diện lệnh và đưa ra kết quả và các tính năng mở rộng như: tra cứu thời tiết, đọc báo…
Về cấu tạo của sản phẩm gồm phần cứng và phần mềm. Phần cứng có bo mạch nhúng Raspberry pi zero, Raspberry pi camera, nút bấm cảm ứng, Microphone, loa. Phần mềm Khoa đã sử dụng ngôn ngữ lập trình Python, C++, thiết bị và máy chủ đều sử dụng hệ điều hành Linux.
Hoạt động của thiết bị, (với nhiệm vụ là Client) sau khi nhấn nút và thu nhận lệnh thì sẽ chụp lại hình ảnh, gửi lệnh và hình ảnh đến máy chủ (server) để xử lý các tác vụ nhận diện, tìm kiếm thông tin tiền xử lý và gửi đến các API hậu xử lý. Máy chủ sẽ gửi kết quả xử lý về cho thiết bị, thiết bị sẽ phát ra giọng nói cho người dùng hiểu.
Bùi Đình Nguyên Khoa chia sẻ: “Ứng dụng trí tuệ nhân tạo và thị giác máy tính để xây dựng và tạo ra các thiết bị phân tích hình ảnh giúp ích cho cuộc sống. Ngoài ra còn nghiên cứu để tạo ra nhiều thiết bị với chức năng khác nhau để giải quyết các vấn đề trong xã hội như cảnh báo tắc đường, quản lý tội phạm, điểm danh, chấm công, làm máy đọc chữ,…”
Tuy nhiên, sản phẩm cũng vẫn còn một số nhược điểm như, miêu tả cảnh mất tới gần 10 giây để xử lý; phải cần có mạng internet để thiết bị hoạt động; sản phẩm còn thiếu thẩm mỹ, chưa có case để bảo vệ thiết bị cũng như người dùng khỏi dây mạch, Khoa nói.
Hiện sản phẩm đang ở giai đoạn thử nghiệm, nhưng với mục tiêu giúp cho xã hội nói chung và người khiếm thi nói riêng bằng công nghệ mới, thời đại 4.0, “thuần Việt cho người Việt” em sẽ tiếp tục nghiên cứu phát triển thêm để cải tiến độ chính xác trong việc nhận dạng, phát triển phần sửa lỗi khi nhận diện ký tự bằng máy học, tối ưu hóa phần mềm với phần cứng. Phát triển ứng dụng điện thoại để người dùng thêm tên mới vào danh bạ, cài đặt thiết bị dễ dàng. Đồng thời mở mã nguồn, xây dựng dữ liệu sách nói cho người khiếm thị; tổng hợp giọng nói có âm điệu dễ nghe và nghiên cứu thu gọn kính để sản phẩm trở nên thẩm mỹ hơn, Khoa chia sẻ.
Tiến sĩ Nguyễn Văn Giang, Trưởng phòng nghiên cứu Khoa học và Hợp tác quốc tế, Trường Cao đẳng Cộng đồng, Chủ tịch Hội đồng giám khảo Cuộc thi Sáng tạo Thanh thiếu niên, nhi đồng tỉnh Kon Tum lần thứ 11 năm 2018-2019 cho biết, sản phẩm của Bùi Đình Nguyên Khoa có nhiều chức năng, nhiều ưu điểm, mang tính xã hội cao; là một sản phẩm thuần Việt, đa tính năng và gần gũi với người khiếm thị, dễ sử dụng, giúp đỡ cho người khiếm thị hòa nhập với cuộc sống.