Thứ tư, 28/12/2022 10:41

Hệ thống hỗ trợ kiểm soát giao thông thông minh sử dụng cơ sở hạ tầng thiết bị biên

ThS Đào Trần Nguyên Bảo

Công ty TNHH Anscenter HCM

Với sự gia tăng dân số ở khu vực thành thị, nhiều khu vực đã bắt đầu ứng dụng mô hình trí tuệ nhân tạo (AI) để giải quyết các vấn đề cấp bách trong quản lý giao thông thông minh. Việc phát triển một hệ thống camera AI hỗ trợ tự động theo dõi và cảnh báo là chìa khóa để giải quyết các vấn đề trên. Ngoài ra, thiết bị biên trở thành một trong những lựa chọn tối ưu để thiết lập cơ sở hạ tầng cho hệ thống camera AI đáp ứng các yêu cầu thực tế. Tại Hội nghị NVIDIA GTC 20211, ANSCENTER2 và ADVANTECH3 đã giới thiệu giải pháp toàn diện giúp phát triển hệ thống camera AI sử dụng công nghệ điện toán biên của NVIDIA hỗ trợ kiểm soát giao thông thông minh một cách hiệu quả.

Tiềm năng thị giác máy tính và điện toán biên AI

Thị giác máy tính (Computer vision) là việc mô hình hóa quá trình xử lý hình ảnh bằng cách sử dụng các kỹ thuật của học máy, quá trình này cũng giống như quá trình suy luận trực quan của thị giác con người.

Điện toán biên AI (Edge AI) là các thuật toán AI được xử lý cục bộ trên một thiết bị phần cứng nhỏ và có thể lắp đặt bổ sung bất cứ lúc nào và ở bất cứ đâu thay vì tập trung trên cơ sở dữ liệu điện toán đám mây hoặc những máy chủ mạnh cần quản lý tập trung tại một địa điểm. Edge AI sẽ cho phép các hoạt động thời gian thực bao gồm tạo dữ liệu, quyết định và đưa ra hành động trong khoảng thời gian tính bằng mili giây.

Trong những năm gần đây, thị giác máy tính và Edge AI đã trở thành trung tâm của những nghiên cứu mới nhất về AI. Tuy nhiên, thị giác máy tính đặt ra các tiêu chuẩn cao đối với tài nguyên phần cứng, yêu cầu về phần cứng là khác nhau đối với các giai đoạn phát triển hệ thống AI khác nhau. Điện toán đám mây là một giải pháp thay thế khả thi, nhưng nó cũng đặt ra các vấn đề mới như yêu cầu cao trong phản hồi thời gian thực hoặc quyền riêng tư của dữ liệu. Những hạn chế này dẫn tới khó khăn trong việc triển khai ứng dụng thị giác máy tính trong các ứng dụng thực tế.

Edge AI là giải pháp được nghiên cứu để hiện thực hóa thị giác máy tính trong thực tế. Họ cung cấp cho thị trường cơ sở hạ tầng mới để trao quyền cho các hệ thống suy luận AI với kích thước nhỏ nhưng đủ mạnh cho các tác vụ thị giác máy tính và có thể cài đặt bất kỳ đâu. Tầm quan trọng của thị giác máy tính và thiết bị Edge đã và đang được nhận được nhiều sự quan tâm từ các nhà phát triển và doanh nghiệp.

Tuy nhiên, sự kết hợp của các công nghệ này vẫn chưa phổ biến vì việc triển khai các mô hình AI vào các thiết bị tiên tiến đặt ra nhiều vấn đề. Giả sử người dùng hay nhà phát triển muốn sử dụng thiết bị Edge AI để gia tăng sức mạnh tính toán cho hệ thống AI của họ. Trong trường hợp này, họ sẽ phải thực hiện nhiều công đoạn như kết nối các loại camera khác nhau, cài đặt hoặc thay đổi cấu hình vào thiết bị biên, tối ưu hóa xử lý cho các ứng dụng AI khác nhau, tạo ra giao diện lập trình cho các ứng dụng (Application Programming Interface - API)… Các tác vụ này đòi hỏi các nhà phát triển phải có kỹ năng và kinh nghiệm để tiếp cận cũng như những thách thức về quyền riêng tư của dữ liệu và tính linh hoạt trong việc phát triển hệ thống độc lập.

Hình 1. Ứng dụng thị giác máy tính trong hệ thống giao thông.

Giải pháp hỗ trợ kiểm soát giao thông thông minh

Hệ thống giao thông thông minh là một trong các ưu tiên hàng đầu trong xây dựng và phát triển thành phố thông minh như hiện nay, nhằm xây dựng hệ thống giao thông an toàn, bền vững. Theo ước tính của Forbes, chỉ riêng mảng giao thông thông minh có thể đạt tới doanh thu 3,5 tỷ USD vào năm 2023. Một ví dụ điển hình trong triển khai quản lý giao thông thông minh của Advantech được mô tả như hình 2.

Hình 2. Mô tả hệ thống quản lý giao thông thực tế của ADVANTECH.

Kết quả thực nghiệm cho thấy, việc triển khai hệ thống là rất thiết thực và nhiều tiềm năng, giúp giảm tải 40% thời gian dừng xe chờ đèn, 20% lượng khí phát thải, 25% thời gian di chuyển. Tuy nhiên, hiện tại các ứng dụng này vẫn chưa thể triển khai rộng rãi trong thực tế vì những lý do về chi phí phần cứng và chi phí triển khai lắp đặt hệ thống.

ANSVIS (ANS Intelligence Video System) là một trong những giải pháp thiết thực được ANSCENTER và ADVANTECH đưa ra nhằm hỗ trợ thiết lập cơ sở hạ tầng toàn diện cho hệ thống giao thông thông minh dựa trên Edge AI. ANSVIS giúp người dùng triển khai các mô hình AI vào các thiết bị biên đã được kết nối với các camera cụ thể. Đây là một trong những giải pháp đầu tiên trên thị trường có thể cho phép người dùng linh hoạt trong việc triển khai đa mô hình, cập nhật và chuyển đổi linh hoạt mô hình bất cứ lúc nào. Một số tính năng chính của mô hình ANSVIS:

Kết nối và quản lý camera: hỗ trợ kết nối các với camera có sẵn bằng giao thức truyền tin thời gian thực (Real time streaming protocol - RTSP) bằng cáp mạng UTP (Unshielded twisted pair). Ngoài ra, người dùng có thể kết nối với các camera cùng lớp mạng nội bộ.

Kết nối và quản lý thiết bị biên: hỗ trợ kết nối các thiết bị biên thành một hệ thống và cho người dùng khả năng phân chia năng lực xử lý của hệ thống này.

Quản lý triển khai và tối ưu mô hình: hỗ trợ triển khai các mô hình AI dựa trên năng lực phần cứng, chuyển đổi linh hoạt các mô hình AI.

Triển khai nhiều mô hình theo kịch bản: người dùng có thể triển khai nhiều mô hình cùng lúc và chồng lớp mô hình để cải thiện bài toán AI. Ví dụ, để phát hiện người đội mũ bảo hiểm tốt hơn, hệ thống sẽ phát hiện phương tiện di chuyển là xe máy trước, sau đó chuyển tới mô hình phát hiện người ngồi trên xe, tiếp theo mới phát hiện người đó có đội mũ bảo hiểm hay không và cuối cùng mới tiến hành phát hiện biển số và phân tích nhận dạng ký tự quang học (Optical character recognition - OCR). Với thiết kế như vậy, ANSVIS đã cho phép người dùng triển khai đồng thời 4-5 mô hình cùng lúc và theo kịch bản cụ thể để thực hiện một bài toán thị giác máy tính hiệu quả hơn.

Lựa chọn và thiết kế điều kiện triển khai (trigger): hỗ trợ thiết kế các bài toán thị giác máy tính một cách dễ dàng. Chỉ bằng những thao tác kéo thả người dùng có thể đặt ra các điều kiện như: lựa chọn vùng nhận diện, tùy chỉnh thời gian nhận diện tối thiểu, hướng di chuyển (hoặc đứng yên) của vật thể nhận diện... Nhờ vậy, một người không có kinh nghiệm lập trình cũng có thể hoàn thành gần như tất cả các bài toán thị giác máy tính một cách dễ dàng.

Trong thử nghiệm thiết kế hệ thống phát hiện đậu xe chẵn lẻ, người dùng sử dụng các công cụ thiết lập trigger của ANSVIS để vẽ các hàng rào ảo xác định vị trí đậu xe cần phát hiện có xe xuất hiện, sau đó cài đặt thời gian xuất hiện của xe nếu quá 60 giây hoặc 300 giây thì sẽ có cảnh báo bắn về theo API đã thiết lập. Như vậy, người dùng đã hoàn thành việc thiết kế một bài toán thị giác máy tính trong giao thông một cách rất đơn giản và sử dụng các camera sẵn có.

Hình 3. Thực tế trong triển khai phát hiện đậu xe chẵn lẻ.

Khi phát hiện được vật thể thỏa mãn yêu cầu và kịch bản vận hành mô hình được thiết lập, hệ thống sẽ gửi phản hồi theo các trigger do chính người dùng cài đặt và kết nối với hệ thống thông báo của bên thứ 3 thông qua các giao thức API thông dụng. Từ đây, người dùng có thể kết nối với các cơ sở hạ tầng của mình như hệ thống quản lý video, thiết bị internet vạn vật (IoT) để tạo ra đa dạng các loại hình thông báo như cảnh báo, báo động, tin nhắn hoặc gửi lệnh đến hệ thống quản lý video...

ANSVIS là một mô hình tối ưu cho hệ thống suy luận thị giác máy tính, tạo tiền đề khả thi để người dùng cuối có thể tập trung vào việc quản lý camera từ xa trên số lượng lớn và phát triển các ứng dụng liên quan từ kết quả suy luận của hệ thống camera trong thời gian ngắn nhất. Đồng thời, ANSVIS còn cung cấp các công cụ giúp người dùng đặt điều kiện phức tạp cho việc nhận diện vật thể và triển khai nhiều mô hình nhận diện theo thứ tự kịch bản mong muốn. Từ đó, người dùng không có kinh nghiệm về lập trình AI cũng có thể tự tay thiết kế hầu hết các bài toán thị giác máy tính đơn giản và hiệu quả chỉ bằng cách kéo thả các công cụ đã được cung cấp.

Ngoài ra, ANSVIS sẽ không ảnh hưởng đến cơ sở hạ tầng hiện tại, nó đóng vai trò thiết kế nên hệ thống cơ sở hạ tầng phía sau (back-end). Vì vậy, ANSVIS có thể được sử dụng bởi bất kỳ nhà thầu và nhà phát triển nào để nâng cấp hệ thống hiện tại của họ. ANSVIS tối ưu hóa tốc độ suy luận trong các thiết bị biên để cho phép phản hồi theo thời gian thực trong trình giám sát lưu lượng. Hệ thống mở ra giải pháp để chuyển đổi tất cả các camera trong hệ thống của khách hàng thành camera thông minh với chi phí không quá đắt đỏ và chuyển đổi mô hình hệ thống linh hoạt theo từng phần, từng khu vực, từng giai đoạn. ANVIS có thể dễ dàng thử nghiệm thí điểm với chi phí thấp và thiết lập vận hành trên thực tế ở bất cứ khu vực giao thông nào tại Việt Nam.

 

1 NVIDIA GTC là sự kiện về AI toàn cầu dành cho các nhà phát triển, nhà nghiên cứu, những người dẫn đầu và định hình xu hướng công nghệ trên thế giới.

2 Startup công nghệ có trụ sở đặt tại TP Sydney của Australia, được sáng lập bởi TS Nguyễn Tuấn Nghĩa - Cựu sinh viên trường Đại học Công nghệ Sydney (UTS).

3 Tập đoàn công nghệ thành lập năm 1983 tại Đài Loan, có trụ sở tại 26 quốc gia trên toàn cầu.

 

TÀI LIỆU THAM KHẢO

1. https://www.nvidia.com/en-us/on-demand/session/gtcfall21-a31649/?fbclid=IwAR1FPjvnaoLJ0HT1f7aM3nMlCNZZx9G-tJAzDCp0BLjKzSIsl-xBlPBPlDc.

2. https://www.advantech.com/vi-vn/resources/news/advantech-anscenter-giai-phap-kiem-tra-truc-quan-ai-uc-viet-nam?fbclid=IwAR17OvMBH934sR_jLoOqj7y2FgqxFz8gN-adIg3GLMaJz9it9-LwO97ytoI.

 

 

 

 

 

Đánh giá

X
(Di chuột vào ngôi sao để chọn điểm)