Bạn cảm thấy mệt mỏi với việc phải liên tục ra lệnh cho trợ lý AI của mình? Tầm nhìn thế hệ tiếp theo về trợ lý AI phổ quát của Google hứa hẹn sẽ giải quyết vấn đề đó và mang lại nhiều hơn thế nữa cho người dùng công nghệ. Trợ lý này không chỉ lắng nghe mà còn chủ động hành động, định hình một kỷ nguyên mới cho tương tác giữa con người và thiết bị.
Project Astra: Bước Tiến Đột Phá Của Trợ Lý AI Trên Android
Google đã trình diễn tầm nhìn của mình về một “trợ lý AI phổ quát” – một hệ thống có khả năng hiểu ngữ cảnh xung quanh bạn, đưa ra giải pháp và tự động thực hiện các tác vụ thay mặt bạn. Mục tiêu cuối cùng là tạo ra một trợ lý toàn diện, có thể “nhìn thấy” và “nghe thấy” mọi thứ, tự động nhận ra khi nào cần thiết và đưa ra hỗ trợ mà không cần người dùng phải gọi thủ công.
Trợ lý mới này được gọi là Project Astra, và Google đã giới thiệu những màn trình diễn khá ấn tượng về khả năng của nó tại sự kiện Google I/O. Trong một bản demo, một người dùng đang gặp sự cố với phanh xe đạp của họ và yêu cầu Astra tìm kiếm hướng dẫn sử dụng xe trực tuyến.
Sau khi Astra tìm thấy hướng dẫn, nó được yêu cầu cuộn đến phần nói về phanh xe đạp và thực hiện thao tác này một cách hoàn hảo. Người dùng tiếp tục yêu cầu Astra tìm kiếm một video hướng dẫn trên YouTube và liên hệ với cửa hàng xe đạp để hỏi thông tin về các bộ phận cần thiết. Đáng ngạc nhiên hơn, Astra thậm chí còn có thể hỏi cửa hàng xem các bộ phận đó có sẵn trong kho hay không.
Trang The Verge cũng đã ghi nhận một bản demo khác, nơi Bibo Xiu, quản lý sản phẩm thuộc nhóm Google DeepMind, hướng camera điện thoại của mình vào một cặp tai nghe Sony và yêu cầu Astra nhận diện chúng. Astra đã trả lời rằng đó là tai nghe WH-1000XM4 hoặc WH-1000XM3 – một sự nhầm lẫn mà hầu hết con người cũng có thể gặp phải.
Sau khi nhận diện, Xiu yêu cầu Astra hiển thị hướng dẫn và giải thích cách ghép nối tai nghe với điện thoại của cô. Cô ấy thậm chí còn ngắt lời trợ lý AI khi nó đang trả lời và yêu cầu nó tự ghép nối tai nghe. Như bạn có thể đoán, Astra đã thực hiện yêu cầu mà không gặp bất kỳ vấn đề nào.
Từ các bản demo, có vẻ như Astra đang mô phỏng các thao tác nhập liệu trên màn hình để di chuyển xung quanh giao diện. Các chỉ báo ghi màn hình cũng cho thấy Astra đọc màn hình của bạn và quyết định vị trí cần đến, điều hướng qua các giao diện người dùng khác nhau khi thực hiện nhiệm vụ của mình.
Tầm Nhìn Về Một Trợ Lý AI Phổ Quát Toàn Diện
Mặc dù ấn tượng, những bản demo này vẫn chưa hoàn hảo. Chúng vẫn yêu cầu một số thao tác đầu vào từ người dùng, và trong trường hợp demo của Xiu, cô ấy phải tự bật một tính năng cấp cho Astra quyền truy cập vào màn hình điện thoại của mình.
Ở thời điểm hiện tại, Project Astra đóng vai trò như một “phòng thí nghiệm” cho những tham vọng AI táo bạo nhất của Google. Các tính năng hoạt động tốt tại đây cuối cùng sẽ được tích hợp vào các công cụ như Gemini và trở nên khả dụng với chúng ta. Google khẳng định rằng tầm nhìn cuối cùng của họ là “biến ứng dụng Gemini thành một trợ lý AI phổ quát, sẽ thực hiện các tác vụ hàng ngày cho chúng ta.”
Google đang nỗ lực hết mình, từng bước loại bỏ các công cụ cũ để thay thế bằng các công cụ mới hơn, được hỗ trợ bởi AI. AI Mode đang dần thay thế Google Search, và đã có một danh sách các tính năng Gemini ấn tượng mà người dùng nên thử.
Biểu tượng ứng dụng Gemini trên điện thoại thông minh
Ngay cả các hệ thống AI tiên tiến nhất hiện nay vẫn yêu cầu bạn nhập lời nhắc ở mỗi bước, cung cấp dữ liệu và ngữ cảnh cần thiết, và đôi khi bạn vẫn cần thực hiện các thao tác thủ công. Vì Astra có thể truy cập internet và các dịch vụ của Google, nó đang hướng tới việc thay thế tất cả các đầu vào này bằng cách truy cập thông tin từ các nền tảng khác nhau và xây dựng ngữ cảnh cần thiết để thực hiện hành động.
Đây không phải là một mục tiêu dễ đạt được, và chúng ta còn chưa kể đến các vấn đề về quyền riêng tư và bảo mật mà một trợ lý AI phổ quát như Astra có thể gây ra trong tương lai. Astra có thể đang thực hiện tất cả các tác vụ nặng nề một cách cục bộ bằng mô hình Gemini Nano, nhưng bản demo không cho thấy bất kỳ dấu hiệu nào về điều đó.
Việc xây dựng một trợ lý như thế này sẽ mất khá nhiều thời gian, nhưng với những bản demo này, Google đã cho chúng ta một cái nhìn thoáng qua về tương lai. Có thể nó sẽ chưa đến sớm, nhưng một trợ lý AI phổ quát đang ở rất gần chân trời, và chúng ta đang háo hức chờ đợi sự ra mắt của nó.